1. Excel

Excel von Microsoft ist das einzige kostenpflichtige Programm bei diesem Projekt. Begründet ist dies durch die hohe Kompatibilität der aus Excel-Tabellen erzeugbaren CSV-Dateien mit den von uns vorgesehenen Programmen. Ein weiterer Grund liegt in der weiten Verbreitung des Programms, wodurch man eine relative Vertrautheit mit den verschieden Funktionen voraussetzen kann. Dadurch, und durch die umfangreiche Hilfestellung, die im Internet geboten wird, sinkt die Einstiegshürde im technischen Bereich. Darüber hinaus kann dieses Programm durch das frei verfügbare LibreOffice substituiert werden. Der verfügbare Umfang an Funktionen ist dort zwar geringer, jedoch sollten die im weiteren Verlauf angesprochenen Anwendungen auch in diesem Programm umsetzbar sein. Der Export als CSV-Datei ist damit auf jeden Fall möglich. Etwas problematisch kann bei den LibreOffice-Programmen die Kompatibilität mit der kostenpflichten Software sein. Dies lässt sich in der Regel über kleine Nachbesserungen lösen, ist jedoch beim Arbeiten in Teams durchaus ein relevanter Faktor, der im Vorfeld geklärt werden sollte.

1.1 Vorbemerkungen zum Arbeiten mit Excel

Grundlegend für das Arbeiten mit Computerprogrammen ist die systematische und genaue Erhebung von Daten, da die Programme nur bei einer sauberen Datenlage zuverlässige Ergebnisse liefern können. Dies mag als Allgemeinplatz gelten, ist allerdings für valide Ergebnisse so wichtig, dass ein kleiner Hinweis nie fehl am Platz ist. Je größer die Datenmengen werden, umso weniger fallen Ungenauigkeiten zwar ins Gewicht, umso höher ist aber auch deren Wahrscheinlichkeit. Vor allem ist darauf zu achten, dass durchgängig mit denselben Begriffen, in derselben Schreibweise und Zeichenfolge gearbeitet wird. Schon ein falsch platziertes Leerzeichen führt dazu, dass ein Begriff vom Programm als unterschiedlich registriert wird.

Bevor mit der Datensammlung begonnen wird, ist es sinnvoll, sich die Ziele der Untersuchung vor Augen zu führen. Man sollte sich Fragen stellen wie: Was genau soll untersucht werden, und welche Informationen müssen dafür beschafft werden? Wie können diese Daten erhoben werden? Wie zukunftsoffen soll die Untersuchung sein, d.h. handelt es sich hierbei um ein einmaliges Projekt, oder will man später in anderen Kontexten erneut auf die Daten zugreifen? Arbeitet man allein oder in einem Team? Usw.. Je genauer definiert ist, was und wie untersucht werden soll, umso effektiver kann gearbeitet werden, und man erspart sich aufwendige Nacharbeiten.

Neben der Genauigkeit bei der Datenerhebung und Recherche ist ein wichtiges Hilfsmittel eine übersichtliche und einheitliche Struktur. Die Nutzung von unterschiedlichen Tabellen innerhalb einer Excel-Datei wäre eine Möglichkeit dafür. Da Excel bezüglich der Ausdehnung der Daten wenig vorstrukturiert ist (die Grenzen sind nur das formatabhängige sehr hohe Maximum an Zeilen und Spalten), liegt es am einzelnen Nutzer, sich hier selbst Grenzen zu setzen. Wenn alle Daten in einer Tabelle erfasst, berechnet und ausgewertet werden, kann das während der Arbeit daran noch übersichtlich wirken. Will man jedoch später darauf zurückgreifen, oder wollen mehrere Personen an einem Projekt arbeiten, braucht es eine vorher festgelegte Einteilung, die das Auffinden einzelner Datenmengen vereinfacht und anschlussfähig macht. Analog zu den Hinweisen im Punkt zuvor, sollte man sich auch darüber früh Gedanken machen, und eine möglichst effiziente Vorgehensweise festlegen. So vermeidet man auch hier nachträgliches Korrigieren, bzw. Mehrfachbearbeitung aufgrund unklarer Angaben.

Ein Beispiel aus der Genese des Projekts, das diesem Tutorial zugrunde liegt, unterstreicht die Bedeutung solcher Vorüberlegungen: Das Datasheet zu Contemporáneos wurde ursprünglich für eine einmalige Analyse der Zeitschrift erstellt, bei der im Fokus stand den Korpus in möglichst detaillierten Daten darzustellen. Grundlage der Datenerhebung war ein Index der Zeitschrift. Da die Präsentation auf Deutsch gehalten wurde, wurden die Daten durchweg auf Deutsch erfasst und strukturiert. Die Form des Datasheets war in sich geschlossen, und nur für die Beteiligten einfach ersichtlich. Im Zuge dieses Forschungsprojekts jedoch, wurde ein wesentlich offenerer Rahmen nötig. Da sich die Visualisierungen nun nicht mehr an ein rein deutschsprachiges, sondern ein internationales Publikum richten sollten, musste zunächst die Sprache von Deutsch auf Englisch verändert werden. Auch waren einige der erhobenen Daten für diese Untersuchung irrelevant, und mussten diesbezüglich umstrukturiert werden. Beim ursprünglichen Datasheet war außerdem mit einem Index gearbeitet worden, der die Informationen bereits in vorstrukturierter Form enthielt, und die Texte in Genres unterteilt hatte. Diese Unterteilung wurde übernommen, da sich daraus für die Analyse einer einzelnen Zeitschrift keine Konflikte ergaben. Es erwies sich allerdings, dass genau dies nun problematisch war, da einige der dort aufgeführten Kategorien für einen Vergleich mehrerer Zeitschriften zu detailliert waren. Das Umarbeiten der Datenmengen gestaltete sich dementsprechend aufwendig. Die anderen Korpora dagegen wurden von Anfang an auf eine offenere Arbeit mit ihnen ausgelegt. D.h. es wurde besonderes Augenmerk auf Vergleichsdaten gelegt und mit denselben Begriffen in englischer Sprache gearbeitet. Diese veränderte Struktur machte eine Anpassung der Daten innerhalb der Untersuchung einfacher, und ermöglichte eine leichtere Vergleichbarkeit der Zeitschriften. Was schon beim Erstellen der ersten Tabelle für Contemporáneos auffiel, war die unabdingbare Genauigkeit der Begriffe. In ersten statistischen Auswertungen fielen immer wieder alleinstehende Daten auf, was schlussendlich auf fehlerhaft gesetzte Leerstellen und kleine Rechtschreibfehler zurückzuführen war. Abhilfe schufen hier bei einer Überarbeitung die ‚Autofill‘-Funktion in Excel sowie das Kopieren der Einträge. Das Beispiel soll vor allem zeigen, dass es sich lohnt, nicht blind Daten zu sammeln, sondern gezielt vorzugehen, und im Zweifelsfall eine Struktur zu wählen, die mehr Offenheit zulässt. Denn was am Anfang vielleicht einen kleinen Mehraufwand bedeutet, kann später die wesentlich aufwendigeren Umarbeitungen von Datasheets für andere Fragestellungen klein halten.

Die Möglichkeit in Excel als Team an Datensätzen zu arbeiten, indem man die Daten zum Beispiel online sammelt und zusammenführt, oder verschiedene Mitarbeiter sich bei der Erfassung ablösen, bietet Chancen ebenso wie Herausforderungen. Klarer Vorteil ist, dass durch Teambildung größere Datenmengen erhoben, und die Datenerhebung über längere Zeiträume erfolgen kann. Genau darin liegt jedoch auch die Herausforderung. Die folgenden Hinweise basieren auch auf den Erfahrungen mit dem ersten Datasheet für Contemporáneos, der einzigen Zeitschrift unserer Untersuchung, deren Daten im Team erhoben wurden. Neben einer deutlichen Strukturierung werden klare Absprachen und die Verlässlichkeit der einzelnen Mitarbeiter, zum unabdingbaren Kriterium einer erfolgreichen Zusammenarbeit. Anders als in anderen Bereichen fällt bei großen Datensätzen nicht so schnell auf, wenn unsauber eingetragen bzw. schlecht recherchiert wird. Dies kann im schlechtesten Fall dazu führen, dass die Datensätze komplett überarbeitet werden müssen. Um solche Unannehmlichkeiten zu vermeiden, empfiehlt es sich, Aufgabenfelder herauszuarbeiten, und die einzelnen Projektteilnehmer in klar festgelegten Arbeitsbereichen tätig werden zu lassen. So könnte, in Bezug auf das Projekt unseres Instituts, zum Beispiel ein Mitarbeiter Informationen zu den Autoren recherchieren, während ein anderer für die Auflistung der Texte sowie deren Metadaten verantwortlich wäre. Oder man könnte den Mitarbeitern einzelne Zeitschriften übertragen. So lässt sich der Aufwand im Fall von Fehleingaben in Grenzen halten, und die Übertragung von Aufgaben auf Andere, für den Fall des Ausfalls eines Mitarbeiters, gestaltet sich einfacher. Ebenso lassen sich auf diese Weise leicht neue Teammitglieder integrieren. Was sicher beim Arbeiten in Teams an einer Datensammlung nötig ist, ist ein Verantwortlicher mit großem Fachwissen, der die Aufgaben sinnvoll verteilt und die Datensätze vor der Weiterverarbeitung sichtet, und auf mögliche Unstimmigkeiten hinweist.

Vor dem Erstellen der Daten lohnt es außerdem, sich ein gewisses Basiswissen anzueignen, das die Bedienung zum Beispiel von Excel vereinfacht. Hier zeigt sich ein weiterer Vorteil der weiten Verbreitung des Programms. Durch die große Menge an Nutzern ist das Internet voller Tutorials zum Umgang mit Excel, die man kostenlos über Suchmaschinen oder in Videoform auf Plattformen wie YouTube findet. Die über das Absolvieren der Tutorials erlangten Grundlagen ermöglichen eine effiziente Nutzung des Programms von Anfang an. Gerade bei großen Datenmengen erweist sich dies schnell als nötig, um einen Zeitrahmen einhalten zu können, der in einem vernünftigen Verhältnis zu den gewünschten Ergebnissen steht. Darüber hinaus finden sich zahllose Rechenbeispiele für Problemstellungen unterschiedlichster Art, die auch als Inspiration für die Möglichkeiten der Datenweiterverarbeitung gesehen werden können. Wenn im Team gearbeitet wird, kann es gewinnbringend, sein vorab eine Tutorial-Sammlung anzulegen, um den Mitarbeitern eine einheitliche Grundlage zu bieten, auf die die Kommunikation untereinander aufbauen kann. Darüber hinaus kann es, gerade bei größeren Teams auch zeitlich relevant sein, ihnen das selbständige Suchen von Grundlagen abzunehmen.

1.2 Visuelle Darstellung von Daten in Excel

Basis für die vorliegenden Visualisierungen waren Metadaten der jeweiligen Zeitschriften (z.B. Beitragstitel, Autoreninformationen, Ausgabe, etc.). Diese wurden zunächst in Excel-Tabellen überführt. Daran anschließend erfolgte eine Sichtung der Daten und die Überlegung welche Formen der Visualisierung sich eignen könnten. Excel bietet hier selbst schon Visualisierungsmöglichkeiten in Form von Graphen und Tabellen.

So können statistische Werte direkt im Programm berechnet und in Diagrammen dargestellt werden. Ebenso lassen sich Tabellenwerte aufeinander beziehen und miteinander vergleichen sowie Durchschnittswerte und zeitliche Abläufe ermitteln und in Tabellen auflisten. Viele dieser Funktionen wurden auch für eine erste digitale Analyse der für unser Projekt erhobenen Daten genutzt, wie man an den Beispielen weiter unten sehen kann. Gleichzeitig sollte aber auch hier über Sinn und Nutzen der grafischen Darstellung reflektiert werden, wie sich bei einer statistischen Erhebung der Geschlechterverteilung innerhalb der von uns untersuchten Zeitschriften deutlich zeigt. Wie zu Beginn des 20. Jahrhunderts nicht anders zu erwarten ist der Anteil der durch Beiträge vertretenen Frauen verschwindend gering. Eine Darstellung dieses Sachverhalts in einem Kreisdiagramm zum Beispiel wäre vollkommen nutzlos. In diesem Fall sind eine klassisch hermeneutische Analyse der einzelnen Beiträge sowie eine Darstellung der Bedeutung ihrer Verfasserinnen sicher zielführender. Excel kann hier dennoch hilfreich sein, wenn es zum Beispiel darum geht, die weiblichen Autorinnen schnell zu finden, und die Verteilung ihrer Beiträge über die Laufzeit der Zeitschrift zu beschreiben, wodurch sich möglicherweise Aussagen über die Motivation für die Übernahme eines Beitrags einer Frau treffen lassen. Darüber hinaus können auch scheinbar unwichtig kleine Datenmengen, im Zuge anderer Untersuchungen, später durchaus wieder relevant werden. Wenn man zum Beispiel irgendwann über genug Metadaten verfügt, um die Entwicklung des weiblichen Schreibens in Kulturzeitschriften im Verlauf des gesamten 20. Jahrhunderts nachzeichnen zu können, ist auch mit diesen Daten viel gewonnen. Für die Forschungsziele des aktuellen Projekts schien die Geschlechterunterscheidung jedoch weitestgehend irrelevant, wurde aber aufgrund ihrer leichten Erfassbarkeit dennoch in die Datensätze mit aufgenommen. Später bei der hermeneutischen Anreicherung und Kontextualisierung jedoch konnten diese Daten als Prozentsätze dann doch überraschend nutzbar gemacht werden, als es, ausgehend von der Sekundärliteratur, darum ging, die Beteiligung weiblicher Autorinnen in Hora de España zu deren Beteiligung in den beiden anderen Zeitschriften abzugrenzen und zu vergleichen. Auch hier erwies sich ein kleiner Mehraufwand später als produktiv, konnte so doch auf einer verlässlichen Datenbasis argumentiert werden, und eine genaue Aussage über die weibliche Beteiligung getroffen werden, ohne noch einmal das ganze Korpus durchsuchen zu müssen.

Um mit Excel gewinnbringend zu arbeiten, sind demnach eine vorausschauende Planung und eine gewissenhafte Erstellung der Datensätze ebenso wichtig wie das Erlangen von Basiswissen über die Funktionen des Programms. Es lässt sich mit dem Programm nicht nur eine gute, portierbare Datengrundlage schaffen, sondern es können damit auch Daten direkt visuell aufgearbeitet und Statistiken erstellt werden.