2. Gephi und Visone

Aufbauend auf die systematische Datensammlung in Excel sollten für dieses Projekt Netzwerkanalysen verschiedener Zeitschriftenkorpora erfolgen. Dazu wurden zwei gängige Softwareprogramme für die Darstellung von Daten in Netzwerkform ausgewählt: Gephi und Visone. In beide können Daten im CSV-Format importiert und als Netzwerke abgebildet werden. Sie bedienen sich dabei verschiedener Algorithmen, durch die die Netzwerke, je nach zugrundeliegender Formel, angeordnet werden. Zielgruppe der Programme ist klar die soziologische Forschung, da in erster Linie das Visualisieren von sozialen Interaktionen z.B. in Facebook oder per E-Mail als Nutzungsmöglichkeit der Software vorgestellt wird. Doch auch für Datensätze im Bereich der Analyse von Zeitschriftenkorpora können sie sich eignen.

Voraussetzung dafür ist, dass Daten vorhanden sind, auf die sich mehrere Elemente eines weiteren Datenbereichs beziehen und auf diese Weise Knotenpunkte entstehen. Dazu dienen in unseren Beispielen Textarten, die mit den einzelnen Autoren verknüpft werden. Dadurch ergibt sich ein Bild der in den einzelnen Sparten tätigen Autoren sowie ein Einblick in ihre Rolle im Rahmen der jeweiligen Zeitschrift. Je häufiger ein Autor einen Beitrag liefert, umso deutlicher kann seine Verknüpfung mit der jeweiligen Textart hervorgehoben werden. Außerdem lassen sich so zentrale Figuren ausmachen, die besonders viele und verschiedenartige Beiträge liefern. Um ein konkretes Beispiel dafür zu nennen, wie von einem Betragsgenre auf die Rolle eines Akteurs innerhalb der Zeitschrift geschlossen werden kann, seien Rezensionen genannt. Mehrere Rezensionen können ein Hinweis auf eine organisatorische Rolle bei der Zeitschrift sein, ebenso natürlich, wie überhaupt eine starke Beteiligung an der Zeitschrift eine zentrale Rolle eines Autors vermuten lässt.

Sowohl bei Visone als auch bei Gephi fällt der technische Einstieg leider nicht ganz so leicht wie das bei Excel der Fall ist, da sie wenig intuitiv aufgebaut sind, was dazu führt, dass man sich vor der Anwendung zunächst mit verschiedenen Tutorials auseinander setzen muss. Durch die Tutorials erhält man einen Überblick über mögliche Funktionen und ihre Anwendungen, die bei beiden Programmen durchaus unterschiedlich ausfallen. Aufgrund dieser großen Unterschiede in den Anwendungsmöglichkeiten werden im Folgenden beide getrennt voneinander vorgestellt.

2.1 Gephi

Gephi The open Graph Viz Platform wurde von uns in verschiedenen Versionen und zuletzt in der Version 0.8.2-beta verwendet. Dadurch, dass es sich bei den verfügbaren Downloads von Gephi um Beta-Versionen handelt, muss mit gewissen Schwierigkeiten gerechnet werden, die durchaus gegeben sind, sich jedoch beheben lassen. Darüber hinaus ergeben sich Unterschiede in den Versionen, je nach Entwicklungsstand. Ganz besonders bei dieser Software ist das Durcharbeiten der Tutorials anzuraten, denn einige wichtige Funktionen des Programms werden dort via Plug-Ins erst geladen.

Um eigene Daten aus einer Excel-Tabelle direkt in Gephi zu importieren, muss allerdings ein Plug-In geladen werden, das weder in den Tutorials noch in der vorhandenen Liste auftaucht. Das ‚Excel / csv converter to network‘-Plug-In von Celement Levallios findet sich auf dem Gephi-Marketplace und erlaubt genau diese Funktion. Im Marketplace finden sich Plug-Ins für verschiedenste Anwendungen, Service und Support des Programms sowie ältere Versionen der Software. Auch kann man eigene Add-Ons anderen Nutzern, ganz im Sinne der Sharing-Idee, zur Verfügung stellen. Nach dem Herunterladen eines Plug-Ins muss es dann nur noch von Gephi aus angewählt und integriert werden. Im Anschluss daran lässt sich im Dropdown-Menü der Punkt ‚Import Spigot‘ auswählen, der dann eine Selektion und den Import von Datenreihen aus einer lokalen Excel-Datei ermöglicht. Das ‚Converter-Plug-In‘ verwendet CSV als Übergangsformat, weshalb ein Trennzeichen zwischen den Einzeldaten angegeben werden muss. In unserem Fall war dies der Strichpunkt (semicolon). Weitere Hinweise zur Nutzung lassen sich auch der Beschreibung im Marketplace entnehmen.

Nach der Fertigstellung des Datenimports erscheint vor der Ausgabe als Netzwerk das Fenster „Import Report“, in dem die importierten Daten gelistet sind und eventuelle Fehler angezeigt werden. Es lassen sich dort auch Einstellungen, wie zum Beispiel die Darstellung der Verbindungslinien als Pfeile (‚directed‘) oder als Verbindungsstriche (‚undirected‘), vornehmen. Nach der Bestätigung der gewünschten Einstellungen erscheint ein Netzwerk, das weiter bearbeitet werden kann.

Hinter den meisten Funktionen von Gephi stecken Algorithmen, die das Verhältnis der Daten zueinander beibehalten. Viele davon sind schon in die Plug-In-Liste des Programms integriert, allerdings finden sich online weitere, die von Anwendern selbst für spezifische Fragestellungen entwickelt und der Allgemeinheit zur Verfügung gestellt werden. Konkret bedeutet die Algorithmen-basierte Darstellung der Daten, dass zum Beispiel je nach Häufigkeit Verbindungsstriche mal dicker, mal dünner ausfallen können, die Intensität von Farben zu- oder abnimmt, Größen von Benennungen schwanken etc. Der Vorteil davon liegt klar auf der Hand. Agiert man ausschließlich mithilfe dieser Algorithmen erhält man mathematisch korrekte Abbildungen der Netzwerke. Allerdings kann darunter auch die Deutlichkeit der Visualisierung leiden, wenn sich zum Beispiel Punkte überlappen, oder die Schrift so klein oder hell wird, dass man sie nicht mehr lesen kann. Die Möglichkeiten der manuellen Anpassung sind leider etwas eingeschränkt und die Bedienung des Programms nicht ganz einfach. So kann man einzelne Punkte schon vergrößern, jedoch vergrößert sich mit ihnen auch die Schrift, die in Abhängigkeit dazu steht, weshalb eine Anpassung nur in begrenztem Maße möglich ist. Ebenso anpassungsabhängig ist die Farbgestaltung, was die Übersichtlichkeit beeinträchtigen kann.

Ein weiterer großer Vorteil von Gephi liegt eindeutig in der Geschwindigkeit einer ersten Visualisierung. Hat man Daten in Gephi geladen, ist nach einigen wenigen Anpassungen schnell ein brauchbares Ergebnis zu sehen, worüber sich mit wenig Aufwand gut abschätzen lässt, ob sich eine Darstellung in Netzwerkform lohnt. Dazu können die Daten mit unterschiedlichen Algorithmen in verschiedene Darstellungsformen gebracht werden. Die Einstellungen dieser Algorithmen lassen sich in einem Dropdown-Menü vornehmen, was weitere Anpassungen möglich macht. Gehobenen Ansprüchen an die Übersichtlichkeit genügt dies allerdings meist nicht, was dann wiederum eine im Verhältnis dazu recht zeitaufwendige händische Überarbeitung mit beschränkten Möglichkeiten erfordert. Besonders bei größeren Datenmengen kann diese Unübersichtlichkeit ein Problem darstellen.

2.2 Visone

Im Gegensatz dazu zeichnet sich Visone: virtual social networks durch gute manuelle Veränderungsmöglichkeiten aus und ist gerade in diesem Bereich deutlich intuitiver als Gephi. Allerdings sind die Tutorials im Vergleich zu Gephi wesentlich umfangreicher, was hier den Einstieg zeitlich aufwendiger macht, aber gleichzeitig auch ein besseres Verständnis des Programmes ermöglicht. Auch ist der Weg zu ersten Ergebnissen länger, da die Gestaltung der Netzwerke sehr viel stärker vom Nutzer abhängt, was allerdings auch den Vorteil hat, dass die Darstellung besser den Auswertungsansprüchen angepasst werden kann. Wir haben auch hier mit verschiedenen Versionen gearbeitet, wobei die aktuellen Ergebnisse mit Visone 2.9.2 erstellt wurden.

Für den Datenimport in Visone ist das Abspeichern von Datenreihen aus Excel als CSV-Datei erforderlich, da Daten nicht direkt aus der Tabelle importiert werden können. Öffnet man eine CSV-Datei in Visone, erscheint das Fenster ‚Import Options‘, dessen Funktionen in einem speziell dafür angelegten Tutorial erläutert werden. Je nach Art der Daten müssen unterschiedliche Formate ausgewählt werden, um danach ein Netzwerk zu erhalten. Beim Laden von CSV-Datein in Visone können sich auch unliebsame ‚Nebenwirkungen‘ im Bild einstellen. So kam es im Falle unserer Datensätze immer wieder dazu, dass sich weitere ungewünschte Verweisstrukturen einschlichen und Verbindungen mehrfach dargestellt wurden. Diese Mankos konnten bisher nur manuell ausgeglichen werden. Um dies zu verhindern, hat es sich bewährt, erst die Daten in Gephi zu laden, von dort unbearbeitet als GraphML-Datei zu exportieren, und dann diese GraphML-Datei in Visone zu öffnen. Über diesen kleinen Zwischenschritt ist es gelungen, die fehlerhaften Darstellungen auszumerzen. Allerdings muss dann in Gephi besonders darauf geachtet werden, dass keine Fehler beim Laden der Daten entstehen, und gegebenenfalls nachgebessert werden.

Wie eingangs herausgestellt sind die Bearbeitungsmöglichkeiten durch den Nutzer deutlich größer. So können die Formen, Farben und Größen der Knotenpunkte individuell und in Gruppierungen verändert, Legenden erstellt, Attribute geladen werden u.v.m. Dies bedeutet zwar etwas mehr Aufwand, allerdings kann davon die Übersichtlichkeit profitieren. Analog zu Gephi gibt es auch in Visone Algorithmen, die die Daten in verschiedenen Darstellungsformen ausgeben. Die nachträgliche Bearbeitung wird davon allerdings nicht so stark beeinflusst, worunter jedoch auch die mathematische Korrektheit leiden kann. Die großen Stärken von Visone liegen daher in der Möglichkeit der hohen Übersichtlichkeit und dem Kreieren von vielschichtigen Netzwerken durch das Laden von Attributen, die dann den Daten zugeordnet werden können.