Maximilian Tenten     Patrick Frank
RWTH Aachen University     RWTH Aachen University
maximilian.tenten@rwth-aachen.de     patrick.frank@rwth-aachen.de



Vorwort

Dieses Online-Buch entstand im Zusammenhang mit dem Proseminar, bei dem Studenten des Bachelorstudienganges Informatik der RWTH Aachen einen Einstieg in das wissenschaftliche Arbeiten und Schreiben erhalten. Hierbei bilden die folgenden neun Beiträge aus dem Sommersemester 2021 gemeinsam die 4. Auflage des Online-Buches mit dem Thema „Algorithmen für die Entdeckung von Communities in sozialen Netzwerken“.

„Algorithmen für die Entdeckung von Communities in sozialen Netzwerken“ haben in den letzten Jahren markant an Bedeutung gewonnen aufgrund der zunehmenden Digitalisierung und dem Internet. Zudem ist eine ansteigende Wichtigkeit dieser in den kommenden Jahren zu erwarten. Für viele Forscher stellt dabei die Analyse von sozialen Netzwerken und das Entdecken von Gemeinschaften in diesen Netzwerken eine Herausforderung dar.

Um diese Netzwerke zu untersuchen, werden die Beziehungen von Netzwerkteilnehmern untereinander analysiert, sodass Rückschlüsse über bestehende Gemeinschaften gezogen werden können. Um eine freundschaftliche Beziehung zwischen zwei Netzwerkteilnehmern zu beschreiben, wird hierbei eine Kante mit einem positiven Vorzeichen versehen. Demgegenüber wird eine feindselige Beziehung mit einem negativen Vorzeichen beschrieben. Diese Netzwerke werden aufgrund ihrer zusätzlichen Informationen zu Freund- und Feind-Beziehungen als vorzeichenbehaftete Netzwerke bezeichnet. Dabei werden vorzeichenbehaftete Netzwerke beispielsweise in der Biologie, Chemie, Physik, Ökonomie und Politik angewendet. Im Rahmen dieses Proseminars steht die Analyse dieser vorzeichenbehafteten Netzwerke im Vordergrund.

Während des Proseminars wurden alle Studenten einem vertikalen und horizontalen Team zugeteilt. Die Aufgabe des vertikalen Teams bestand dabei darin, einen wissenschaftlichen Beitrag in einer von fünf Kategorien zu verfassen. Im Folgenden werden die einzelnen Beiträge innerhalb der jeweiligen Kategorie beschrieben, um einen Überblick über die Arbeiten zu geben.

Hierbei stehen im nachfolgenden Abschnitt die Abkürzungen „OCD“ für „Overlapping Community Detection“, „OCDA“ für „Overlapping Community Detection Algorithm“ und „OCDAs“ für „Overlapping Community Detection Algorithms“.

1. Erweiterung bekannter OCD Algorithmen auf vorzeichenbehaftete Netzwerke

Die Arbeit „Erweiterung bekannter OCDA auf vorzeichenbehaftete Netzwerke (1)“ von Haider Abbas und Felix Voigtländer geht auf erweiterte Overlapping Community Detection Algorithmen für vorzeichenbehaftete Netzwerke ein und erklärt die Vorteile der Änderungen im Vergleich zu initialen Algorithmen. Des Weiteren werden die unterschiedlichen OCD Algorithmen veranschaulicht.

In dem Beitrag „Erweiterung bekannter OCDA auf vorzeichenbehaftete Netzwerke (2)“ von Valentin Baumann und Stefan Bleß werden bekannte Overlapping Community Detection Algorithmen sozialer Netzwerke auf vorzeichenbehaftete Netzwerke erweitert und detaillierter untersucht. Hierbei wird insbesondere der Attractor-Algorithm behandelt, der im Vergleich zu anderen OCDA auf vorzeichenbehafteten Netzwerken eine sehr gute Modularität aufweist.

In der Arbeit „Erweiterung bekannter OCDA auf vorzeichenbehaftete Netzwerke (3)“ von Laurenz Haug und Simon Hebich werden synthetische oder aus realen Daten generierte soziale Netze analysiert, in denen einzelne Knoten, im Gegensatz zu vergangen Ansätzen, mehreren Communities angehören können. Dies wird durch Overlapping Community Detection Algorithms realisiert, die aktuell häufig auf Netze mit ausschließlich positiv gewichteten Links angewendet werden. Dies ist jedoch nicht der effizienteste Ansatz. Dabei wird erläutert, wie die Erweiterung von Verbindungen durch eine negative Gewichtung vorteilhaft für die Effizienz von OCDAs und der Evaluation von Links in sozialen Netzwerken ist. Dieser Ansatz verspricht in praktischen Anwendungen bisher bestehende Algorithmen in Geschwindigkeit und Genauigkeit zu übertreffen.

Die Arbeit „Random Walks auf vorzeichenbehafteten Netzwerken“ von Malte Knuth und Mohammad Mahdi Khalily behandelt, wie ein OCD Algorithmus zur Findung von Communities effizienter entwickelt werden kann. Anschließend werden mit Hilfe von konkreten Beispielen der Unterschied zwischen der Erweiterung und den Vorgängermodellen veranschaulicht sowie die Vorteile des Signed Random Walk with Restart im Vergleich zu ähnlichen Algorithmen hervorgehoben.

2. Neue OCD für vorzeichenbehaftete Netzwerke

Der Beitrag „Neue OCDA für vorzeichenbehaftete Netzwerke“ von Marco Heinisch, Maximilian Tenten und Michael Kewa behandelt, wie durch neue OCDAs für vorzeichenbehaftete Netzwerke beispielsweise überlappende gesellschaftliche Gruppierungen und politische Meinungsfelder besser identifiziert, analysiert und beschrieben werden können. Ziel dieser Arbeit ist es, einige für vorzeichenbehaftete Netzwerke neu entwickelte Overlapping Community Detection Algorithmen in deutscher Sprache vorzustellen, deren Funktionsweise zu erläutern und sie in Hinblick auf Ergebnisse und Laufzeit zu vergleichen.

3. Berechnung der strukturellen Ausgeglichenheit in vorzeichenbehafteten Netzwerken

Die Arbeit „Berechnung der strukturellen Ausgeglichenheit in vorzeichenbehafteten Netzwerken“ von Darya Naumava und Patrick Frank analysiert mithilfe von Zyklen die Harmonie eines vorzeichenbehafteten Netzwerkes. Die Ausgeglichenheit wird dabei berechnet, indem einzelne Zyklen entdeckt und auf ihre Balance geprüft werden, sodass Aussagen über das Maß der Balance eines gesamten Netzwerkes getroffen werden können. Durch geeignete Anwendungsbeispiele wird ersichtlich, dass eine Anwendung dieser Methode auf kleine bis große Netzwerke möglich und zielführend ist. Dementsprechend können mithilfe dieses Ansatzes effiziente Analysen von vorzeichenbehafteten Netzwerken durchgeführt werden.

4. Vorhersage des sozialen Status von Knoten in vorzeichenbehafteten Netzwerken

Der Beitrag „Vorhersage des sozialen Status von Knoten in vorzeichenbehafteten Netzwerken (1)“ von Alina Korschikowa und Ioan Cristian Bratu konzentriert sich darauf, auf einfache Art und Weise soziale Merkmale zu entdecken, um die Zukunft von Beziehungen in Netzwerken zu bestimmen. Es werden dabei reale Netzwerke verwendet, auf deren Basis Vorhersagemodelle für die Forschung entwickelt werden.

Die Arbeit „Vorhersage des sozialen Status in sozialen Netzwerken (2)“ von Malte Säuberlich und Natalia Slowikowska untersucht mithilfe von überlappenden Communities Vorhersagen in Bezug auf Wahlen, das Kaufverhalten und das Verhalten in Freundschaftsgruppen zu machen. Diese überlappenden Communities werden mit Hilfe von einem Overlapping Community Detection Algorithm erkannt. Dabei werden die Prinzipien von überlappenden Communities und deren Bewertung am Beispiel des sozialen Netzwerkes YouTube erläutert, weil bei diesem der soziale Status eines Nutzers auf einfache Art und Weise erkannt und dessen Entwicklung nachverfolgt werden kann.

5. Anwendungen von OCD für vorzeichenbehaftete Netzwerke in Ökonomie, Politik usw.

Der Beitrag „Anwendung des Borgia Clustering für die Analyse vorzeichenbehafteter Netzwerke am Beispiel des EU-Parlaments“ von Konrad Schindler und Jonas Säuberlich gibt einen Überblick über das Borgia Clustering, einem neuen Algorithmus zur Community Detection auf Netzwerken. Dabei wird anhand von kürzlich erhaltenen Abstimmungsergebnissen des Europäischen Parlaments mit Hilfe eines geeigneten Algorithmus gezeigt, dass diese Eigenschaften ausschlaggebend für eine sinnvolle Analyse sind. Zudem wird daraus geschlossen, dass vorzeichenbehaftete Netzwerke kein Anwendungsfeld des Borgia Clusterings in seiner momentanen Form darstellen.


Darüber hinaus bestand die Arbeit der horizontalen Teams unter anderem darin, unterstützende Layouts, Designs und Vorgaben für das Proseminar zu entwickeln oder die Einhaltung von Deadlines sicherzustellen. Die Teilnehmer wurden hierzu in ein Designteam, WebOCD-Team, Visualisierungsteam, Präsentationsteam, PR-Team, Herausgeberteam oder Begutachtungsteam eingeteilt.

Gleichzeitig wurden die Studenten während dieses Seminars von den Veranstaltern, Priv.-Doz. Dr. rer. nat. Ralf Klamma, Kim Fidomski und Michal Slupczynski, durch in etwa zweiwöchentlich stattgefundene Workshops zum wissenschaftlichen Arbeiten unterstützt und in das wissenschaftliche Schreiben eingeführt.

Zusammenfassend haben die Teilnehmer während des Proseminars Kenntnisse im wissenschaftlichen Arbeiten und Schreiben erworben und konnten ihr Wissen im Bereich der „Algorithmen für die Entdeckung von Communities in sozialen Netzwerken“ erweitern.

Unser Dank gilt Priv.-Doz. Dr. rer. nat. Ralf Klamma, Kim Fidomski und Michal Slupczynski für Ihre ausgiebige und hilfreiche Unterstützung.

Aachen, im Juli 2021

Patrick Frank und Maximilian Tenten