TU Berlin

Stabsstelle Kommunikation, Events und AlumniMedieninformation Nr. 241/2012

Inhalt des Dokuments

zur Navigation

Community-Daten in den Griff bekommen

Medieninformation Nr. 241/2012

TU-Wissenschaftler forschen im neuen Projekt ROBUST

Forscher des Fachgebietes Datenbanksysteme und Informationsmanagement der TU Berlin entwickeln neuartige, skalierbare Methoden zur Analyse von Community-Daten aus Online-Netzwerken im Rahmen des EU-Projekts „Risk and Opportunity Management of Huge-scale Business Community Cooperation“ (ROBUST).

Professionelle Online-Communities erzeugen einen enormen wirtschaftlichen Mehrwert und sind ein zentrales Element im unternehmerischen Wissensmanagement, Marketing und der Innovationsfähigkeit. Solche Communities können leicht mehr als eine Millionen Nutzer umfassen und die zugrunde liegende Infrastruktur muss in der Lage sein, mehrere hundert Millionen Diskussionsverläufe mit Milliarden von Beiträgen zu verwalten. Die Wissenschaftlerinnen und Wissenschaftler des Projekts ROBUST arbeiten an Lösungen zum Risikomanagement, Datenmanagement, der Nutzermodellierung, der Simulation und der Datenanalyse für Online-Communities.

Für die Verarbeitung großer Mengen von Textdaten wie Forum-Posts sowie von Graph Daten, welche zum Beispiel die soziale Struktur eines Netzwerks repräsentieren, entwickeln die TU-Forscherinnen und -forscher skalierbare Methoden, die für großes Datenwachstum besonders geeignet sind. So können effizient auf „massiv parallelen“ Datenverarbeitungssystemen wie Apache Hadoop, Apache Giraph oder dem an der TU Berlin entwickelten System Stratosphere, also auf vielen Geräten gleichzeitig – in der Industrie sind es tausende –, ausgeführt werden. Skalierbarkeit ist ein wichtiger Bestandteil der ROBUST-Plattform, weil so enorm große Datenmengen („Big Data“) analysiert werden können.

Diese technischen Werkzeuge ermöglichen komplexere Algorithmen für die Analyse und Verbesserung von Online-Communities, wie beispielsweise das Empfehlen von Experten zu bestimmten Diskussionsthemen oder die automatische Ermittlung von Communities, die besonderer Aufmerksamkeit bedürfen.

Um die Skalierbarkeit der entwickelten Algorithmen zu überprüfen, haben TU-Forscher Experimente mit massiven Datensätzen durchgeführt, welche die Größe der Forschungsdaten im Projekt deutlich übersteigen. So konnten Sie zum Beispiel die Graphstruktur eines sozialen Netzwerkes mit über 40 Millionen Nutzerinnen und Nutzern sowie 3 Milliarden Verbindungen unter den Nutzern effizient analysieren und die lineare Skalierbarkeit der entwickelten Methoden verifizieren. Ausgewählte Algorithmen wurden bereits in die populären Open-Source-Bibliotheken Apache Mahout [1] und Apache Giraph [2] integriert. Sie stehen somit ab sofort für Entwickler, welche die Algorithmen in ihren eigenen Softwareprojekten einsetzen möchten, unter der Apache Software Lizenz zur Verfügung.

Das Projekt ROBUST wird mit 10,3 Millionen Euro im Rahmen des „Seventh Framework Programme“ der Europäischen Union für 3 Jahre gefördert. Die Projektleitung ist an der Universität Koblenz-Landau angesiedelt. Weitere Partner sind die SAP AG (Deutschland), IBM Israel – Science and Technology LTD (Israel), National University of Ireland, Galway (Irland), University of Southampton (Vereinigtes Königreich), TEMIS S.A. (Frankreich), Software Mind SA (Polen), The Open University (Vereinigtes Königreich) und MeaningMine Ltd. (Irland).

Website zum Projekt ROBUST: www.robust-project.eu

jb

Weitere Informationen erteilt Ihnen gern:

Prof. Dr. Volker Markl
TU Berlin
Fachgebiet Datenbanksysteme und Informationsmanagement
Tel.: 030/314-25553

Navigation

Direktzugang

Schnellnavigation zur Seite über Nummerneingabe