Das 320West, die neue Eventlocation in Zürich-West, bot diesmal den Schauplatz für die 17. Java Lounge. 320WEST ist ein bisher in der Schweiz einzigartiges Eventlocation-Konzept, wo Events, Architektur und Kulinarik aufeinandertreffen. Zürich-West ist ein Ort für Kunst und Design, was mit dem heutigen Thema harmonierte.

Teil 1: Analyse sozialer Medien

Albert Blarer, Principal
Consultant, Trivadis AG

 Soziale Medien sind heute allgegenwärtig und aus unserem Alltag kaum mehr wegzudenken. Rund 2 Milliarden Menschen, (mehr als ein Viertel der Weltbevölkerung) nutzen soziale Medien wie Facebook, Twitter, Instagram, WhatsApp oder LinkedIn, um mit Freunden und Familie zu kommunizieren. Aber auch in Revolutionen, wie etwa dem arabischen Frühling, spielt die Kommunikation über soziale Medien eine tragende Rolle.

Social Media Intelligence, kurz SOCMINT, bezeichnet einen umfassenden Prozess, der Inhalte und Daten aus sozialen Medien sammelt, aufbereitet und anschliessend analysiert. Entlang den fünf Dimensionen Zeit, Raum, Inhalt, Sozial-Beziehung und Technik kann so ein Lagebild in nahezu Echtzeit erstellt oder auch Anomalien im Kommunikationsstrom entdeckt werden, die auf ungewöhnliche Ereignisse hindeuten.

Manche Analysemethoden funktionieren einwandfrei in diesem Big & Fast Data Umfeld, während andere, wie etwa die Sentiment-Analyse, noch in der Erforschung stecken und nur beschränkt qualitativ gute Resultate liefern.

 

 

Teil 2: Lösungsansätze für die Analyse von sozialen Medien mit Open Source Werkzeugen          

Guido Schmutz, Technology
Manager, Trivadis AG

In diesem Vortrag haben wir uns auf mögliche Implementationen des Speed Layer der Lambda Architektur konzentriert. Die Nachrichten werden erst über ein so genanntes zentrales Unified Log  (z.B. Apache Kafka) entgegengenommen und den interessierten Systemen, z.B. Stream Processing (Apache Storm) oder Batch Processing (Hadoop Ecosystem) zur weiteren Verarbeitung zur Verfügung gestellt.

Apache Storm lässt es zu, Nachrichten in nahezu Echtzeit zu verarbeiten, indem die notwendigen Verarbeitungseinheiten in einer Storm Topologie abgebildet werden. Storm ist horizontal skalierbar und eine einzelne Topologie kann in einem Cluster auf mehreren Maschinen ablaufen. In einer „Unified Event Processsing Architecture“ produzieren die Strom Topologien dabei wieder neue Ereignisse und stellt diese in das Unified Log, so dass diese von weiteren Storm Topologien konsumiert werden können.

Die effektiven Resultate werden von den Storm Topologien in einer geeigneten Datenbank abgespeichert. Dies kann eine NoSQL Datenbank wie Cassandra sein, um Zeitreihen oder Graphen abzuspeichern oder aber Elasticsearch, um eine Volltextsuche auf Resultaten zu unterstützen.

 

Einen herzlichen Dank an die beiden Referenten Albert Blarer und Guido Schmutz sowie die Organisatoren.

Wir würden uns sehr freuen, Sie zur 18. Trivadis Java Lounge wieder begrüssen zu dürfen.