HMD 271, 47. Jahrgang, Februar 2010

Web 3.0 & Semantic Web

Herausgeber: Urs Hengartner, Andreas Meier

Unstrukturierte Daten im Business. Intelligence - Vorgehen, Ergebnisse und Erfahrungen in der praktischen Umsetzung

Ute Steinecke, Walter Straub

Zusammenfassung

Information-on-Demand und Business Intelligence (BI) gehören zu den weiterhin wachsenden Beratungsfeldern. Standen bisher strukturierte Daten im Vordergrund, so wird es in Zukunft mehr und mehr darum gehen, Informationen aus unstrukturierten Daten wie beispielsweise aus Dokumenten, Videos, Bildern, E-Mails oder Wikis zu erschließen und zu nutzen. Unstrukturierte Informationen werden zwar u.a. bereits in Content-Managementsystemen verwaltet, aber in Kombination mit Business Intelligence kaum genutzt. Die Einbindung unstrukturierter Daten in BI-Systeme und deren Auswertung stellt die etablierten BI-Methoden vor vollkommen neue Anforderungen und verlangt zum Teil neue Verfahren und Technologien. Dabei liefern unstrukturierte Daten nicht nur Fakten, sondern vor allem auch Informationen aus dem und über den Kontext. Es kann für den Marketingleiter oder die Produktentwicklung entscheidend sein, ob es sich um positive, negative oder neutrale Kontexte handelt. Für Gewährleistungs- und Servicecenter kann es wesentlich sein, ob es sich um neue oder um bekannte Probleme handelt und in welcher Beziehung diese zu anderen Fragen stehen. An die Unternehmensberatung IBM Global Business Services ist eine Reihe von Anfragen gestellt worden, um unstrukturierte Daten in BI-Systeme zu integrieren und für Auswertungen und Reporting verfügbar zu machen. So wurde gemeinsam mit einer Customer Support Service GmbH ein Projekt aufgesetzt, um die Notizen von Agents auszuwerten, aufzubereiten und über herkömmliches Reporting dem Business bereitzustellen. Ein anderes Projekt hatte zum Ziel, RSS-Feeds automatisch zu klassifizieren und in die internen Informationssysteme zu integrieren. Im Folgenden werden das Vorgehen, die Ergebnisse und die Erfahrungen aus diesen zwei Anwendungen dargestellt.

Inhaltsübersicht

  1. Unstrukturierte Daten im Business Intelligence - fachliche Anforderungen
  2. Auswertung von Störmeldungen in einem Customer Service Center
    1. Ausgangssituation
    2. Aufgabenstellung
    3. Lösungsansatz
    4. Ergebnis
    5. Software
  3. Automatische Klassifikation von RSS-Feeds für ein Unternehmen der Energiewirtschaft
    1. Aufgabenstellung
    2. Lösungsansatz
    3. Ergebnis
    4. Software
  4. Unstrukturierte Daten im BI - Technologie und Standards
    1. Vorverarbeitung
    2. Modellierung
    3. Frontend
  5. Literatur