HMD 268, 46. Jahrgang, August 2009

Web & Data Mining

Herausgeber: Matthias Knoll, Andreas Meier

Als E-Book bestellen
Gedruckte Ausgabe bestellen
Feedback an den Herausgeber
Zum Inhaltsverzeichnis

Editorial

Der Data Miner arbeitet für gewöhnlich unscheinbar unter Tage, taucht aber zuverlässig immer dann in den Büroetagen auf, wenn Finanzkennzahlen analysiert, Kundenakquisitions- und Kundenbindungsprogramme entwickelt oder Markttrends nachgespürt werden müssen. Mit dieser Charakterisierung hat Markus Grolik den Wettbewerb für die Wahl eines neuen Cartoonisten gewonnen. Die visuelle Umsetzung seiner Idee finden Sie als Cartoon in diesem Heft. Wir begrüßen Markus Grolik und freuen uns auf weitere grafische Würfe für unsere künftigen Schwerpunktthemen.

An dieser Stelle möchten wir uns bei Norman Zey herzlich bedanken, der uns seit Jahren als Cartoonist unterstützt. Sein erster Cartoon erschien im HMD-Heft 223 über elektronische Marktplätze im Februar 2002. Norman Zey hat uns mit seinem Talent bei 45 HMD-Heften begleitet! Seine Cartoons finden Sie zum Download unter http://hmd.dpunkt.de/archiv/cartoons.php.

Wie können die stark wachsenden Datensammlungen in Firmen und Organisationen oder der wild wuchernde Datendschungel im World Wide Web mit Werkzeugen erforscht werden? Leiden wir nicht alle unter dem Information Overload und gibt es hier Abhilfe? Diese oder ähnliche Fragen haben Sie, liebe HMD-Leserinnen und -Leser, sicher schon öfter gestellt. Die HMD-Herausgeber haben sich deshalb entschlossen, dem Themengebiet Web und Data Mining ein eigenes Schwerpunktheft zu widmen. Bei diesem Heft hat uns Prof. Dr. Matthias Knoll von der Hochschule Darmstadt als Gastherausgeber tatkräftig unterstützt.

Was ist nun der Unterschied zwischen Web Mining und Data Mining? Wenn Sie den Grundlagenbeitrag von Kilian Stoffel studieren, können Sie der einfachen Formel Web + Data Mining = Web Mining folgen. Tatsächlich ist die Suche nach Mustern in Datenbeständen in der Informatik schon immer ein wichtiges Thema gewesen. Begonnen mit dem Information Retrieval, d.h. der Suche nach relevanter Information, haben sich die Algorithmen rasch verbreitet. Interessant ist, dass beim Web Mining einerseits bekannte Verfahren des Information Retrieval angewendet werden - Google lebt uns dies täglich vor -, dass aber andererseits auch innovative Methoden speziell fürs Web Mining entwickelt worden sind.

Sie haben nun, liebe HMD-Leserinnen und -Leser, ein Schwerpunktheft über Web und Data Mining in den Händen. Dabei geben wir zu, Sie in einigen Beiträgen herauszufordern. So lernen Sie neben neueren Ansätzen wie Random Forest oder Fuzzy-Klassifikation auch Methoden und Techniken für das Opinion bzw. Stream Mining kennen. Wenn wir Sie an der einen oder anderen Stelle etwas stark mit methodischem und mathematischem Background strapazieren, so war das durchaus Absicht der Herausgeber. Anspruchsvolle Algorithmen des Web und Data Mining verlangen, die darunterliegende Theorie zu verstehen und nachvollziehen zu können.

Wir wünschen Ihnen, liebe Suchende nach Mustern in großen Datenbeständen, viel Spaß und viel Erkenntnis mit unserem Schwerpunktheft. Wie immer sind wir offen für Anregungen, Kritik oder Kommentare zu den einzelnen Beiträgen.

Matthias Knoll Andreas Meier