Data Mining: information discovery

Data Mining: information discovery

Worum geht es? In unstrukturierten Daten sollen Informationen entdeckt werden. Akteur ist die Maschine.

Datenquellen

  • Text
  • Bild
  • Datenbanken

was gefunden wird

  • Wörter
  • Patterns
  • Zusammenhänge

Strukturierung der Ergebnisse

  • Index von Wörtern oder Patterns: "Was wurde wo gefunden?"
  • höherwertige inline Dokument-Strukturen
  • Dokument-Metadaten

In diesem Vortrag

  • Fokus auf Wort-Annotationen (Inline oder in Form von Metadaten) als Ergebnis von Data-Mining-Prozessen
  • wichtige zweite Schiene: Datenbank-Integration, ETL u.V. m.: nicht heute!