Data Mining: information discovery
Worum geht es? In unstrukturierten Daten sollen Informationen entdeckt werden. Akteur ist die Maschine.
Datenquellen
- Text
- Bild
- Datenbanken
was gefunden wird
- Wörter
- Patterns
- Zusammenhänge
Strukturierung der Ergebnisse
- Index von Wörtern oder Patterns: "Was wurde wo gefunden?"
- höherwertige inline Dokument-Strukturen
- Dokument-Metadaten
In diesem Vortrag
- Fokus auf Wort-Annotationen (Inline oder in Form von Metadaten) als Ergebnis von Data-Mining-Prozessen
- wichtige zweite Schiene: Datenbank-Integration, ETL u.V. m.: nicht heute!