WIF640: Themen und Termine

Wir erarbeiten in der Arbeitsweise “Seminar” das folgende Hauptwerk:

Sucht man nach zusammenhängenden Themenblöcken mit ungefähr ähnlichem Umfang und Schwierigkeitsgrad, ergibt sich aus Hoppes Buch eine natürlich Gliederung in die folgenden Themen. (Wenn das Seminar mehr als 9 Teilnehmer hat, können Themen auch zu zweit bearbeitet werden.)

Thema 1

2.1 Token, Wörter, Terme, Entitäten, Benannte Entitäten | 2.2 Tokenisierung – 20 | 2.3 Bedeutungstragende Bezeichnungen – 23 | 2.4 Nominalkomposita – 23 | 2.5 Schreibfehlererkennung und -korrektur – 25 | 2.6 N-Gramme – 31 | 2.7 Kookkurrenzen und Kollokationen – 32

Thema 2

2.8 Part-of-Speech-Tagging – 36 | 2.9 Nominalphrasen – 43 | 2.10 Erkennung benannter Entitäten – 45 | 2.11 Erkennung von anwendungsgebiets-spezifischen Entitäten – 46 | 2.12 Stoppwortentfernung – 47 | 2.13 Stammformableitung – 49

Thema 3

3.1 Repräsentation von Dokumenten – 65 | 3.2 Interpretation von Suchanfragen – 72 | 3.3 Anfrage-Operatoren – 73 | 3.4 Boolesche Anfragen an einen invertierten Index – 75 | 3.5 Erweiterte Anfragen an einen positionellen invertierten Index – 77

Thema 4

3.6 Ranking der Ergebnisse – 81 | 3.7 Probleme der Vektorraumrepräsentation – 95

Thema 5

4.1 Begriffe und mehr – 111 | 4.2 Wissensorganisation: Vom Vokabular zur Ontologie – 114 | 4.3 Wichtige Standards – 121 | 4.4 Linked Data – 130 | 4.5 Technologien – 131 | 4.6 Und woher kommt das Wissensmodell? – 131

Thema 6

5.1 Komponenten zur Semantifizierung konventioneller Suchfunktionen – 138 | 5.2 Komponenten zur Textaufbereitung – 145

Thema 7

5.3 Verschlagwortung von Dokumenten und Anfragen – 153

Thema 8

5.5 Benutzerschnittstellen-Komponenten – 176

Thema 9

6.1 Definitionsansätze – 202 | 6.2 Abgrenzung – 203 | 6.3 Referenz-Architektur semantischer Anwendungen – 207 | 6.4 Semantische Suche – 209