Abschlussarbeiten
Grundsätzlich lassen sich alle Studienprojekte etc. auch als Bachelor- oder Master-Abschlussarbeiten ausgestalten. Bitte sprechen Sie mich einfach an!
Zusätzlich sind im Folgenden Ideen für weitere Abschlussarbeiten aufgeführt.
Zeitreihenanalysen auf WaTor
Übergreifendes Erkenntnisinteresse:
- Aufbau eines didaktischen Jupyter-Notebooks für die Lehre
- zum Thema "Zeitreihenanalyse"
- auf Basis des gut untersuchten, gut dokumentierten Usecases Wator
Gegenstand der Arbeit: Zeitreihen-Analysen in einem dynamischen Räuber-Beute-System
Interessante Fragestellungen bei einer laufenden Simulation:
- Eingeschwungenes, stabiles System: Vorhersage von Populationen in der Zukunft
- Monitoring, Anormalie-Erkennung:
- verborgene Eingriffe in das System durch Wilderer erkennen
- Beginn von chaotischem Verhalten im System selbst erkennen; ggf. Empfehlungen geben zu stabilisierenden Eingriffen
- Folgen von stabilisierenden Eingriffen abschätzen
Semantisches Feature Engineering mit WordNet im Text-Corpus "20 Newsgroups"
übergreifendes Erkenntnisinteresse: Aufbau einer Mess-Station zur Bewertung verschiedener Feature Engineering Strategien anhand ihrer Auswirkung auf die Klassifikationsergebnisse
Datensatz: 20 newsgroups dataset
Teil 0, Datenvorverarbeitung: Datensatz z.B. mittels NLTK, TextBLOB, TreeTagger etc. so als Bag of words repräsentieren, so dass die Features bijektiv auf WordNet abbildbar sind:
- Nach-Implementierung z.B. von Lemmatization Approaches with Examples in Python : Wordnet Lemmatizer with appropriate POS tag
- Ergebnis: Ein bag of Words (DataFrame), bei dem die Attribute POS-getaggte WordNet-Einträge sind
Teil 1, "Pflicht": Aufbau einer Pipeline:
- CountVectorizer
- Anwendung verschiedener WordNet-basierter Feature-Engineering-Strategien
- TfidfTransformer
- klassifizieren u.A. mit multinominaler Logistischer Regession (sklearn.linear_model.LogisticRegression.html)
Ergebnisform Teil 0 und 1: Ein schön kommentiertes Notebook, das man in einer nachfolgenden Veranstaltung "Data Science" als Beispiel für Text-Klassifikation einsetzen kann.
Teil 2, "Kür":
- Diskussion und vergleichende Bewertung ohne/mit Feature Engineering Strategie
- Entwicklung eigener Feature-Engineering Strategien