Studienprojekt 2019: "Data Science"

Im Studienprojekt "Data Science" sammeln sich verschiedene kleinere Gruppen, um zu insgesamt 2-3 sich sachlich ergänzenden, organisatorisch jedoch autarken Studienprojekten Lösungen zu entwickeln. Es entsteht ein "Großprojekt" als eine Gruppe von sich ergänzenden und aufeinander abgestimmten Teilprojekten.

Um Synergien entstehen lassen zu können treffen wir uns alle paar Wochen im Plenum. Hier findet die projektübergreifende Basis-Betreuung und die Kommunikation unter den Teilprojekten statt. Zusätzlich gibt es eine Einzelbetreuung der Gruppen nach individueller Zeitvereinbarung.

Meetings (in umgekehrter zeitlicher Reihenfolge)

  • Mo 25.11. 10:30-12:00 Uhr, Raum J1.01

Analyse von Flugschreiber-Daten

Kontext:

  • Eine handelsübliche Kamera-Drohne wird mehrfach eine gerade Strecke von ca 100m hin- und zurückgeflogen. Vor jedem Flug beschädigen wir zunächst einen, dann mehrere verschiedene Rotorblätter, wie dies z.B. nach einer Landung in einem groben Acker passiert sen könnte. Auf dem Rückflug korrigiert der Autopilot der Drohne automatisch die Fluglage, indem er z.B. die Motordrehzahl erhöht oder "schräg" fliegt. Ein erhöhter Batterieverbrauch und im Extremfall ein instabiler Flug sind die Folgen. Die Blackbox-Daten liegen vorbereitet und klassifiziert vor.

Ziel:

  • Erkenne auf Basis der Flugdaten aus der Blackbox, welcher Rotor beschädigt ist und ausgewechselt werden sollte.

Extras:

  • Bei Bedarf können wir für das Studienprojekt eine geeignete Drohne anschaffen, so dass durch weitere Testflüge erweiterte Daten gewonnen werden können.

Daten:

Datenanalyse/Reporting/Visualisierung

Kontext:

  • sich eine Vorstellung eines Datensatzes machen; explorative Datenanalyse visuell; visuelle Bewertung der Modellqualität;

Ziel:

  • Analyse, Diskussion, Demonstration von 100+ Visualisierungen zur Anzeige von komplexen Datensätzen und ihren Zusammenhängen - bis hin zur interaktiver Handhabung im Browser?

Aufbau einer Lernumgebung

Kontext:

  • Mit dem Werk python-whirlwind liegt dankenswerterweise eine vergleichsweise frei wiederverwendbare Kurzeinführung in Python vor.

Ziel:

  • Aufbau einer Lernumgebung incl. umfangreichem Übungsmaterial, Tests, ggf. auto-grading, in der sich unsere Studierende im 3. Semester die Inhalte dieses Werks hands-on im Selbststudium aneignen können.
  • Plattform: zunächst für das dsci-lab; ggf. auch https://cocalc.com/

Doubletten Erkennung

Kontext:

  • Die Python-Bibliothek https://github.com/dedupeio/dedupe fasst komplexe Algorithmen zur Erkennung von Doubletten z.B. in Adress-Datenbeständen unter einer einheitlichen API zusammen.

Ziele:

  • Kennenlernen, Anwendung und ggf. Evaluation der Bibliothek
  • Identifizieren: Anwendung von (welchem) Machine Learning wo?

erste Schritte:

Kleinprojekte

Es haben sich noch verschiedene Kleinprojekte angemeldet, die sich bitte sinnvoll in lockerem Verbund einem der o.a. Themen zuordnen mögen:

Web Scraping gelbe Seiten: siehe Studienprojekt 2019: Gelbe Seiten am Bsp. Übersicht Posaunenchöre Nürnberg