Studienarbeit#

Thema der Studienarbeit: ML-Modell zu einem bisher unbekannten Datensatz.

  • Datensatz wird bekannt gegeben Anfang Dezember

  • gemeinsame Besprechung der groben Analyse-Strategie noch in der Veranstaltung dsci-ml

  • JB gibt gerne Feedback

    • gerne in Bezug auf gröbere Fehler

    • aber nicht mehr bzgl. einer Verbesserung von „gut“ auf „sehr gut“

Technik:

  • Ein (einziges) Jupyter Notebook, das bei JB im dsci-lab läuft

Bezug zu den Vorlesungsinhalten:

  • Bitte nicht irgend eine Analyse und irgend ein ML-Modell, sondern Bezug zu den Techniken und Methoden aus der Veranstaltung.

  • Ausnahme nach Absprache möglich, falls Sie bereits Vorkenntnisse haben und diese sinnvoll einsetzen können. (Aber Vorsicht vor Lösungen mit Neuronalen Netzen, Deep Learning etc.: Diese sind für uns nur interessant, wenn sie ähnlich erklärbar sind wie die in der Veranstaltung verwendeten ML-Modelle.)

Abgabe:

  • Sonntag nach Vorlesungsende im Januar 2024 auf Moodle

  • Eine Abgabe jetzt im WS 2023 wird dringend empfohlen: Für das SS 2024 ist ein Forschungsfreisemester vorgesehen. Aus Gründen der Gleichbehandlung bin ich gehalten, für eine Nachzügler-Abgabe im SS einen völlig neuen, in der Veranstaltung noch nicht besprochenen Datensatz zur Bearbeitung auszugeben. Da auch die Bearbeitungszeit ähnlich sein soll, wird das Ausgabedatum ca. sechs Wochen vor Vorlesungsende, also ca. Anfan Juni sein.

Gruppenarbeit grundsätzlich („defaultmäßig“) JA:

  • Ja, bitte erarbeiten Sie sich den Stoff und die Lösungsstrategie zur Studienarbeit idealerweise in kleinen Arbeitsgruppen.

  • Dennoch gibt jeder ein eigenes, selbst geschriebenes Jupyter Notebook als Studienarbeit ab.

    • Gruppen-Mitglieder unbedingt im Deckblatt der Studienarbeit mit aufführen.

Gruppenarbeit Ausnahmen, nach Absprache mit JB: Gruppe mit 2 oder 3 Mitgliedern gibt eine gemeinsame Studienarbeit ab:

  • die dann aber den 2- oder 3-fachen Umfang hat, und selektiv deutlich mehr in die Tiefe geht als eine einzelne Studienarbeit

  • penible Kennzeichnung der Autorschaft der entsprechenden Teile

  • typische Arbeitsteilung z.B. EDA, Datenqualität bewerten, verbessern; Feature Engineering; Auswahl und Tuning eines ML-Modells; Bewertung des Modells duch Kennzahlen; Überwachung des Modells nach Deployment