Themen und Termine
Contents
Themen und Termine#
Semester-Strukturierung, hier für das WS 2022 an der HAW LA.
Der Unterricht ist DIGITAL. Zoom siehe Moodle-Kurs.
siehe auch dsci-Mindmap: http://jbusse.de/dsci-101/d_dsci-mindmap-ws2022.html
KW 41: Arbeitsfähigkeit herstellen#
Mo 2022-10-10, 10:30-14:20 Uhr
Vortrag JB:
Arbeitsweise im Kurs
oberflächliche Übersicht über diese Website
Was ist das dsci-lab?
Python lernen: Tipps siehe http://jbusse.de/dsci-lab/t_python-lernen.html
Nachbereitung heute = Vorbereitung kommende Woche:
Das dsci-lab in den nächsten 2 Tagen downloaden und installieren.
das Kaggle-Modul der Folgewoche KL > Python schon mal anschauen: grundlegende Probleme oder Hindernisse erkennbar?
ZUSATZTERMIN Mi 2022-10-12, 9-10 Uhr: Erste Hilfe
bei Installations-Problemen des dsci-lab
auch bei ernsthaften Python-Problemen
Die Theorie wird im wesentlichen abgedeckt mit:
Michael Bowles: Machine Learning in Python: Essential Techniques for Predictive Analysis. Wiley 2015. Online in der HAW LA: https://flatp20.bib-bvb.de/search?bvnr=BV043397686
KW 42: Python#
Vortrag JB:
Das Öko-System Jupyter Notebook, Jupyterbook, Zotero
jb create test
, dann die verschiedenen Dateien anschauen, spielen; auch jupytext
Strategien, um Python zu wiederholen (oder neu lernen)
Python-Ressourcen
Lernziel: Arbeitsfähig sein, alles muss funktionieren;
und zwar am einfachsten im dsci-lab,
zur Not ersatzweise auch in einer eigenen Conda-Installation, oder auch Online.
Bitte um Mithilfe bis kommende Woche:
Datensammlung Alter, Größe, Schugröße, Geschlecht (man, woman, girl boy), Details: http://jbusse.de/dsci-101/d_schuhgroesse.html
Gemeinsame Arbeitsweise:
Erste Fingerübungen in Python: Herumspielen mit Mengen, Listen, Dicts, siehe http://jbusse.de/2021_ws_dsci/python-lernen-dicts.html
Zusammenfassung: Zusammenfassung: Python -> <>
KW 43#
Gemeinsame Arbeitsweise: Wir erarbeiten uns in Einzel- oder Kleingruppenarbeit die Inhalte des aktuellen Kaggle-Moduls, nämlich KL > Intro to Machine Learning durcharbeiten.
Schritt 1, Input: Das Kaggle-Modul durcharbeiten
Schritt 2, Rekapitulation: Anhand der Zusammenfassung Zusammenfassung: intro to ml ein eigenes Notebook erstellen.
KW 44#
Kaggle-Modul: KL > Intermediate Machine Learning
KW 45#
Kaggle-Modul: KL > Data Visualization
Einführung in Bowles und die Bowles-Datensätze:
Bowles, Michael: Machine learning in Python. Essential Techniques for Predictive Analysis. Wiley 2015. Bibliothek der HAW LA: https://flatp20.bib-bvb.de/search?bvnr=BV043397686
Ort der Dateien siehe Bowles Notebooks
Gruppenarbeit, erste Runde, Auftrag: Im Yopad als Markdown-Datei einen Steckbrief erstellen, danach im Plenum Vorstellung der Ergebnisse auf Basis der öffentlichen Etherpads:
Wo in Bowles (Kapitel, Seiten, Notebooks etc.) schreibt Bowles etwas zu dem Datensatz?
recherchieren (z.B. googeln): Wo kommt der Datensatz her, wo ist er schon beschrieben?
Welche Art von ML-Problem haben wir?
Inhaltsangabe für hypothetischeS Notebook:
Schritte, um mit Regression / logistischer Regression ein Modell zu erstellen und zu testen?
Welches Feature Engineering ist hilfreich?
ab 13 Uhr: Zuerst einlesen: https://de.wikipedia.org/wiki/Glas#Einteilung_der_Gläser, dort -> Nach Art des “Chemismus”; dann nochmal Breakout-Session zu Glass und Wine, dann kurzer Bericht im Plenum
KW 46#
Kaggle-Modul: KL > Pandas
Einführung in den Datensatz “Schuhgröße”
KW 47#
Kaggle-Modul: KL > Feature Engineering
Datensatz Schuhgröße, erste Schritte zum Beispiel so: EDA Schuhgröße
verstehen, was da passiert!
dazu die Datenstrukturen nochmal genauer anschauen: Wie kann man das machen?
Hausaufgabe: Bis kommende Woche ein grobschlächtiges erstes ML-Modell “Gender” erstellen, nämlich
Gender aus den anderen 3 Attributen vorhersagen
Datensatz WS 2022: https://moodle.haw-landshut.de/mod/resource/view.php?id=396706
KW 48#
Besprechung des Modells “Gender” (Hausaufgabe aus der vergangenen Woche)
Weiteres ML-Modell “Schugröße” konstruieren:
Schuhgröße aus Alter, Körpergröße, Gender
Studienprojekt: Modelle “Gender” und “Schuhgröße” verfeinern, Datensätze beschreiben, Doku des ML-Modells erstelen