IM 970 Themen und Termine¶
Wir haben drei Blöcke:
Block 1, ungefähr Oktober: Ramp Up
Block 2, ungefähr November: Die Kaggle-Kurse
Block 3, ungefähr Dezember: Projektarbeit
Mittwoch 2021-10-06 Veranstaltungsbeginn:¶
DIGITAL
Themen:
Einführung
Zugangsdaten und erste Intro in das dsci-lab
Empfehlungen, um ganz schnell Python zu lernen
Meinungsbild: lieber digital, oder lieber in Präsenz?
A: Okt Präsenz, Nov teildigital, Dez Präsenz
Mi 2021-10-13 PRÄSENZ: Praktische Einführung in das dsci-lab¶
Raum:
K0 10 oder K0 16 (?)
Unser Markdown- und Zotero- Technology Stack fürs Publishing im Schnelldurchlauf:
trickreich und erklärungsbedürftig: Pairing von
*.ipynb
und*.md
Arbeiten mit Jupyter Notebooks:
Kaggle Learn > ganz unten der legacy snapshot
Linux lernen: Hier gibt es viele hervorragende Tutorials im Netz, so z.B.
Welcher Editor?
Grundkennisse in
vi
/vim
muss jeder kennen: damit anfangen?JB verwendet immer noch emacs, aber das ist retro.
Vermutlich würde ich heute mit https://code.visualstudio.com/ anfangen.
Spezifisch für Python ist auch https://www.jetbrains.com/de-de/pycharm/ interessant.
Mi 2021-10-20 PRÄSENZ:¶
Vortrag von Dana Simian, (ULBS, Sibiu): Machine Learning as a Black Box. A Python Perspective and Applications (in EN)
anschließend Austausch mit Dana für Interessierte
2021-10-27 bis 2021-12-01: Kaggle Learn, DIGITAL¶
Zu jedem Thema gibt JB eine Einführung, dann kollektive Einzelarbeit; für Fragen steht JB online zeitsynchron zur Verfügung.
Die Inhaltsverzeichnisse der jeweiligen Kurse finden sich unter Kaggle Learn.
2021-10-27 T 14:30 DIGITAL: intro-to-machine-learning¶
Rückblick Python lernen
Das sollten Sie können: Herumspielen mit Mengen, Listen, Dicts
Codewars?
Einführung JB in
Inhalt von KaggleLearn_ws2020.tar.gz
Entwicklungsumgebung und externer Editor:
File > Jupytext > Pair Notebook with MyST-Markdown
Inhaltliche Einführung in
2021_ws_dsci/KaggleLearn/Intro_to_Machine_Learning/IntroToMachineLearning.ipynb
Ergänzende Lektüre, sachsystematisch: http://jbusse.de/2021_ws_dsci/dsci-101-curriculum.html#lehrmaterialien-als-pdf-und-online
2021-11-03: intermediate-machine-learning¶
2021-11-10: data-visualization¶
2021-11-17: pandas¶
2021-11-24: feature-engineering¶
Block 3: Einführung in die Projekte¶
Ich stelle Ihnen die Datensätze vor, die in der Studienarbeit analysiert werden sollen
2021-12-01: Diskussion der Projekt-Aufgaben 1 + 2
2021-12-08: Diskussion Aufgabe 3
2021-12-15: CRISP-DM¶
CRISP-DM: Cross-industry standard process for data mining. CRISP-DM 1.0 Step-by-step data mining guide Pete Chapman (NCR), Julian Clinton (SPSS), Randy Kerber (NCR), Thomas Khabaza (SPSS), Thomas Reinartz (DaimlerChrysler), Colin Shearer (SPSS) and Rüdiger Wirth (DaimlerChrysler). © 2000 SPSS Inc. CRISPMWP-1104
Übersicht als Mindmap auf Moodle: crisp-dm.mm
Figure 3: Generic tasks (bold) and outputs (italic) of the CRISP-DM reference model (p.12): http://jbusse.de/2019_ws_dsci/crisp-dm_phases-tasks-outputs.html
Besprechung z.B. “2.2 Describe data”: p.18, p.39
2022-01-12, 2022-01-19¶
Abgabe der Projekte nach den Weihnachtsferien:
Präsentation der wesentlichen Aspekte 5-10 Min
Hochladen auf Moodle bis Vorlesungsende Di 2022-01-25