Machine Learning mit Python (dsci-ml-py)

Skizze für ein FWP

  • FWP Studiengang WIF, Schwerpunkt BWL
  • auch offen für Bachelor IF

Inhalte

Machine Learning gewinnt in immer mehr Disziplinen an Bedeutung. Der Kurs gibt anhand typischer WIF-Probleme eine praktische, niedrigschwellige Einführung in einfache Datenanalysen und Machine Learning.

Wir diskutieren exemplarisch Anwendungsfälle aus der WIF wie z.B.

  • die Bepreisung von Immobilien (Boston Housing Dataset)
  • Die Klassifikation von Texten (20 Newsgroups Dataset)
  • Beispiele aus dem Bereich Linked Open Govermemt Data (LOGD)

Die Studierenden erhalten als VirtualBox ein fertig konfiguriertes virtuelles Data Science Lab "to go" (dsci-lab) an die Hand, in dem grundlegende Experimente vorkonfiguriert vorliegen. Die Handhabung dieses virtuellen Labors und seiner Instrumente gehört zu den primären Lerninhalten.

Der Kurs beinhaltet eine niedrigschwellige Einführung in Xubuntu-Linux, Python und Scikit-Learn. Bezüglich ML beschränken wir uns auf "in der Breite" praxisrelevante Verfahren wie insbesondere die (auch logistische) Regression. Neuronale Netze, Deep Learning spielen für uns keine Rolle.

Voraussetzungen

Die Studierenden haben eine Einführung in die Programmierung mit C und/oder Javaim Umfang von idealerweise 10 ECTS gehört. Wir setzen voraus, dass die Studierenden einfache prozedurale Programme codieren können.

Für das dsci-lab ist ein eigener Laptop erforderlich, der nicht älter als 3-4 Jahre sein und über ca 50 GB freien Plattenplatz verfügen sollte.

Bezüglich Mathematik genügen Abitur-Kenntnisse.

Medien

Neben dem vom Dozenten bereitgestellten dsci-lab verwenden wir Elemente einschlägiger bekannter Online-Lernumgebungen, insbesondere aus https://www.kaggle.com/learn/ die (jeweils ca vierstündigen Mikro-) Kurse Python, Data Visualization und Intro to Machine Learning.

Die Kommunikation im Kurs findet auf DE statt; sujet-typisch liegen die meisten online Lernmedien allerdings ausschließlich in EN vor.

Sonstiges

Die Veranstaltung wird digital über Zoom durchgeführt.

Für Studiengangleiter: Kontext des Moduls

Im Studiengang WIF wird derzeit die Programmiersprache C durch Python ersetzt. Das vorliegende FWP hat solche Studierende als Adressaten, die in einem höheren Semester den Übergang von C oder Java zu Python am Beispiel ML schnell vollziehen wollen - und zwar nicht in Form eines Programmierkurses, sondern praxisorientiert anhand ausgewählter (hier WIF-naher) Datensätze.

Im Unterschied zu Veranstaltungen wie etwa "Programmieren 1" (WIF160) oder "Programmieren 2" (WIF260) wird im vorliegenden Modul nicht in Programmieren eingeführt, sondern Programmierkenntnisse (im Umfang von einem Studienjahr, ca 10 ECTS) in einer Sprache wie z.B. C und/oder Java werden vorausgesetzt.

Das Modul thematisiert Python als Zweit- oder Drittsprache für Studierende, die bereits in einer prozeduralen Sprache einfache Algorithmen implementieren können. Bezüglich Programmierung neu sind Python-Besonderheiten wie insbesondere List Comprehension, vektorisierte Operatoren oder andere spezifische Python-Idiomatiken, die aus C oder Java keine Rolle spielen.

In der Terminologie der GI: Data Science: Lern- und Ausbildungsinhalte adressiert das Modul insbesondere auch Studierende vom Typ "Persona B" und kann nach Absprache auch für Studierende anderer Studiengänge angeboten werden.

Vorsicht Missverständnis: Primäres Thema des Moduls sind grundlegende Techniken der Datenanalyse mit Python. Das Erlernen von Python selbst ist dagegen lediglich ein erwünschter Nebeneffekt. Der Kurs ist kein dezidierter Programmierkurs und insbesondere für Programmier-Anfänger ungeeignet.