Klausur¶
WS 2021:
Mi 26.1.2022, 10:30-12 Uhr, A0 01/02 (Angabe ohne Gewähr, maßgeblich ist der offizielle Prüfungsplan!)
Hilfsmittel¶
Als Hilfsmittel zugelassen ist ein in eigenen Worten selbst verfasstes Skript.
Das ist typischerweise das Jupyterbook aus dem LN, das gerne beliebig erweitert werden kann - solange es eben in eigenen Worten und selbst verfasst wurde.
Das Skript ist mit der Klausur abzugeben.
Eine Klausur ohne abgegebendes Skript führt zu einer 5.0.
Ausnahme: Sie deklarieren zu Beginn der Klausur, dass Sie die Klausur ohne Hilfsmittel durchführen (z.B. weil Sie ihr Skript zuhause vergessen haben?): Bitte in der ersten Reihe Platz nhemen, auf der Klausur vermerken lassen.
Sollten im Skript Textteile enthalten sein, die nicht selbst verfasst sind, erfüllt dies den Tatbestand eines Unterschleifs.
Je nach Anteil oder Informationsgehalt der Fremdtexte führt dies in der Klausur zu einem Notenabzug bis hin zu einer 5.0.
Was kommt ‘dran?¶
Insbesondere ist alles wichtig, was in Themen und Termine durch KLAUSUR gekennzeichnet ist.
Da als Hilfsmittel ein (in eigenen Worten selbst verfasstes) Skript zugelassen ist, werden Fragen, die rein auf Auswendiglernen abzielen, die Ausnahme sein. Eher geht es also um Verstehen.
Aufgabentypen¶
NEU 2022-01-17
Aufgabentyp “Was ist der Unterschied zwischen …”¶
Die Antwort hat drei Teile:
(1) die Gemeinsamkeit, z.B. die gemeinsame Obeklasse
(2) und (3): die charakteristischen Unterschiede.
Beispiel:
Q: “Was ist der Unterschied zwischen Regression und Klassifikation?”
A: “In beiden Fällen gilt es aus einer Liste von x-Werten einen y-Wert vorherzusagen. Bei der Regression ist dieser y-Wert eine Zahl. Dagegen ist bei der Klassifikation dieser y-Wert eine Kategorie.”
Klausurvorbereitung¶
Den Stoff nochmal durchgehen, und im Skript (zugelassenes Hilfsmittel) selbst und in eigenen Worten zusammenfassen. Im Einzelnen:
KW 41: Berufsfeld Data Science¶
(siehe auch Technology-Stack Markdown, Jupyterbook, Zotero > b Inhalt erstellen). Data Science Jobs:
Achtung: Die einzelnen Seiten meiner Website sind hier leider inkonsistent (-> im WS 2022 besser machen). Für die Klausur interessieren uns diese Rollen:
Data Scientist
Data Analyst
Data Engineer
Data Architect
Machine Learning Engineer
KW 42: Wissenschaftliche Begriffbildung und wiss. Zitieren¶
Unterschied Wort (Term, Bezeichnung) und Begriff; RDF, URI, Ressource, Literal. Thesaurus-Grundlagen_2015-01-18.pdf.
Wissenschaftliches Zitieren: “7.2.3 Korrekte Zitierweise der verarbeiteten Literatur”, incl. den verschiedenen Formen von Plagiaten, aus Kornmeier, Martin (2018): Wissenschaftliches Arbeiten leicht gemacht
KW 43: dsci-lab¶
Es gab eine Einführung in die virtuelle Maschine; für die Klausur brauchen wir die wichtigsten Befehle der Linux bash aus https://www.ernstlx.com/linux90bash.html
(siehe auch KW 49)
KW 44: dsw2020, Kapitel 1, S. 2-6¶
Begriffe: siehe LN Aufgabe 3: Aufgabe 3: Glossar anlegen zu dsw2020, Kapitel 1, S. 2-16
KW 45: Wir erzeugen den Datensatz “Statur”¶
technisches wissen, Praxis; Ergebnis vor allem LN:
Pandas DataFrame, Series, CSV, JSON (dsw2020 S.17-25) KLAUSUR
dsw2020 Kapitel 10: Analyzing a Dataset (S. 445-497) KLAUSUR (nur in Grundzügen)
LN: Aufgabe 4: Mini-Doku zu Pandas DataFrame KLAUSUR
LN: Aufgabe 5: Einen Datensatz bereinigen KLAUSUR
KW 46: Exkurs Wissenschaftstheorie¶
KLAUSUR
KW 47: Datensatz-Typen¶
Datensatz-Typen: Unterscheide
“Typ” des Datensatzes
Modelltyp
Algorithmus, der ein Modell erzeugt
KW 48: Freeplane¶
Tool: freeplane
Shortcuts: http://jbusse.de/traktate/freeplane_keyboard_shortcuts.html
KW 50: The Moral Machine¶
KW 50: Fehler und Fakes¶
(1) Viele Begriffe für das eigene Skript
(2) Katharina A. Zweig: Wo Maschinen irren können, insbesondere Abbildung 4: Mögliche Fehler im Entwicklungs- und Einbettungsprozess von algorithmischen Entscheidungssystemen (S.21) KLAUSUR
(3) Angenommen, Sie sollen unseren Datensatz “Statur” vorsätzlich und irreführend so erzeugen, dass Frauen “objektiv” gesehen größer und schwerer sind als Männer: Was können Sie tun, um auch auf einen zweiten Blick den Anschein von Wissenschaftlichkeit vorzutäuschen? (mögliche Klausurfrage)
KW 51: Clustering-Algorithmen¶
KNN, K-means
die 5 V
KW 2/2022: KI und Diskriminierung¶
Allgemeinwissen:
die 6 Items aus dem Allgemeinen Gleichbehandlungsgesetz
Text: Backlink > https://www.plattform-lernende-systeme.de/publikationen-details/kuenstliche-intelligenz-und-diskriminierung-herausforderungen-und-loesungsansaetze.html?file=files/Downloads/Publikationen/AG3_Whitepaper_250619.pdf
Begriff Diskriminierung
S.14-15, Abschnitt “3. Herausforderungen” (ohne den Kasten Deep Learning)