Python 101 LN 5

Contents

Python 101 LN 5#

(Sie brauchen übrigens in Ihren Lösungs-Zellen keine Metadaten mehr angeben, ich habe mein Auswertungs-Skript geändert. Wichtig ist, dass Sie die Dateinamens-Konvention beachten, Danke!)

In unserer Vorlesung woche-6-kw-47 haben wir das Tutorial https://www.jbusse.de/jvdp-jb/e_r1b.html besprochen. Im vorliegenden Übungsblatt geht es darum, dass Sie dieses Tutorial 1:1 auf ein eigenes Beispiel anwenden.

Sie können die Aufgabe fast mit copy und paste lösen. Idealerweise streben Sie aber an, etwas zu lernen. Gehen sie die die Aufgabe dazu wir folgt an:

  • (a) studieren Sie das Tutorial;

  • (b) identifizieren Sie Puzzle-Stücke_ lösen Sie einzelne Teilaufgaben zunächst separat

  • (c) sezten Sie dann Ihre Puzzle-Stücke zu einer Gesamtlösung zusammen; das Tutorial ziehen Sie nur noch im Notfall heran.

Spielsituation. Sie sind ein Wissenschaftler / eine Wissenschaftlerin, die den Zusammenhang zwischen Körpergröße, Gewicht und Schuhgröße bei Menschen herausfinden will. (Was meinen Sie: Ist die Schuhgröße eines Menschen vom Gewicht abhängig?)

Aufgabe#

Erstellen Sie z.B. in LibreOffice (im dsci-lab enthalten) oder einem anderen Tool ihrer Wahl eine CSV-Datei mit folgenden Spalten:

  • erforderlich: Erhebungsdatum, Alter, Geschlecht, Körpergröße

  • optional: Gewicht, Schuhgröße.

Füllen Sie diese Tabelle mit einigen wenigen Echtdaten aus Ihrem privaten Umfeld außerhalb der Hochschule aus:

  • Mindestens drei Kinder oder Jugendliche jünger als 16 Jahre, und

  • mindestens drei Personen älter als 16 Jahre.

Speichern Sie diese Datei im selben Verzeichnis wie dieses IPYNB-Notebook.

Lesen Sie diese Tabelle mit Pandas ein:

...
Ellipsis

Überführen Sie das Pandas Dataframe mit der Methode to_dict(orient='list') in ein Dict aus Listen:

...
Ellipsis

Berechnen Sie Statistiken wie Durchschnitt, Minimum, Maximum mindestens für für die Spalte Körpergröße:

...
Ellipsis

Wer es hinbekommt: Wir benötigen diese Kenngrößen typischerweise für alle Datenspalten: Erstellen Sie eine geeignete Funktion!

...
Ellipsis

Speichern Sie Ihr Kenngrößen in einem Dict von Dicts z.B. so:

Statistiken = { "Körpergröße": { "min": ..., "max": ..., "avg": 166 },
   "Gewicht": { "min": ..., "max": 102, "avg": ...}
}

Nun kann man auf die Statistiken einfach zugreifen:

# Test
Statistiken["Körpergröße"]["avg"] == 166
Statistiken["Gewicht"]["max"] == 102
# usw.
True