dsci-ml 2022-12-05#

einlesen : https://www.kaggle.com/code/dansbecker/basic-data-exploration (Datenvisualisierungen: https://www.kaggle.com/learn/data-visualization –> wo Ausreißer?)

mit train_0 daten#

split in train_0 + test_: https://www.kaggle.com/code/dansbecker/model-validation

  • train-Set

  • test … wegsperren!

zirkulär? parallelisieren?

(Datenvisualisierungen: https://www.kaggle.com/learn/data-visualization) ML-Modell 1 bauen

Modell deployen#

Modell 2 (das erste Schlussmodell) bauen

  • Hyper-Parameter sind fix, aus dem Bau von Modell_1

  • alle verfügbaren Daten heranziehen - auch die Test-Daten aus dem split train_0 + test 0 für neue Datensätze Pipeline Bausteine bauen : https://www.kaggle.com/code/alexisbcook/pipelines

  • säubern

  • neue features einfügen

  • separieren Modell beobachten