Lawinengefahrenprognose mit Text Analytics und Maschinellem Lernen

To ski or not to ski, that is the question: Lawinengefahrenprognose mit Text Analytics und Maschinellem Lernen

Gastvortrag von Ulrich.Reincke at sas dot com

Koordinaten:

  • Mi 8.1.2020
  • 14:30 Uhr Vortrag und Diskussion
  • ab ca 16:00 Hands-On Workshop
  • HAW Landshut, Raum Z005

In den Alpen sterben jedes Jahr rund 100 Menschen bei Lawinenunfällen. Die meisten Unfälle geschehen in einem Skitourenkontext außerhalb von gesicherten Pisten und Skigebieten.

Ein Werkzeug, das Lawinen voraussagt, existiert nicht und wird es auf absehbare Zeit nicht geben. Die Website Skitourenguru.ch ist jedoch in der Lage, zweimal täglich eine Risikoschätzung für 1200 Skitouren in der Schweiz abzuleiten und zu veröffentlichen. Ziel von Skitourenguru.ch ist es, eine rationale Entscheidungsfindung in der Planungsphase vor einer Skitour zu unterstützen, sei es, einen weniger riskanten Gipfel als Tagesziel zu wählen oder gar nicht zu auf Tour zu gehen.

Der Algorithmus von Skitourenguru verarbeitet die elektronisch verfügbare Informationen über die Geografie und Topographie des Gelände sowie der vorhergesagten Wetter-, Schnee- und Lawinenverhältnisse gemäß dem öffentlichen Lawinenbulletin.

Das Lawinenbulletin drückt das "Lawinengefahrenniveau" auf einer diskreten Skala mit fünf Klassen aus. Ein zusätzlicher Textblock in englischer, französischer, deutscher und italienischer Sprache beschreibt verbal die gültigen Schnee- und Lawinenverhältnisse. Die diskrete Eigenschaft der der fünf veröffentlichten "Gefahrenniveaus" bereitet den Berechnungen von Skitourenguru.ch bei der kontinuierliche Verteilung des Lawinenrisikos in Raum und Zeit ein Problem.

Wir schlagen eine Methode vor, die auf Textanalytik und Gradient Boosting basiert, um aus den im Lawinenbulletin enthaltenen Textinformationen einen "kontinuierlichen Gefahrenindikator" abzuleiten. Als Nebeneffekt werden einige interessante Erkenntnisse diskutiert:

  • a) über die Konsistenz des Lawinenbulletins,
  • b) über die Genauigkeit und Grenzen des resultierenden "Gefahrenindikators" in verschiedenen Sprachen und
  • c) über die besten Textanalysekalibrierungen für verschiedene Sprachen und deren Grenzen.