WIF 640 / IM 820: Knowledge Graphs
Vorbemerkungen:
- Coronabedingt finden die Veranstaltungen komplett digital statt.
- Als Lehr-Experiment ist angedacht, Studierende aus dem Bachelor- und dem Master-Studiengang zur Diskussion der jeweiligen Themen (außerhalb der synchronen Online-Slots) in Kontakt zu bringen. Deshalb diese Doppel-Homepage zu 2 verschiedenen Veranstaltungen.
In unserer Veranstaltung wollen wir Knowledge Graphs in den Blick nehmen, in denen wir in Form von Terminologien und Ontologien Weltwissen modellieren.
Die Veranstaltung wird in einem Bachelor- und einem Master-Track durchgeführt, jeweils mit unterschiedlicher Tiefe und Zielsetzung:
Bachelor-Seminar WIF 640
Do 10:30-14:20 14-tägig uKW
Termine
- Vorbesprechung: Do 2020-10-08 (KW 41), 10:30 Uhr
- Beginn: Do 2020-10-20 (KW 43)
Moodle:
-
Themenverteilung (2020-10-20 abgeschlossen): Siehe email von Prof. Jürgen Wunderlich 2020-09-29T20:34, Moodle: [[ https://moodle.haw-landshut.de/course/view.php?id=6086 ]], Pass: WIF640_Seminar - WS 20/21 Busse wif640 Bachelor-Seminar (Einschreibeschlüssel: "Bachelor")
Zoom:
-
Die Zoom-Einwähldaten werden jeweils spätestens 30 Min vor Veranstaltungsbeginn
an dieser Stellein der Moodle-Gruppe bekannt gegeben. (Sie sollten während des Semesters als "recurrent meeting" eigentlich gleich bleiben, aber man weiß ja nie).
Schwerpunkte:
- Detaillierte Darstellung der Grundidee
- Verknüpfung mit dem Gesamtzusammenhang
- wo möglich praktische Demonstration
Master-Seminar IM 820
Di 8:45-12:00 14-tägig gKW
Vorbesprechung:
-
Do 2020-10-01 (!),
8:45 Uhr10:30 Uhr
Beginn:
- Di 2020-10-13 (KW 42), 8:45 Uhr
Moodle:
- WS 20/21 im820 Master-Seminar (Busse) (Einschreibeschlüssel: "Master")
Zoom:
-
Die Zoom-Einwähldaten werden spätestens 30 Min vor Veranstaltungsbeginn
an dieser Stellein der Moodle-Gruppe bekannt gegeben. (Sie sollten während des Semesters als "recurrent meeting" eigentlich gleich bleiben, aber man weiß ja nie).
Schwerpunkte: Wir betrachten vor allem das Inferencing, das auf den im Bachelor-Track vorgestellten KG aufsetzt. Stichworte:
- Sprache
- formale Semantik
- aktuelle Inferencing-Systeme
- Details siehe unten
Eine genauere Vorstellung der Themen gibt es in der Vorbesprechung.
EINLESEN: Um sich "einzugrooven" bietet sich für beide Tracks ein Querlesen dieses hervorragend verständlich geschriebenen Büchleins an: Heiner Stuckenschmidt: Ontologien. Konzepte, Technologien und Anwendungen. Springer, 2. Aufl. 2011.
Themen für das Bachelor-Seminar
- Einführung in Knowledge Graphs
- in: Dieter Fensel u.A.: Knowledge graphs: methodology, tools and selected use cases
Springer 2020, S.1-10
- https://opac.haw-landshut.de/search?bvnr=BV046404198
- ISBN: 9783030374396
- Noy et al: Industry-scale knowledge graphs
- in: Dieter Fensel u.A.: Knowledge graphs: methodology, tools and selected use cases
Springer 2020, S.1-10
- Das RDF Datenmodell
- Hitzler et al: Semantic Web. Grundlagen
- https://opac.haw-landshut.de/search?bvnr=BV022951762
- Einfache Ontologien in RDF und RDF Schema, S. 33-88
- Hitzler et al: Semantic Web. Grundlagen
- RDF-Formate, incl. json-ld
- linked open data (LOD)
- SKOS
- OpenThesaurus
- neo4j
- Ontotext GraphDB
- DBpedia
- Lehmann, Jens, et al. DBpedia–A Large-scale, Multilingual Knowledge Base Extracted
from Wikipedia.
- DOI 10.3233/SW-140134
- Lehmann, Jens, et al. DBpedia–A Large-scale, Multilingual Knowledge Base Extracted
from Wikipedia.
- Wikidata
- Vrandečić, Denny, and Markus Krötzsch. Wikidata: a free collaborative knowledgebase
- ConceptNet
- Speer, Robert, and Catherine Havasi. Representing General Relational Knowledge in ConceptNet 5
- WordNet
- Maciej Piasecki, Stan Szpakowicz, Christiane Fellbaum & Bolette Sandford Pedersen. Introduction to the special issue: On wordnets and relations. Language Resources and Evaluation volume 47, pages757–767(2013)
- BabelNet
- Navigli, Roberto, and Simone Paolo Ponzetto. BabelNet: Building a very large multilingual semantic network
- KBpedia
- Michael Bergamnn: A Knowledge representation practitionary. Springen 2018
- DOI: 10.1007/978-3-319-98092-8
- ISBN 978-3-319-98092-8
- Michael Bergamnn: A Knowledge representation practitionary. Springen 2018
- Yago
- YAGO: A Multilingual Knowledge Base from Wikipedia, Wordnet, and Geonames
- WebIsA
- Seitner, Julian, et al. A Large DataBase of Hypernymy Relations Extracted from the Web
- schema.org
- R.V. Guha, Dan Brickley, Steve Macbeth: Schema.org: Evolution of Structured Data on the Web. Big data makes common schemas even more necessary.
- datacommons.org
Themen für das Master-Seminar
Grundsätzlich geht es darum, wie man auf Grundlage der im Bachelor-Track dargestellten Knowledge-Graphs mit logikbasierten Ansätzen neues Wissen ableiten kann. Stichworte:
- SPARQL
- SHAQL
- Cypher
- RDFS-Inferencing
- OWL2-Inferencing
- Horn-Logik, Prolog
- In den KG eingebettete Ontologien
- Klassen- vs. Instanz-Ontologien
Ergänzend besteht die Möglichkeit einer gemeinsamen Lektüre folgender aktuellen Werke:
- Dieter Fensel u.A.: Knowledge graphs : methodology, tools and selected use cases. Springer 2020
- Mayank Kejriwal: Domain-specific knowledge graph construction. Springer 2019
- Thomas Hoppe, Bernhard Humm, Anatol Reibold: Semantic applications: methodology, technology, corporate use.
Die hier genannten Themen lassen sich ergänzen. Je nach Anzahl und Interesse der TN können auch individuell weitere spannende Themen aus dem Bereich Semantic Web vereinbart werden: Bitte sprechen Sie mich an!
Durchführungsdetails
Vorgehen
- Kurzpräsentation KW 42: lediglich text-immanent; in den folgenden Wochen dann
- Lit.-Recherche
- zitierte Literatur scannen: auf welche Grundlagen bezieht sich der Text?
- Bezüge zu den Grundlagen-Aufsätzen herstellen
- Vorwärts-Suche: Finde (neuere) Aufsätze, die den Text zitieren
- eigene Nachforschung
- Welche Entwicklung gab es seitdem?
- In welchen Zusammenhängen / wofür wird die Technik heute genutzt?
- Vergleich mit anderen Texten aus der Gruppe Manual Curation | Creation from Wikipedia | Creation from Unstructured Text / Web Sources
- Evaluationen: Wie leistungsfähig ist die Wissensrepräsentation für ihren jeweiligen Zweck?
- Präsentation halten:
- Zeit: 20-30 Min
Inhalte Präsentation
- bitte mit Seiten-Nummern ...
- verwendeter Formalismus
- Datenmodell, z.B. RDF
- Abfragesprache, z.B. SPARQL
- Ontologiesprache, z.B. RDFS, SKOS, OWL, andere?
- Regeln, Inferencing?
- ggf. Endpoints: https://query.wikidata.org/, https://dbpedia.org/sparql etc.
- ggf. Server, technische Plattform; wer hostet?
- technisch
- Lizenz, Zugänglichkeit
- Größe, Abdeckung
- Erstellung und Pflege
- manuell? harvesting von Quelle? andere?
- Evaluationen
- Was heißt "Erfolgsquote"?
- Fachbegriffe erwähnt: precision, recall etc
- "Faktenchecker": ground truth, gold standard
- Konsistenz, Kohärenz etc.
- Sinnhaftigkeit der Evaluationen, Maße, Werte ...
Ausarbeitung
- ca 2k Wörter +-10%
- DE oder EN beliebig
- Aufbau z.B. http://jbusse.de/traktate/AbstractPlusDiskussion.html, aber gerne auch anders
- Abbildungen: ausschließlich selbst hergestellte (um Abdruckrechte nicht einholen zu müssen)
- Abgabe bis 15.2.2021 auf Moodle