Master-Seminar IM 820: Semantisches Wissensmanagement
NEU 2019-10-18:
- Um eine Vertretung des verstorbenen Kollegen Seel zu ermöglichen, mussten wir unser Seminar stundenplantechnisch eine Woche nach hinten von geraden auf ungerade KW verschieben. Die Vortrags-Übersicht unten ist entsprechend angepasst.
Unter dem Titel ""semantisches Wissensmanagement" wollen wir Knowledge Graphs in den Blick nehmen, in denen wir in Form von Terminologien und Ontologien Weltwissen modellieren.
Koordinaten:
-
Mi 8:45-12:00 an
geradenungeraden KW - Raum J1 07 (neu seit 2019-11-25)
Beginn: Themenverteilung in KW 40, also erste Semesterwoche:
- Mi 2.10.2019 um 10:30 Uhr
nach Vereinbarung ggf auch ein WE Fr 16-21 + Sa 9-16 Uhr statt 3*Mi? NEIN, d.h. wir bleiben beim 2-Wochen-Rhythmus
Moodle:
- https://moodle.haw-landshut.de/course/view.php?id=2578, Einschreibeschlüssel: Wissenschaft
Treffen KW 42:
- 8:45-11:00 Uhr
- Jeder stellt 5 Min lang sein Thema vor: Spezial-Aufsatz und zugehörige Grundlagen aus den Grundlagen-Artikeln
Die Literaturauswahl des Seminars ist weitgehend identisch mit der Veranstaltung Knowledge Graphs Seminar (FSS 2019) von Prof. Dr. Paulheim der The Data and Web Science Group der Universität Mannheim.
Grundlagen
Übersicht
- Paulheim, H.: Knowledge graph refinement: A survey of approaches and evaluation methods
- Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs
- Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources
Hintergrund
- Bonatti, P.A., Cochez, M., Decker, S., Polleres, A., and Presutti, V. (eds.): Knowledge Graphs: New Directions for Knowledge Representation on the Semantic Web
- Färber, M., Bartscherer, F., Menne, C., & Rettinger, A.: Linked data quality of dbpedia, freebase, opencyc, wikidata, and yago
- Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co
Einzelne Vorträge
KW 45 | Intro Suchanek | Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources | |
Wikidata | Vrandečić, Denny, and Markus Krötzsch. Wikidata: a free collaborative knowledgebase | ||
Intro Ehrlinger | Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs | ||
DBpedia | Lehmann, Jens, et al. DBpedia–A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia. | ||
KW 47 | Probase | Wu, Wentao, et al. Probase: A probabilistic taxonomy for text understanding | |
WordNet und GermaNet | Verena Henrich and Erhard Hinrichs: Consistency of Manual Sense Annotation and Integration into the TüBa-D/Z Treebank. | ||
YAGO | Mahdisoltani, Farzaneh, Joanna Biega, and Fabian M. Suchanek. Yago3: A knowledge base from multilingual wikipedias. | ||
KW 49 | WebIsA | Seitner, Julian, et al. A Large DataBase of Hypernymy Relations Extracted from the Web | |
DeepDive | Shin, Jaeho, et al. Incremental knowledge base construction using deepdive | ||
NELL | Carlson, Andrew, et al. Coupled semi-supervised learning for information extraction | ||
ConceptNet | Speer, Robert, and Catherine Havasi. Representing General Relational Knowledge in ConceptNet 5 | ||
DS | DIADEM | Furche, Tim, et al. DIADEM: thousands of websites to a single database | |
BabelNet | Navigli, Roberto, and Simone Paolo Ponzetto. BabelNet: Building a very large multilingual semantic network | ||
KW 51 | Cyc | Lenat, Douglas B. CYC: A large-scale investment in knowledge infrastructure | |
Knowledge Vault | Dong, Xin, et al. Knowledge vault: A web-scale approach to probabilistic knowledge fusion | ||
[vergleich] | Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co | ||
KnowItAll/ReVerb | Etzioni, Oren, et al. Open information extraction: The second generation | ||
RDF(S), SKOS |
Vorgehen
Kurzpräsentation KW 42: lediglich text-immanent; in den folgenden Wochen dann
Lit.-Recherche
- zitierte Literatur scannen: auf welche Grundlagen bezieht sich der Text?
- Bezüge zu den Grundlagen-Aufsätzen herstellen
- Vorwärts-Suche: Finde (neuere) Aufsätze, die den Text zitieren
eigene Nachforschung
- Welche Entwicklung gab es seitdem?
- In welchen Zusammenhängen / wofür wird die Technik heute genutzt?
- Vergleich mit anderen Texten aus der Gruppe Manual Curation | Creation from Wikipedia | Creation from Unstructured Text / Web Sources
- Evaluationen: Wie leistungsfähig ist die Wissensrepräsentation für ihren jeweiligen Zweck?
Präsentation halten:
- Zeit: 20-30 Min
Inhalte Präsentation
bitte mit Seiten-Nummern ...
verwendeter Formalismus
- Datenmodell, z.B. RDF
- Abfragesprache, z.B. SPARQL
- Ontologiesprache, z.B. RDFS, SKOS, OWL, andere?
- Regeln, Inferencing?
- ggf. Endpoints: https://query.wikidata.org/, https://dbpedia.org/sparql etc.
- ggf. Server, technische Plattform; wer hostet?
technisch
- Lizenz, Zugänglichkeit
- Größe, Abdeckung
Erstellung und Pflege
- manuell? harvesting von Quelle? andere?
Evaluationen
- Was heißt "Erfolgsquote"?
- Fachbegriffe erwähnt: precision, recall etc
- "Faktenchecker": ground truth, gold standard
- Konsistenz, Kohärenz etc.
- Sinnhaftigkeit der Evaluationen, Maße, Werte ...
Ausarbeitung
ca 2k Wörter +-10%
DE oder EN beliebig
Aufbau z.B. http://jbusse.de/traktate/AbstractPlusDiskussion.html, aber gerne auch anders
Abbildungen: ausschließlich selbst hergestellte (um Abdruckrechte nicht einholen zu müssen)
Abgabe bis 15.2.2020 auf Moodle