Master-Seminar IM 820: Semantisches Wissensmanagement

NEU 2019-10-18:

  • Um eine Vertretung des verstorbenen Kollegen Seel zu ermöglichen, mussten wir unser Seminar stundenplantechnisch eine Woche nach hinten von geraden auf ungerade KW verschieben. Die Vortrags-Übersicht unten ist entsprechend angepasst.

Unter dem Titel ""semantisches Wissensmanagement" wollen wir Knowledge Graphs in den Blick nehmen, in denen wir in Form von Terminologien und Ontologien Weltwissen modellieren.

Koordinaten:

  • Mi 8:45-12:00 an geraden ungeraden KW
  • Raum J0 17

Beginn: Themenverteilung in KW 40, also erste Semesterwoche:

  • Mi 2.10.2019 um 10:30 Uhr

nach Vereinbarung ggf auch ein WE Fr 16-21 + Sa 9-16 Uhr statt 3*Mi?  NEIN, d.h. wir bleiben beim 2-Wochen-Rhythmus

Moodle:

Treffen KW 42:

  • 8:45-11:00 Uhr
  • Jeder stellt 5 Min lang sein Thema vor: Spezial-Aufsatz und zugehörige Grundlagen aus den Grundlagen-Artikeln

Die Literaturauswahl des Seminars ist weitgehend identisch mit der Veranstaltung Knowledge Graphs Seminar (FSS 2019) von Prof. Dr. Paulheim der The Data and Web Science Group der Universität Mannheim.

Grundlagen

Übersicht

  • Paulheim, H.: Knowledge graph refinement: A survey of approaches and evaluation methods
  • Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs
  • Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources

Hintergrund

  • Bonatti, P.A., Cochez, M., Decker, S., Polleres, A., and Presutti, V. (eds.): Knowledge Graphs: New Directions for Knowledge Representation on the Semantic Web
  • Färber, M., Bartscherer, F., Menne, C., & Rettinger, A.: Linked data quality of dbpedia, freebase, opencyc, wikidata, and yago
  • Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co

Einzelne Vorträge

KW 45 Intro Ehrlinger Ehrlinger, L., & Wöß, W.: Towards a Definition of Knowledge Graphs
Intro Suchanek Suchanek, F., & Weikum, G.: Knowledge harvesting from text and web sources
DBpedia Lehmann, Jens, et al. DBpedia–A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia.
YAGO Mahdisoltani, Farzaneh, Joanna Biega, and Fabian M. Suchanek. Yago3: A knowledge base from multilingual wikipedias.
KW 47 Wikidata Vrandečić, Denny, and Markus Krötzsch. Wikidata: a free collaborative knowledgebase
WebIsA Seitner, Julian, et al. A Large DataBase of Hypernymy Relations Extracted from the Web
Probase Wu, Wentao, et al. Probase: A probabilistic taxonomy for text understanding
NELL Carlson, Andrew, et al. Coupled semi-supervised learning for information extraction
WordNet und GermaNet Verena Henrich and Erhard Hinrichs: Consistency of Manual Sense Annotation and Integration into the TüBa-D/Z Treebank.
KW 49 Knowledge Vault Dong, Xin, et al. Knowledge vault: A web-scale approach to probabilistic knowledge fusion
DeepDive Shin, Jaeho, et al. Incremental knowledge base construction using deepdive
DIADEM Furche, Tim, et al. DIADEM: thousands of websites to a single database
ConceptNet Speer, Robert, and Catherine Havasi. Representing General Relational Knowledge in ConceptNet 5
BabelNet Navigli, Roberto, and Simone Paolo Ponzetto. BabelNet: Building a very large multilingual semantic network
KW 51 Cyc Lenat, Douglas B. CYC: A large-scale investment in knowledge infrastructure
KnowItAll/ReVerb Etzioni, Oren, et al. Open information extraction: The second generation
[vergleich] Ringler, D., & Paulheim, H. One knowledge graph to rule them all? Analyzing the differences between DBpedia, YAGO, Wikidata & co

Vorgehen

Kurzpräsentation KW 42: lediglich text-immanent

Lit.-Recherche

  • zitierte Literatur scannen: auf welche Grundlagen bezieht sich der Text?
  • Bezüge zu den Grundlagen-Aufsätzen herstellen
  • Vorwärts-Suche: Finde (neuere) Aufsätze, die den Text zitieren

eigene Nachforschung

  • Welche Entwicklung gab es seitdem?
  • In welchen Zusammenhängen / wofür wird die Technik heute genutzt?
  • Vergleich mit anderen Texten aus der Gruppe Manual Curation | Creation from Wikipedia | Creation from Unstructured Text / Web Sources
  • Evaluationen: Wie leistungsfähig ist die Wissensrepräsentation für ihren jeweiligen Zweck?

Präsentation

  • Zeit: 20-30 Min

Inhalte

  • technisch
    • verwendete Modellierungs- oder Ontologie-Sprache
    • Größe, Abdeckung
    • Lizenz, Zugänglichkeit
    • Regeln, Inferencing?
  • Aufwand von Erstellung und Pflege
  • Evaluationen
    • precision, recall etc

Ausarbeitung