Grundbegriffe: Thesaurus, Taxonomie, Ontologie ============== Grundlage: . Eind umfangreicher Aufsatz, der auch viele einschlägige Abbildungen diskutiert. ## Begriffsverständnis in GenDifS *Folksonomy*: Liste von Wörtern *Schlagwortverzeichnis* in einem Buch: Liste von Controlled Terms, wir würden sagen: Begriffen *Glossar*: Liste von Begriffen samt natürlichsprachlicher Erklärung Thesaurus: * konsensuales Grundverständnis: * vorwiegend als Baum strukturierte Sammlung von Wörtern oder Begriffen (vgl. [Q: What's the difference between 'concept-oriented' and 'term-oriented' models of thesaurus structure?](https://www.w3.org/2001/sw/wiki/SKOS/FAQs#Q:_What.27s_the_difference_between_.27concept-oriented.27_and_.27term-oriented.27_models_of_thesaurus_structure.3F)) * idealerweise Begriffe, plus Wörter als Labels, scope, documentation-properties etc. * entsteht praktischweise durch die Höher-Strukturierung eines Glossars * chrakteristische "Baum-Relation": broaderTerm Taxonomie: * konsensuales Grundverständnis: * Klassifikationsschema zur Einordnung von Objekten in einen Baum (allgemeiner: Verband) von Kategorien anhand ihrer Eigenschaften * vorherrschende Baum-Relation: subclass * vgl. auch [ Wikipedia -> Taxonomie und Typologie](https://de.wikipedia.org/wiki/Klassifikation#Taxonomie_und_Typologie) Ontologie: * konsensuales Grundverständnis: : "sprachlich gefasste und *formal geordnete* Darstellungen einer Menge von Begriffen und der zwischen ihnen bestehenden Beziehungen in einem bestimmten Gegenstandsbereich" (Hervohebung JB) * Wir interpretieren *formal geordnet* stark in Sinne von *in formaler Logik axiomatisiert*, und zwar so weit, dass ein Standard-Reasoner auf Grundlage dieser Axiomatisierung logisches Inferencing betreiben kann. * Typische Sprachen sind z.B. OWL, F-Logic, Prädikatenlogik, Prolog etc. (Auch in RDF(S) kann man eine Ontologie formulieren, auch wenn die Inferencing-Ausdruckskraft von reinem RDF(S) für praktische Zwecke eher zu schwach ist). * chrakteristische "Baum-Relation": Teilmengen-Beziehung, subclass ## FAQ: Ist ... eine Ontologie? Q: Ist SKOS eine Ontologie? A: Ja, SKOS ist eine Ontologie - falls man unter SKOS das Schema versteht, mit dem sich auf Instanzebene Wissen nach Art eines Thesaurus organisieren lässt: * SKOS ist eine Ontologie, die für die Wissensrepräsentation "Thesaurus" ein Schema liefert. * In der Ontologie SKOS werden nur drei Begriffe definiert, nämlich `skos:Concept`, `skos:Collection`, `skos:ConceptScheme`, sowie mehr als ein Dutzend zugehöriger Properties. * SKOS wurde zunächst in OWL Full formuliert. Um SKOS praktisch nutzbar zu machen, gibt es SKOS auch in der Version OWL-DL. Q: Ist ein gemäß dem SKOS-Schema modellierter Thesaurus eine Ontologie? A: Ein SKOS-Thesaurus ist ein Thesaurus, aber keine Ontologie - zumindest nicht gemäß der o.A. Definition von Ontologie. Denn wir wollen nicht jede beliebige Graph-Struktur, wie sie auch in einem Thesaurus ohne Zweifel vorkommt,, als eine *formale Ordnung* interpretieren. Q: Ist eine Taxonomie eine Ontologie? A: Grenzwertig, eher nicht. Es kommt m.E. darauf an, wie weit das Kriterium der formalen Ordnung erfüllt ist. Q: Ist GenDifS eine Ontologie? A: Nein. GenDifS ist eine Sprache, genauer: eine Sprache, mit der sich Taxonomien abstrakt formulieren lassen. Q: Ist eine in GenDifS formulierte Taxonomie eine Ontologie? A: Es kommt darauf an, welcher Export primär beabsichtigt ist. * Der SKOS-Export erzeugt einen SKOS-Thesuarus. Hier entsteht also keine Ontologie. * Der OWL-Export erzeugt eine OWL2-RL Ontologie. Hier sind Axiome enthalten, die in Verbindung mit einem Standard-OWL2-RL-Reasoner (z.B. [Python > OWL-RL](https://owl-rl.readthedocs.io/en/latest/)) die in einer Taxonomie erwünschte Klassierung von Instanzen out-of-the-box besorgen. Wir würden diesen Export als eine leichtgewichtige Ontologie bezeichnen. Q: Ist eine Concept Map eine Ontologie? A: Nein, denn es fehlt die formale Ordnung. * Insbesondere ist (außer bei `is_a`) die Semantik der Relationen weitgehend unbestimmt. Diskussion siehe {doc}`e_rel-semantik`. * Allerdings können Concept Maps Wissen ausdrücken, das von GenDifS-Ontologien nicht ausgedrückt werden kann, und sind für den Prozess und das Ergebnis von Wissen-Schöpfung hoch relevent. Ontologien und Concept Maps sind komplementär, siehe {doc}`dagstuhl2022_ertraege`. Unterschied Thesaurus - Ontologie ----------- Der Unterschied zwischen einem Thesaurus und einer Ontologie kann man auch darin sehen, in welcher der Richtungen bottom-up und top-down man wir schlussfolgern können. * bottom-up: Aus der Zugehörigkeit zu einer (Unter-)Klasse (z.B. X ist eine Ziegenmilch) kann man auf die Zugehörigkeit zu einer allgemeineren (Ober-) Klasse schließen (z.B. X ist eine Milch). Einzelfall: X ist eine Ziegenmilch. Regel: Jede Ziegenmilch ist eine Milch. Klassierung: Also ist X eine Milch. * top-down: Aus der Zugehörigkeit eines Beispiels X zu einer Oberklasse (z.B. X ist eine Milch) und einer zusätzlichen (genauer: bisher nicht ausgewerteten) charakteristischen Eigenschaft (z.B. X stammt von einer Ziege) kann man auf die Zugehörigkeit zu einer spezielleren Klasse schließen (z.B. X ist eine Ziegenmilch), die durch diese zusätzliche Eigenschaft bestimmt ist. Einzelfall: X ist eine Milch, und X stammt von einer Ziege. Regel: Eine Milch, die von Ziegen stammt, ist eine Ziegenmilch. Klassierung: Also ist X eine Ziegenmilch. In diesem Beispiel ist "stammt von einer Ziege" die charakteristische Eigenschaft, die eine Teilmenge aller Milche als Ziegenmilch kennzeichnet. GenDifS ist darauf ausgelegt, genau solche Spezialisierungen als Baumstruktur zu notieren: Milch BY hat Quelle SOME Tier Ziegenmilch SOME Ziege