Präsentation 2023-09-11#

Diese Seite: Präsentation

Historie#

Baum des Wissens, Aristoteles, erstmas formal rekonstruiert von Porphyr (um 300 v. Chr.). Grundprinzip: Genus proximum, differentia specifica; hier als Fresko (18. Jahrhundert) im Bibliothekssaal des Klosters Schussenried:

_images/Schussenried_Kloster_Bibliothekssaal_Gewölbefresko_Baum_des_Porphyrius.jpg

Fig. 4 https://de.wikipedia.org/wiki/Baum_des_Wissens wikimedia#

_images/Arbor_porphyrii_according_Sowa_(2001)_GER.png

Fig. 5 Sowa 2001 (?), aus https://de.wikipedia.org/wiki/Baum_des_Wissens wikimedia#

Leitende Fragestellung#

  • Was ist eine Ontologie?

  • Was stellen wir uns vor, wenn wir von einer (Semantic Web-) Ontologie sprechen?

Begiffsbaum?, Concept Tree? Ein Netzwerk, Concept Map, Gerichteter Azyklischer Graph (DAG)?

Position JB:

  • Wir sollten uns eine Ontologie weniger als einen Baum (oder einen DAG) vorstellen,

  • sondern als eine Systematik von Unterschieden, mit denen wir dann einen Baum (oder DAG) konstruieren können.

  • Das ist rekursiv: Auch Unterschiede lassen sich systematisch unterscheiden.

mehr: http://jbusse.de/akwi2023/aufsatz_online.html#leitende-fragestellung

Strukturwissenschaftliche Sichtweise#

Formal … Eine Definition verschiedener Mengen, und wie sie zusammenhängen … keine extensionale Definition, sondern eine intensionale Definition: Wir geben charakteristische Merkmale an … typischerweise Attribut-Wert-Paare: Eine Menge wird durch die Menge der für sie charakteristischen Attribut-Wert-Paare definiert … aus einer so definierten Menge kann eine speziellere Menge (mathematisch eine Teilmenge) definiert werden, indem man ein weiteres charakteristisches Attribut-Wert-Paar hinzufügt: Wesen, körperliche Wesen, beseelte körperliche Wesen, empfindende beseelte körperliche Wesen usw.

(Je mehr charakteristische Merkmale zu einer Menge hinzukommen, desto “kleiner” wird die Menge, d.h. desto weniger Elemente wird sie haben … Rudolf Carnap hat gezeigt, dass sich einen Roundtrip zwischen extensionaler und intensionaler Mengenlehre gibt.)

Im Prinzip kann man eine Semantic Web Ontologie “bauen”, indem man in einem Text-Editor logische Formeln in FOL, DL, OWL, Turtle tippt … nur wenige Experten tun das, und auch die kommen gelegentlich durcheinander …

Baum, DAG, sematisches Netz?#

Wer in der Praxis Begrifssysteme baut und kommuniziert, editiert nicht nicht, sondern arbeitet mit Visualisierungen: Das ist im einfachsten Fall “der” Klassenbaum , siehe das einleitende Beispiel.

Komplexer als ein Baum wäre ein gerichteter, azyklischer Graph (DAG). Ein frühes Beispiel, nicht mehr aktuell:

_images/Fig1CmapAboutCmaps-large.png

Fig. 6 Quelle: Technical Report IHMC CmapTools 2006 / 2008, https://cmap.ihmc.us/docs/theory-of-concept-maps (img src)#

So etwas würde man heute als Knowledge Graph bezeichnen. Probleme beim CMAP-Beispiel:

  • Die Semantik der Kanten ist semantisch komplett unbestimmt

  • Concepts - are - Hierarchically Structured: Will diese Abbildung ein Beispiel dafür sein?

Ein positives Beispiel: Eine „netzartige“ und dennoch gültige Visualisierung einer Ontologie liegt z.B. OntoLex-Lemon bei: Cimiano 2016 > https://www.w3.org/2016/05/ontolex/Lemon_OntoLex_Core.png. Jede Kantenbezeichnung kommt genau einmal vor, eine Domain-Range-Semantik aus RDFS ist eine mögliche und gültige Interpretation der gerichteten Kanten.

Modellierungsbeispiel: Gewässer (EN)#

https://en.wikipedia.org/wiki/Body_of_water:

Text

  • Canal – an artificial waterway, usually connected to (and sometimes connecting) existing lakes, rivers, or oceans. (rc)

  • Channel – the physical confine of a river, slough or ocean strait consisting of a bed and banks. See also stream bed and strait. (rc)

  • Lagoon – a body of comparatively shallow salt or brackish water separated from the deeper sea by a shallow or exposed sandbank, coral reef, or similar feature. (lscm)

  • Lake – a body of water, usually freshwater, of relatively large size contained on a body of land. (nsc)

  • Maar – NO ENTRY (snc)

  • Puddle – a small accumulation of water on a surface, usually the ground. (tns)

  • Pond – a body of water smaller than a lake, especially those of artificial origin. (nsc)

  • Pool – various small bodies of water such as a swimming pool, reflecting pool, pond, or puddle. (nsc)

  • Reservoir – a place to store water for various uses, especially drinking water, which can be a natural or artificial (see lake and impoundment). (sc)

  • River – a natural waterway usually formed by water derived from either precipitation or glacial meltwater, and flows from higher ground to lower ground. (rnc)

  • Rivulet – (UK, US literary) a small or very small stream. (rnc)

  • Runnel – NO ENTRY (rnc)

  • Sea – a large expanse of saline water connected with an ocean, or a large, usually saline, lake that lacks a natural outlet such as the Caspian Sea and the Dead Sea. In common usage, often synonymous with the ocean. (nscm)

  • Stream – a body of water with a detectable current, confined within a bed and banks. (rnc)

  • Tarn – a mountain lake or pool formed in a cirque excavated by a glacier. (nsc)

  • Torrent – NO ENTRY (rnc)

  • Trickle – NO ENTRY (rnc)

Liniendiagramm automatisch konstruieren: FCA#

Formal Concept Analysis (FCA), https://en.wikipedia.org/wiki/Formal_concept_analysis:

_images/FCA_body_of_water_formal-context.png

Fig. 7 „Formaler Kontext“ aus https://en.wikipedia.org/wiki/Formal_concept_analysis#Example#

_images/1175px-FCA_body_of_water.svg.png

Fig. 8 „Liniendiagramm“ aus https://en.wikipedia.org/wiki/Formal_concept_analysis#Example#

Die FCA analysiert und visualisiert die Zusammenhänge in einem empirisch vorgegebenen Beipiel-Datensatz. FCA setzt voraus,

  • dass man die Welt schon vorab in Klassen, Attribute und Werte einteilt;

  • und auch die Auswahl der Beispiele muss stimmen.

Problem: in dieser Abbildung lässt sich nicht ablesen, welche Attribut-Wert-Paare (a) zwar vorkommen können, aber in den Beispielen nicht enthalten waren; und welche anderen Attribu-Wert-Paare sich (b) “logisch” ausschließen.

Wissen, das man zusätzlich hineinstecken und formal erfassen will:

  • running vs. stagnant: r XOR s

  • temporary vs. constant: t XOR c

  • Süßwasser vs. Salzwasser

  • etc.

Gewässer (DE)#

vorbildliche Systematik von Einteilungskriterien - manuell konstruiert

Text

https://de.wikipedia.org/wiki/Gew%C3%A4sser, Inhaltsverzeichnis:

1 Gewässertypen

  • 1.1 Nach Haupt- und Nebengewässer

  • 1.2 Nach Lage des Wasserkörpers

  • 1.3 Nach Stellung im Gewässersystem

    • 1.3.1 Grundsätze

    • 1.3.2 Binnengewässer

      • 1.3.2.1 Fließgewässer

      • 1.3.2.2 Stillgewässer

    • 1.3.3 Meere

  • 1.4 Nach dem Strömungsverhalten

  • 1.5 Nach Wasserführung im Zeitverlauf

  • 1.6 Nach Nährstoffgehalt

  • 1.7 Regionale Gewässertypen

  • 1.8 Im Wasserrecht

Interessant die Visualisierung als Mindmap:

_images/wikipedia_gewaesser-DE_Gewaesserdiagramm.png

Fig. 9 Wikipedia > Gewässer, Abbildung Mindmap: Klassifikation der Gewässer#

Gewässer (DE) mit GenDifS#

Nocheinmal Introspektion: Was stelle ich mir heute vor? Anlass zum Umdenken war 4 Advanced SKOS: When KOSs are not Simple Anymore:

SKOS makes it possible to define meaningful groupings or “collections” of concepts. (4.1 Collections of Concepts)

milk
  <milk by source animal>
    cow milk
    goat milk
    buffalo milk

Übertragen auf das Gewässer-Beispiel lautet die Leitfrage: Nach welchen Kriterien lassen sich welche Gewässer-Typen weiter unterscheiden?

_images/Gewässer_2023_DE_akwi2023.png

Fig. 10 Wikipedia > Gewässer, Struktur in GenDifS#

Die formale Semantik dieser Mindmap ergibt sich aus der Übersetzung jedes einzelnen Knoten in seinem spezifischen in eine formale Logiksprache, hier: OWL im Format Turtle. Details siehe Semantik Gewässer-Beispiel.

Zusammenfassung#

Ontologie konventionell: Ein Baum (oder Netzwerk) von Klassen; Bsp.:

  • Nahrungsmittel

    • Milch

      • Kuhmilch

      • Ziegenmilch

      • H-Milch

      • Tetrapack-Milck

      • Vollmilch

      • Bio-Milch

Einsicht aus 4 Advanced SKOS: When KOSs are not Simple Anymore: Interessanter als die Klassen an sich sind die Unerscheidungs-Merkmale.

Ontologie interessanter: Eine Systematik von Unterscheidungen.

GenDifS erlaubt solche bequemer, konziser, systematischer zu notieren als andere Ontologiesprachen.