Relationen in Semantischen Mindmaps
Gute Einführung in die Thesaurus-Praxis: http://www.willpowerinfo.co.uk/thesprin.htm
Unsere eigentliche fachliche Basis:
- praktikabel fürs Bachelor-Studium: Simple Knowledge Organization System (SKOS) http://www.w3.org/2004/02/skos/
- für Experten im Master-Studium: OWL 2 Web Ontology Language http://www.w3.org/TR/owl2-primer/
Hier eine Kurzanleitung für ein sehr einfaches Thesaurusmodell, mit dem wir uns im ersten Semester Wirtschaftinformatik an erste Terminologiearbeit wagen wollen.
Hierarchie-Relationen: ISA, PARTOF, BT
Hierarchie-Relationen wollen wir `1:n`-Relationen nennen. Mit ihnen lässt sich insbesondere ein Baum aufspannen.
Ihre "Richtung" in einer Semantischen Mindmap geht, falls nicht anders angegeben, von außen (den Blättern, in freemind rechts) nach innen (zur Wurzel, in freemind nach links).
is a (ISA)
"is a" (englisch) heißt einfach "ist ein", und zwar als Teilmenge-Beziehung.
Wir wollen als synonyme Aussagen betrachten:
- Ein Pferd ist ein Tier.
- Pferde sind Tiere.
- Jedes Ding, das ein Pferd ist, ist auch ein Tier.
- Die Menge der Pferde ist eine Teilmenge der Menge der Tiere.
Beispiel:
- Lebewesen
- ISA
- Tier
- ISA
- Pferd
- Zebra
- ISA
- Pflanze
- ISA
- Apfel
- Gras
- ISA
- Tier
- ISA
Teilmengen-Beziehungen sind *transitiv*: In obigem Beispiel kann man aus den Sätzen "Pferde sind Tiere" und "Tiere sind Lebewesen" logisch schlussfolgern, dass Pferde Lebwesen sind. ( Diese Transitivität gilt nicht für die Relation BT, s.u.)
Leserichtung in einer SMM: Von rechts nach links
is part of (PARTOF)
Komposition; "ist (physischer, logischer) Teil von"
Beispiel:
- Fahrrad
- PARTOF
- Hinterrad
- PARTOF
- Schaltung
- Bremse
- PARTOF
- Tretlager
- Hinterrad
- PARTOF
Auch die PARTOF-Relation ist transitiv. In der Praxis kann man das dazu benutzen, eine Stückliste aller benötigten Teile eines Bauteils ( in unserer eingeschränken Wissensrepräsentation allerdings ohne die benötigte Anzahl) anzugeben.
Leserichtung in einer SMM: Von außen nach innen
has broader term (BT)
Broader Term : "broader" heißt hier sehr allgemein: "generiert mehr Treffer", "ist weniger spezifisch", "ist umfassender". Die Relation kann je nach Aufgabenstellung sehr breit interpretiert werden.
Beispiel:
- Freizeit
- BT
- Reiten
- BT
- Pferd
- Jockey
- BT
- Fußball
- BT
- Ball
- Torwart
- BT
- Reiten
- BT
Im Unterschied zu ISA oder PARTOF kann die genaue Bedeutung von "breiter" zwischen je zwei Begriffen weitgehend variieren. In obigem Beispiel ist "Reiten" in einer gewissen Hinsicht umfassender als "Pferd (Tier)", und "Freizeit" ist in einer anderen Hinsicht umfassender als "Reiten". Dennoch folgt daraus (zumindest sachlogisch) nicht, dass "Freizeit" umfassender ist als "Pferd (Tier)": BT-Beziehungen sind *nicht transitiv*!
Wir verwenden BT sozusagen als "Restklasse", also dann, wenn ISA oder PARTOF nicht angemessen erscheinen, und insbesondere dann, wenn wir keine transitiven Strukuren aufschreiben wollen.
Leserichtung in einer SMM: Von außen nach innen
Definitionen, Synonyme und Abkürzungen: DEF,SYN
has definition (DEF)
Manchmal will man einen Begriff gerne normalsprachlich definieren, ohne sich im Detail in ausufernden Formalismen zu verlieren.
Beispiel:
- Pferd
- ISA
- Rennpferd DEF ein schlankes, schnelles, wendiges Pferd
- Brauereigaul DEF stark und kräftig, kann einen mit Bierfässern beladene Kutsche ziehen
- ISA
has synonym (SYN)
Beispiel:
- Geld
- SYN
- Kohle
- Zaster
- Schotter
- SYN
Relationen "quer" zur Hierarchie: REL, REL_xxx
"Quer"-Relationen wollen wir `n:m`-Relationen nennen. Mit ihnen lässt sich ein beliebiger Graph konstruieren. Wir verwenden sie, um Begriffe in einem Baum "quer" zu hierarchischen Relationen zu vernetzen.
REL meint einfach ein unspezifisches "is related to", "hat zu tun mit". Nach Bedarf kann die sehr unspezifische Relation REL auch spezifischer notiert werden
mit REL_xxx, z.B.
REL wird bisweilen verwendet, um transitive ISA- oder PARTOF-Bäume sauber nebeneinander aufzubauen, statt durch BT-Relationen "hässliche", nichttransitive Strukturen zu schaffen.
Beispiel:
- Sportler
- ISA
- Jockey
- Torwart
- ISA
- Tier
- ISA
- Pferd (Tier)
- ISA
- Sportgerät
- ISA
- Pferd (Sportgerät)
- Ball
- ISA
- Sportart
- ISA
- Reiten
- REL
- Pferd (Tier)
- Jockey
- REL
- Fußball
- REL
- Ball
- Torwart
- REL
- Reiten
- ISA
Es ist guter Stil, REL-Beziehungen (a) relativ sparsam, und wenn, dann (b) nur zwischen Begriffen anzulegen, die bereits anderswo schon in einem ISA- oder PARTOF-Baum angelegt sind. Sie werden zu diesem Zweck mehrfach identisch (copy & paste) angelegt.
Leserichtung in einer SMM: Von innen nach außen
Ein ganz bestimmtes Exemplar: EX
Wenn wir von Begriffen reden, reden wir im Allgemeinen über Klassen: z.B. "Häuptling" bezeichnet die Idee des Häuptlings, den "Häuptling an sich", irgendeinen Häuptling, allgemein eben: Häuptlinge.
In seltenen Fällen ist es erforderlich, ganz eindeutig bestimmte Individuen oder Exemplare in einen Thesaurus aufzunehmen: z.B. den Häuptling "Winnetou" aus dem gleichnamigen Roman von Karl May, oder den Schauspieler Pierre Piece, das in der Winnetou-Verfilmung von 1966 die Rolle des Häuptlings Winnetou spielt.
Beispiel:
- Alpha-Mann
- ISA
- Häuptling
- EX
- Winnetou
- EX
- Pierre Piece
- EX
- Winnetou
- EX
- General
- EX
- Napoleon
- EX
- Häuptling
- ISA
Es ist sehr schlechter Stil, auf einem Zweig zwei oder mehr EX-Relationen in Folge anzubringen. Das ist für Nicht-Experten verboten! Fast immer ist hier eigentlich ein ISA gemeint: Sobald man in obigem Beispiel auf Schauspieler-Ebene geht, steht "Winnetou" nicht mehr für ein Individuum, sondern für eine Rolle, einen Typ, ein Ideal, eine abstrakte Idee von edlem Helden - und damit also kein Individuum mehr, sondern eine Klasse.
Idealerweise verwendet man EX gar nicht: Uns geht es bei der Thesaurus-Konstruktion um Terminologiearbeit, also um Begriffe. Individuen können hier höchstens exemplarischen (sic!) Charakter haben.
Leserichtung in einer SMM: Von innen nach außen.
Definition nach Merkmal: ALL, SOME
has SOME values from / has ONLY values from (SOME / ONLY)
Auf dem Weg zu formalen Klassifikationen ist es hilfreich anzugeben, durch welche
Eigenschaften sich eine Klasse im einzelnen auszeichnet und sich von anderen Klassen
unterscheidet. Beispiel:
In der Beschreibungslogik OWL2 spricht man hier von sogenannten " property restrictions", insbesondere:
- SOME: OWL2:ObjectSomeValuesFrom
- ONLY: OWL2:ObjectAllValuesFrom
Wir wollen ausdrücken können,
- dass ein Begriff durch eine bestimmte Eigenschaft einer bestimmten Relation gekennzeichnet ist (z.B. "hat_Farbe weiß", "hat_Geschlecht weiblich"),
- dass diese Eigenschaft mindestens einmal (SOME) oder ausschließlich (ONLY) auftreten darf oder muss.
Beispiel:
- Pferd
- ISA
- Rappen
- hat_Farbe ONLY
- schwarz
- hat_Farbe ONLY
- Stute
- hat_Geschlecht ONLY
- weiblich
- hat_Geschlecht ONLY
- Zebra
- hat_Farbe SOME
- schwarz
- hat_Farbe SOME
- weiß
- hat_Farbe SOME
- Rappen
- ISA
Leserichtung in einer SMM: von innen nach außen
nach Merkmalen Gruppieren: COLLECTION
Ein wichtiges Strukturierungselement von Thesauri sind Kollektionen: Gruppen von Begriffen, die sich in Bezug auf ein gemeinsames Attribut in ihren Attributwerten unterscheiden.
Beispiel:
- Pferd
- COLLECTION
- Pferd nach Verwendung
- ISA
- Rennpferd
- hat_Verwendung ONLY
- schlank
- wendig
- wird von einem Jockey geritten
- hat_Verwendung ONLY
- Karrengaul
- hat_Verwendung ONLY
- kann eine Bierkutsche ziehen
- hat_Verwendung ONLY
- Rennpferd
- ISA
- Pferd nach Farbe
- ISA
- Schimmel
- hat_Farbe ALL
- weiß
- hat_Farbe ALL
- Rappen
- Fuchs
- Schimmel
- ISA
- Pferd nach Geschlecht
- ISA
- Stute
- hat_Geschlecht ONLY
- weiblich
- hat_Geschlecht ONLY
- Hengst
- hat_Geschlecht ONLY
- männlich
- hat_Geschlecht ONLY
- Stute
- ISA
- Pferd nach Verwendung
- COLLECTION
Mehr zu Kollektionen: http://www.w3.org/TR/skos-primer/#seccollections : aber SKOS geht über den Stoff in GdW weit hinaus.