Exkurse zu “Gewässer”
Contents
Exkurse zu “Gewässer”#
Exkurse anlässlich des Gewässer-Beispiels Challenge: Wikipedia-Artikel “Gewässer”.
Gruppierungen#
Um Dinge eines Gegenstandsbereichs begrifflich in Beziehung zu setzen ist es hilfreich, ihre Beschreibungen in verschiedene Gruppen einzuteilen. Obige Grammatik von Ding-Benenungen kann uns als Faustregel dabei unterstützen.
Vorgehen:
(1) Nehme eine eine (idealerweise gut strukturierte, notfalls auch nur glossar-artige) Darstellung zu den Dingen aus einem interessierenden Gegenstandsbereich (domain of interest).
Eine sehr hoch strukturierte und systematisierte Darstellung zur Domäne “Gewässer” liegt im Lexikontext https://de.wikipedia.org/wiki/Gew%C3%A4sser vor.
Eine kaum strukturierte Darstellung liegt in der glossar-artigen englischen Darstellung von “Gewässer (https://en.wikipedia.org/wiki/Body_of_water) vor.
(2) Extrahiere aus der zugrundegelegten Darstellung eine Menge von typischen Eigenschaften, durch die sich Dinge unterscheiden. Oft - aber bei weitem nicht immer - werden diese Eigenschaften sprachlich mit sogenannten Eigenschaftwörtern wiedergegeben:
grammatisch vor allem Adjektive: z.B. schnell, langsam
stellvertretend aber auch Verbformen, die als Eigenschaft auftreten können: z.B. fließend, stehend
dort, wo es kein natürlichsprachliches Eigenschaftswort gibt, notfalls auch grob konstruiert: z.B. süßwasser-artig, höhlen-artig, fijord-artig
(3) Untersuche, welche dieser typischen Eigenschaften zusammengehören, und gruppiere sie zu Eigenschaftsmengen
suche passende Benennungen für Eigenschaftsmengen: das sind dann unsere Facetten.
z.B. warmblütig, kaltblütig -> Temperament; weiß, rot, braun, schwarz -> Farbe; männlich, weiblich -> Geschlecht
(4) Differenziere die Elemente unserer Facetten:
Kann man sie in eine Ordnung bringen? z.B. weiß - hell - grau - schwarz; dauerhaft - gelegentlich - nie
Gibt es Antonyme? z.B. männlich vs. weiblich
All diese Schritte rekonstruieren ein intuitives sprachliches Vorverständnis und ordnen ein solches. Wir behalten im Auge, das dieses Vorverständnis für unsere Modellierung gleichermaßen hilfreich wie fehlleitend sein kann. Da eine Ontologie aber eine kommunizierbare Strukturierung einer immer auch sprachlich mitgeteilten Domäne sein soll ist es jedenfalls eine gute Strategie, sich des eingeführten Sprachgebrauchs zumindest dort, wo er verwendbar ist, auch zu bedienen.
Interessant an diesem Vorgehen ist die Gruppierung von Bezeichnern:
Eigenschaft
sprachlich: im allgemeinen durch Eigenschaftswörter mitgeteilt
mathematisch: Werte auf einer Achse im n-dimensionalen Merkmalsraum
Informatik: Attributwert; Pandas: –
Facette: eine Gruppe von zueinander in semantischer Beziehung stehenden Eigenschaften
sprachlich: (unklar)
mathematisch eine Dimension (Achse) im n-dimensionalen Merkmalsraum
Informatik: Attribut; Pandas: column
Einwort-Benennung von Dingen
sprachlich: im allgemeinen Hauptwörter, in DE auch Komposita (schwarzes, männliches Pferd = Rapphengst)
mathematisch ein Unterraum des Merkmalsraums
Die deutsche Seite Wikipedia > Gewässer#
https://de.wikipedia.org/wiki/Gew%C3%A4sser
Facetten#
Unsere Facetten sind Gruppen von Eigenschaften, mit denen sich Gewässer feiner unterscheiden lassen. Unser Wikipedia-Artikel enthält ca 15 Facetten mit insgesamt ca. 50 Eigenschaften:
Salzgehalt: salzwasser-artig, süßwasser-artig, brackwasser-artig
Lage des Wasserkörpers: über der Erde liegend, unterirdisch, quellen-artig, schwinden-artig
Stellung im Gewässersystem: binnen-artig, meeres-artig (hier konstruieren wir uns die fehlen Adjektive), festlandnah
Entstehungstyp: natürlich entstanden, künstlich
Strömungsverhalten: strömend, strömungsfrei, stehend
Zugänglichkeit: offen, geschlossen
Größe: sehr groß, groß, klein
Tiefe: tief, mäßig tief, flach
Entwässerung: exorheisch, endorheisch
Zirkulationstyp: amiktisch, meromiktisch, holomiktisch
Wasserführung im Zeitverlauf: perennierend, intermittierend, periodisch, episodisch, ephemer
Trophiestufe: oligotroph, mesotroph, eutroph, hypertroph
ökologischer Zustand: sehr gut, gut, mäßig, unbefriedigend, schlecht
Gewässerfarbe: dunkeltrüb, helltrüb, klar
Sättigung mit Wasser: phreatisch
Trennung vom Meer: Inselkette, Festland, Meeresschwelle, Meerenge
Man sieht leicht:
die einzelnen Attributwerte sind eindeutig einzelnen Attributen zuordenbar.
Attributwerte verschiedener Attribute lassen sich im Prinzip beliebig kombinieren.
Diese Eigenschaftsmengen aufzustellen (und geeignet zu visualisieren) ist eine der zentralen Aufgaben beim Erstellen einer GenDifS-Taxonomie.
Einwort-Benennungen#
Einwort-Benennungen ungefähr in der Reihenfolge ihres Auftretens im Wikipedia-Artikel https://de.wikipedia.org/wiki/Gew%C3%A4sser:
Binnengewässer | Fließgewässer | Stillgewässer | Quelle | Schwinde | Vorfluter | Strom | Fluss | Bach | Gerinne | Kanal | Schifffahrtskanal | Stauhaltung | Schleusenstrom | Höhlenfluss | Kluftwasser | See | Stausee | Weiher | Teich | Tümpel | Pfütze | Höhlensee | Kaverne | Zisterne | Nebenmeer | Meer | Randmeer | Mittelmeer | Binnenmeer | Küstengewässer | Totwasser | Stillwasser | Druckstollen | Sickerströmung | Oberflächengewässer | Quelle | Hungerquelle | Brackwasser | Rückstaubereich | Vorfluter | Pfütze | Wadi | Rivier | Überlauf | Sumpfgebiet | Moorgebiet | Schmelzwassersee | Gieße | Klinge | Brack | Fleet | Wetterung | Grundwasser | Küstengewässer | Meeresgewässer | Straßenseitengraben | Bewässerungsgraben | Entwässerungsgraben | Heilquelle | Kalksee | Alpenabfluss | Schwarzwasserfluss | Weißwasserfluss | Klarwasserfluss (ca 60 Einwort-Benennungen)
Wir haben auch Einzelne namentlich genannte Gewässer als Beispiele, die jedoch im Folgenden nicht relevant sind:
Aubach (Wiehl) | Fehmbacher Weiher | „Märchendom“ in den Feengrotten | Müritz | Ilz | Donau | Inn | Passau | Amazonas | Rio Negro | Alaknanda | Bhagirathi | Ganges | Vorderrhein | Hinterrhein | Rio Solimões
Merkmals-Implikation#
Es gibt Gegenstandsbereiche, in denen nicht jede Kombination von Merkmalsausprägungen (Facetten, Foci) möglich ist. So wird z.B. in der Praxis nur bei Binnengewässern, nicht jedoch bei Meeren zwischen Oberflächen- und unterirdischen Gewässern unterschieden. (Nur ein Logiker käme auf die Idee, ein Meer als Oberflächengewässer zu bezeichnen). Und auch nur für Binnengewässer kann sinnvoll angegeben werden, ob sie ins Meer (exorheisch) oder auf andere Art uns Weise (endorheisch) entwässern.
In solchen Fällen könnte man von einer Merkmals-Implikation sprechen: Wenn bekannt ist, dass bei einem Gewässer die Lage des Wasserkörpers oberirdisch ist, dann folgt daraus, dass dieses Gewässer ein Binnengewässer ist: Das Merkmal “oberirdisch” erzwingt das Merkmal “binnen-artig”.
(Eine Merkmals-Implikation ist gleichbedeutend mit einer Teilmengen-Beziehung der zugehörigen Extensionen der durch die Merkmale intensional beschriebenen Mengen.)
In einer GPDSCL-Klassifikation wird man Gewässer zuerst nach Meer- oder Binnengewässern, und nur Binnengewässer nach ober- oder unterirdischen Gewässern unterscheiden. Der wesentliche Schritt in der Konstruktion einer GPDSCL-Klassifikation besteht darin, solche Implikationen zu erkennen und geeignet zu modellieren.
In obigem Gewässer-Beispiel haben wir ca 50 Eigenschaften, die in ca 15 Facetten gruppiert sind. Wenn wir annehmen, dass jede Facette im Durchschnitt 3 Werte hat, sind in der Größenordnung 3^15 verschiedene Merkmals-Kombinationen möglich.
Wir verfügen aber lediglich über ca 60 Einwort-Bezeichner. Eine Durchsicht der Einwort-Bezeichner zeigt, dass es für einige wenige “x+1 Gewässer” entsprechende Einwortbezeichner gibt:
z.B. Gewässer, salzwasser-artig = Salzwasser; Gewässer, süßwasser-artig = Süßwasser; Gewässer, brackwasser-artig = Brackwasser
Die meisten Einwort-Bezeicher bezeichnen also Dinge, die sich durch mehr als eine einzelne Eigenschaft von anderen Dingen unterscheiden.
englische Wikipedia-Seite Body of Water#
https://de.wikipedia.org/wiki/Gew%C3%A4sser -> In anderen Sprachen -> EN -> https://en.wikipedia.org/wiki/Body_of_water
Hier sind ca. 80 Einwort-Begriffe alphabetisch aufgeführt und normalsprachlich erklärt. Im Gegensatz zur DE-Seite ist hier so gut wie keine Vorstruktur erkennbar.
Tatsächlich handelt es sich hierbei um nicht mehr als ein Glossar.
Es wird einen deutlich größeren Aufwand kosten, hier eine Ordnung aufzubauen, die der Strukturiertheit des DE-Artikels entspricht.
Vermutlich ist diese Seite eine interessante Grundlage für eine FCA?
Interessant: Einige der normalsprachlichen Erklärungen nehmen Bezug auf andere Begriffe des Glossars. Können wir das für unsere Strukturierung nutzen?
Letzte Zeile!