Achsen#
Meta-Terminologie:
Achse hier mathematisch: Eine Achse im Koordinatensystem; eine Dimension im n-dimensionalen Merkmalsraum. Idee: Wir benutzen diese Achsen später zum Aufbau unserer eigentlichen ontologie.
Darüber reden wir: Entitäten#
Ene Entität ist alles, worüber wir reden können: Gegenständliche Entitäten, abstrakte Entitäten, analoge und digitale Entitäten (insbesondere auch Sequenzen von Schriftzeichen), auch Handlungen, Geschehnisse, Gedanken, Eigenschaften, Normen, Irrtümer – einfach alles, anything.
Entität (mittellateinisch entitas, zu spätlateinisch ens ‚seiend, Ding‘) ist in der Philosophie ein Grundbegriff der Ontologie [… er bezeichnet etwas], das existiert, ein Seiendes, einen konkreten oder abstrakten Gegenstand. In diesem Sinn wird der Begriff der Entität in der Regel als Sammelbegriff verwendet, um so unterschiedliche Gegenstände wie Dinge, Eigenschaften, Relationen, Sachverhalte oder Ereignisse auf einmal anzusprechen.
Any IRI or literal denotes something in the world (the “universe of discourse”). These things are called resources. Anything can be a resource, including physical things, documents, abstract concepts, numbers and strings; the term is synonymous with “entity” as it is used in RDF 1.2 Semantics [RDF12-SEMANTICS]. The resource denoted by an IRI is called its referent, and the resource denoted by a literal is called its literal value. rdf12-concepts
Terminologie
EN: reseource, SYN: entity; DE: Entität
Thematisieren: rdf12-concepts setzt fett auf denotieren. Das wollen wir nicht tun, wir verwenden diesen Begriff nicht hier, und schon gar nicht als vorausgesetzten Grundbegriff.
Achse: Beschreiben vs. benennen#
Entitäten lassen sich beschreiben. Auch Beschreibungen von Entitäten sind Entitäten, und auch die Handlung des Beschreibens ist eine Entität.
Entitäten kann man einen Namen geben, benennen. Auch Benennungen sind Entitäten, und auch die Handlung des Benennens ist eine Entität. (Man könnte an dieser Stelle auch von “Bezeichung” reden wollen. Aber wir wissen an dieser Stelle ja noch gar nicht, was ein Zeichen ist, geschweige denn, wie der Akt des Bezeichnens vor sich geht.)
In der SWS sind die grundlegenden Operationen beschreiben und benennen. Weil Beschreibungen und das Beschreiben, Benennungen (und das Benennen) etc. auch alles Entitäten sind, können wir auch Beschreibungen und Bennungen etc. selbst wieder beschreiben, benennen, gruppieren etc.
Achse: Gruppierung, Element#
Theorie: naive Mengenlehre, Menge, Element einer Menge
Entitäten lassen sich gruppieren. Wenn man dasMan macht das z.B. in der Schule, es entsteht eine Klasse. (Die Kriegsflotte der Römer, die classis romana, hat dem mathematischen Begriff der Klasse ihren Namen gegeben.) Natürlich ist auch eine Gruppierung eine Entität, und auch die Handlung des Gruppierens.
Mit dem Gruppierungen ganz eng verbunden sind Unterscheidungen, gruppieren und unterscheiden sind die zwei Seiten einer Medaille. Wo es eine Gruppe gibt, gibt es eine Innen und ein Außen, ein Dazugehören oder ein Ausgeschlossensein, ein “wir” und ein “ihr”.
Die einfachste Form, “wir” und “ihr” zu unterscheiden, ist eine Deklaration: Uns zugehörig ist der, auf den wir zeigen.
Die in den Strukturwissenschaften übliche Form, die Zugehörigkeit zu einer Gruppierung festzustellen, orientiert sich an Eigenschaften von Entitäten: Uns zugehörig ist, wer unsere Flagge am Mast aufzieht, die gleichen Freunde hat wie wir, unsere Sprache spricht, unsere Hautfarbe hat.
Gruppierungen sind einfach nur mathematische Mengen: Jedes Ding kommt nur einmal vor, und eine Reihenfolge gibt es auch nicht.
Achse: analoge vs. digitale Entitäten#
Theoriehintergrund: HTTP Range-14 Problem
Eine für die digitale Welt grundlegende Unterscheidung ist die zwischen digitalen und analogen Entitäten … Slash-Uris vs. Hash-Uris …
Achse: Zeichenkette vs. Text#
Theoriehintergrund: RDA, FRBR: Unterscheidung von Expression und Manifestation.
Schriftzeichen: Buchstaben, Ziffern, Satzzeichen, Sonderzeichen, Icons, Emojis … Wie viele Schriftzeichen kennen wir? Die wichtigsten Sammlung von Schriftzeichen ist Unicode … derzeit ca. 150.000 Schriftzeichen
(Vorsicht: Schriftzeichen als atomare Elemente innerhalb einer Zeichenkette sind in unserer Darstellung keine semiotischen Zeichen, keine Zeichen im Sinne der Semiotik).
Zeichenkette, String: eine eindimensionale Sequenz von Schriftzeichen … lässt sich mit sog. endlichen Automaten in Teilsequenzen (Tokens) zerschneiden: man erhält Wörter, Satzzeichen, html- oder XML-Markup, etc. … in so erhaltenenen Sequenzen von Tokens kann man mit sog. Kellerautomaten ergänzend auch noch auf tief verschachtelte Sequenzen von Sequenzen hin untersuchen … man erhält einen Baum von Tokens (z.B. einen Syntaxbaum).
Eine Zeichenkette kann als Datei auf der Festplatte liegen, oder auch “nur” flüchtig in den RAM-Speichern der weltweiten Netzinfrastruktur liegen.
Ein Schriftzeichen ist eine Nummer, in Unicode: ein code point im code space, die für die bildliche Darstellung eines Schriftzeichens, die Glyphe, steht. https://www.unicode.org/versions/Unicode15.1.0/
Es gibt so viele verschiedene Zeichenketten, wie es natürliche Zahlen gibt; die Menge der denkbaren Zeichenketten ist abzählbar … aber es gibt noch viel mehr Entitäten, überabzählbar: Das sind alles analoge Entitäten … in einer Zeichenkette kann man Entitäten beschreiben, benennen, gruppieren, zusammenfassen … auch ein Computer kann Entitäten beschreiben, benennen, gruppieren, zusammenfassen – aber eben nur wieder Zeichenketten. Die digitale Welt der Zeichenketten ist eine zwar unendlich große, aber doch nur abzählbar-unendliche Welt, in die die analoge Welt überabzählbar-unendlich of dazwischen passt.
Kaum ein Nutzer liest und schreitbt Zeichketten in Rohform. Fast immer ist es Software, die aus Zeichenketten eine Repräsentation auf dem Bildschirm oder auf Papier herstellen. Websites, Printtexte, Formulare, mathematische Formeln, Musik-Partituren sind bildliche Darstellugen ausgewählter Abschnitte von Zeichenketten als Glyphen auf einem zewidimensionalen Medium. Ebenso können Zeichenketten in grafische (liniennasierte) Elemente wie Diagramme übersetzt werden; und Bilder oder Video lassen sich sowieso nicht als rohe Zeichenkette lesen. All das nennen wir Text.
In den meisten Fällen lässt sich ein Text auf verschiedene Weise als Zeichenkette darstellen, codieren:
Achse: IRI vs. Literal#
Theoriehintergund: RDF
Achse: Concept (SKOS), Class (RDFS), Sense (Wordnet), Lexem (Linguistik)#
Theoriehintergrund: SKOS, Wordnet, zusammengeführt in Ontolex Lemon
Achse: stehend, fließend#
fließend: Das Wetter an einem Ort; Verkehr an einer Ampel