Ausschnitt einer Seite eines Wörterbuchs

Thesaurus zur Kategorisierung und Klassifizierung von Daten

Integrieren Sie einen Thesaurus als kontrolliertes Vokabular, um Wissen für den späteren Abruf zu organisieren.

Die Verwaltung von Daten ist wie das Hüten von Katzen. Es ist sehr schwierig zu kontrollieren, zu koordinieren und zu organisieren. Glücklicherweise gibt es einige Mechanismen, die den Datenteil unterstützen. Für Katzen, tut mir leid, Sie sind auf sich allein gestellt.

Eine Möglichkeit, Daten zu organisieren, ist die Verwendung von Thesauri (der Plural von Thesaurus). Ohne zu esoterisch oder detailliert zu werden, ist die einfachste Definition von Thesauri „ein kontrolliertes Vokabular, das verwendet wird, um Wissen für den späteren Abruf zu organisieren“. Betonung auf „kontrolliert“. Das bedeutet im Wesentlichen, dass Konzepte oder Schlüsselwörter einem vordefinierten Satz von Wörtern (d. h. Vokabular) entsprechen müssen. Das Problem, das Thesauri lösen, ist die unorganisierte spontane oder Ad-hoc-Kategorisierung und -Klassifizierung. Eine Person verwendet möglicherweise ein Schlüsselwort für ein Thema, während eine andere Person ein anderes Schlüsselwort verwendet. Im Laufe der Zeit entsteht dadurch ein unorganisierter Datensatz, der es sehr schwierig macht, Ihre Daten zu verstehen und zu durchsuchen. Der Hauptvorteil der Verwendung von Thesauri besteht in der Einhaltung von Standards in einem Wissensgebiet.

Ein treffendes Beispiel für kontrolliertes Vokabular (d. h. Thesaurus) ist der Getty Art & Architecture Thesaurus (AAT)®. Dieser Thesaurus wird von Bibliothekaren, Museum-Personal, Archivaren und Katalog-Erstellern zur Beschreibung von Kunst- und Architekturgegenständen verwendet. Den Thesaurus finden Sie hier: https://www.getty.edu/research/tools/vocabularies/aat/

Um die Verwendung des ‘Getty Art and Architecture’ (AAT) Thesaurus zu veranschaulichen, ein Beispielszenario: Ein Forscher, der untersucht, wie Keramik im Laufe der Geschichte verwendet wurde. Keramiken werden im Allgemeinen hergestellt, indem Mischungen aus Ton und Wasser angerührt und in gewünschte Formen, wie Töpfe oder Statuen, gebracht werden. Der Forscher möchte möglicherweise die Tonart für einen Keramikgegenstand beschreiben und dabei die Beschreibungen der Tonarten auf ein Standardvokabular beschränken. Hier ist ein abgekürzter Thesaurus-Eintrag von AAT für keramische Materialien, insbesondere „Ton“.


Mataerialien Darstellungsformen
… Materialien (Hierarchiename)
…… Materialien (Substanz)
……… <Materialien , kombiniert>
………… anorganisches Material
…………… Ton
……………… <Ton , kombiniert oder originär)
………………… Gault (Ton-Typ)
………………… Kaolin
………………… Kugel-Ton
………………… Natürlicher Ton
………………… Rohr-Ton
………………… “Terre de Lorraine”


Das kontrollierte Vokabular ist in diesem Fall ein Standardsatz von Datenwerten zur Beschreibung von Tonmaterialien (z. B. Gault, Kaolin, Kugel-Ton, natürlicher Ton, Rohr-Ton, “Terre de Lorraine”). Dies ist ein vereinfachtes Beispiel, verdeutlicht jedoch den Wert von Standards und Konsistenz.

Thesauri zeigen typischerweise Beziehungen zwischen ‘Konzepten’: Und zwar in Form von verwandten Konzepten, umfassenderen Konzepten oder enger gefassten Konzepten. Diese Beziehungen werden als hierarchische Bäume mit einem Hauptbegriff als Überschrift in der Baumstruktur formuliert. 

eyebase enthält einen "Thesaurus Editor". Dazu gehören Funktionen zum Importieren eines Thesaurus oder zum Erstellen eines neuen Thesaurus. Dieser wird dann in Dropdown-Listen verwendet, um die Eingabe von Thesaurusbegriffen für einen bestimmten Datensatz oder eine Gruppe von Datensätzen zu erleichtern. Die Tiefe der Hierarchien und die Anzahl der Begriffe ist technisch unbegrenzt. Thesauri können als CSV-Datei exportiert werden. Jeder Thesaurus kann mehrsprachig angezeigt werden.