Einleitung

von Verena Schwägerl-Melchior

Einführendes

Im Rahmen des Projekts „Netzwerk des Wissens“ wurde in den Jahren 2013-2016, ausgehend von den in Wolf (1993) für die thematische Auszeichnung der Korrespondenz verwendeten Schlagwörtern, ein webbasierter Thesaurus erstellt, mit Hilfe dessen die Zuordnung von Deskriptoren zu Briefen und sukzessive auch anderen Materialien möglich ist. Ziel der Vergabe von Deskriptoren ist es, ein thematisches „Browsen“ der Materialien auf der Website zu ermöglichen. Die Deskriptoren stellen eine semantische Verknüpfung zwischen verschiedenen Dokumenten her und sollen gemeinsam mit dem sukzessive weiterentwickelten Suchsystem dabei helfen, die für das jeweilige sprachwissenschaftliche, wissenschaftsgeschichtliche oder historische Erkenntnisinteresse relevantesten Ergebnisse zu erzielen. Durch die Verwendung eines Sprach-Deskriptors etwa wird aus dem Material herausgefiltert, in welchen Briefen es z.B. um eine bestimmte Kreolsprache geht. Auch auf komplexere Fragen wie z.B. „Welche Briefe weisen einen inhaltlichen Bezug zur Diskussion um die Ausnahmslosigkeit der Lautgesetze auf?“ kann durch das Auszeichnen der Briefe eine zumindest annähernd vollständige Antwort gegeben werden (vgl. das hier abrufbare Suchergebnis). Ebenso können Deskriptoren als Hilfe dazu benutzt werden, zu erfahren, in welchen Briefen von oder an Schuchardt über eine bestimmte Person gesprochen wird, die nicht der Adressat bzw. Empfänger des betreffenden Briefes ist. So scheint z.B. unter Antonio Ive nicht nur die Korrespondenz mit Schuchardt auf, sondern es werden auch die Briefe, die Ive in irgendeiner Form zum Thema haben, angezeigt („gekennzeichnete Briefe“). Durch die Vergabe eines „Werk-Deskriptors“ wiederum kann beispielsweise der Zusammenhang zwischen einem Brief, in dem Sprachproben oder Skizzen geliefert wurden und einem Werk, in dem diese angeführt werden, digital rekonstruiert werden und es ist so möglich, direkt vom Brief zum Werk zu springen.

Struktur des Thesaurus

Der Thesaurus befindet sich hier und gliedert sich in folgende Bestandteile: Sprachen, Personen, Orte (geographische Areale) und Sachschlagwörter, die jeweils durch das entsprechende Symbol gekennzeichnet sind. Durch Weg- oder Hinzuklicken der einzelnen Symbole kann man sich entweder alle Kategorien oder nur einzelne in alphabetischer Reihenfolge anzeigen lassen. Beim Klicken auf einzelne Schlagwörter wird neben den mit diesem Deskriptor ausgezeichneten Briefen die hierarchische Einordnung im Thesaurus angezeigt wie z.B. hier. Bezüglich der Sprachen erfolgte die Klassifizierung weitgehend in Anlehnung an die im Ethnologue vergebenen ISO-Codes. Personen wurden – sofern möglich – mit der jeweiligen VIAF-ID verknüpft und erscheinen, abgesehen von klassischen Autoren oder historischen Figuren (wie z.B. Dante Alighieri), in der Nennform „Nachname, Vorname“. Personenschlagwörter wurden insbesondere dann vergeben, wenn in einem Brief von Person A an Person B über Person C gesprochen wird. Die Menge an einbezogenen Personen übersteigt dadurch bei weitem die Zahl der Korrespondenzpartner Schuchardts. Die so gewonnenen Daten können allerdings für die Rekonstruktion des Netzwerks von großem Wert sein. Als Orte (geographische Areale) wurden im Thesaurus sowohl Städte und Regionen als auch Länder angelegt, die als Thema in den Briefen genannt werden. Mit Blick auf die Sprach- und Orts-Tags ist anzumerken, dass hiermit nicht die Briefsprache und der Absendeort des Briefes gemeint ist (die jedoch separat erfasst werden), sondern eine Thematisierung der Sprache oder des Ortes im Brieftext gekennzeichnet wird. Neben den Orten und den Sprachen wurde eine Serie von Schlagwörtern angelegt, die ein „kreuzklassifiziertes“ Browsen nach „Sprachen in Areal XY“ ermöglicht und die parallele Abfrage von Material zu verschiedenen (verwandten oder nicht verwandten) Sprachen in einem bestimmten Gebiet erlaubt wie etwa hier. In manchen Fällen erschien es sinnvoll, im Rahmen eines Schlagworts die Verwendung einer bestimmten Sprache in einem bestimmten (nicht „angestammten“) Territorium zu fassen. Hierzu wurde insbesondere die Kategorie „Europäische Sprachen außerhalb Europas“ mit den entsprechenden Unterkategorien geschaffen. Gut sichtbar wird die mehrfache Zuordnung von Sprachen zu Sprachfamilien und Territorien z.B. hier. So wird auch deutlich, dass der Zugriff auf eine Kreolsprache von verschiedenen Seiten erfolgen kann: genetisch-klassifizierend über die Lexifier-Sprache, über das Territorium, in dem die betreffende Sprache gesprochen wird und über die wissenschaftliche Beschreibungsebene/Subdisziplin „Sprachkontaktforschung/Kontaktlinguistik“. Die Sachschlagwörter schließlich sind nach den Personen die numerisch größte Gruppe von Deskriptoren und erlauben Recherchen zu verschiedensten Fragestellungen. Die bisher in Bezug auf ihre Verwendung wichtigsten Großgruppen von Sach-Deskriptoren sind – nimmt man die jeweils darunter liegenden Schlagwörter zusammen – „Wissenschaftliche Institutionen“, „Publikationswesen“, „Korrespondenzzwecke“, „Postwesen“, „Sprachwissenschaft“ und „Politik- und Zeitgeschichte“. Aber auch „Biographisches“ und das Einzelschlagwort „Gesundheit“ wurden bereits sehr häufig vergeben. Neben den beschriebenen Kategorien von Schlagwörtern können, wie eingangs erwähnt, auch die Schuchardt-Werke als Deskriptoren einzelnen Briefen zugeordnet werden, was den engen Zusammenhang der Schuchardt'schen Korrespondenz mit seiner Publikationstätigkeit digital nachvollziehbar machen kann.

Status der Beschlagwortung

Am Ende des durch den FWF geförderten Projekts „Netzwerk des Wissens“ waren ca. 2000 Briefe mit Personen-, Sprach-, Orts- und Sachschlagwörtern ausgezeichnet. Da die Zahl online verfügbarer Korrespondenz mehr als doppelt so hoch ist und die Auszeichnung mit Werk-Tags erst später beginnen konnte, ist die Beschlagwortung der Materialien auf der Website des Hugo Schuchardt Archivs noch nicht abgeschlossen. Dies bedeutet, dass Abfragen mittels des Thesaurus derzeit noch nicht alle Briefe berücksichtigen und damit keine vollständigen Ergebnisse liefern können. Es wird aber ein Anliegen aller Beteiligten sein, den begonnenen Prozess so rasch wie möglich fortzusetzen, um das dem Material innewohnende Erkenntnispotential den Nutzern der Website möglichst vielseitig und vollständig zugänglich zu machen.