Methode

Das Mainzer Akademieprojekt PfeilWörterbuch der deutschen Winzersprache (PfeilWDW) hat zum Ziel, mit Hilfe neuer Medien die in den 1980-er Jahren erhobenen dialektalen Sprachaufnahmen zu sichern und und nach semasiologischen und onomasiologischen Gesichtspunkten hinsichtlich der Fachsprache der Winzer aufzuarbeiten. 

Das "Wörterbuch der deutschen Winzersprache" ist somit als lexikographisches Komplementärwerk zum "Wortatlas" geplant, aber auch unabhängig von diesem benutzbar. Dazu wurden die vorhandenen umfangreichen Tonmaterialen auf CD-ROM gesichert, auf einem File-Server installiert und stehen nun zur Abhören am Computer zur Verfügung. Parallel zum Abhören werden die ermittelten Winzerfachausdrücke mit weiteren Zusatzinformationen wie Genus, Wortart, Lemma, Semantik versehen und in einheitlicher Transkription unter Anwendung des Internationalen Phonetischen Alphabets (IPA) in einer Datenbank gespeichert. Zur Aufarbeitung des Materials und zur Erarbeitung des Wörterbuchtextes werden folgende Arbeitsinstrumente benutzt: 

  1. ein Programm zur PfeilSicherung der ca. 520 analogen Tonträger aus 13 verschiedenen Staaten auf CD-ROM und 

  2. eine Pfeilrelationale SQL-Datenbank, mit deren Hilfe die von den so hergestellten CD-ROMs abgehörten und überprüften Sprachdaten gespeichert und verwaltet werden.

Auch wenn die beiden Programme speziell für das Mainzer Akademieprojekt Wörterbuch der deutschen Winzersprache entwickelt wurden, so können sie auch für andere Wörterbuchprojekte von Interesse sein, die mit bimedialem Material ein lexikographisches Werk zu erstellen beabsichtigen.

Blauer Portugieser

 

Sicherung

Ziel Sicherung analoge Tonträger
Name PfeilWDWSic
technische Ausstattung PC mit CD-Brenner, Soundkarte, Abspielprogramm für MP3-Dateien (z.B. Winamp), Tonbandgerät, Brennprogramm
technisches Verfahren Am Fraunhofer-Institut entwickeltes MPEG-Verfahren: Umwandlung der analogen Tonsignale in digitale Zeichen (sog. WAV-Dateien) mit fast gleichzeitiger Komprimierung zu deutlich kleineren Dateien (sog. MP3-Dateien); Reduktion der ursprünglichen Datenmenge ohne hörbaren Qualitätsverlust auf ein Zwölftel; automatische Aufgliederung der gesamten Tonaufnahme (ca. 4-5 Stunden) in handhabbare kleine Einheiten (sog. Tracks), die ein schnelles Ansteuern einer bestimmten Stelle auf der CD-ROM erlauben
Programmierung Firma ABEMO

 

Relationale SQL-Datenbank

Eine wichtige Aufgabe des Abhörens besteht erstens darin, die Explorator-Transkriptionen des Originalfragebogens zu überprüfen und in einheitlicher Transkription in die Datenbank zu überführen, zweitens aus dem Sprachkontext der Tonaufnahme die Bedeutungsnuancen der jeweiligen Winzerfachausdrücke herauszulösen und drittens die spontanen fachsprachlichen Äußerungen der Gewährspersonen zu erfassen, die im WKW keine Berücksichtigung finden konnten. Hervorzuheben ist, dass durch Abspeicherung der Fundstelle des akustischen Belegs die Möglichkeit geschaffen ist, das akustischen Tonbeispiel beliebig oft von der CD-ROM abspielen zu lassen, um beispielsweise die Transkription zu überprüfen. Denn die entsprechende Stelle auf der CD-ROM wird dauerhaft in der Datenbank gespeichert. 
  
technische Ausstattung Netzwerk mit Server und Workstation, Streamer zur Datensicherung, Microsoft SQL Server, Soundkarte, Lautsprecher, Abspielprogramm für MP3-Dateien
technisches Verfahren Relationale SQL-Datenbank: Speicherung und Verwaltung der Daten in nach Themen geordneten Tabellen, die nach bestimmten Kriterien miteinander verknüpft sind; die zugrunde liegende Programmier- bzw. Abfragesprache ist SQL, die Abkürzung für "Structured Query Language" (Strukturierte Abfrage-Sprache)
Datenbankstruktur Die WDW-Datenbank besteht u.a. aus folgenden miteinander verknüpften Einheiten: "Main" (zur Aufnahme des von der CD-ROM abgehörten Belegs in phonetischer Transkription und weiterer Informationen, z.B. von grammatischen Angaben), "Aufnahme" (zur Lokalisierung des Belegs), "Lemma" (Stichwort, das beim Export zum Schreiben der Wörterbuchartikel eine wichtige Rolle spielt und die "Main" mit weiteren Einheiten verbindet, die die Lemmatisierung abstützen), "Semantik", "Referenzen" (Angaben aus anderen Dialektwörterbüchern, historischen bzw. etymologischen Wörterbüchern, Weinbaumonographien, Grammatiken etc.), "Sachkunde", "Wortbildung", "Etymologie" und "Historischer Beleg", "Abkürzungsverzeichnis" (dieses wird mit geringfügigen Änderungen Eingang in das fertige Wörterbuch finden), "CD-R-Track" (zur Speicherung der Fundstelle eines akustischen Belegs)
Benutzeroberfläche Die Daten werden in eine Eingabemaske, den sog. WDWDialog, eingegeben, der eine Vielzahl von Feldern enthält, die den späteren Datenexport für das Wörterbuch vorbereiten
Entwicklung der 

Datenbankstruktur

Privatdozentin Dr. Maria Besse
Programmierung Firma ABEMO

©  Besse (20.02.2010)