Thomas Schmidt
Computergestützte Transkription
Modellierung und Visualisierung gesprochener Sprache
mit texttechnologischen Mitteln
Eintrag in der Deutschen Nationalbibliothek (DNB)
Persistent Identifier URN: urn:nbn:de:101:1-2023030609105074873948
Computergestützte Transkription ist ein essenzieller Bestandteil vieler linguistischer Methoden. Dieses Buch behandelt den Gegenstand aus einer interdisziplinären Perspektive, die gesprächsanalytische mit texttechnologischer Forschung in Verbindung bringt. Es schlägt eine Sichtweise auf die computergestützte Transkription vor, die sich vom etablierten "Verschriftlichungs"-Gedanken löst und sich stattdessen auf den wissenschaftlichen Modellbegriff stützt. Davon ausgehend wird ein Modellierungsverfahren für gesprächsanalytische Transkriptionen entwickelt, das von modernen texttechnologischen Methoden Gebrauch macht und so zu einer verbesserten Austauschbarkeit und Verarbeitbarkeit von computerlesbaren Transkriptionsdaten beitragen kann.
Bei seinem Erscheinen im Jahr 2005 verstand sich das Buch als einen Beitrag zu einer im Entstehen begriffenen digitalen Methodik der Gesprächsforschung und anderer Disziplinen, die mit mündlichen Daten arbeiten. Der heute weniger geläufige Begriff der 'Texttechnologie' ist zwischenzeitlich im Oberbegriff der 'Digital Humanities' aufgegangen, der im Buch gewählte methodische Ansatz der Modellierung und die damit verbundenen Technologien behalten aber auch in diesem neuen Kontext ihre Gültigkeit und Aktualität.
Viele der konzeptuellen Überlegungen aus diesem Buch sind in die Entwicklung der EXMARaLDA-Werkzeuge eingeflossen (Schmidt/Wörner 2014), inklusive der Tools aus dem Workflow für das Forschungs- und Lehrkorpus gesprochenes Deutsch (FOLK, Schmidt 2016a/b).
Darauf aufbauend folgen auch die Datenbank für Gesprochenes Deutsch (Deppermann/Schmidt 2014, Schmidt 2014) und die Architektur und Tools des ZuMult-Projekts (Fandrych et al. 2023) unter anderem den in diesem Buch entwickelten Ideen.
Mit dem "ISO 24624:2016 Language resource management — Transcription of spoken language" wurde 2016 ein internationaler Standard veröffentlicht, der mit diesem "Ökosystem" an Datenmodellen, Datenformaten und digitalen Werkzeugen konform ist und sich als Lösung zur Interoperabilität in digitalen Infrastrukturen zu etablieren beginnt (Hedeland/Schmidt 2022).
Die Literaturhinweise befinden sich am Ende der Seite.
Thomas Schmidt, geboren 1971, studierte Sprachwissenschaften und Mathematik in Kaiserslautern, Mainz, Edinburgh, Berlin und Paris.
Von 1998 bis 1999 arbeitete er als Language Resource Engineer bei Philips Speech Processing in Aachen.
Von 2000 bis 2011 war er zunächst als wissenschaftlicher Mitarbeiter, später als Projektleiter, am Sonderforschungsbereich 538 „Mehrsprachigkeit“ der Universität Hamburg für die Entwicklung des EXMARaLDA-Systems und die Einrichtung des Hamburger Zentrums für Sprachkorpora (HZSK) verantwortlich.
Nach der Promotion an der Universität Dortmund (2004) hat er 2005/2006 im Rahmen eines Post-Doc-Aufenthaltes am International Computer Science Institute (ICSI) in Berkeley das mehrsprachige Fußballwörterbuch ‚Kicktionary‘ entwickelt.
2007/2008 war er als wissenschaftlicher Mitarbeiter im Projekt „Digitales Wörterbuch der Deutschen Sprache (DWDS)“ an der Berlin-Brandenburgischen Akademie der Wissenschaften tätig.
Zwischen 2012 und 2021 hatte er die Leitung des Programmbereichs ‚Mündliche Korpora‘ am Leibniz-Institut für Deutsche Sprache in Mannheim inne, wo er neben mehreren Drittmittelprojekten auch das Archiv für Gesprochenes Deutsch und sowie die Projekte zum Aufbau des Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK, bis 2019) und der Datenbank für Gesprochenes Deutsch (DGD) leitete.
2021 wechselte er an die Universität Basel, wo er für Aufbau und Leitung der Research and Infrastructure Services (RISE) verantwortlich war.
Seit 2022 arbeitet Thomas Schmidt als Software Engineer bei der Musical Bits GmbH in Bingen und bietet über linguisticbits.de wissenschaftliche Dienstleistungen im Bereich von Sprach- und Korpustechnologie an. Seine Forschungsinteressen liegen in der digitalen Methodik für die wissenschaftliche Auseinandersetzung mir gesprochener Sprache sowie in der Korpuslinguistik und digitalen Lexikographie.
Für weitere Informationen und eine vollständige Veröffentlichungsliste siehe das Orcid-Profil unter https://orcid.org/0000-0003-0026-6450.
Deppermann, Arnulf/Schmidt, Thomas (2014): Gesprächsdatenbanken als methodisches Instrument der Interaktionalen Linguistik - Eine exemplarische Untersuchung auf Basis des Korpus FOLK in der Datenbank für Gesprochenes Deutsch (DGD2). In: Domke, Christine & Gansel, Christa (eds.): Korpora in der Linguistik - Perspektiven und Positionen zu Daten und Datenerhebung [=Mitteilungen des Deutschen Germanistenverbandes 1/2014], 4-17.
Fandrych, Christian / Schmidt, Thomas / Wallner, Franziska / Wörner, Kai (2023): Zugänge zu multimodalen Korpora gesprochener Sprache. Erscheint als Themenheft der Zeitschrift „Korpora Deutsch als Fredmsprache“ (KorDaF). ISSN: 2749-4411
Hedeland, Hanna / Schmidt, Thomas (2022): The TEI-based ISO Standard ‘Transcription of spoken language’ as an Exchange Format within CLARIN and beyond. Monica Monachini and Maria Eskevich (eds.): Selected Papers from the CLARIN Annual Conference 2021. Linköping Electronic Conference Proceedings (189).
Schmidt, Thomas (2014): Gesprächskorpora und Gesprächsdatenbanken am Beispiel von FOLK und DGD. In: Gesprächsforschung 15, S. 196-233.
Schmidt, Thomas (2016a): Construction and Dissemination of a Corpus of Spoken Interaction - Tools and Workflows in the FOLK project. In: Corpus Linguistic Software Tools, Journal for Language Technology and Computational Linguistics (JLCL 31/1), by Kupietz, Marc & Geyken, Alexander (Hrsg.), S. 127-154. Text im Open-Access bei JLCL
Schmidt, Thomas (2016b): Good practices in the compilation of FOLK, the research and teaching corpus of spoken German. In: International Journal of Corpus Linguistics 21:3, S. 396-418.
Schmidt, Thomas (2017): DGD – die Datenbank für Gesprochenes Deutsch. Mündliche Korpora am Institut für Deutsche Sprache (IDS) in Mannheim. In: Zeitschrift für germanistische Linguistik 45.3. Berlin/Boston: de Gruyter, 2017. S. 451-463.
Schmidt, Thomas / Wörner, Kai (2014): EXMARaLDA. In: Jacques Durand, Ulrike Gut, and Gjert Kristoffersen (eds.): The Oxford Handbook of Corpus Phonology. Oxford: OUP 2014, S. 402-419.