MHDBDB

Die Die Mittelhochdeutsche Begriffsdatenbank erschließt seit den frühen 1970er-Jahren den mhd. und fnhd. Wortschatz onomasiologisch, also über die Wortbedeutung. Von 2016 bis 2021 wird die Datenbank einem erneuten Redesign und einer Migration unterzogen. Sie enthält mittlerweile rund 10,7 Millionen Tokens verteilt auf über 660 Texteditionen unterschiedlichster Textsorten und -gattungen, mit rund 6,7 Millionen semantischen Annotationen.
Die Texteditionen der Datenbank werden im Zuge des Relaunchs nach TEI-XML transferiert. Um in den e-Texten beliebig viele Annotationsebenen wie etwa Part-Of-Speech (POS), Phrasen- und Satzstrukturen, Onomastik oder Semantik auszeichnen zu können, werden die Annotationen im Stand-Off-Verfahren über das Web Annotation Vocabulary auf die Tokens der Texte bezogen.

Link zum Projekt: http://mhdbdb.sbg.ac.at/ // Kontakt: Dr. Katharina Zeppezauer-Wachauer