Skip to main content

Potsdamer Zeitungskorpus - diachron

Das Potsdamer Zeitungskorpus ist eine diachrone Dependenzbaumbank, die sowohl Informationen zu den Lemmata und Wortarten als auch ausgewählte Dependenzrelationen der Universal Dependencies (UD) enthält. Der Aufbau der Baumbank erfolgte an der Universität Potsdam im Rahmen des Projekts C06 im SFB 1287 „Limits of Variability in Language: Cognitive, Computational, and Grammatical Aspects“, gefördert von der Deutschen Forschungsgemeinschaft (Projektnummer 317633480).

Das Korpus umfasst eine strukturierte Auswahl von Zeitungstexten, die zwischen 1600 und 1949 in verschiedenen Regionen Deutschlands publiziert wurden. Für jedes 50-Jahres-Intervall wurden Ausschnitte aus jeweils zwei unterschiedlichen Zeitungen ausgewählt, sodass pro Zeitfenster etwa 27.000 Wortformen vorliegen. Insgesamt umfasst das Korpus 171.375 Wortformen in 7.594 Sätzen. Die Zeitungstexte für den Zeitraum von 1600 bis 1899 liegen als Ausschnitte aus Faksimilevorlagen vor, die im Rahmen des Projekts transkribiert und annotiert wurden. Die Ausschnitte aus dem Berliner Tageblatt und der Vossischen Zeitung (1900 bis 1949) stammen aus dem DWDS-Korpus; sie wurden manuell exportiert, wobei jeweils nur die für das Korpus benötigte Anzahl an Wortformen annotiert wurde.

Die  Annotation von Lemmata und Wortarten erfolgte semi-automatisch: Nach der manuellen Segmentierung der Ganzsätze wurde mithilfe der Stanford Natural Language Processing Software  zunächst automatisch das Lemma-Tagging und Part-of-Speech-Tagging vorgenommen. Anschließend wurden fehlerhafte Annotationen auf Wortebene manuell korrigiert. Die Annotation der Dependenzrelationen wurde im Double-Keying-Verfahren ebenfalls manuell erstellt. Der Zugang zum Korpus erfolgt über TüNDRA.

Zitierweise

Demske, Ulrike,  Iskra Fodor, Emil Paraskevopulos,  Laura Partikel & Malika Reetz. 2025. Potsdamer Zeitungskorpus - diachron. Universität Potsdam: Institut für Germanistik. DOI:  https://doi.org/10.57754/FDAT.crpb9-vpr31

In der folgenden Tabelle sind die Zeitungstexte in der jeweiligen Zeitperiode aufgeführt, ebenso die Anzahl der Wortformen pro Zeitfenster sowie das Erscheinungsjahr der Zeitung. Die Abkürzungen der Zeitungstitel sind nachfolgend erläutert. Für alle Fragen das Potsdamer Zeitungskorpus betreffend wenden Sie sich bitte an Prof. Dr. Ulrike Demske, Universität Potsdam, Institut für Germanistik.

Übersicht
Zeitperiode 1600-1649 1650-1699 1700-1749 1750-1799 1800-1849 1850-1899 1900-1949
Zeitungstexte 1609_Rel 1667_OP 1724_BP 1750_LZ 1805_KukZ 1859_AZ 1905-1925_BT
  1628_OZ 1667_Rel 1743_MOP 1766_OMZ 1820_BN 1881_BoZ 1905-1925_VZ
Wortformen  gesamt 27.736 25.106 27.677 26.757 30.956 33.143 29.681

Legende

AZ = Allgemeine Zeitung. Stuttgart und Augsburg 1859. Nr. 2 und Beilage zu Nr. 2. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10504415-6.

BN = Berlinische Nachrichten von Staats- und gelehrten Sachen. Berlin 1820. Nr. 119–121. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10486266-1.

BoZ = Bonner Zeitung. Bonn 1881. Nr. 81–83. Universitäts- und Landesbibliothek Bonn, urn:nbn:de:0303-47557.

BP = Berlinische Privilegirte Zeitung. Berlin 1724. Nr. 95, 97, 98, 101, 103. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10404776-3.

BTB = Berliner Tageblatt. Berlin 1905–1925. Abend-Ausgabe vom 01.03.1905, 01.02.1906, 01.03.1907, 03.03.1910, 01.03.1915, 05.03.1920, 05.03.1925. Aus dem Kernkorpus (1900–1999) des DWDS, www.dwds.de/d/korpora/kern, zuletzt abgerufen am 15.12.2023.

KuKZ = Kaiserlich und Kurpfalzbairisch privilegierte Allgemeine Zeitung. Stuttgart 1805. Nr. 1–4. München: Bayerische Staatsbibliothek, bsb10504751_00133_u001.

LZ = Leipziger Zeitungen. Leipzig 1750. Nr. 1 (Woche 4, 15), 2 (Woche 3, 4), 3 (Woche 2, 5, 15), 4 (Woche 3, 4). Staatsbibliothek zu Berlin, urn:nbn:de:gbv:46:1-6030.

MOP = Mercurii Relation, oder wochentliche Ordinari Zeitungen von unterschiedlichen Orthen. Münchner Post=Zeitungen. München 1743. Nr. 1–16. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10505638-7.

OMZ = Ordinari=Müncher=Zeitungen, Welche Montags, Dienstags, Donnerstags, und Freytags ausgegeben werden […]. München 1766. Nr. 1–11. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb10505666-2.

OP = Ordentliche Wochentliche Postzeitungen. München 1667. Nr. 2–7, 11–14. Staats- und Universitätsbibliothek Bremen, urn:nbn:de:gbv:46:1-2276.

OZ = Particular vnd rechte Ordinari Zeitungen/ auß vnderschidlichen Orten. München 1628. Nr. 16–24. Bayerische Staatsbibliothek, urn:nbn:de:bvb:12-bsb 10505558-3.

Rel = Relation aller Fürnemmen und gedenckwürdigen Historien […]. Straßburg 1609. Nr. 1–7. Universitätsbibliothek Heidelberg, urn:nbn:de:bsz:16-diglit-27395.

VZ = Vossische Zeitung. Berlin 1905–1920. Abend-Ausgabe vom 01.03.1905, 01.02.1906, 01.03.1907, 01.03.1910, 02.03.1915, 05.03.1920. Aus dem Kernkorpus (1900–1999) des DWDS, www.dwds.de/d/korpora/kern, zuletzt abgerufen am 15.12.2023.