uni-potsdam.de

Sie verwenden einen veralteten Browser mit Sicherheitsschwachstellen und können die Funktionen dieser Webseite nicht nutzen.

Hier erfahren Sie, wie einfach Sie Ihren Browser aktualisieren können.

Guten Morgen, Twitter! - Sprachforscher entdecken soziale Netzwerke als ergiebige Datenquelle

Mann mit schwarzer Hornbrille legt seinen Kopf auf dem Tisch ab. In der Hand hält er einen Kaffeebecher. Im Vordergrund befindet sich ein Wecker. Foto: Fotolia/katie martynova.

Guten Morgen, Twitter! Foto: Fotolia/katie martynova.

Das Klingeln des Weckers ist unbarmherzig. Wer morgens nur mit Mühe aus dem Bett kommt, abends aber gern lange wach ist, gilt in der Chronobiologie als „Eule“. Das Fachgebiet beschäftigt sich mit biologischen Rhythmen und den dabei ablaufenden physiologischen Prozessen. Den „Lerchen“ fällt es dagegen nicht schwer, morgens aufzustehen. Dafür sind sie abends eher müde. Das Tageslicht und die innere Uhr bestimmen natürlicherweise, wann der Tag beginnt und wann er endet. Wer arbeiten geht oder zur Schule muss, genießt diesen Luxus jedoch nur am Wochenende. Gerade der Chronotyp „Eule“ leidet unter diesem vom Wecker bestimmten Tagesrhythmus. Forscher sprechen vom „Social Jetlag“. Weil „Eulen“ nicht früh genug einschlafen können, aber trotzdem zeitig aufstehen müssen, summiert sich im Laufe der Woche ein Schlafmangel, den sie am Wochenende häufig durch längere Schlafzeiten ausgleichen.

Tatjana Scheffler ist keine Chronobiologin. Trotzdem interessiert sich die Computerlinguistin für die Problematik des „Social Jetlag“. Ausgangspunkt dafür waren die Untersuchungen ihres Kollegen Christopher Kyba, der am Deutschen GeoForschungsZentrum (GFZ) zum Thema Lichtverschmutzung forscht. Denn künstliches Licht hat ebenfalls Auswirkungen auf den Schlaf-Wachrhythmus der Menschen. „Normalerweise sammeln die Forscher Daten darüber in Schlafstudien, die im Labor durchgeführt werden, oder über Fragebögen“, erläutert Tatjana Scheffler. Allerdings seien dafür die Datenerhebung und auch die Auswertung sehr aufwendig. Und genau für dieses Problem hat Tatjana Scheffler eine Lösung parat. 

Auf der einen Seite steht dabei der Kurznachrichtendienst Twitter, auf der anderen Seite ein Computerprogramm, das Text automatisch analysieren kann. Die Idee: Die Phrase „Guten Morgen!“ ist der Schlüsselmoment, der mit der Aufwachzeit des Twitternden übereinstimmt. Auf einen Schlag würden die Forscher die Aufwachzeiten Tausender Twitter-Nutzer kennen – und das täglich.

Ob die Idee trägt, überprüften die Forscher in einer umfangreichen Studie, die mit dem Sammeln von Tweets begann. Dafür nutzt die Computerlinguistin eine sogenannte Programmierschnittstelle, über die sie Tweets automatisiert abfragen kann. Dabei gibt sie bestimmte Suchkriterien an – etwa Suchwörter, Hashtags oder auch Nutzer. Auf diese Weise filtert sie sämtliche Tweets zu den gewünschten Angaben aus den Unmengen an Nachrichten heraus. Anschließend wird der Filterprozess verfeinert. „Wenn ich mich beispielsweise nur für deutsche Tweets interessiere, verwende ich noch einen Sprachfilter. Wenn mich bestimmte Sprach- oder Satzstrukturen interessieren, kann ich auch gezielt danach suchen“, beschreibt Tatjana Scheffler das Vorgehen. Um die Aufwachzeiten von Twitter-Nutzern zu untersuchen, filterte sie alle Tweets mit der Phrase „Guten Morgen!“ heraus und kombinierte diese mit den Zeiten, zu denen sie getwittert wurden.

Um die Unmengen sprachlicher Informationen erfassen und analysieren zu können, müssen die Computerprogramme zunächst trainiert werden – eine bestimmte Menge Text versehen die Forscher per Hand mit beschreibenden Attributen. „Das ist insgesamt der aufwendigste Schritt“, betont die Wissenschaftlerin. „Annotieren“ heißt der Fachbegriff hierfür. Das Programm lernt auf dieser Basis, bestimmte Textmerkmale selbst zu erkennen und einzuordnen. Durch das Maschinenlernverfahren wird es möglich, große Textmengen innerhalb kürzester Zeit auszuwerten.

Die Ergebnisse der „Guten Morgen!“-Studie zeigen, dass das Verfahren funktioniert. „Es gibt tatsächlich viele Menschen, die das Handy neben dem Bett haben, und das Erste, was sie morgens tun, ist twittern“, bestätigt Tatjana Scheffler. Ein Jahr lang sammelte die Wissenschaftlerin sämtliche Tweets mit der Phrase „Guten Morgen!“. Insgesamt wertete sie rund 1,5 Millionen Tweets von über 200.000 Nutzern aus. Dabei interessierte sie sich besonders für die Unterschiede zwischen den Aufwachzeiten an Werktagen, an denen der Wecker das Signal zum Aufwachen gibt, und an Sonntagen, an denen die Aufwachzeit eher durch natürliche Faktoren bestimmt wird. „Im Winter und im Frühling folgte die Aufwachzeit an Sonntagen sehr stark der Zeit des Sonnenaufgangs“, erklärt sie. „Das wurde so auch schon in Schlafstudien festgestellt.“ Denn in diesen Jahreszeiten stimmt die innere Uhr, die das Signal zum Aufwachen gibt, am ehesten mit dem natürlichen Lichtsignal überein. Dagegen weichen die Aufwachzeiten im Sommer und im Winter von der Zeit des Sonnenaufgangs ab – was auch die Twitterdaten zeigten. „Das sehen wir als Bestätigung unserer Methode“, betont die Computerlinguistin. Ein gemeinsames Forschungsprojekt mit einem Chronobiologen, in dem die Forscher die neue Methode anwenden wollen, ist bereits in Planung.

Auch für weitere Fragestellungen lohnt es sich, die Sprache aus sozialen Netzwerken zu analysieren, ist Tatjana Scheffler überzeugt. Denn dort wird nicht nur gepostet, sondern auch kommuniziert. Die Struktur dieser Konversationen ist für viele Wissenschaftler von besonderem Interesse. Worüber reden die Leute? Tauschen sich Menschen mit unterschiedlichen Meinungen aus? Wie sieht die politische Meinungsbildung in sozialen Medien aus? Diese Fragen sind vor allem für Sozialwissenschaftler von Interesse. Für Politik-, Kommunikations oder Medienwissenschaftler liefern Computerlinguisten die notwendigen Werkzeuge, um diese potenziellen Datenquellen anzuzapfen.

Die Wissenschaftlerin

Dr. Tatjana Scheffler studierte Computerlinguistik in Saarbrücken und promovierte an der University of Pennsylvania (USA). Seit 2013 forscht sie an der Universität Potsdam.

Kontakt

Universität Potsdam
Department Linguistik
Karl-Liebknecht-Straße 24-25
14476 Potsdam
Email: tatjana.scheffleruni-potsdamde

Text: Heike Kampe
Online gestellt: Agnetha Lang
Kontakt zur Online-Redaktion: onlineredaktionuni-potsdamde