Young Visual Linguists

In der neuen Reihe „Young Visual Linguists“ werden Blog-Beiträge von Studierenden publiziert, die sich im Rahmen eines Seminars „Visuelle Linguistik“ an der Technischen Universität Dresden intensiv mit dem Thema befassen. Folgende Themen werden aufgegriffen:

  • Analyse traditioneller Visualisierungen in der Sprachwissenschaft
  • Vorstellung neuer Visualisierungsformen der Korpusanalyse
  • Berichte und Interviews vom Symposium „Visual Linguistics“

Drogen und Sprache

Dass man bei übermäßigem Alkoholkonsum zu lallen beginnt, ist ein Gemeinplatz, der und hier nicht weiter interessiert. Viel interessanter ist, wenn Leute über ihre Drogenerfahrungen berichten. Das tun sie auf der Plattform Land der Träume in Form von Tripberichten.

Mihael Švitek und Fabian Klinker (TU Dresden) untersuchten diese Daten korpuslinguistisch und suchten nach Visualisierungsmethoden, um die Daten besser überblicken und interpretieren zu können – und kommen mit datengeleiteten Methoden zu interessanten Erkenntnissen.

Bildschirmfoto 2015-03-12 um 16.15.11

Ausschnitt aus dem als Netzgraph visualisierten Topic Model der Tripberichte (Klinker/Švitek)

Ein Topic Modelling-Verfahren zeigt beispielsweise die Nähe unterschiedlicher Drogen aufgrund des Vokabulars, das bei den entsprechenden Tripbeschreibungen benutzt wird. Fantastisch sind jedoch auch die handgemalten Visualisierungen der Topics von Kirsti Zimmermann – eine Symbiose von maschinellem und manuellem Vorgehen! Hier der Link zur Website: http://linguistik.zih.tu-dresden.de/lehre/blogs/datenrausch/

 

Visuelle Linguistik: Ein neues Forschungsfeld?

diagramGestern endete das Symposium „Visuelle Linguistik„, das ich zusammen mit Marc Kupietz organisiert hatte. Aus unserer Sicht besonders interessant am Symposium war die breite Palette von unterschiedlichen Hintergründen, denen die Beiträge entstammten: Linguistik, Korpus- und Computerlinguistik, Digital Humanities, Informatik und Ästhetik – um nur die wichtigsten Perspektiven zu nennen.

Die Keynotes von Mark Lauersdorf, Martin Hilpert und Maximilian Schich boten den Rahmen für die 16 Vorträge und die zusätzlichen Poster und Live-Präsentationen. Am dritten Tag ermöglichte der Workshop von Sandra Hansen-Morath und Sascha Wolfer zu R, verschiedene Visualisierungsmethoden selber auszuprobieren.

Die Folien meines Eröffnungsvortrags, der „Visuelle Linguistik“ als lohnenswertes Forschungsfeld vorschlägt, sind ab sofort online verfügbar. In den kommenden Tagen werden auch die Folien weiterer Vorträge, sowie Berichte zur Tagung, publiziert.

[Update 23. 11. 14] Die Kollegen aus Regensburg haben einen kurzen Bericht zum Symposium verfasst.

SNF Ambizione-Förderung: Visual Linguistics

Soeben habe ich die erfreuliche Nachricht erhalten: Der Schweizer Nationalfonds fördert mein Projekt “Visual Linguistics: Grundlagen der Visualisierung von sprachlichen Daten” über drei Jahre! Voraussichtlich ab 2015 werde ich das Projekt mit dem Ziel starten, ein “Visual Linguistics Framework” zu erarbeiten. Es geht im Grunde um die Fragen:

  • Wie wurden Visualisierungen zur Datenanalyse bereits bisher in der Sprachwissenschaft verwendet?
  • Welche Visualisierungsmodi gibt es in verwandten Disziplinen?
  • Welche Chancen ergeben sich durch visuelle Analysemethoden in der Welt von (sprachlicher) Big Data?
  • Aber was machen wir eigentlich, wenn wir Daten visualisieren?

Die äußerst positiven Gutachten ermutigen mich, die Aufgabe anzupacken! Danke an alle mir bekannten und unbekannten Unterstützer/innen des Projekts, die mir den nötigen Rückenwind geben!

Merkel und die Krisen

Bildschirmfoto 2013-08-27 um 23.45.30Es gehört zur klassischen Definition einer Krise, dass man gestärkt aus ihr heraus gelangen wird. Dies ist der Topos, den auch Angela Merkel bemüht: Wenn auch die Auswirkungen auch schlimm und die Aussichten noch nicht rosig sind, so bleibt doch der Trost, dass Europa letztlich von der Krise profitieren wird – so zumindest Merkel:

„Wir haben es geschafft, Deutschland stärker aus der Finanzmarktkrise hinauszuführen, als es in sie hineingegangen ist. […] Nun wollen wir, Europa stärker aus der Krise hinausführen.“

Das sind Floskeln, wie sie in der politischen Rhetorik üblich sind. Wir berechneten Formulierungsmuster, sog. komplexe n-Gramme (cf. Scharloth/Bubenhofer 2012), die typisch für die Rhetorik von Angela Merkel sind. Die Datengrundlage waren alle Redebeiträge von Angela Merkel im Bundestag der letzten Legislaturperiode (September 2009 bis Juni 2013 – PolMine-Korpus).

Continue reading

Die Welt im Bundestag

Die weite Welt ist oft Thema unter der Glaskuppel des Bundestags: Die Parteien versuchen sich auch in außenpolitischen Themen voneinander zu differenzieren. Mit der Berechnung von Geocollocations kann analysiert werden, wie die Parlamentarierinnen und Parlamentarier über Orte, Regionen und Länder dieser Erde sprechen.

btmapSPDBildschirmfoto 2013-08-14 um 15.54.51
Ausschnitt Geocollocations SPD: Typische Wörter in Verbindung mit Orten (siehe die Karten komplett auf bubenhofer.com/geocollocations/Bundestag/)

Die folgenden Analysen basieren auf den Protokollen des Bundestags der 17. Wahlperiode, also der Zeit von 2009 bis 2013 (Korpus: Andreas Blättes PolMine). Ein Blick in die vergangene Legislatur sagt mitunter mehr darüber aus, was nach der Wahl zu erwarten ist, als die Wahlprogramme und Wahlreden.

Ich berechnete pro Partei, welche Wörter überzufällig häufig zusammen mit den jeweiligen Orten, Regionen oder Ländern verwendet werden und visualisierte die Ergebnisse auf Karten. Unter bubenhofer.com/geocollocations/Bundestag/ können die Karten im Detail eingesehen werden. Die technischen Details sind hier beschrieben.

Continue reading