Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 

Foto: Matthias Friel

Quantitative Textanalyse mit R - Einzelansicht

Veranstaltungsart Seminar Veranstaltungsnummer 423211
SWS 2 Semester WiSe 2021/22
Einrichtung Sozialwissenschaften   Sprache deutsch
Belegungsfrist 01.10.2021 - 10.11.2021

Belegung über PULS
Gruppe 1:
     jetzt belegen / abmelden
    Tag Zeit Rhythmus Dauer Raum Lehrperson Ausfall-/Ausweichtermine Max. Teilnehmer/-innen
Einzeltermine anzeigen
Seminar Di 10:00 bis 12:00 wöchentlich 26.10.2021 bis 15.02.2022  3.07.1.44 Tures 21.12.2021: Akademische Weihnachtsferien
28.12.2021: Akademische Weihnachtsferien
10
Kommentar

Die quantitative Textanalyse umfasst die Anwendung statistischer Methoden auf geschriebene Sprache. Darunter fallen unter anderem das Zählen von Worthäufigkeiten, die Analyse von Korrelationen und Netzwerken zwischen Wörtern, das Erkennen der emotionalen Haltung in geschriebener Sprache (Sentiment Analyse) und die automatisierte Einordnung von Texten in latente oder explizite Kategorien (Machine Learning). Diese und andere Techniken der quantiativen Textanalyse werden wir in diesem Seminar behandeln.

 

Die computergestützte quantitative Textanalyse ermöglicht dabei die Analyse großer Datenmengen in relativ kurzer Zeit. Im Rahmen dieses Kurses werden wir die Plenarprotokolle des 19. Deutschen Bundestags analysieren. Dies sind mehr als 200 Protokolle mit jeweils ca. 50-200 Seiten Text. Eine rein händische Analyse ist in Anbetracht dieser Mengen praktisch unmöglich.

 

Die Techniken der quantitativen Textanalyse erlernen und wenden wir dabei in der Sprache R in Kombination mit RStudio an. Die im Seminar genutzte Software ist frei zugänglich und für alle gängigen Betriebssysteme verfügbar. Anleitungen und Hilfestellungen zur Installation und Nutzung werden im Seminar gegeben. Es werden keine Vorkenntnisse in quantitativer Textanalyse und der Nutzung von R und RStudio vorausgesetzt.

 

Inhalte des Seminars:

  • Der erste Block des Seminars umfasst eine Einführung in R und RStudio. Neben den Grundlagen der Bedienung sowie wichtiger erster Befehle, wird vor allem die Bereinigung, Transformation und deskriptive sowie graphische Analyse mit dem beliebten R packages des tidyverse behandelt.
  • Im zweiten Block beginnt die quantiativen Textanalyse mit dem tidytext package. Wir lernen den Umgang mit Textdaten und der statistischen Analyse einzelner Wörter bevor wir uns der Arbeit mit Kombinationen mehrerer Wörter widmen. Abgeschlossen wird der Block mit Techniken der Sentiment Analyse, also der Bestimmung des emotionalen Gehalts eines Texts.
  • Block Drei führt ein weiteres package zur quantitativen Textanalyse ein, quanteda, welches bestimmte Analysetechniken ermöglicht die über die Möglichkeiten von tidytext hinausgehen.
  • Der abschließende vierte Block führt in die grundlegenden Techniken der Textanalyse mit Machine Learning Methoden ein.

 

Ablauf des Seminars:
Das Seminar findet als Präsenzseminar im PC-Pool 1.44 in Haus 7 am Campus Griebnitzsee statt.

Zu jeder Sitzung wird ein vorbereitender Text zu lesen sein. Die Textmaterialien stammen teilweise aus einem vom Dozenten geschriebenen Skript, welches Ihnen in Form einer Website zur Verfügung gestellt wird, teilweise aus Lehrbüchern, Artikeln und von externen Online-Ressourcen. Die Materialien werden über den Moodle-Kurs zur Verfügung gestellt.

Neben der Vermittlung der Lerninhalte, liegt der Fokus der Präsenzsitzungen vor allem auf dem selbst Ausprobieren der Methoden in R und der Diskussion der Ergebnisse sowie möglicher Probleme. Selber Code zu schreiben ist zentral für das Erlernen einer Statistiksoftware und wird integraler Bestandteil des Seminars sein.

Nach jeder Sitzung sind auf den Inhalten basierende Übungsaufgaben im Selbststudium zu erarbeiten, deren Abgabe gleichzeitig die Prüfungsnebenleistung bildet. Feedback zu den abgegebenen Aufgaben sowie eine Musterlösung werden über den Moodle-Kurs kommuniziert.

Als Modulprüfung sind Hausarbeiten vorgesehen. Die Details werden im Laufe des Seminars geklärt.


Um an dem Kurs teilzunehmen, melden Sie sich bitte über Puls an und schreiben eine kurze E-Mail an jakob.tures@uni-potsdam.de. Sie erhalten dann die Zugangsdaten zum Moodle-Kurs. Dort finden Sie auch den Seminarplan. Der genaue Ablauf sowie die Prüfungsleistungen werden in der ersten Sitzung besprochen. Im Anschluss daran erfolgt die Zulassung zum Seminar in Puls.


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester WiSe 2021/22 , Aktuelles Semester: SoSe 2024