Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 

Foto: Matthias Friel

Quantitative Textanalyse mit R - Einzelansicht

Veranstaltungsart Seminar Veranstaltungsnummer 424521
SWS 2 Semester SoSe 2024
Einrichtung Sozialwissenschaften   Sprache deutsch
Belegungsfrist 02.04.2024 - 10.05.2024

Belegung über PULS
Gruppe 1:
     jetzt belegen / abmelden
    Tag Zeit Rhythmus Dauer Raum Lehrperson Ausfall-/Ausweichtermine Max. Teilnehmer/-innen
Einzeltermine anzeigen
Seminar Di 10:00 bis 12:00 wöchentlich 09.04.2024 bis 16.07.2024  3.07.1.44 Tures   20
Kommentar

Die quantitative Textanalyse umfasst die Anwendung statistischer Methoden auf geschriebene Sprache. Darunter fallen unter anderem das Zählen von Worthäufigkeiten, die Analyse von Korrelationen und Netzwerken zwischen Wörtern, das Erkennen der emotionalen Haltung in geschriebener Sprache (Sentiment Analyse) und die Modellierung latenter Kategorien in Texten (Topic Modelloing/Unsupervised Machine Learning. Diese und andere Techniken der quantiativen Textanalyse werden wir in diesem Seminar behandeln.

Die computergestützte quantitative Textanalyse ermöglicht dabei die Analyse großer Datenmengen in relativ kurzer Zeit. Im Rahmen dieses Kurses werden wir die Plenarprotokolle des 19. Deutschen Bundestags analysieren. Dies sind mehr als 200 Protokolle mit jeweils ca. 50-200 Seiten Text. Eine rein händische Analyse ist in Anbetracht dieser Mengen praktisch unmöglich.

Die Techniken der quantitativen Textanalyse erlernen und wenden wir dabei in der Sprache R in Kombination mit RStudio an. Die im Seminar genutzte Software ist frei zugänglich und für alle gängigen Betriebssysteme verfügbar. Anleitungen und Hilfestellungen zur Installation und Nutzung werden im Seminar gegeben. Es werden keine Vorkenntnisse in quantitativer Textanalyse und der Nutzung von R und RStudio vorausgesetzt.

Inhalte des Seminars

  • Einführung in R und RStudio. Neben den Grundlagen der Bedienung sowie wichtiger erster Befehle, wird vor allem die Bereinigung, Transformation und deskriptive sowie graphische Analyse mit dem beliebten R packages des tidyverse behandelt.
  • Quantiative Textanalyse mit den Packages tidytext und quanteda
  • Umgang mit Textdaten und Preprocessing
  • Frequenzanalysen einzelner Wörter
  • Wörter in ihrem Kontext verstehen
  • Sentiment Analyse
  • Topic Modelling

 

Ablauf des Seminars

Das Seminar findet als Präsenzseminar im PC-Pool 1.44 in Haus 7 am Campus Griebnitzsee statt.

Zu jeder Sitzung wird ein vorbereitender Text zu lesen sein. Die Textmaterialien stammen teilweise aus einem vom Dozenten geschriebenen Skript, welches Ihnen in Form einer Website zur Verfügung gestellt wird, teilweise aus Lehrbüchern, Artikeln und von externen Online-Ressourcen. Die Materialien werden über den Moodle-Kurs zur Verfügung gestellt.

Neben der Vermittlung der Lerninhalte, liegt der Fokus der Präsenzsitzungen vor allem auf dem selbst Ausprobieren der Methoden in R und der Diskussion der Ergebnisse sowie möglicher Probleme. Selber Code zu schreiben ist zentral für das Erlernen einer Statistiksoftware und wird integraler Bestandteil des Seminars sein.

Nach jeder Sitzung sind auf den Inhalten basierende Übungsaufgaben im Selbststudium zu erarbeiten, deren Abgabe gleichzeitig die Prüfungsnebenleistung bildet. Feedback zu den abgegebenen Aufgaben sowie eine Musterlösung werden über den Moodle-Kurs kommuniziert

Leistungsnachweis

Prüfungsnebenleistung

Die erfolgreiche Abgabe einer Anzahl von Übungsaufgaben (siehe oben).

 

Modulprüfung

Als Modulprüfung sind Hausarbeiten vorgesehen. Die Details werden im Laufe des Seminars geklärt.

Anmelde- und Rücktrittsfrist in PULS für die Modulabschlussprüfung: 10.04.2024 - 29.09.2024


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester SoSe 2024 , Aktuelles Semester: WiSe 2024/25