Zur Seitennavigation oder mit Tastenkombination für den accesskey-Taste und Taste 1 
Zum Seiteninhalt oder mit Tastenkombination für den accesskey und Taste 2 

Foto: Matthias Friel

Supervised Machine Learning: Zwischenrufe im Bundestag (Teil 2) - Einzelansicht

Veranstaltungsart Lehrforschungsprojekt Veranstaltungsnummer 423112
SWS 2 Semester WiSe 2022/23
Einrichtung Sozialwissenschaften   Sprache deutsch
Belegungsfrist 04.10.2022 - 10.11.2022

Belegung über PULS
Gruppe 1:
     jetzt belegen / abmelden
    Tag Zeit Rhythmus Dauer Raum Lehrperson Ausfall-/Ausweichtermine Max. Teilnehmer/-innen
Einzeltermine anzeigen
Lehrforschungsprojekt Di 10:00 bis 12:00 wöchentlich 18.10.2022 bis 07.02.2023  3.07.1.44 Tures 20.12.2022: Akademische Weihnachtsferien
27.12.2022: Akademische Weihnachtsferien
20
Kommentar

Im zweiten Teil des Lehrforschungsprojekts, setzen wir die bereits vorbereitete Codierung der Zwischenrufe des 17.-19. Bundestags um. Dazu setzen wir uns auch mit der Quantifizierung der Qualität unserer Codierung auseinander.

Das LFP wird in die Grundlagen von Supervised Machine Learning, speziell im Kontext der Textanalyse einführen. Was ist ML und wie können wir die technische Umsetzung in R realisieren? Welche Algorithmen eignen sich für die Klassifizierung von Texten und wie bereiten wir Texte für das Modell vor?

Im letzten drittel des Semesters, soll auf Basis der kodierten Stichprobe von zwischenrufen ein Machine Learning Algorithmus trainiert werden. Dieser kann potentiell genutzt werden um die restlichen unkodierten Zwischenrufe automatisiert für uns zu kodieren.
Dabei ist wichtig: Wir wissen im Vorfeld nicht, ob die Qualität des Modells ausreichend sein wird um zuverlässig Zwischenrufe für uns zu kodieren. Es ist Teil des Risikos bei der Anwendung innovativer Methoden auf eine neue Fragestellung, dass wir damit auch scheitern können. Dies bedeutet aber auch, dass dieses LFP nahe an der Forschungsrealität operiert. Da wir dann bereits eine Stichprobe aus Zwischenrufen händisch kodiert haben, steht uns im Worst Case Scenario mindestens ein kodierter Teildatensatz zur Verfügung, welcher bereits zur Analyse und zur Beantwortung der Forschungsfragen genutzt werden kann.

Dies alles dient der Vorbereitung der eigentlichen statistischen Analyse der Zwischenrufe im 17.-19. Bundestag in den Forschungsberichten, welche auch die Modulprüfung bilden.

 

Inhalte des LFP:

2. Semester:

  • Händische Kodierung einer Stichprobe aus Zwischenrufen
  • Bewertung der Reliabilität der kodierten Zwischenrufe
  • Einführung in das Supervised Machine Learning
  • Training eines Modells zur automatisierten Kodierung der Zwischenrufe
  • Offene Bewertung des Erfolgs

 


Technische Voraussetzungen:
Das Projekt findet in Präsenz in einem PC Pool statt. Es stehen Rechner mit der benötigten Software zur Verfügung, Sie können aber auch eigene Laptops mitbringen. Die genutzte Software ist frei zugänglich und für alle gängigen Betriebssysteme verfügbar. Anleitungen und Hilfestellungen zur Installation auf Ihren eigenen Rechnern werden im Seminar gegeben.

Inhaltliche Voraussetzungen:
Es wird kein Vorwissen in R vorausgesetzt. Alle Techniken die wir für das Projekt benötigen, werden gemeinsam im Seminar erarbeitet. Die Einführung in R und RStudio im Rahmen dieses Seminars erfolgt dabei "problemorientiert" und kann/soll eine umfassende Einführung nicht ersetzen.

Es bestehen keine formalen Zulassungsvoraussetzungen. Vorwissen in R und/oder anderer Statistiksoftware wie Stata ist hilfreich, wird aber nicht vorausgesetzt.


Ablauf des Seminars:

Zur Vorbereitung der Sitzungen zu lesende Literatur wird über Moodle bekanntgegeben.

Die Arbeit mit R und die Anwendung der besprochenen Methoden lässt sich nur durch selbstständiges Schreiben von Code erlernen. Dazu werden Ihnen Übungsaufgaben über Moodle zur Verfügung gestellt.

Als Modulprüfung ist nach dem zweiten Semester ein Forschungsbericht zu einer selbst entwickelten Fragestellung, welche sich mit den im LFP genutzten Daten beantworten lässt, zu verfassen. Gruppenarbeiten sind möglich. Die Planung der Forschungsbereichte begann bereits im ersten Semester.

Die Prüfungsnebenleistung im zweiten Semester besteht aus zwei Teilen:
1. ist eine noch festzulegende Anzahl von Zwischenrufen zu kodieren.
2. werden die Exposes zu der selbst entwickelten Fragestellung abgeschlossen und im Plenum vorgestellt

Voraussetzungen

Der Besuch des 1. Teils des LFP ist Zulassungsvoraussetzung.

Leistungsnachweis

Modulprüfung
Forschungsbericht zu einer selbst entwickelten Fragestellung, welche sich mit den im LFP genutzten Daten beantworten lässt. Gruppenarbeiten sind möglich.

Prüfungsnebenleistung
1. Codierung einer noch festzulegenden Anzahl von Zwischenrufen
2. Vervollständigung und Vorstellung der Exposes im Plenum


Strukturbaum
Keine Einordnung ins Vorlesungsverzeichnis vorhanden. Veranstaltung ist aus dem Semester WiSe 2022/23 , Aktuelles Semester: SoSe 2024