PULS
Foto: Matthias Friel
Im zweiten Teil des Lehrforschungsprojekts, setzen wir die bereits vorbereitete Codierung der Zwischenrufe des 17.-19. Bundestags um. Dazu setzen wir uns auch mit der Quantifizierung der Qualität unserer Codierung auseinander.
Das LFP wird in die Grundlagen von Supervised Machine Learning, speziell im Kontext der Textanalyse einführen. Was ist ML und wie können wir die technische Umsetzung in R realisieren? Welche Algorithmen eignen sich für die Klassifizierung von Texten und wie bereiten wir Texte für das Modell vor?
Im letzten drittel des Semesters, soll auf Basis der kodierten Stichprobe von zwischenrufen ein Machine Learning Algorithmus trainiert werden. Dieser kann potentiell genutzt werden um die restlichen unkodierten Zwischenrufe automatisiert für uns zu kodieren. Dabei ist wichtig: Wir wissen im Vorfeld nicht, ob die Qualität des Modells ausreichend sein wird um zuverlässig Zwischenrufe für uns zu kodieren. Es ist Teil des Risikos bei der Anwendung innovativer Methoden auf eine neue Fragestellung, dass wir damit auch scheitern können. Dies bedeutet aber auch, dass dieses LFP nahe an der Forschungsrealität operiert. Da wir dann bereits eine Stichprobe aus Zwischenrufen händisch kodiert haben, steht uns im Worst Case Scenario mindestens ein kodierter Teildatensatz zur Verfügung, welcher bereits zur Analyse und zur Beantwortung der Forschungsfragen genutzt werden kann.
Dies alles dient der Vorbereitung der eigentlichen statistischen Analyse der Zwischenrufe im 17.-19. Bundestag in den Forschungsberichten, welche auch die Modulprüfung bilden.
Inhalte des LFP:
2. Semester:
Technische Voraussetzungen:Das Projekt findet in Präsenz in einem PC Pool statt. Es stehen Rechner mit der benötigten Software zur Verfügung, Sie können aber auch eigene Laptops mitbringen. Die genutzte Software ist frei zugänglich und für alle gängigen Betriebssysteme verfügbar. Anleitungen und Hilfestellungen zur Installation auf Ihren eigenen Rechnern werden im Seminar gegeben.Inhaltliche Voraussetzungen:Es wird kein Vorwissen in R vorausgesetzt. Alle Techniken die wir für das Projekt benötigen, werden gemeinsam im Seminar erarbeitet. Die Einführung in R und RStudio im Rahmen dieses Seminars erfolgt dabei "problemorientiert" und kann/soll eine umfassende Einführung nicht ersetzen.Es bestehen keine formalen Zulassungsvoraussetzungen. Vorwissen in R und/oder anderer Statistiksoftware wie Stata ist hilfreich, wird aber nicht vorausgesetzt.Ablauf des Seminars:
Zur Vorbereitung der Sitzungen zu lesende Literatur wird über Moodle bekanntgegeben.Die Arbeit mit R und die Anwendung der besprochenen Methoden lässt sich nur durch selbstständiges Schreiben von Code erlernen. Dazu werden Ihnen Übungsaufgaben über Moodle zur Verfügung gestellt.Als Modulprüfung ist nach dem zweiten Semester ein Forschungsbericht zu einer selbst entwickelten Fragestellung, welche sich mit den im LFP genutzten Daten beantworten lässt, zu verfassen. Gruppenarbeiten sind möglich. Die Planung der Forschungsbereichte begann bereits im ersten Semester.Die Prüfungsnebenleistung im zweiten Semester besteht aus zwei Teilen:1. ist eine noch festzulegende Anzahl von Zwischenrufen zu kodieren.2. werden die Exposes zu der selbst entwickelten Fragestellung abgeschlossen und im Plenum vorgestellt
Der Besuch des 1. Teils des LFP ist Zulassungsvoraussetzung.
ModulprüfungForschungsbericht zu einer selbst entwickelten Fragestellung, welche sich mit den im LFP genutzten Daten beantworten lässt. Gruppenarbeiten sind möglich.
Prüfungsnebenleistung1. Codierung einer noch festzulegenden Anzahl von Zwischenrufen2. Vervollständigung und Vorstellung der Exposes im Plenum
© Copyright HISHochschul-Informations-System eG