PULS
Foto: Matthias Friel
E-Lexikographie
Der Erstellungsprozess von akademischen Wörterbüchern basiert auf einem wissenschaftlichen Prozess, bei dem typische Wortgebrauchsmuster in großen Mengen von Korpusdaten identifiziert und in gut strukturierten Beschreibungen von Angaben zu Form und Bedeutung so zusammengefasst und kodiert werden, dass sie für ein breites Publikum und für verschiedene Anwendungen geeignet sind. Obwohl die akademische Lexikographie ein „early adopter” der Informationstechnologie war, ist die Erstellung und Verbreitung lexikographischen Wissens nach wie vor entscheidend auf menschliches Fachwissen angewiesen. Da die Lexikographie aus großen Mengen unstrukturierter Daten strukturiertes und hoch schematisiertes Wissen erzeugt, stellt sie ein ideales Experimentierfeld für die Forschung in den Bereichen der Data Analytics und des maschinellen Lernens dar. Das erklärte Ziel akademischer Wörterbücher, der Sprachgemeinschaft als Ganzes zu dienen, macht sie darüber hinaus besonders geeignet, um die breite Öffentlichkeit durch Citizen Science-Projekte einzubeziehen und die automatische Anpassung von Inhalten für ein vielfältiges Publikum zu erforschen.
Mit E-Lexikographie wird die Teildisziplin der Lexikographie bezeichnet, die Verfahren aus den o.g. Gebieten der Informationsverarbeitung einbezieht.
Der 4-tägige Kompaktkurs führt in die o.g. Punkte ein. Er vermittelt zunächst (i) die grundlegenden Konzepte des Aufbaus und der Nutzung von Korpusdaten, (ii) die derzeit angewendeten Methoden zur automatischen Extraktion lexikographischer Informationen aus Korpora und führt (iii) in die Praxis des Schreibens von Wörterbuchartikeln unter Verwendung standardisierter Darstellungsschemas ein. Zum Abschluss des Blockseminars wird auch (iv) das Thema Citizen-Science behandelt bzw. auf deren Einsatz in großen europäischen Wörterbuchprojekten eingegangen.
Leistungsnachweis: Kurzreferat (15 Minuten) + anschließende Hausarbeit (abzuliefern bis 31.3.).
Mögliche Themen (die Themen werden zu Beginn des Kurses erläutert):
(1a) Automatische Extraktion lexikographischer Informationen aus Korpora: Extraktion geeigneter Belege (Gdex) --- Referat: Gerhard Haß )
(1b) Automatische Extraktion lexikographischer Informationen aus Korpora: Word-sketches (Referat unbenotet: Monique Noss, Maria Lomaeva - Thema Mehrwortausdrücke, vgl. Dokument Literatur); Word-sketches (Referat unbenotet: H. Peuckmann; Thema SEO mit word-sketches, vgl. Dokument Literatur); Anna Barkowski (Projektarbeit).
(3) Lexikographie - zwischen sprachlichem Wissen und Weltwissen
(4) Wortnetze und Ontologien (Lukas Paschen; Programmierprojekt)
(5) Modellierung von Wörterbüchern mit xml anhand eines auszuwählenden Wörterbuchs (Karla A. Friedrichs)
(6) der lexikographische Arbeitsprozess: Erstellung von Einträgen
(7a) Nutzung von Wörterbüchern: Vergleich verschiedener Plattformen (oxforddictionaries, merriam-webster, dictionary.com)
(7b) Nutzung von Wörterbüchern: Vergleich verschiedener Plattformen (duden, wiktionary, dwds) (Hausarbeit unbenotet: I. Mozhina)
(7c) Nutzung von Wörterbüchern: Vergleich verschiedener Plattformen (leo, linguee, pons, dict.cc)
(8) Erstellung und Analyse von Korpora mit Web-Crawling Techniken
Kurzreferat (15 Minuten) + anschließende Hausarbeit (abzuliefern bis 31.3.)
© Copyright HISHochschul-Informations-System eG