Veranstaltungsdetails
"tl;dr" Too long; didn't read (?) - Große Textmengen computergestützt analysieren
Die Summer School beschäftigt sich mit computergestützten Verfahren, um große Mengen digitaler Texte, wie z. B. Internet-Blogs, Social Media-Einträge oder twitter Posts, zu extrahieren (Web Scraping), zu analysieren und für empirischen Forschungsprojekte und Abschlussarbeiten zu nutzen. Von korpuslinguistischen Verfahren (Frequenz- und Kollokationsanalysen) bis zu Machine Learning-Algorithmen werden methodische Ansätze aus vielfältigen Disziplinen zusammengebracht und aus der jeweils fachwissenschaftlichen Sicht diskutiert und in Hands-on Sessions in kleinen Gruppen an konkreten Fragestellungen praktisch eingeübt. Die Ergebnisse werden abschließend im Plenum präsentiert und diskutiert.
Grundkenntnisse in Python werden vorausgesetzt. Der Python-Workshop des Methodenzentrums vermittelt alle notwendigen Grundkenntnisse und kann von den Teilnehmer*innen der Summer School als Vorkurs besucht werden.
Die Anmeldung erfolgt in campus. Bitte beachten: Zur Anmeldung wird um eine kurze Skizze zum Interesse am Thema aus der Perspektive Ihres Faches gebeten.
Weitere Infos: Summer School Blog
Lehrende
Für die Summer School konnten wir zwei externe Expert*innen gewinnen, die einzelne Workshop-Tage leiten werden:
Jan Oliver Rüdiger
studierte Germanistik, Informatik und Kunstwissenschaft. Er arbeitete als IT-Consultant und Trainer/Dozent in der Erwachsenenbildung. Seit 2018 ist er wissenschaftlicher Mitarbeiter am Lehrstuhl Computergestützte Sozio- und Diskurslinguistik der Universität Siegen. Seine Forschungsschwerpunkte sind Computer- & Korpuslinguistik sowie E-Learning.
Ulrike Henny-Krahmer
hat Regionalwissenschaften Lateinamerika in Köln und Lissabon studiert. Sie war wissenschaftliche Mitarbeiterin am Cologne Center for eHumanities (CCeH) und Mitarbeiterin im Projekt „Computergestützte Literarische Gattungsstilistik“ (CLiGS) an der Universität Würzburg. Aktuell befindet sie sich in Elternzeit und arbeitet an dem Abschluss ihrer Dissertation mit dem Thema “Genres as text categories: a stylistic analysis of nineteenth century Spanish American novels (1830-1910)”, in der auch Topic Modeling zum Einsatz kommt.
Zum Auftakt am 24. August erwartet uns eine spannende Keynote von Nils Rieter (Universität zu Köln)
Nils Reiter
hat Computerlinguistik und Informatik an der Universität des Saarlandes studiert. Zur Promotion wechselte er an die Universität Heidelberg, und arbeitete in einem Kooperationsprojekt zwischen klassischer Indologie und Computerlinguistik im Sonderforschungsbereich 619 „Ritualdynamik“. Seit 2014 hat er an der Universität Stuttgart als wissenschaftlicher Koordinator und Forscher im Zentrum für Reflektierte Textanalyse (CRETA) gearbeitet. Unter diesem Dach läuft auch seit 2017 sein Mixed-Methods-Projekt QuaDramA zur quantitativen Analyse dramatischer Texte aus dem 17.-19. Jahrhundert (gemeinsam mit Dr. Marcus Willand, Universität Heidelberg). Derzeit ist er Vertretungsprofessor für Sprachliche Informationsverarbeitung an der Universität zu Köln. Seine Forschungsinteressen beziehen sich hauptsächlich auf Operationalisierungsfragen, insbesondere im Bereich der (komputationellen) Literaturwissenschaft, sowie die Verbindung quantitativer, statistischer und formaler Methoden mit hermeneutischen Verfahren.
Veranstalter
Methodenzentrum und weitere Lehreinheiten der RUB
Leitung
Frederik Elwert (CERES) , Sebastian Gerhartz (Methodenzentrum) , Stephanie Heimgartner (Philologie) , Stefan Reiners (PSE)
Termine
Donnerstag, 09.07.2020 16:00 bis 18:00 Uhr
Montag, 24.08.2020 09:00 bis 16:00 Uhr
Dienstag, 25.08.2020 09:00 bis 16:00 Uhr
Mittwoch, 26.08.2020 09:00 bis 16:00 Uhr
Donnerstag, 27.08.2020 09:00 Uhr