Veranstaltungsdetails

ICAL

Mit Python durch das Textchaos – Bearbeitung von Textdaten

Inhalt

Auswertungen von Daten beschränken sich oftmals nur auf bloße Zahlenwerte, allerdings sind wichtige Informationen für Forschungsfragen ebenso oft in kategorialen Variablen, Zeit- und Adressangaben oder Freitextfeldern gespeichert. In der Regel sind Datensätze jedoch nicht für die Computerverwertung vorbereitet und bedürfen sorgfältiger vorbereitender Überarbeitung – so beispielsweise bei der Auswertung von offenen Angaben in Befragungen oder bei Onlinetextdaten aus unterschiedlichen Quellen. Enstsprechend stellt die Fähigkeit mit Textdaten umzugehen eine wertvolle Erweiterungen und Vereinfachungen auch für quantitativ angelegte Datenanalysen dar.

Im Rahmen des Workshops wird ein Überblick über die Möglichkeiten zur Textverarbeitung mit Python. Hierbei werden die folgenden Inhalte behandelt:

  • Der Umgang mit String-Variablen in Datensätzen (Manipulation, Bereinigung)
  • Regular Expression
  • Stopword removal
  • Wortzählung
  • Tokenisierung
  • Lemmatisierung
  • Einführung in Natural Language Processing

Grundsätzlich sind geringe Vorkenntnisse in Python wünschenswert, jedoch nicht zwingend erforderlich. Es wird jedoch empfohlen den Workshop "Einführung in Python" oder ein vergleichbarers Angebot zur Vorbereitung zu besuchen.

Der Workshop gehört zum Angebot des Projekts "Data.Literacy@RUB". Nähere Informationen zu weiteren Angeboten im Bereich Data Literacy finden Sie auf der Website des Projekts (https://uni.ruhr-uni-bochum.de/de/dataliteracyrub).

Leitung

Valentin Fuchs

Termine

  • Freitag, 19.11.2021
    13:30 bis 17:30 Uhr

Anmeldung

Bitte melden Sie sich in eCampus für die Veranstaltung an.