Einführung in R

Überblick

Einstieg und technische Voraussetzungen

Um mit R auf einem Computer arbeiten zu können, wird eine R-Installation benötigt und eine integrierte Enwicklungsumgebung (IDEintegrated development environment) empfohlen.

Üblicherweise handelt es sich bei letzterem um das kostenlose und opensource RStudio, das von dem gleichnamigen Unternehmen vertrieben wird. (Es können aber auch Alternativen wie Jupyter notebook, Visual Studio, Vim und andere verwendet werden. In dieser Einführung beschränken wir uns jedoch darauf RStudio vorzustellen, da es das verbreitetste IDE für R ist.)

Installation und Einrichtung von R/RStudio

R und RStudio können nur separat voneinander installiert werden. Im Folgenden wird zuerst die Installation von R und dann von RStudio gezeigt.

Die offizielle R-Installationsanleitung kann auf cran.r-project.org abgerufen werden. Ein Kurzeinführung für RStudio findet sich auf dem github-Profil von RStudio Education.

RStudio

Die Arbeit mit R kann nun komplett in RStudio erfolgen, R muss nicht separat gestartet werden.

In der folgenden Präsentation werden ein paar grundlegende Funktionen von RStudio gezeigt. Eine ausführliche Dokumentation findet sich auf rstudio.com.

R-Syntax

R ist eine Programmiersprache, die für Statistik-Anwendungen optimiert ist. Sie bringt viele grundlegende Statistikbefehle mit, sodass nicht jede Analyse völlig neu programmiert werden muss. Ihre Syntax legt fest, nach welchen Regeln ihre einzelnen Elemente verwendet werden dürfen.

Objekte und Funktionen

Zentrale Konzepte bei der Programmierung in R sind Objekte und Funktionen — beide vereinfachen und beschleunigen Analysen in R erheblich. Alle Informationen, die im Laufe einer Berechnung verwendet werden, können in Objekten gespeichert werden. Funktionen erlauben es komplexe Auswertungen mit wenig Code durchzuführen.

Datentypen in R

Es wurde schon angedeutet, dass sehr verschiedenartige Informationen in R als Daten verwendet werden können. Die Art der Daten — der sogenannte Datentyp — gibt Auskunft über das Format ihrer Information (handelt es sich um eine Zahl, eine Zeichenkette, eine Funktion, eine Grafik...?) und über die Operationen die auf diese angewendet werden können (ist es möglich die Information zu dividieren oder in einem Balkendiagramm darzustellen oder als Überschrift für eine Tabelle zu verwenden...?).

Wird eine falsche Operation mit einer Information durchgeführt, erzeugt dies entweder unerwünschte Ergebnisse oder eine Fehlermeldung in der R-Console. Es ist daher wichtig, einige grundlegende Datentypen in R zu kennen! Dies ermöglicht es, Fehler zu verhindern und Fehlermeldungen richtig zu interpretieren.

Packages

R bietet seinen Nutzer*innen die Möglichkeit Funktionen zu nutzen, die nicht standardmäßig in R enthalten sind. Diese zusätzlichen Funktionen sind in nutzer*innengeschrieben Paketen enthalten und können von den CRAN Mirrors heruntergeladen werden.

Hilfe

Egal ob Einsteiger*in oder jahrelanger Profi, es ist völlig normal bei der Arbeit mit R Fehlermeldungen zu produzieren oder bei manchen Anweisen nicht weiterzukommen. Da niemand alle R-Funktionen bzw. -packages kennen kann, ist es wichtig zu wissen, wie und wo Hilfe zu suchen ist.

Creative Commons Lizenzvertrag

Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung - Nicht-kommerziell - Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.

Autor*innen dieses Artikels

Diese Seite wurde zuletzt am 10.10.2022 aktualisiert.