Statistik und Daten-Analyse mit R und Rstudio
Du brauchst ein Statistik-Programm, mit dem du auch zu Hause arbeiten kannst?
Zum Glück gibt es „R“: (d)eine Open-Source-Programmiersprache für Datenanalyse und Datenvisualisierung!
R ist (neben der Programmiersprache Python) derzeit eines der beliebtesten Tools für alle Arten der Datenaufbereitung, -analyse und -visualisierung – und R wird ständig erweitert und verbessert. Mit „R-Studio“ gibt es auch eine sogenannte „Entwicklungsumgebung“, die mit einer grafischen Oberfläche mehr Übersicht als das normale R bietet (R hat sonst nur ein Eingabefenster für Code, was nicht sehr intuitiv für den Einsteig ist).
Achtung: RStudio funktioniert nicht ohne R!.
Durch Erweiterungen („Pakete“), stehen dir enorm viele statistische Verfahren zur Verfügung. Wenn du ein bestimmtes Verfahren suchst, gib einfach in einer Suchmaschine das entsprechende Verfahren ein und z.B. „package in R“.
Einige Anwendungsbereiche von R sind:
- deskriptive Methoden (wie Häufigkeits- und Kontigenztabellen)
- Plots und Diagramme (z.B. Paket
ggplot
) - statistische Analyse- und Strukturprüfungsverfahren (Regressionen, ANOVAs, Strukturgleichungsmodelle) (z.B. Paket
lavaan
) - Verfahren der prädiktiven Modellierung (Machine-Learning, Deep-Learning, Neural Networks, etc.; z.B. Paket
caret
) - textbasierte Analysen (quantitative Textanalyse, Text-Mining, Natural Language Processing, etc.; z.B. Paket
quanteda
)
Da R frei verfügbar ist, kannst du es auch außerhalb der Uni nutzen und weitergeben. So können andere oder du selbst später ebenfalls mit deinen Analysen weiterarbeiten. An der Universität Bremen gibt es regelmäßig Lehrveranstaltungen für die Datenanalyse mit R und auch studentische Gruppen, die sich regelmäßig Treffen.
Hilfe
- R Handbücher und Dokumentation (Sprache: Englisch):
- R Dokumente aus der Community (Sprache: Englisch, versch. Sprachen):
- RStudio
Buch-Empfehlungen zum Einstieg in R:
- Sebastian Sauer – Moderne Datenanalyse mit R (Sprache: Deutsch, Online-Ausgabe verfügbar)
- Garrett Grolemund, Hadley Wickham – „R for Data Science“ (Sprache: Englisch, frei verfügbar)
Dieses Werk ist lizenziert unter einer Creative Commons Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 International Lizenz.
2 thoughts on “Statistik und Daten-Analyse mit R und Rstudio”