Woche 1 - Einführung in Data Science

Diese Woche werdet Ihr...

eine Einführung zu den folgenden Themen bekommen:
  • Was ist Data Science?
  • R vs. Python vs. SPSS vs. ...
  • Wozu RStudio?
  • Datenstrukturen in R

Lernressourcen

231024_Einführung.pdf
6MB
PDF

Bis zur nächsten Woche solltet Ihr...

  • Euch einen Account bei GitHub anlegen.
  • Optional: Euch wie hier beschrieben für GitHub Copilot anmelden und das 30-Tage-Probe-Abo nutzen, das gratis ist. Zur Integration in R könnt Ihr die diese Anleitung nutzen.
  • insbesondere falls Ihr noch nie mit RStudio gearbeitet habt, Euch das oben verlinkte Einführungsvideo zu RStudio anschauen.
  • die folgenden Aufgaben bearbeiten (siehe auch Präsentation):
    • Importiere den Datensatz “wetter.csv”, den Du über folgenden Link herunterladen kannst: https://raw.githubusercontent.com/opencampus-sh/einfuehrung-in-data-science-und-ml/main/wetter.csv
    • Berechne die Gesamtdurchschnittstemperatur.
    • Berechne die Durchschnittstemperatur für den Monat Juli.
    • Vergleiche, ob die Monate Juli und Mai sich in ihrer Durchschnittstemperatur signifikant unterscheiden.
    Denkt daran, dass Ihr jederzeit ChatGPT zur Unterstützung einsetzen könnt, gerade anhand vergleichsweise leichter Aufgaben kann man gut lernen wie man Aufgabenstellungen lösen kann, die man vorher noch nie gemacht hat.
  • die folgenden zwei R-Pakete installieren:
    • ggplot2
    • dplyr
  • dieses Video (5 Min.) zum Aufbau von R-Programmen und Funktionen schauen.
  • dieses Video (10 Min.) zu Datenstrukturen schauen
  • das erste Kapitel des Kurses Introduction to Data Visualization with ggplot2 absolvieren.
Gerade wenn man sich bisher noch gar nicht mit Programmierung beschäftigt hat, ist es am Anfang des Kurses immer sehr viel Stoff auf einmal. Ich hoffe jedoch, die Online-Tutorials sind eine gute Hilfe für den Einstieg. Ein paar Dinge werden wir auch in der nächsten Woche noch einmal wiederholen.