Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Von alle Teilnehmenden wird erwartet, dass sie ein Leistungszertifikat oder ECTS anstreben bzw. am Ende des Kurses die Bedingungen dafür erfüllen. Dies sind die folgenden drei Bedingungen:
Zur Präsentation anhand Eures besten Modells die Vorhersagen für den Testdatensatz der Kaggle Competition berechnen und dort hochladen!
Jedes Team hält eine 8 oder 10-minütige Abschlusspräsentation (genaue Info erfolgt in der Vorwoche - bitte darauf achten, dass Ihr die Länge einhaltet!) mit den folgenden Inhalten:
Euren Namen auf der Titelseite
Auflistung und kurze Beschreibung der selbst erstellten Variablen
Balkendiagramme mit Konfidenzintervallen für zwei selbst erstellte Variablen
Optimierung des linearen Modells: Modellgleichung und adjusted r²
Art der Missing Value Imputation
Optimierung des neuronalen Netzes:
Source Code zur Definition des neuronalen Netzes
Darstellung der Loss-Funktionen für Trainings- und Validierungsdatensatz
MAPEs für den Validierungsdatensatz insgesamt und für jede Warengruppe einzeln
„Worst Fail“ / „Best Improvement“
Die Dokumentation des Leistungsnachweises erfolgt über das von Euch erstellte Repository, das wie in den READMEs angegeben vervollständigt werden muss. Anschließend muss ein Team-Mitglied das README des Hauptverzeichnisses wie hier beschrieben in der EduHub-Plattform hochladen.
folgende Themen behandeln:
Charakteristika des maschinellen Lernens
Definition der linearen Regression
Kostenfunktionen
Optimierungsfunktionen
DataCamp Tutorial zur Linearen Regression
folgende Themen behandeln:
Overfitting und Regularisierung
Interaktionseffekte
Modellgütekriterien
Einführung in neuronale Netze
Grafisches Tool zur Definition und Schätzung von Neuronalen Netzen für unterschiedliche Beispieldatensätze
Beispiel für die Auswirkung von Overfitting und Regularisierung
folgende Themen behandeln:
Wiederholung Neuronaler Netze (NN)
Umsetzung eines Dropout Layer
Visualisierung von fehlenden Werten
Verschiedene Imputationsverfahren
Beispielnotebook zur Behandlung von fehlenden Werten
Lektion 1 dieses Kurses bei datacamp
folgende Themen behandeln:
Muster in Zeitreihenanalysen
Baseline Modelle
Naïve Forecasting
Video (5 Minuten) zu Zeitreihenanalysen
Beispielnotebook zur grafischen Auswertung von Zeitreihen
Hugging Face-Kurs zur Nutzung der Transformers Library
folgende Themen behandeln:
VSCode und GitHub Code Spaces
KI-unterstützte Programmierung
Darstellung von unterschiedlichen Datenstrukturen
Einlesen von Daten aus externen Quellen
Diagramm- und Skalentypen
Optionale
für die grafische Darstellung von Daten
eine Einführung zu den folgenden Themen bekommen:
Was ist Data Science?
R vs. Python vs. SPSS vs. ...
Jupyter Notebooks
Wenn Ihr Schüler:in, Student:in oder Lehrkraft seid, könnt Ihr Euch wie beschrieben gratis für GitHub Co-Pilot registrieren, das Ihr dann ggf. in VSCode, das wir uns in der nächsten Woche anschauen, integrieren könnt. Die Bezahlversion kostet aktuell 10 US-Dollar pro Monat.
folgende Themen behandeln:
Hyperparameter in Neuronalen Netzen
Frameworks zur Implementierung von Neuronalen Netzen
Datenaufbereitung für TensorFlow
Optimierung eines neuronalen Netzes mit Python und TensorFlow
(12 Minuten) zur Einführung in Neuronale Netze
zur Datenaufbereitung für TensorFlow
zur Optimierung eines neuronalen Netzes
mit zusätzlichen Informationen zur Batch-Normalisierung
zum Arbeiten mit Pandas durcharbeiten (nur Lektion 1).
zum Importieren von Daten als Pandas-Dataframe schauen (18 Minuten).
zum Erstellen von Visualisierungen mit Matplotlib durcharbeiten (nur Lektion 1).
(4 Minuten) anschauen, um die Relevanz von Konfidenz-Intervallen zu verstehen.
einen GitHub Codespace anlegen und dort die Dateien „kiwo.csv“, „umsatzdaten_gekuerzt.csv“ und „wetter.csv“ aus speichern.
(7 Minuten) schauen, um die Eigenschaften von Dropout-Layern genauer zu verstehen.
(5 Minuten) schauen, um die Vorteile der Normalisierung besser zu verstehen.
folgende Themen behandeln:
Ergänzung der Teams für die Auswertungsprojekte
Besprechung der Aufgaben zu dieser Woche
Einführung in die Versionierung mit git (Teil 2)
Aktuelle KI-Anwendungen
Beispiel für die Relevanz von Interaktionseffekten