codegree Lernpfad

Python Data-Science Kurs: der große Lernpfad.

Mittlerweile ist jeden bewusst: Daten sind das Gold des digitalen Zeitalters. Jedes Unternehmen, welches schlau Daten sammelt, kann aus diesem wertvollen Wissen ziehen!

Meistere die Grundlagen von Data Science in Python mit den beliebten NumPy & Pandas-Bibliotheken.

Jetzt kostenlos registrieren
Python Data Science Kurs: Der große Data Science Online Kurs
Schwierigkeit

Fortgeschritten

Dauer

05:47 Stunden

Sprache

Python

Dozent

Dr. -Ing. Soner Emec

Das solltest du bereits können:

Datentypen
Datenstrukturen
Arrays
Schleifen
Bedingte Anweisungen
Arithmetische Operatoren
Verständnis von Methoden & Funktionen

Was dich erwartet:

Bei der täglichen Nutzung von Instagram, Twitter, TikTok, YouTube oder Google Maps werden gigantische Datenmengen produziert. Die Datenmenge nimmt von Jahr zu Jahr exponentiell zu. Anhand dieser Daten treffen Unternehmen jeden Tag Entscheidungen, beispielsweise welche personalisierte Werbung jemand erhält oder für wie teuer täglich die Produkte auf E-Commerce Plattformen, wie Amazon und Ebay verkauft werden.

Lerne zusammen mit Dr.-Ing. Soner Emec in 33 Einheiten und 22 interaktiven Programmierübungen die Data Science Grundlagen kennen!

Inhaltsverzeichnis:

Einführung in NumPy

Tauch mit uns ein in die spannende Welt von NumPy. Gemeinsam installieren und importieren wir diese mächtige Python-Bibliothek und entdecken, warum NumPy-Arrays das Zeug haben, deine Datenbearbeitung auf das nächste Level zu heben.

NumPy Grundlagen: Vektoren

Komm, wir tauchen tiefer in die Welt der Vektoren ein. Zusammen erstellen wir Arrays, spielen mit zeros, ones und leeren Arrays und entdecken die Funktionen von arange und linspace. Und um den Bogen zu schließen, sehen wir uns an, wie Schleifen und Vektoren Hand in Hand gehen, um unsere Datenbearbeitung zu optimieren.

NumPy Grundlagen: Matrizen

Jetzt wird's noch spannender, wir steigen auf Matrizen um! Lass uns gemeinsam Matrizen mit vorhandenen Daten erstellen, uns mit den Funktionen zeros und ones vertraut machen und dann ins Auge des Sturms blicken mit eye und diag. Und weil wir schon dabei sind, nehmen wir uns auch das Transponieren und die Spur einer Matrix vor. Zum Abschluss schauen wir uns an, wie Schleifen unsere Arbeit mit Matrizen noch weiter erleichtern können.

Import und Export von CSV Dateien

Jetzt wo wir die Grundlagen drauf haben, wenden wir unser Wissen auf echte Daten an! Zusammen importieren wir CSV-Daten, lernen, wie wir mit Pandas umgehen, um die Daten noch effizienter zu bearbeiten und am Ende zeigen wir dir, wie du deine bearbeiteten Daten als CSV wieder exportieren kannst.

Größe und Form eines NumPy-Arrays

Nun wird's Zeit, die wahre Gestalt unserer Arrays zu erforschen! Mit den Methoden shape und size zeigen wir dir, wie du die Dimensionen deines Arrays im Blick behältst und effizient damit arbeiten kannst.

Umformen von NumPy-Arrays

In diesem Kapitel zeigen wir dir, wie flexibel Arrays wirklich sind. Zusammen lernen wir, wie wir die Form unserer Arrays verändern können, um sie genau an unsere Bedürfnisse anzupassen.

Indexierung und Slicing

Hier geht's ans Eingemachte. Wir lernen, wie wir in Vektoren und Matrizen genau die Daten finden und auswählen, die wir brauchen. Von der Indexierung bis zum Slicing - nach diesem Kapitel bist du ein Meister im Umgang mit Datenstrukturen.

Die häufigsten NumPy-Array Operationen

Lass uns die Ärmel hochkrempeln und unsere Arrays in Schwung bringen. Wir zeigen dir, wie man Arrays addiert und subtrahiert, und dann heben wir das Ganze auf eine neue Ebene mit Broadcasting. Nach diesem Kapitel wirst du in der Lage sein, Operationen auf deinen Daten durchzuführen wie ein Profi.

Einführung in Pandas

Pack deine Sachen, wir gehen auf Safari in den Dschungel von Pandas! Gemeinsam entdecken wir, was Pandas ist und warum es unser neuer bester Freund bei der Datenanalyse wird. Nach der Installation und dem Import zeigen wir dir die Grundlagen von Pandas Datenstrukturen - Series und DataFrame.

Mit externen Dateien arbeiten I: Dateien laden

Jetzt, wo wir Pandas kennen, lassen wir es auf die freie Wildbahn los und laden Daten aus CSV-Dateien. In diesem Kapitel lernst du, wie du echte Daten in deine Pandas-Umgebung bringst und sie bereit machst für die Analyse.

Pandas DataFrame für Anfänger: Daten bereinigen

Daten sind toll, saubere Daten sind besser. In diesem Kapitel lernst du, wie du einen ersten Blick auf deine Daten wirfst, die Struktur deines DataFrames kennst, mehr über dein DataFrame erfährst und unerwünschte Überraschungen wie fehlende Werte oder Duplikate beseitigst. Nach diesem Kapitel sind deine Daten bereit für die große Show!

Mit externen Dateien arbeiten II: Dateien exportieren

Du hast die Daten geladen und gereinigt, aber was nun? In diesem Kapitel zeigen wir dir, wie du deine Daten in eine CSV-Datei exportierst, damit du sie teilen oder später weiter bearbeiten kannst.

Pandas DataFrame für Anfänger: Datenmanipulation für Anfänger

Jetzt, wo deine Daten bereit sind, wird es Zeit, ein wenig Magie zu wirken. Zusammen suchen wir nach spezifischen Datensätzen, filtern sie nach Bedingungen, fügen neue Daten hinzu und entfernen nicht benötigte. Und weil Ordnung das halbe Leben ist, sortieren wir auch noch unser DataFrame.

Pandas DataFrame für Anfänger: Datenmanipulation für Fortgeschrittene

Wir haben die Grundlagen gemeistert, jetzt steigen wir auf das nächste Level. Gemeinsam fügen wir DataFrames mit merge() und join() zusammen, lernen, wie man Daten gruppiert und aggregiert, und führen arithmetische Operationen auf unseren DataFrames durch.

Aus der Praxis: Performance & Best-Practices

Jetzt, wo du ein Pandas-Profi bist, lass uns dein Wissen auf die Probe stellen. Wir zeigen dir Best-Practices, effizienten Zugriff, wie man Duplikate vermeidet und den Typ konvertiert, und wie man richtig mit großen Datenmengen arbeitet. Nach diesem Kapitel bist du bereit, die Datenwelt zu erobern!

Dein Praxisprojekt:

Das Praxisprojekt von deinem Data Science Kurs

Bei codegree hast du den Vorteil, dass du bei jedem Kurs Schritt-für-Schritt ein größeres Praxisprojekt aufbaust! Also, lass uns mal reinschauen, was du in diesem Kurs zum Thema Data Science mit Python, Pandas & NumPy bauen wirst!

In diesem großen Lernpfad wirst du mit Kryptopreisen arbeiten. Du erhältst Preisdaten der größten Kryptowährungen der Welt und musst diese analysiere. Es geht um bares Geld, also pass auf das du keine Fehler machst!

Das kannst du am Ende:


Data Science

Du verstehst die Aufgabe & Rolle als Data-Scientist und kennst die gängigsten Begriffe.

Logo von NumPy

Python NumPy

Du weißt wie du mit NumPy und den NumPy-Arrays effizient arbeiten kannst.

Logo von Pandas

Python Pandas

Du kannst mit Series & DataFrames problemlos arbeiten und Daten effizient visualisieren und analysieren.

Dein Dozent:

Dr.-Ing. Soner Emec - Mitgründer von codegree

Dr.-Ing. Soner Emec

Mitgründer von codegree & Leiter KISZ am HPI (Hasso-Plattner-Institut)

Häufig gestellte Fragen

Der Schwierigkeitsgrad eines Data Science-Studiums kann variieren, je nachdem, wie vertraut du mit Mathematik und Programmieren bist. Es erfordert eine solide Grundlage in Statistik und Maschinellem Lernen sowie die Fähigkeit, komplexe Datenstrukturen zu verarbeiten und zu analysieren.

Ein Data Analyst konzentriert sich in der Regel auf das Extrahieren von Erkenntnissen aus Datenbeständen, während ein Data Scientist zusätzlich fortgeschrittene statistische und maschinelle Lernmodelle entwickelt, um zukünftige Ereignisse vorherzusagen oder tiefergehende Erkenntnisse zu gewinnen.

Das Gehalt eines Data Scientists kann stark variieren, abhängig von Faktoren wie Erfahrung, Standort, und der Größe des Unternehmens. In Deutschland liegt das durchschnittliche Jahresgehalt eines Data Scientists laut Gehaltsstudien zwischen 60.000 und 100.000 Euro.

Data Scientists finden Arbeit in einer Vielzahl von Branchen, darunter Technologieunternehmen, Beratungsfirmen, Finanzinstitutionen, Gesundheitswesen, E-Commerce und viele mehr. Praktisch jede Branche, die Daten sammelt, kann von den Fähigkeiten eines Data Scientists profitieren.

Python ist für Data Science beliebt, weil es eine einfache Syntax hat, die das Schreiben und Lesen von Code erleichtert. Darüber hinaus bietet es eine Fülle von Bibliotheken wie Pandas, NumPy und SciKit-Learn, die speziell für Datenanalyse und maschinelles Lernen entwickelt wurden.

Nahezu jede Branche kann von Big Data profitieren. Es kann Unternehmen dabei helfen, bessere Entscheidungen zu treffen, Prozesse zu optimieren, Trends vorherzusagen, das Kundenerlebnis zu verbessern und vieles mehr.

Python und R sind die beiden am häufigsten verwendeten Programmiersprachen in der Data Science. Python ist aufgrund seiner Einfachheit und der breiten Palette an Data Science-Bibliotheken besonders populär.

Ein Data Scientist studiert in der Regel Fachgebiete wie Statistik, Informatik, maschinelles Lernen und Datenanalyse. Darüber hinaus sind Fähigkeiten in Programmiersprachen wie Python oder R oft wesentliche Bestandteile des Studiums.

Die genaue Anzahl von Data Scientists in Deutschland ist schwer zu bestimmen, da es auf die spezifische Definition und das jeweilige Berufsfeld ankommt. Es ist jedoch sicher, dass der Bedarf an Data Scientists in den letzten Jahren stark gestiegen ist.

Data Science ist ein interdisziplinäres Feld, das Aspekte der Informatik, Statistik und Geschäftsanalyse vereint. Während Informatik-Kenntnisse wichtig sind, spielen auch andere Fähigkeiten und Kenntnisse eine wesentliche Rolle im Bereich Data Science.

Data-Scientist im Jobprofil:

Offene Stellen (🇩🇪)

11.450 (05/2023)

Ø-Gehalt (🇩🇪)

60.000€ - 80.000€

Abschluss notwendig

Nein

Karrierechancen

Sehr gut

🧪 Starte deine Karriere als Data-Scientist!

Lerne spielerisch Data Science und komme deiner gutbezahlten (und an der 🌴 liegenden) Traumkarriere einen Schritt weiter.

100% kostenlos registrieren · keine Kreditkarte notwendig

👋 Wir warten bereits auf dich!

Lerne das, was du wirklich brauchst.

Im Gegensatz zu der Abendschule oder der alteingesessenen Uni lernst du bei codegree die Sprachen & Pakete, die wirklich im Jobmarkt gesucht werden.

Logo von Python
Logo von PyTorch
Logo von Pandas
Logo von Matplotlib
Logo von Java
Logo von NumPy
Jetzt kostenlos registrieren

100% kostenlos registrieren · keine Zahlungsdaten notwendig