Data Science Opleiding

Wil jij expert worden in data science? Dan biedt onze data science opleiding een compleet programma. We starten bij de basis en eindigen met geavanceerde machine learning modellen. Na deze opleiding ben je in staat om zelfstandig te opereren als data scientist binnen jouw organisatie.

Tijdens deze opleiding werken we met de meestgebruikte data science programmeertaal, namelijk Python. Voorkennis van programmeren is geen vereiste.

Leerdoelen data science opleiding

data science opleiding leerdoel python

Complete introductie in data science

De wereld van data science kan in eerste instantie intimiderend overkomen. In de eerste twee dagen maken we je vertrouwd met de mogelijkheden van data science. We leggen alle basisvaardigheden voor data scientists uit en oefenen in een eigen online omgeving. Dit geeft je al voldoende basis om zelfstandig aan de slag te gaan in de praktijk.

data science opleiding machine learning leerdoel

Verdiepende kennis van machine learning

Waar we tijdens de eerste twee dagen een solide basis leggen, gaan de laatste twee dagen over verdiepende onderwerpen. Je leert over machine learning en het in productie brengen en monitoren van jouw machine learning modellen. Na de opleiding ben je in staat om zelf voorspellende algoritmes te schrijven voor jouw organisatie.

Is deze data science opleiding wat voor mij?

Deze training is iets voor jou als:

  • Je meer inzichten wilt halen uit beschikbare data binnen jouw werkomgeving.
  • Je een beroep hebt waar veel databronnen en -analyses bij komen kijken en je je kennis wilt verbreden. Bijvoorbeeld in finance, logistiek, marketing, ICT, of HR.

Benodigde voorkennis

Er is geen specifieke voorkennis vereist, maar het is handig als je basiskennis van wiskunde hebt en ervaring hebt met bijvoorbeeld Excel files, tekstbestanden (csv) of databases. Het is een opleiding op uitdagend niveau en wij raden minimaal een afgeronde HBO opleiding aan.

Inhoud Data Science Opleiding

Dag 1: Data Science basisvaardigheden

Data science introductie

Je maakt kennis met data science: wat is de historie en wat zijn de belangrijkste eigenschappen. Je leert waarom Python zo geschikt is voor data science door stil te staan bij packages, verzamelingen vooraf gedefinieerde code. We bekijken de verschillende manieren om met Python code te werken en je voert je eerste eigen script uit met Jupyter Notebook.

Variabelen en datatypes

Om als data scientist informatie en data te kunnen gebruiken maken we gebruik van variabelen. Verschillende soorten data zoals getallen en stukken tekst worden als verschillende datatypes opgeslagen. Je leert verschillende datatypes kennen en komt er achter dat verschillende datatypes tot verschillend gedrag leiden.

Lists

Binnen data science maak je vaak gebruik van grote hoeveelheden aan datapunten. De eerste manier waarmee je kennismaakt om hier in mee om te gaan is met lists, een verzameling van meerdere datapunten. In de opleiding leer je hoe je lists bewerkt en waarvoor je deze het best kunt gebruiken.

Dictionaries

Dit is een datatype waarmee je gegevens in sleutel-waarden combinaties op kunt slaan. Dictionaries worden veel gebruikt binnen data science en je leert hier waarom een dictionary handig is en hoe je het toepast.

Logica, methoden en functies voor data science

Je leert welke vormen logica bestaan en hoe je deze toepast. Daarnaast leer je zelf functies schrijven om makkelijker met herhaaldelijke activiteiten om te gaan. Je leert hierbij hoe je methoden en functies gebruikt en hoe je jouw eigen functies kunt maken. Dit geeft je al de vrijheid om snel complexe inzichten uit data te halen.

Dag 2: Meestgebruikte tools door data scientists

Numpy: efficiënt met veel data werken

Het NumPy stelt je in staat om efficiënt met grote numerieke datasets te werken. Hierdoor is het een essentieel onderdeel binnen iedere data science opleiding. Hier leer je hoe je een NumPy array maakt en hoe je hier vervolgens berekeningen op uit kunt voeren.

Pandas: de belangrijkste data science tool

Pandas is de meestgebruikte tool door data scientists. Met Pandas kun je datasets importeren vanuit verschillende bronnen, zoals bijvoorbeeld een database of een Excel bestand. Met verschillende methoden kun je je datasets vervolgens efficiënt verkennen en kun je transformaties toepassen door bijvoorbeeld datasets te combineren, nieuwe berekende kolommen toe te voegen, te groeperen en filters toe te passen. Je leert hoe je dit met pandas kan doen om zo je data om te zetten in interessante inzichten.

Matplotlib: mooie figuren plotten

Een beeld zegt meer dan 1000 woorden. Wanneer je data inzichten uit kunt beelden ben je in staat om de achterliggende boodschap efficiënt over te brengen. Het Python package matplotlib bevat een grote verzameling van verschillende visualisaties en grafiektypen die je hiervoor kunt gebruiken. Je leert hoe je matplotlib toepast en hoe je hiermee complexe en gepersonaliseerde visualisaties en sprekende grafieken van je datasets kunt maken.

Eindopdracht

In een interessante eindopdracht pas je je nieuwe data science vaardigheden toe op een vraagstuk over een dataset uit de praktijk. Je combineert gegevens vanuit meerdere databronnen, past logica toe en verwerkt dit tot bruikbare informatie vanuit tabellen en grafieken.

Dag 3: Machine learning basis

Machine learning introductie

Je maakt kennis met machine learning en leert waarom het zo in opkomst is en waarvoor je het kunt gebruiken. We leggen je uit wat supervised learning, unsupervised learning en reinforcement learning is, welke verschillende soorten machine learning algoritmes hier onderdeel van zijn en tonen je welk algoritme je wanneer toepast. Hierna leer je welke stappen je standaard doorloopt om een machine learning model op te bouwen.

Classificatie, de theorie

Met classificatie kun je voorspellen of iets tot een bepaalde groep of categorie behoort, bijvoorbeeld of een e-mail wel of geen spambericht is. Je leert vanuit een high level wiskundige uitleg wat classificatie is en waarvoor je het toe kunt passen. We laten je meerdere praktijkvoorbeelden zien en tonen je de Python packages die je er het beste voor kunt gebruiken.

Classificatie, een praktijkcase

Door samen een praktijkcase uit te werken bouw je je eerste eigen machine learning model. Je importeert een dataset uit de praktijk die je met specifieke hulpmiddelen voor classificatie gaat verkennen. Zo ga je grafieken maken die het verband inzichtelijk maken tussen bepaalde gegevens en de beoogde classificering. Ook leer je welke mogelijkheden er zijn als je te maken hebt met vervuilde of missende data in je dataset. Je maakt een classificatiemodel, bijvoorbeeld met logistic regression, en traint dit met een deel van je bewerkte dataset. 

Regressie, de theorie

Met regressie kun je numerieke waarden voorspellen, bijvoorbeeld de prijs van een huis gebaseerd op meerdere eigenschappen van het huis. Je leert vanuit een high level wiskundige uitleg wat regressie is en waarvoor je het toe kunt passen. We laten je ook zien welke Python packages er specifiek geschikt zijn voor regressie.

Regressie, een praktijkcase

Net als bij classificatie werken we ook bij regressie samen aan een mooie case en je bouwt hierbij van begin af aan je eigen model op. Dit begint met een ruwe dataset die je in Python importeert. Met diverse statistische samenvattingen en visualisaties specifiek voor regressie bepaal je welke gegevens uit je dataset waarschijnlijk een goede bijdrage zullen hebben bij het voorspellend vermogen van het model wat je gaat maken. Je leert hoe je niet-numerieke gegevens zoals tekstuele data toch kunt gebruiken in regressiemodel. Door verschillende algoritmes te gebruiken zoals linear regression of gradient boosting doe je ervaring op met de verschillen in het gebruik hiervan.

Dag 4: modellen verbeteren en in gebruik nemen

Beoordelen en verbeteren van een model

Er zijn verschillende manieren om de prestatie van een model te meten, je leert welke dit zijn en wanneer je wat toepast. We kijken hierbij bijvoorbeeld naar een ROC curve, AUC en een confusion matrix. Met deze kennis gaan we terug naar je eerder gemaakte modellen en laten we zien wat het effect is van diverse verbetering met behulp van feature engineering en hyperparameter tuning.

Een model in productie brengen

Een model voegt pas echt waarde toe als het consequent wordt toegepast op nieuwe data. Denk hierbij bijvoorbeeld aan een voorspelling die automatisch wordt gegenereerd wanneer er nieuwe data in een database verschijnt. Je leert vanuit een praktijkvoorbeeld hoe je hier invulling aan kunt geven en we geven. Nieuwe gegevens kunnen tot een nieuwe situatie leiden waardoor de prestaties van je model mettertijd achteruit gaan. Je leert hoe je hier rekening mee kunt houden en hoe je dit voorkomt.

Eindopdracht

In een uitdagende eindopdracht pas je je nieuwe vaardigheden toe op een interessant vraagstuk vanuit een dataset uit de praktijk. Je combineert gegevens vanuit meerdere databronnen, voegt extra informatie toe met feature engineering, en stelt een model naar eigen keuze op wat je iteratief verbetert tot het aan de verwachtingen voldoet.

Ervaringen met onze Data Science trainingen

maurice bij python cursus voor data science

Professioneel opgezet. Heldere verhaallijn gedurende de dag!

Maurice Wijshoff, Specialist Improvement & Innovation bij Ahold Delhaize
imbert tijdens python voor data science training

Inhoudelijk sterk en enthousiast team. Leerzaam! Kortom goede introductie en fijne locatie.

Imbert Myers, Database marketeer & Business analyst bij FNV
debra tijdens python cursus

Erg goed verzorgde cursus. Docenten zijn enthousiast en ik vond het een goede selectie van onderwerpen. Goede basis en kweekt nieuwsgierigheid naar wat nog meer mogelijk is.

Debra Marcella, Operator LPC TREx bij Ministerie van Defensie
olaf tijdens data science met python cursus

Tijd genomen voor de basis en niet tegen beter weten in alle materie er doorheen geduwd. Goed tempo!

Olaf van der Veen, co-founder bij Zero Foodwaste
Willem tijdens python training

Jullie zijn een enthousiast team!!

Willem Kuilman, Information Security Manager bij Fujitsu
hugo heuts tijdens training

Gezellige sfeer, sterke voorbeelden, kundige docenten, goede presentatie

Hugo Heuts
4 dagen€1800 ex. BTW
BCN Utrecht of in-company
- 27, 28 aug & 3, 4 sept - 10, 11, 17 & 18 dec
09:30 - 16:30