Data Science draait om het analyseren van data om waardevolle inzichten te verkrijgen en beter onderbouwde beslissingen te nemen. Python is een populaire taal voor Data Science vanwege de eenvoudige syntaxis en krachtige bibliotheken zoals NumPy, Pandas en Matplotlib. Deze tools maken het mogelijk om data te manipuleren, visualiseren en machine learning-modellen te bouwen.
Doelgroep
Actuarieel professionals die zich willen specialiseren in Data Science met behulp van Python en daarvoor basiskennis van Python hebben en/of de PE-workshop Basiscursus Python voor actuarieel professionals hebben gevolgd.
Programma
De volgende onderwerpen worden behandeld met een combinatie van theorie en praktijk, waarbij je zelf programmeert in een Jupyter notebook.
- Korte herhaling van de basiskennis Python
Handig als het wat langer geleden is dat je een introductiecursus programmeren in Python hebt gevolgd of als je je basisvaardigheden wilt opfrissen. - Introductie van de verschillende modellen
Je bent vertrouwd met lineaire regressie, zoals het , eventueel uitgebreid met LASSO. Met de opkomst van geavanceerde machine learning-modellen zoals neurale netwerken, zijn een betere modelprestaties mogelijk. Deze modellen vergen doorgaans meer rekentijd en leveren resultaten op die niet altijd eenvoudig te interpreteren zijn. - Modelresultaten interpreteren en uitleggen
Machine learning-modellen worden vaak als een black box gezien, maar er zijn technieken om resultaten uitlegbaar te maken.Je leert deze technieken toe te passen om meer inzicht te krijgen in je modellen.
Spreker
Paul van Leeuwen is als freelance econometrist werkzaam in de financiële sector bij verzekeraars en banken. Daarnaast doceert hij de vakken wiskunde en statistiek aan Wageningen University en verzorgt hij regelmatig workshops programmeren in R.