Ik werk zelf nu zo'n 12 jaar in de IT-sector, voor het grootste deel als software engineer in Java/Kotlin/JavaScript en ook een goeie 3 jaren lang als Python-ontwikkelaar.
Dankzij die laatste ervaring was het mij ook ooit gelukt om een project te doen als "data engineer": dus deel uitmaken van een team dat ruwe data transformeert naar een database om dan vervolgens value te halen uit die gegevens voor industriële productieprocessen. "ETL" wordt dat ook wel eens genoemd.
Ik was initieel heel enthousiast en omdat het team voor 80% bestond uit PhD's, dacht ik: wow, hier ga ik superveel van bijleren! Maar dat sloeg in de praktijk echt wel tegen... Daar werd Apache Airflow gebruikt, wat volgens mij helemaal niet de geschikte tool was voor hun use case (qua scalability) in combinatie met een configuratie die veel te ingewikkeld was gemaakt. Om een voorbeeld te geven: daar was 1 PhD gewoon voltijds bezig met klanten te onboarden op dat systeem en dieje mens was voor 1 nieuwe klant daar bijna 1 volledige maand mee bezig: dus YAML-configuraties maken en dan trial en error om het werkend te krijgen. Software testing? Was allemaal niet nodig volgens hen, hoewel ik hen probeerde duidelijk te maken dat dat in hun geval echt wel zinvol was. Mijn constructieve raad op het vlak van programmeren werd veelal in de wind geslagen. Ik had immers geen PhD zoals hen, dus hoorde er toch niet echt bij.

True story. In mijn eerste maanden daar was ook veel verloop in het data engineering team, later is mijn frank/euro pas beginnen vallen waarom...
En als die gegevens dan eenmaal in de database zaten, dan hadden ze eigenlijk niet veel meer dan een key-value met nog metadata, zoals datum en tijd. Vervolgens was er dan het team van "data scientists" (ook allemaal PhD's met vooral ervaring in MATLAB) bezig met het maken van berekeningen, maar dat waren bijna altijd gewoon week- en maandgemiddelden. Allemaal gegevens die wel wat value hadden voor die productieprocessen, maar echt revolutionair was het allemaal toch ook niet... Terwijl er op hun website gegoocheld wordt met woordjes als "AI" en "machine learning", maar eigenlijk was het gewoon maar dashboards maken voor klanten met week- en maandgemiddelden.
En ik vrees dat het bij veel "revolutionaire" bedrijven in deze tak van de IT-sector wel zo is. Allez, dat is toch de perceptie die ik heb na mijn 1 jaar ervaring als "data engineer". Maar de echte experten hier die er veel langer inzitten of hebben gezeten als mij zullen mij misschien ook wel wat kunnen tegenspreken vermoed ik.
En in die reporting/dashboarding zit zeker value voor klanten, dat wil ik helemaal niet ondermijnen, maar vrees dat het ook vaak verpakt wordt als "AI/machine learning" terwijl dat nog iets helemaal anders is...