Data engineer
Het programma doorontwikkeling begrotings- en verantwoordingscyclus wil meer inzicht bieden in de overheidsfinanciën in onze rapporten van het verantwoordingsonderzoek. Het gaat dan bijvoorbeeld om meerjarenoverzichten van de verandering van uitgaven aan verschillende beleidsonderwerpen (beleidsmatige mutaties). Hiervoor zal informatie uit rijksbegrotingen geput (gescrapt) moeten worden en verwerkt tot betrouwbare overzichten.
Opdrachtomschrijving
De Algemene Rekenkamer wil tabellen met ‘grootste beleidsmatige geldmutaties’ voor alle departementale verantwoordingsonderzoeken in het voorjaar van 2025. De hoofdopdracht is om de werkende code voor de Extract en Transform modules van de dataverwerking (ETL) aan te leveren. De Extract module moet bestaan uit een configureerbare scraper voor data over beleidsmatige mutaties uit verschillende open bronnen van de rijksoverheid. Het uit te voeren werk aan de Transform module bestaat uit het ontwerpen van een gestandaardiseerd formaat voor data over beleidsmatige mutaties en het transformeren van de data uit de scrapers naar dit formaat. Tenslotte verwerk je de gestandaardiseerde data naar tabellen per begrotingshoofdstuk met de ‘grootste beleidsmatige mutaties’. Je bent gedurende je opdracht een sparringspartner voor het ontwikkelteam van een relationele database voor financiële overheidsdata. Doel is om voor het plannen van het verantwoordingonderzoek mee te denken over het geautomatiseerder aanleveren van data voor grote financiële mutaties voor het verantwoordingsonderzoek 2026 en verder. Je stemt binnen de Algemene Rekenkamer af met de projectleider over voortgang en eventueel met de departementale teams. Je sluit aan bij periodieke stand-ups van het Algemene Rekenkamer innovatieteam en brede overleggen van het programmateam Doorontwikkeling Begrotings- en Verantwoordingscyclus.
Resultaatgebied & verantwoordelijkheden
Algemeen: Voor het programma doorontwikkeling begrotings- en verantwoordingscyclus (BV-cyclus) zoeken we een dataengineer die goed thuis is in het scrapen en opschonen van data.
Op te leveren resultaten
– Je levert voor alle departementale verantwoordingsonderzoeken (VO) een tabel met ‘grootste beleidsmatige mutaties’ op in het voorjaar van 2025. Deze stem je vanaf eind 2024 af met VO-teams en directeuren o.l.v. het programma doorontwikkeling BV-cyclus.
– Je maakt hiervoor gebruik van de informatie uit departementale begrotingen en bijbehorende memories van toelichting, die je verwerft en verwerkt via de op te leveren Extract en Transform modules.
– Je levert deze modules op. Deze zijn geschreven in Python, zijn inclusief unittests en integratietests, technische documentatie, functionele documentatie en maken gebruik van poetry, pytest, mypy, flake8 en black. Je combineert deze data met andere gescrapte informatie en de verwerkte data is herleidbaar tot de bron. Kortom beleidsmutatiedata waarop teams binnen de Algemene Rekenkamer kunnen vertrouwen.
Procedure
Aanbieden kan tot en met 19 september om 09:00 uur. CV’s zullen regelmatig beoordeeld worden en passende profielen zullen dan eerder dan de deadline worden aangeboden bij de opdrachtgever. Hierdoor kan aanvraag eventueel eerder sluiten. Enkel CV’s die via het systeem ESD worden aangeboden worden in behandeling genomen, CV’s die per mail of andere communicatiekanalen worden verzonden, worden niet in behandeling genomen. Alleen CV’s in de Nederlandse taal worden in behandeling genomen. Per leverancier mogen er max 2 kandidaten worden aangeboden.
Eisen
- Aantoonbare ervaring met Python, het bouwen en testen van ETLs, en scrapen van informatie.
- Enkele jaren ervaring als data-engineer.
- Ervaring met bouwen van datapijplijnen en scrapen van informatie.
- Kennis van Overheidsfinanciën.
- Ervaring binnen de Rijksoverheid.
- Alleen CV’s in de Nederlandse taal worden in behandeling genomen.
- Het is niet toegestaan om medewerkers in loondienst bij een ander bureau voor te stellen.
- ZZP is niet toegestaan voor deze rol.
Wensen
- Je levert voor alle departementale verantwoordingsonderzoeken (VO) een tabel met ‘grootste beleidsmatige mutaties’ op in het voorjaar van 2025. Deze stem je vanaf eind 2024 af met VO-teams en directeuren o.l.v. het programma doorontwikkeling BV-cyclus.
- Je maakt hiervoor gebruik van de informatie uit departementale begrotingen en bij bijbehorende memories van toelichting, die je verwerft en verwerkt via de op te leveren Extract en Transform modules.
- Je levert deze modules op. Deze zijn geschreven in Python, zijn inclusief unittests en integratietest, technische documentatie, functionele documentatie en maken gebruik van poetry, pytest, mypy, flake8 en black.
- Je combineert deze data met andere gescrapte informatie en de verwerkte data is herleidbaar tot de bron.
- Je bent gedurende je opdracht een sparringspartner voor het ontwikkelteam van een relationele database voor financiële overheidsdata.
- Je denkt mee over het geautomatiseerder aanleveren van data voor grote financiële mutaties voor het verantwoordingsonderzoek 2026 en verder.
- Je stemt binnen de Algemene Rekenkamer af met de projectleider over voortgang en eventueel met de departementale teams.
- Je sluit aan bij periodieke stand-ups van het Algemene Rekenkamer innovatieteam en brede overleggen van het programmateam Doorontwikkeling Begrotings- en Verantwoordingscyclus.