Per jaar worden er door DAS 7 miljoen documenten gegenereerd, kennis uit deze (ongestructureerde) data wordt nog beperkt benut, dus daar valt nog veel te halen. Beklim deze berg ongestructureerde data en gebruik je kennis van NLP-algoritmes om deze om te zetten naar waardevolle gestructureerde data. Werk vanaf het begin mee met het opzetten van de NLP-pipeline in Elastic Search.Werk mee aan het voorspellen van de uitkomsten van binnengekomen dossiers. Bouw mee aan het nieuw opgezette Data Science Team van DAS. Wil je dus pionieren en heb je wel zin in een mega uitdaging? Neem contact op!
Dit ga je doen als NLP Data Scientist
Bij DAS worden jaarlijks meer dan 100.000 dossiers behandeld. Dit veelvoud van dossiers zorgt voor een enorme hoeveelheid data, waarvan de data in gestructureerde vorm slechts het tipje van de ijsberg is. Bij DAS gaan we na een aantal geslaagde Proof of Conceps, nu echt beginnen met het genereren van voorspellingen op basis van deze ongestructureerde data. Hiervoor hebben we jouw NLP kennis en ervaring nodig. Dit zorgt ervoor dat je in deze functie een grote verantwoordelijkheid krijgt bij het Data Science Team. We staan we aan het begin van deze boeiende reis, wat ervoor zorgt dat een stukje flexibiliteit en ondernemerschap erg gewenst is.
Wat ga je doen
Je gaat NLP-algoritmes ontwikkelen en implementeren om de ongestructureerde tekst data om te zetten naar gestructureerde data
Je gaat meewerken aan het opzetten en onderhouden van de NLP-pipeline waarin deze algoritmes hun werk doen
Je beslist mee in het opzetten van de benodigde infrastructuur
Je bent een vraagbaak voor de rest van het Data Science Team op het gebied van NLP, Text Mining en Information Extraction
Je werkt mee aan het ontwikkelen en implementeren van modellen om voor onze rechtsgebieden de uitkomst van de binnengekomen dossiers te voorspellen
Waar kom je terecht?
Zoals al vermeld, kom je terecht in het kersverse Data Science Team van DAS, met een gezonde groei ambitie. Je standplaats wordt Amsterdam Zuidoost (op loopafstand van het station), met de mogelijkheid om thuis te werken.
Onze organisatie wordt gekenmerkt door het mensgerichte karakter en collegialiteit . Onze cultuur is uit te drukken in de volgende waarden: menselijk, slim, open, betrokken en optimistisch.
Must Have
Academisch werk- en denkniveau (studie Econometrie, Wiskunde, Statistiek, Business Analytics, Computer Science, Data Science, Kunstmatige Intelligentie).
Minimaal 2 jaar werkervaring in een Data Science / Engineer functie waarbij NLP werd toegepast.
Diepgaande kennis en ervaring met het analyseren en modelleren van ongestructureerde data. Kennis op het gebied van Natural Language Processing, Information Extraction en Machine Learning.
Kennis van en ervaring met scripting en programmeertaal Python en eventueel R.
Kennis van en ervaring met verschillende vormen van dataopslag (vooral noSQL, zoals Elastic Search en/of MongoDB).
Nice to Have
Ervaring met juridische ongestructureerde data is een pré.
Ervaring met het opzetten en onderhouden van Elastic Search is een pré.
Ervaring met werken in Agile projectomgeving is een pré.
Ons aanbod
Een maximaal salaris van € 5.073 bruto per maand o.b.v. 38 uur, inschaling is afhankelijk van opleiding en ervaring
Een 38-urige werkweek, 8% vakantiegeld en een 13e maand
25 vakantiedagen op fulltime basis en de mogelijkheid tot het opbouwen van spaaruren
Collectieve verzekering voor zorg- en inkomen en een pensioenregeling
Jezelf blijven ontwikkelen met een ruim aanbod aan online trainingen via Goodhabitz & DataCamp
De mogelijkheid om gebruik te maken van de collectieve regeling bedrijfsfitness