DESCRIPTION DU POSTE
Fonction : DATA SCIENTIST
Employeur : DREES – Observation de la santé et de l’assurance maladie
Lieu d’exercice : place des cinq Martrys du Lycée Buffon PARIS 14ème
DESCRIPTION DE LA STRUCTURE
La DREES a pour mission prioritaire de doter les ministères chargés des affaires sociales et de la santé, leurs services déconcentrés ainsi que les établissements, organismes et agences placés sous leur tutelle, d’une meilleure capacité d’observation, d’expertise et de prospective.
La sous-direction de l’Observation de la santé et de l’ assurance maladie réalise les opérations statistiques et conduit les études concernant les politiques sanitaires et le système de santé. Elle assure également la gouvernance des données de santé. Elle rassemble les travaux concernant les populations, leurs besoins, les structures de prises en charge et les professionnels de santé ainsi que les masses financières en jeu.
Le « lab innovation et évaluation en santé » est un bureau transversal chargé de diffuser l’innovation sur les données de santé. Composé notamment de data scientists, il met en place des outils de traitement et d’ analyse des données (conception et installation d’un serveur « big data » interne permettant le recours à des logiciels de traitement à l’état de l’ art), développe également des méthodes innovantes d’ analyse des données dans le domaine de la santé, ou encore contribue à la valorisation des données ouvertes (cartographie des indicateurs de santé, site opendata de la Drees, applications de dataviz).
MISSIONS
Encadrement (oui ou non) : non
Activités principales :
Au sein de la sous-direction Observation de la santé et de l’assurance-maladie, dans le « lab innovation et évaluation en santé », le/la datascientist est en charge de travaux autour du système national des données de santé (SNDS), base médico-administrative regroupant les données de santé (remboursements et hospitalisation) de l’ensemble de la population. Plus précisément, il sera amené à travailler sur la mise au format OMOP de ces données (format de données de santé interopérable) et sur la chaîne de traitement SCALPEL permettant leur mise au format plus opérationnel. Il contribuera à ces deux travaux en coopération avec les équipes de développeurs de la Plateforme de Données de Santé (Health Data Hub) et de l’Assurance Maladie, et exposera les dernières avancées aux utilisateurs de la Drees tout en portant leurs besoins sur ces sujets. Il assurera une veille sur les travaux internationaux de recherche concernant l’exploitation des données de santé.
Les connaissances acquises sur ces projets d’’ingénierie de la donnée seront mises à profit dans des travaux d’exploitation des données du SNDS, au travers d’une infrastructure moderne de calcul (Spark, Python, R). Le datascientist aura une part active et pourra être force de proposition sur ces études (exemple d’étude précédemment réalisée : parcours de soins des patients atteints de bronco-pneumopathie chronique obstructive).
A plus court terme, et selon la date d’arrivée du candidat sur le poste, il pourra être amené à travailler sur des problématiques opérationnelles liées au Covid. Une partie du lab santé travaille en effet actuellement en renfort du centre de crise sanitaire en appui sur l’exploitation des données.
Le bureau est par ailleurs chargé de l’animation du réseau des statisticiens et data scientists en ARS.
Spécificités du poste / Contraintes :
Le poste nécessite des compétences élevées en datascience et dataengineering afin d’être force de proposition.
Formations prévues dans le cadre de l’adaptation au poste de travail
1 Formation au système national des données de santé (SNDS)
2 RGPD
PROFIL RECHERCHÉ
Indiquez les compétences requises sur le poste ainsi que la lettre correspondant à la légende ci-dessous.
E : Savoir agir dans un contexte complexe, faire preuve de créativité, trouver de nouvelles solutions, former d’autres agents, être référent dans le domaine.
M : Mettre en œuvre la compétence de manière régulière, corriger et améliorer le processus, conseiller les autres agents, optimiser le résultat.
A : Savoir effectuer, de manière occasionnelle ou régulière, correctement les activités, sous le contrôle d’un autre agent, savoir repérer les dysfonctionnements.
N : Disposer de notions de base, de repères généraux sur l’activité ou le processus (vocabulaire de base, principales tâches, connaissance du processus, global…)
Connaissances :
- Analyse de données : E
- Techniques liées au volume des gisements de données (Scala, calcul distribué) : E
- Outils de versionnage de code (git) : M
- Langage de programmation (SAS, R, Python…) : E
- Système de santé français : A
Savoir-être : Indiquez au moyen de *** en fonction des attentes
- Autonomie ***
- Force de proposition ***
- Etre organisé et rigoureux ***
- Sens de la pédagogie ***
- Curiosité intellectuelle ***
- Capacité d’adaptation et réactivité ***
Savoir-faire :
- Rendre compte ***
- Capacité de synthèse ***
- Communication orale et écrite ***
- Conduire un projet, une démarche***
POUR POSTULER
Personne à qui adresser les candidatures (mail) :
Personne à contacter (mail) : charlotte.geay@sante.gouv.fr, chef du lab « innovation et évaluation en santé »
Autres personnes à contacter (mail) : javier.nicolau@sante.gouv.fr, adjoint à la chef du lab « innovation et évaluation en santé »