INGÉNIEUR EN APPRENTISSAGE AUTOMATIQUE DATA SCIENTIST - H/F 94 - Villejuif
Offre n° 8315993
INGÉNIEUR EN APPRENTISSAGE AUTOMATIQUE DATA SCIENTIST - H/F
94 - Villejuif - Localiser avec Mappy
Publié le 26 janvier 2026
Description : A PROPOS DE LA STRUCTURE : Le CépiDc a pour mission de produire la base de données statistique sur les causes médicales de décès en France, de la diffuser et de réaliser des analyses sur cette base de données, qui est utilisée pour la veille sanitaire et pour des études épidémiologiques et statistiques. MISSION PRINCIPALE : Vous participez à la mise en oeuvre en production courante des outils d’intelligence artificielle pour le codage des causes de décès. Ces outils fondés sur de l’apprentissage profond et du traitement automatique des langues améliorent la qualité et la rapidité de codage automatique, de façon à satisfaire les délais réglementaires de diffusion de la base. Vous êtes responsable de leur adaptation pour tenir compte du prochain changement de nomenclature (passage de la CIM 10 à la CIM 11) et vous êtes partie prenante de l’évolution du système d’information du CépiDc qui en découle. Vous bénéficiez d’un accès à des ressources de calcul (GPU) permettant de concevoir, entraîner et tester des modèles et de réaliser des prédictions. Au sein du pôle production des données du CépiDc, vous travaillez dans l’équipe automatisation, sous la responsabilité de la cheffe d’équipe, et en étroite collaboration avec le data scientist senior. Vous collaborez également avec le reste de l’équipe pluridisciplinaire (codeurs, nosologistes, responsables de production, statisticiens) et vous êtes partie prenante de l’écosystème formé avec les partenaires de recherche et développement (médecins spécialisés en informatique médicale et datascientists, de l’AP-HP, LISN-CNRS, Insee, Santé publique France, Inserm). ACTIVITÉS PRINCIPALES : * Mettre en production, maintenir, monitorer et valider une chaîne de traitements de données textuelles comprenant des prédicteurs de type réseaux de neurones (transformers) pour aider/automatiser le codage du texte libre des certificats de décès dans la CIM (annotation, training/fine-tuning, monitoring). * Mettre en production le ciblage des certificats à allouer aux différentes modalités de codage (IA, manuel), évaluer l’amélioration continue du codage automatique (en taux de codage et en qualité) en vue d’une boucle d’apprentissage continue (on line) à partir de la validation/correction des codeurs des propositions de l’algorithme. * Adapter l’architecture du modèle et le _feature engineering_ en vue d’améliorer la classification des causes, en adéquation avec la finalité statistique du traitement et les bonnes pratiques. * Participer à l’internationalisation de ces méthodes en lien avec les instances représentatives françaises à l’OMS et au sein de l’Europe. * Assurer une veille scientifique sur les modèles et les algorithmes à l’état de l’art dans le domaine. * Participer activement à des groupes d’échanges de bonnes pratiques existants ou à construire regroupant datascientists, statisticiens et chercheurs en épidémiologie et informatique (Insee, DREES, Inserm, Inria,...) autour de l’usage de l’IA/TAL sur ces thématiques. Profil recherché : CONNAISSANCES : * Apprentissage automatique, traitement automatique des langues, _deep learning_, sciences des données ; * Maîtrise de l’ensemble des étapes allant du développement à la mise en production ; * Maîtrise des environnements de production ; * De bonnes bases statistiques ; * Des connaissances en biostatistique et un intérêt pour l’épidémiologie sont des plus. SAVOIR-FAIRE : * Très bonne maîtrise de Python et des librairies de _deep learning_ (Tensorflow, Pytorch) en particulier celles appliquées au traitement automatique des langues ; * Entraînement et monitoring d’algorithmes de_ deep learning_ * Mise en production d’algorithmes de _machine learning_, MLops * Git, outil de versioning * Design et maintien de pipeline de _machine learning_, ces expériences sont des plus, de même que l’utilisation de Docker, MLFlow, et de technologies cloud. APTITUDES : * Proactivité, force de proposition ; * Aisance relationnelle, sens de la communication et de la pédagogie ; * Capacités d’organisation, de planification et de rigueur ; * Discrétion et confidentialité ; * Savoir s’insérer et interagir avec des équipes multidisciplinaires : pôle de production, experts métiers chargés de production, statisticiens, stagiaires, chercheurs, etc. ; * Savoir se maintenir à l’état de l’art des connaissances. NIVEAU DE DIPLÔME ET FORMATION : Titre ou diplôme classé au moins au de Niveau 7 ou qualification professionnelle jugée équivalente. Diplôme d’ingénieur de grandes écoles, Master en data science ou équivalence professionnelle SPÉCIFICITÉS ET ENVIRONNEMENT DU POSTE : confidentialité des données et contraintes de production. EXPÉRIENCE SOUHAITÉE : ce poste convient à un sortant d’école motivé, formé à l’usage de Python et des librairies d’apprentissage profond.
- Type de contrat
-
CDD - 36 Mois
Contrat travail - Durée du travail
-
Travail en journée
Profil souhaité
Expérience
- Débutant accepté
Informations complémentaires
- Secteur d'activité : Recherche-développement en autres sciences physiques et naturelles
Employeur
Inserm
D'autres offres peuvent vous intéresser :
(déjà vu)
Chargé(e) du Suivi Contractuel des Marchés de Maintenance/Travaux H/F
CRIT INTERIM - 93 - Tremblay-en-France
CRIT Intérim recherche pour l'un de ses clients un(e) Chargé(e) du suivi contractuel des marchés de maintenance/travaux. Vos missions principales : En phase de procédure de passation des marchés...
Intérim - Temps plein
Publié hier
Intérim
Temps plein(déjà vu)
Technicien bureau d'études (H/F)
MANPOWER - 77 - Réau
Vous êtes passionné(e) par la conception mécanique et souhaitez contribuer à des projets technologiques d'envergure ? Rejoignez notre client, acteur majeur de l'aéronautique, et participez à la...
Intérim - Temps plein
Publié il y a 12 jours
Intérim
Temps plein(déjà vu)
AIRFREIGHT PRICING SPECIALIST (H/F)
LOGAERO SERVICES - 95 - LE THILLAY
En support au Directeur Network & au service commercial - Cotations, offres agents et / ou clients. - Dispatch / traitement / suivi des cotations import / export, émanant du réseau international et...
CDI - Temps plein
Publié il y a 15 jours
CDI
Temps plein(déjà vu)
COMMERCIAL DÉVELOPPEUR (H/F)
VIC - 95 - GONESSE
Rejoignez l'un des leaders français du transport de voyageurs Fort d'une flotte haut de gamme unique en France (Autocars GT, véhicules premium), de services urbains et scolaires, notre groupe...
CDI - Temps plein
Publié il y a 9 jours
CDI
Temps plein(déjà vu)
Data Scientist - Infrastructure IA & NLP appliqué (H/F)
MALOU-FOOD MARKETING - 75 - PARIS 18
Votre rôle : Rejoignez notre équipe technique dynamique et jouez un rôle central dans l'avancement de projets à la pointe de l'Intelligence Artificielle. Vos missions ne seront pas routinières. Vous...
CDI - Temps plein
Publié il y a 7 jours
CDI
Temps plein(déjà vu)
Forward Engineer (H/F)
NEXA FORWARD - 75 - PARIS 10E ARRONDISSEMENT
Envie de plonger dans l'univers de l'IA, un domaine en évolution permanente aux perspectives immenses ? Tu recherches un rôle qui combine conseil, technologies de nouvelle génération et esprit...
CDI - Temps plein
Publié hier
CDI
Temps plein(déjà vu)
Data Scientist - H/F (H/F)
DAY USE - 75 - PARIS
À PROPOS DE DAYUSE Dayuse ouvre les portes des hôtels en journée à une nouvelle clientèle en quête d'expériences inédites. Sublimer son quotidien, partager des moments forts, vivre l'instant présent...
CDI - Temps plein
Publié hier
CDI
Temps plein(déjà vu)
Data Scientist (H/F)
IKOS CONSULTING - 92 - Levallois-Perret
Ikos recherche un Data Scientist (F/H) pour renforcer ses équipes. Le travail consiste à réaliser pour l'un de nos clients les activités suivantes : - Automatisation de banc de test -...
CDI - Temps plein
Publié il y a 8 jours
CDI
Temps plein(déjà vu)
Data Scientist (H/F)
75 - PARIS 12
Dans le cadre de projets stratégiques autour de la donnée et de l'IA appliquées au bâtiment / construction / smart building, nous recherchons un(e) Data Scientist / Ingénieur IA confirmé(e) capable...
CDI - Temps plein
Publié il y a 6 jours
CDI
Temps plein(déjà vu)
Data Scientist (H/F)
ASSISTANCE PUBLIQUE HOPITAUX DE PARIS - 75 - Paris (Dept.)
Nous recrutons un ou une Data Scientist pour travailler sur le projet CODIA. Ce projet est un projet interdisciplinaire à l'intersection de la médecine (diabétologie), de la pharmaco-épidémiologie...
CDD - Temps plein
Publié il y a 7 jours
CDD
Temps plein
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)


.



