Ingénieur en apprentissage par renforcement F/H - Système, réseaux, données (H/F) 91 - Palaiseau
Offre n° 5519481
Ingénieur en apprentissage par renforcement F/H - Système, réseaux, données (H/F)
91 - Palaiseau - Localiser avec Mappy
Publié le 22 novembre 2025
Descriptif du poste: Description de l'entreprise Construisons ensemble un avenir de confiance Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cybersécurité & Identité numérique. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays. Avec plus de 600 experts IA et une centaine de doctorants en IA chaque année, et disposant d'un réseau de partenaires industriels, start-up et académiques de premier ordre, Thales est, depuis une décennie, un acteur majeur de l'IA de confiance, transparente, explicable et éthique. Le Groupe figure en tête, en Europe, dans le classement des déposants de brevets dans l'IA des systèmes critiques. Il intègre de l'IA dans plus d'une centaine de ses produits et services. CortAIx est l'accélérateur IA qui dotera les forces armées, les avionneurs et tous les opérateurs d'infrastructures critiques, de solutions hautement sécurisées leur apportant plus d'efficacité dans l'analyse des données et la prise de décision, tout en tenant compte des contraintes spécifiques, telles que la cybersécurité, l'embarquabilité et la frugalité, liées aux environnements critiques. Au sein de cette nouvelle organisation, nous représentons l'axe "cortAIx Factory" qui vise à accélérer la qualification et l'industrialisation des outils de développement de l'IA ainsi que les cas d'usage pour les données des systèmes. Thales dote déjà ses systèmes d'IA et continue d'identifier de nouveaux cas d'usages pour accélérer la performance, comme par exemple la planification de missions, la gestion du trafic aérien, le pilotage de drones et de robots. Missions Lieu : Palaiseau, France Construisons ensemble un avenir de confiance Thales est un leader mondial des hautes technologies spécialisé dans trois secteurs d'activité : Défense & Sécurité, Aéronautique & Spatial, et Cyber & Digital. Il développe des produits et solutions qui contribuent à un monde plus sûr, plus respectueux de l'environnement et plus inclusif. Le Groupe investit près de 4 milliards d'euros par an en Recherche & Développement, notamment dans des domaines clés de l'innovation tels que l'IA, la cybersécurité, le quantique, les technologies du cloud et la 6G. Thales compte près de 81 000 collaborateurs dans 68 pays. Profil recherché: Votre quotidien Thales Research&Technology, notre centre de recherche dans les domaines matériels, et CortAIx Labs, notre centre de recherche en IA et digital ont pour mission de proposer des innovations de ruptures, de maintenir et d'accroitre l'avance technologique et d'en assurer la compétitivité pour le groupe. Résoudre des jeux multi-agents à information incomplète (contrairement aux échecs ou au go) est un défi majeur : chaque agent doit raisonner avec de l'incertitude sur l'état réel du jeu et sur les intentions des adversaires. Les approches de type Counterfactual Regret Minimization (CFR) ont montré leur efficacité lorsque la combinatoire reste limitée. Plus récemment, des travaux de pointe de Google Deepmind en 2023 ont démontré qu'un apprentissage par renforcement et des architectures dédiées peuvent atteindre un niveau expert sur des jeux à très grande combinatoire comme Stratego. Votre objectif sera de reproduire les principes de ces approches de pointe sur le jeu Zenith (multi-agents, information incomplète, complexité intermédiaire). L'enjeu sera de dépasser les limites des méthodes CFR « pures » en s'appuyant sur des techniques d'apprentissage par renforcement et de recherche mieux adaptées à ce cadre. Dans ce contexte, vous aurez pour missions : * État de l'art : jeux à information incomplète, CFR/Deep-CFR, self-play, régularisation/équilibres, estimation de croyances (beliefs) et modèles d'adversaires. * Modélisation de Zenith : spécification des règles, états partiellement observables, espaces d'actions, mécanismes de révélation d'information. * Implémentation : environnement d'entraînement, RL basé sur les agents (policy/value), gestion de l'exploration/exploitation sous incertitude. * Évaluation : métriques de performance (win-rate, ELO, exploitabilité), ablations (avec/sans croyances, variations de budget de calcul), robustesse face à des stratégies variées. * Valorisation : analyse de la transposabilité aux cas d'usage Thales (entraînement stratégique/tactique, raisonnement en environnement électromagnétique avec brouillage/anti-brouillage). Votre profil - Ingé
- Type de contrat
-
CDI
Contrat travail - Durée du travail
-
00H/semaine
- Salaire
- A négocier
Profil souhaité
Expérience
- Débutant accepté
Informations complémentaires
- Qualification : Cadre
- Secteur d'activité : Programmation informatique
Employeur
CARREVOLUTIS
Description de l'entreprise HARA Consulting est une communauté d'ingénieurs passionnés, animés par le sens du collectif et une expertise technique de haut niveau. Entreprise à mission fondée en 2021, HARA Consulting s'inscrit pleinement dans l'Économie Sociale et Solidaire avec un modèle unique et engagé. Présente dans les principales régions de France, l'entreprise compte plus de 100 salariés et connaît une forte croissance, saluée par plusieurs distinctions pour ses expe...
D'autres offres peuvent vous intéresser :
(déjà vu)
Expert Infrastructure & Logiciels Socle pour le Mainframe zOS (H/F)
COLCOMBET THIBAULT - 75 - Paris (Dept.)
Vous rejoignez la Direction des Infrastructures Informatique, l'un des plus grands centre européens de services partagés. Vous garantissez le fonctionnement du socle Mainframe Gérer les...
CDI - Temps plein
Publié il y a 7 jours
CDI
Temps plein(déjà vu)
Ingénieur vérification RTL senior (H/F)
NANOXPLORE - 92 - SEVRES
Nous cherchons en CDI temps plein pour notre équipe FIRMWARE, un développeur Systèmes Embarqués. Le candidat évoluera au sein de l'équipe responsable du développement de la chaine de communication...
CDI - Temps plein
Publié il y a 16 jours
CDI
Temps plein(déjà vu)
Expert Infrastructures Middleware Middleware Mainframe Z/Os (H/F)
COLCOMBET THIBAULT - 75 - Paris (Dept.)
Vous rejoignez la Direction des Infrastructures Informatique, l'un des plus grands centre européens de services partagés. Missions : - Garantir l'exploitation technique et la maintenabilité des...
CDI - Temps plein
Publié il y a 7 jours
CDI
Temps plein(déjà vu)
Lead Architecte Technique SAP S/4 - Migration RISE - Nanterre (H/F)
CIORANE - 92 - Nanterre
Bonjour, Nous recherchons un(e) Lead Architecte Technique SAP S/4 pour une Migration RISE ; mission d'un an à Nanterre avec un démarrage le 3 décembre. . *** Description de la mission : En marge...
CDD - Temps plein
Publié il y a 4 jours
CDD
Temps plein(déjà vu)
Ingénieur / Ingénieure système Linux - N3 : Gitlab/Ansible/Debian (H/F)
ECONOCOM SERVICES & SOLUTIONS - 78 - Maisons-Laffitte
Contexte client : L'objectif est l'utilisation d'une expertise au profit des équipes de notre client, en charge des systèmes informatiques pour assurer la sécurisation et le suivi des configurations...
CDI - Temps plein
Publié il y a 17 jours
CDI
Temps plein(déjà vu)
Cloud architect (H/F)
LYNXEO FRANCE - 92 - Puteaux
Objectif Le Cloud Architect est responsable de la revue, de l'optimisation et de l'évolution de l'infrastructure cloud de l'entreprise basée sur Azure ainsi que des environnements hybrides. Ce rôle...
CDI - Temps plein
Publié il y a 19 jours Soyez parmi les 1ers à postuler
CDI
Temps plein(déjà vu)
Architecte Cloud Azure (H/F)
SEGMENT ELITE - 75 - PARIS 09
Nous recrutons un Architecte Azure confirmé pour concevoir, déployer et sécuriser les environnements Cloud à grande échelle. Localisation : Paris-La Défense / Hybride Expérience : 7 à 8...
CDI - Temps plein
Publié il y a 18 jours Soyez parmi les 1ers à postuler
CDI
Temps plein(déjà vu)
Ingénieur système Linux (H/F)
OSMOZIUM - 78 - VERSAILLES
Nous recherchons actuellement un(e) ingénieur expert Linux (H/F) pour intégrer l'activité Ingénierie de notre entreprise. Vous serez amené(e) à intervenir pour nos clients en Assistance Technique ou...
CDI - Temps plein
Publié il y a 5 jours
CDI
Temps plein(déjà vu)
Architecte Solution Oracle ERP Cloud Finance (GL/FA/AR/SLA) - Par (H/F)
CIORANE - 75 - PARIS 08
Bonjour, Nous recherchons un(e) Architecte Solution Oracle ERP Cloud Finance (GL/FA/AR/SLA) pour une mission située à Paris (Télétravail 60 % sur site) avec un démarrage le 1er décembre 2025 pour 5...
CDD - Temps plein
Publié il y a 11 jours
CDD
Temps plein(déjà vu)
Architecte Azure (H/F)
SEGMENT ELITE - 75 - PARIS 09
Nous recrutons un Architecte Azure confirmé pour concevoir, déployer et sécuriser les environnements Cloud à grande échelle. Localisation : Paris / Hybride Expérience : 7 à 8 ans Compétences...
CDI - Temps plein
Publié il y a 18 jours
CDI
Temps plein
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)


.



