Thèse cifre /phd - apprentissage par renforcement multimodal pour la robotique (m/f) (h/f) 31 - Toulouse
Offre n° 3733093
Thèse cifre /phd - apprentissage par renforcement multimodal pour la robotique (m/f) (h/f)
31 - Toulouse - Localiser avec Mappy
Publié le 12 juin 2026
Job Description: Airbus Commercial Aircraft recherche un(e) étudiant(e) en thèse sur le sujet: “Apprentissage par Renforcement Multimodal pour la Robotique (M/F)” pour rejoindre le département Central Research & Technology, Airbus SAS basé à Toulouse, France . Le département travaille en collaboration avec des laboratoires du CNRS (le LAAS pour son expertise robotique et le CerCo pour l’IA inspirée des neuro-sciences), également impliqués dans la chaire synergie C3PO du cluster IA toulousain ANITI. Le travail de recherche sera réalisé à Toulouse : il est prévu à 40% dans les locaux d’Airbus et à 60% dans les locaux académiques (CNRS/ANITI). Le début de la thèse est envisagé en Octobre 2026. Etes-vous prêt à faire progresser l'intelligence des robots pour qu'ils s'adaptent dynamiquement aux instructions humaines dans un environnement industriel aéronautique ? Votre environnement de travail : Capitale mondiale de l'aéronautique et capitale européenne de la recherche dans le spatial, Toulouse est une ville dynamique du sud-ouest de la France desservie par un aéroport international. Idéalement située entre la mer Méditerranée et l'océan Atlantique et à proximité des Pyrénées, elle offre de nombreuses possibilités d'activités de plein air ! Parce que nous prenons soin de vous : Avantages financiers : Salaire attractif, accords d’intéressement et de participation, plan d'épargne salariale abondé par Airbus, plan d’actionnariat salarié sur la base du volontariat, avec attribution d'actions gratuites en fonction du nombre d’actions souscrites. Équilibre vie privée / professionnelle : Des jours de congés supplémentaires pour occasions spéciales et des options de transfert de congés, un comité d'entreprise proposant de nombreuses activités socio-culturelles et d’autres services. Bien-être / santé : couverture complémentaire des frais de santé et de prévoyance (incapacité, invalidité, décès). Selon le site : centre de services de santé, services de conciergerie, salle de sport, application de covoiturage. Développement individuel: des opportunités d’évolution et des possibilités de formations nombreuses (catalogue de plus de 10.000 e-formations disponibles en libre accès pour développer votre employabilité, certifications, programmes de développement accéléré, parcours expert, mobilité nationale et internationale). Chez Airbus, nous vous aidons à travailler, à vous connecter et à collaborer plus facilement et de manière plus flexible. Partout où cela est possible, nous favorisons la flexibilité dans nos modes de travail afin de stimuler l'esprit d'innovation. Vos challenges : Contexte de la thèse : L'apprentissage par renforcement (“Reinforcement Learning” ou RL) est devenu un acteur majeur dans la prise de décision séquentielle en robotique, notamment pour gérer des entrées multimodales complexes (informations vectorielles, perception visuelle, instructions en langage naturel...). Dans le secteur aérospatial, le RL multimodal ouvre des perspectives de développement de robots plus adaptatifs, capables d'opérer dans des environnements industriels pour des tâches variées : inspection, manipulation, navigation, etc. La robotique est un champ de recherche actuellement très actif, avec deux impulsions récentes qui révolutionnent le domaine. La première vient du RL qui, depuis l’avènement de simulateurs massivement parallèles, permet par exemple de générer des politiques de marche en quelques minutes/heures. La seconde est l’utilisation de modèles de fondation robotique pré-entrainés type VLA (Vision-Language-Action), une extension naturelle des LLM (Large Language Models) & VLM (Vision-Language Models) à la robotique, permettant de capitaliser sur des connaissances acquises pour ne pas apprendre de zéro. L'objectif de cette thèse est d’utiliser le RL multimodal pour apprendre aux robots à adapter dynamiquement leur comportement à partir d’instructions de haut niveau fournies par des humains, en évitant de passer par l’ingénierie de fonction de récompense complexe. Ceci sera abordé en s’appuyant sur des modèles VLA pré-entrainés ainsi que sur la théorie du Global Workspace pour une fusion efficace des différentes modalités (proprioception, vision, instructions en langage naturel). Il est à noter qu’il existe plusieurs types de robots (bras robotiques, quadrupèdes...) qui peuvent jouer un rôle dans les opérations visées. Ainsi, des algorithmes généralistes applicables à différentes morphologies seront à privilégier dans ce contexte. Le travail de thèse consistera donc à : Réaliser un état de l'art sur le RL multimodal, les modèles Vision-Language-Action (VLA) et les mécanismes de fusion multimodale (Global Workspace Theory) Concevoir un cadre de RL multimodal basé sur des modèles de fondation robotique Proposer des méthodes pour simplifier/automatiser l’ingénierie de la
- Type de contrat
-
CDI
Contrat travail - Durée du travail
-
Travail en journée
Profil souhaité
Expérience
- Expérience exigéeCette expérience est indispensable
D'autres offres peuvent vous intéresser :
(déjà vu)
Alternance - Technicien SIG (H/F)
PARERA - 32 - L ISLE JOURDAIN
Vos missions : Structurer et intégrer les données dans le SIG et mettre à jour en fonction du MCD client ; Préparer l'activité pour les techniciens terrain ; Réceptionner les données terrain et les...
CDD - Temps plein
Publié il y a 7 jours
Employeur handi-engagéCDD
Temps plein(déjà vu)
Électro-acousticien(ne) / Bureau d'études (H/F)
MBS SOUND (MAJORCOM / BOUYER) - 31 - VILLENEUVE LES BOULOC
Chez MBS SOUND, nous concevons et fournissons des systèmes de sonorisation innovants pour le confort et la sécurité, destinés aux projets tertiaires, institutionnels, sportifs et commerciaux, en...
CDI - Temps plein
Publié il y a 15 jours
CDI
Temps plein(déjà vu)
Scientist II Purification Process Design (H/F)
JUST-EVOTEC BIOLOGICS EU - 31 - TOULOUSE
Le groupe de développement des procédés de purification de Sandoz - France recherche un membre d'équipe enthousiaste et motivé, passionné par l'idée d'élargir l'accès mondial aux biothérapeutiques...
CDI - Temps plein
Publié il y a 15 jours
CDI
Temps plein(déjà vu)
Chef de projet BE / R&D (F/H)
EXPECTRA - 32 - Isle-Jourdain
Rattaché.e au Project Manager, vous aurez les missions suivantes dans un contexte international : Piloter des projets complexes de bout en bout (cadrage, planification, exécution, suivi, clôture)...
CDI - Temps plein
Publié il y a 16 jours
CDI
Temps plein(déjà vu)
Ingénieur Certification Aéronautique H/F
EXPLEO FRANCE - 31 - TOULOUSE
Dans le cadre du développement de nos activités aéronautiques, vous intégrerez le département Qualité et serez responsable de la certification des modifications (MOD) réalisées par le Bureau d'études...
CDI - Temps plein
Publié il y a 21 jours
CDI
Temps plein(déjà vu)
Scientist II Bioreactor Process Development, Pilot (H/F)
JUST-EVOTEC BIOLOGICS EU - 31 - TOULOUSE
Vos responsabilités: - Préparer et exploiter des bioréacteurs à usage unique à l'échelle pilote et les équipements associés, et fournir un support opérationnel sur les spécifications des...
CDI - Temps plein
Publié il y a 23 jours
CDI
Temps plein(déjà vu)
Scientist, Drug Product Design (H/F)
JUST-EVOTEC BIOLOGICS EU - 31 - TOULOUSE
Vous êtes chargé de la conception de produits pharmaceutiques pour rejoindre une équipe multidisciplinaire, collaborative et au rythme rapide. Vous rejoignez l'équipe de formulation et de fabrication...
CDI - Temps plein
Publié il y a 23 jours
CDI
Temps plein(déjà vu)
Technicien / Technicienne en robotique (H/F)
GRAINES & COMPETENCES - 31 - CASTELMAUROU
Vous souhaitez rejoindre une entreprise innovante qui révolutionne la réhabilitation des réseaux souterrains près de L'Union ? Notre client, acteur reconnu dans son domaine, mise sur la robotique et...
Intérim - Temps plein
Publié il y a 6 jours
Intérim
Temps plein(déjà vu)
Réf AR IPR ING PROJETS SYSTEMES ROBOTIQUES - AUTOMATISMES Nat FR (H/F)
CIMEM - 31 - Toulouse
Réf AR IPR INGENIEUR PROJETS SYSTEMES ROBOTIQUES - AUTOMATISMES - AERONAUTIQUE Nationalité FRANCAISE PME filiale d'un leader mondial de la construction aéronautique concevant, assemblant,...
CDI - Temps plein
Publié il y a 14 jours
CDI
Temps plein
(déjà vu)Ingénieur Automatisme / Robotique F/H - Informatique industrielle (H/F)
DoiT Platinium - 31 - Toulouse
Descriptif du poste: Prêt(e) à faire décoller votre carrière ? Dans le cadre du développement de ses activités Do iT Platinium recherche son/sa futur(e) Ingénieur Automatisme / Robotique (H/F)...
CDI - Non renseigné
Publié il y a 9 jours
CDI
Non renseigné
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)


.



