Ingénieur Logiciel – Runtime d'Inférence IA & Plateforme de Serving (H/F) 92 - Meudon
Offre n° 3621738
Ingénieur Logiciel – Runtime d'Inférence IA & Plateforme de Serving (H/F)
92 - Meudon - Localiser avec Mappy
Publié le 10 juin 2026
RESPONSABILITÉS : Nous recherchons un Ingénieur Logiciel pour permettre le serving d'inférence IA à grande échelle sur la plateforme accélératrice Vsora Jotunn8. Le rôle porte sur l'évaluation, le portage, l'optimisation et le déploiement de runtimes d'inférence et frameworks de serving de pointe tels que vLLM et SGLang, afin de délivrer des solutions de serving IA performantes et scalables. Responsabilités principales • Piloter la conception, le développement et l'intégration de la stack logicielle chargée d'orchestrer et de gérer les charges de travail d'inférence IA hautes performances sur l'accélérateur Vsora Jotunn8. • Évaluer et conduire une analyse technique approfondie des runtimes d'inférence IA modernes et des frameworks de serving, notamment vLLM, SGLang et d'autres solutions émergentes pour LLMs et charges de travail IA. • Piloter le portage et l'optimisation des runtimes d'inférence et frameworks de serving sélectionnés vers la plateforme matérielle Vsora, en exploitant pleinement les capacités de l'accélérateur. • Concevoir et implémenter des architectures de déploiement scalables pour le serving IA, couvrant les environnements mono-nœud et distribués, la planification des modèles, la gestion des ressources et les opérations en production. • Définir l'architecture logicielle et la roadmap pour le serving IA sur les plateformes Vsora, en équilibrant performance, couverture fonctionnelle, maintenabilité et compatibilité écosystème. • Collaborer avec les communautés open-source et les partenaires de l'écosystème IA pour assurer la compatibilité avec les principaux frameworks, environnements de déploiement et écosystèmes de modèles. • Accompagner les clients et équipes internes via des implémentations de référence, des guides de déploiement, des caractérisations de performance et des bonnes pratiques pour l'inférence IA sur les plateformes Vsora. PROFIL RECHERCHÉ : • Solides compétences en programmation Python et/ou C++. • Solide expérience avec les frameworks ML : PyTorch, TensorFlow, JAX, ONNX ou écosystèmes équivalents. • Expérience dans le déploiement, l'optimisation ou le portage de modèles IA sur des plateformes matérielles spécialisées (GPU, NPU, accélérateurs IA). • Compréhension des architectures de réseaux de neurones : transformers, modèles de diffusion, CNN, modèles multimodaux et grands modèles de langage. • Familiarité avec les compilateurs ML, frameworks d'optimisation de graphes et toolchains de déploiement (ONNX Runtime). • La connaissance de la quantification, précision mixte, compression de modèles et techniques d'optimisation d'inférence est un plus.
- Type de contrat
-
CDI
Contrat travail - Durée du travail
-
35H/semaine
Travail en journée
- Salaire
- Salaire brut : Annuel de 55000.0 Euros à 80000.0 Euros
Profil souhaité
Expérience
- Débutant accepté
Informations complémentaires
- Qualification : Cadre
Employeur
Mercato de l'emploi
Rejoindre cette entreprise, c'est intégrer un acteur innovant du secteur des processeurs, engagé dans le développement de solutions de pointe pour l'intelligence artificielle. L'entreprise offre un environnement stimulant, propice à l'excellence technique et à l'innovation, au sein d'équipes passionnées et multidisciplinaires, situées à Meudon.
D'autres offres peuvent vous intéresser :
(déjà vu)
Gestionnaire d'application informatique (H/F)
SIEGE ASP LIMOGES - 93 - Montreuil
Environnement professionnel : L'Agence de Services et de Paiement (ASP) est un établissement public administratif placé sous la double tutelle du Ministère en charge de l'Agriculture et de la...
CDD - Temps plein
Publié hier
CDD
Temps plein(déjà vu)
DEVELOPPEUR D'APPLICATIONS POWER APPS H/F
ADEQUAT INTERIM - 94 - Villeneuve-Saint-Georges
Notre agence Adéquat CHAMPIGNY recrute un DEVELOPPEUR D'APPLICATIONS POWER APPS H/F pour son client spécialisé en transport. Contexte : Site est en pleine transformation, Le projet PEPS...
Intérim - Temps plein
Publié il y a 2 jours
Intérim
Temps plein(déjà vu)
Quant Developer Java Python (H/F)
CIORANE - 93 - La Courneuve
Nous recherchons un Développeur Java / Python confirmé pour intervenir au sein d'un environnement bancaire exigeant sur des sujets liés à la valorisation d'instruments financiers de taux simples et...
CDI - Temps plein
Publié il y a 3 jours
CDI
Temps plein(déjà vu)
Architecte Logiciel (H/F)
SIMAERO OPERATIONS - 95 - ROISSY EN FRANCE
Simaero est un fournisseur international de formation sur simulateurs de vol destiné aux compagnies aériennes, aux organismes de formation et aux pilotes professionnels. Le groupe dispose d'un réseau...
CDI - Temps plein
Publié il y a 3 jours
CDI
Temps plein(déjà vu)
Ingénieur(e) Solutions Sénior - Robotique Mobile & Automatisation (H/F)
HIKROBOT EUROPE B.V. - 93 - NOISY LE GRAND
Description du poste Rattaché(e) à l'équipe technique et commerciale, vous jouerez un rôle clé dans le gain des projets et leur mise en œuvre réussie. Vous serez responsable de la conception des...
CDI - Temps plein
Publié il y a 8 jours
CDI
Temps plein(déjà vu)
Développeur LoanIQ (H/F)
TESSELATE FRANCE - 92 - NEUILLY SUR SEINE
Développeur LoanIQ (H/F) Dans le cadre du renforcement de nos équipes, nous recherchons un(e) Développeur(se) LoanIQ expérimenté(e) pour intervenir sur des projets stratégiques au sein d'un...
CDI - Temps plein
Publié il y a 9 jours
CDI
Temps plein(déjà vu)
Développeur Cobol / AS400 (H/F)
SYMBIOZ RECRUTEMENT - 75 - PARIS 02
Société d'assurance de 200 collaborateurs, notre partenaire recherche un nouveau Développeur Cobol/AS400 pour remplacer un départ en retraite Dans une DSI composée d'une cinquantaine de...
CDI - Temps plein
Publié il y a 9 jours
CDI
Temps plein(déjà vu)
Software Engineer (H/F)
75 - PARIS 09
Qui sommes-nous ? Artefact est un cabinet de conseil en data nouvelle génération qui compte plus de 1 200 collaborateurs dans 19 pays, dédiés à l'accompagnement et à la transformation de nos clients...
CDI - Temps plein
Publié il y a 2 jours
CDI
Temps plein(déjà vu)
Ingénieur / Ingénieure logiciel H/F (H/F)
75 - PARIS 01
Prendre en charge la maintenance évolutive et corrective de la solution- Capacité à intégrer de nouvelles équipes projets de nouveaux développements de logiciels- Réaliser l'analyse détaillée et...
CDI - Temps plein
Publié il y a 21 jours Soyez parmi les 1ers à postuler
CDI
Temps plein
(déjà vu)Manager data & it (f/h) (CDI)
92 - Courbevoie
En tant que Manager Data & IT, vous pilotez la stratégie SI et Data, vous garantissez la cohérence des projets technologiques et vous accompagnez l'évolution du système d'information, sous la...
CDI - Non renseigné
Publié hier
CDI
Non renseigné
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)


.



