Offre n° 3420286
Ml Ops Engineer H/F
92 - Courbevoie - Localiser avec Mappy
Publié le 04 juin 2026
POSTE : Ml Ops Engineer H/F DESCRIPTION : Mission principale Garantir que les solutions d'IA produites par Brain soient déployées, exploitées et supervisées de manière fiable, performante et reproductible, en cohérence avec les standards de la DSI et les exigences métier. Industrialisation des APIs Brain : - Concevoir, maintenir et faire évoluer les chaînes CI/CD (Azure DevOps) pour les APIs développées par Brain (.NET sur Linux notamment). - Packager les applications via Helm, gérer les charts, les valeurs par environnement (dev / staging / prod) et les hooks de déploiement. - Définir les bonnes pratiques de configuration Kubernetes : requests / limits, sondes liveness / readiness, autoscaling, gestion des secrets, observabilité. - Diagnostiquer et résoudre les incidents de plateforme (OOMKilled, hooks Helm en échec, problèmes RBAC, certificats, etc.) en collaboration avec la DSI. Déploiement et exploitation des LLMs - Mettre en place les pipelines de déploiement de modèles (LLMs auto-hébergés ou via API externes) : versionning, gestion du cycle de vie, rollback, A/B testing. - Optimiser l'inférence : choix du runtime (vLLM, TGI, Triton, ONNX Runtime ou équivalent), gestion GPU / CPU, mise en cache, batching, quantification. - Intégrer les briques d'écosystème LLM (vector stores, orchestrateurs type LangChain / Semantic Kernel, passerelles type LiteLLM) dans des architectures industrielles. - Mettre en place le monitoring spécifique aux LLMs : latence, coûts par requête, qualité des réponses, dérive, télémétrie applicative. Interface avec la DSI groupe : - Être l'interlocuteur·rice technique privilégié·e entre Brain et la DSI sur les sujets infrastructure, sécurité, conformité et déploiement. - Aligner les pratiques de Brain avec les standards groupe (gestion des clusters Kubernetes, politiques RBAC, gestion des secrets, conformité réseau). - Co-construire les processus de mise en production : revues d'architecture, critères de Go Live, gestion des changements, astreintes éventuelles. - Documenter et transmettre la connaissance : runbooks, schémas d'architecture, post-mortems. Observabilité, fiabilité et sécurité : - Mettre en place et faire vivre la stack d'observabilité (logs, métriques, traces) pour les APIs et les modèles. - Définir et suivre les indicateurs SRE pertinents (SLO, SLI, error budgets) sur les services Brain. - Intégrer la sécurité dès la conception : gestion des secrets, scans de vulnérabilités, signature d'images, supply chain. - Optimiser les coûts d'infrastructure et d'inférence (FinOps appliqué à l'IA). Stack Technique : - Frameworks ML/DL : PyTorch et/ou TensorFlow, scikit-learn ; compréhension du cycle entraînement checkpoint export (ONNX, SafeTensors). - Serving de modèles : Triton Inference Server, TorchServe, BentoML, KServe/Seldon Core sur Kubernetes. Expérience sur clusters on-premise appréciée. - CI/CD : Azure DevOps (pipelines YAML), GitOps (ArgoCD ou Flux), pratiques de déploiement progressif. - Conteneurisation : Docker, optimisation d'images, multi-stage builds, sécurité. - Infrastructure as Code : Terraform, Ansible ou équivalent. - Observabilité : Prometheus, Grafana, OpenTelemetry, ELK ou stack équivalente. Rejoindre Septeo, c'est aussi : - Grandir et s'épanouir grâce à un parcours de formation personnalisé, des opportunités de mobilité interne et la possibilité de s'auto-former via notre plateforme Udemy - Vivre une aventure humaine, échanger et partager autour d'évènements thématisés (afterworks, sport, RSE, séminaires, etc.) - Rejoindre un collectif qui prend soin des autres et s'engage en faveur de l'égalité des chances, la diversité et l'inclusion Vous faites quoi lundi ? PROFIL : Nous recherchons un profil doté d'un excellent sens du dialogue et de la pédagogie, capable de traduire de manière claire les contraintes liées à l'intelligence artificielle auprès des équipes IT. La personne devra faire preuve de pragmatisme, avec une capacité à aller à l'essentiel, livrer rapidement des résultats et adopter une démarche d'amélioration continue par itérations. Une curiosité technique est également indispensable, notamment concernant les évolutions rapides de l'écosystème des modèles de langage (LLM) et des technologies associées. Le poste requiert par ailleurs une grande autonomie, ainsi qu'une bonne capacité à prioriser dans un environnement en construction et en évolution constante.
- Type de contrat
-
CDI
Contrat travail
Profil souhaité
Expérience
- Expérience exigéeCette expérience est indispensable
Informations complémentaires
- Qualification : Cadre
- Secteur d'activité : Conseil pour les affaires et autres conseils de gestion
Employeur
Le Groupe Septeo
Septeo est un acteur de référence du software en Europe, présent à l'international et reconnu parmi le top 5 des éditeurs de logiciels sectoriels en France. En forte croissance et en transformation permanente, le groupe s'impose comme un acteur clé de l'édition logicielle grâce à la force de son collectif : des équipes déterminées, audacieuses et engagées. Chez Septeo, l'intelligence artificielle est placée au coeur de notre évolution. Nous la concevons comme...
D'autres offres peuvent vous intéresser :
(déjà vu)
Alternant - Développeur Web (H/F)
EXPONENS - 75 - Paris 12e Arrondissement
QUI SOMMES-NOUS ? Exponens c'est. Un groupe dynamique à taille humaine, qui se développe depuis plus de 30 ans autour des métiers financiers 10 expertises : l'expertise comptable, l'audit, le...
CDD - Temps plein
Publié il y a 7 jours
CDD
Temps plein(déjà vu)
Alternant - Développeur Web (H/F)
EXPONENS - 75 - Paris 12e Arrondissement
QUI SOMMES-NOUS ? Exponens c'est. Un groupe dynamique à taille humaine, qui se développe depuis plus de 30 ans autour des métiers financiers 10 expertises : l'expertise comptable, l'audit, le...
CDD - Temps plein
Publié il y a 7 jours
CDD
Temps plein(déjà vu)
Alternant - Développeur Web (H/F)
EXPONENS - 75 - Paris 12e Arrondissement
QUI SOMMES-NOUS ? Exponens c'est. Un groupe dynamique à taille humaine, qui se développe depuis plus de 30 ans autour des métiers financiers 10 expertises : l'expertise comptable, l'audit, le...
CDD - Temps plein
Publié il y a 8 jours
CDD
Temps plein(déjà vu)
Alternant - Développeur Web (H/F)
EXPONENS - 75 - Paris 12e Arrondissement
QUI SOMMES-NOUS ? Exponens c'est. Un groupe dynamique à taille humaine, qui se développe depuis plus de 30 ans autour des métiers financiers 10 expertises : l'expertise comptable, l'audit, le...
CDD - Temps plein
Publié il y a 8 jours
CDD
Temps plein(déjà vu)
Kubernetes Administrator / DevOps Engineer H/F (H/F)
CONSORT FRANCE - 75 - PARIS
Vous êtes passionné-e par les environnements Cloud, Kubernetes et la résolution d'incidents complexes ? Vous aimez industrialiser, automatiser et garantir la stabilité des plateformes critiques ? Ce...
CDI - Temps plein
Publié il y a 3 jours
CDI
Temps plein(déjà vu)
Ingénieur FinOps (H/F)
GITEC HUMAN RESOURCES - 75 - PARIS 09
Cabinet de recrutement à taille humaine, Gitec IT, filiale de VNH Resources Group (CDI, CDD et Intérim) est partenaire depuis 15 ans de multiples clients finaux et d'Entreprises de Services...
CDI - Temps plein
Publié il y a 13 jours
CDI
Temps plein(déjà vu)
Ingénieur MLOPS/DEVOPS (H/F)
DATABEANS - 75 - PARIS
Entraîner et déployer des modèles La conception d'infrastructures supportant des traitements algorithmiques intensifs à grande échelle Monitorer la performance des modèles Spécialisé dans...
CDI - Temps plein
Publié il y a 17 jours
CDI
Temps plein
(déjà vu)APPRENTISSAGE - Ingénieur RelOps / DevOps (H/F)
78 - Vélizy-Villacoublay
Dassault Systèmes, l'entreprise de la 3DEXPERIENCE, est un « accélérateur de progrès humain ». Elle propose aux entreprises et aux particuliers des environnements virtuels collaboratifs qui leur...
Intérim - Non renseigné
Publié il y a 8 jours
Intérim
Non renseigné
(déjà vu)Ingénieure / Ingénieur DevOps - Alternance (H/F)
92 - Issy-les-Moulineaux
Vos tâches Votre objectif : rejoindre une équipe et accompagner la culture DevOps au sein d'un projet d'envergure. • Assurer la construction des environnements• Maintenir les plateformes CI/CD (N2...
Intérim - Non renseigné
Publié il y a 5 jours
Intérim
Non renseigné
(déjà vu)Chef de Projet Infrastructure et Cloud Public H/F
ITS Group - 75 - Paris 1er Arrondissement
POSTE : Chef de Projet Infrastructure et Cloud Public H/F DESCRIPTION : About the Job : De belles missions vous attendent chez nos clients grands comptes sur des environnements riches et variés. ...
CDI - Non renseigné
Publié il y a 6 jours
CDI
Non renseigné
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)


.



