Administrateur HPC / Maintien en Condition Opérationnelle (MCO) (H/F) 91 - Bruyères-le-Châtel
Offre n° 4095936
Administrateur HPC / Maintien en Condition Opérationnelle (MCO) (H/F)
91 - Bruyères-le-Châtel - Localiser avec Mappy
Publié le 22 juin 2026
Contexte de la mission Le prestataire interviendra au sein d'une équipe d'environ d'experts HPC (techniciens & ingénieurs) dédiée au maintien en condition opérationnelle de supercalculateurs de classe mondiale (TOP500). L'environnement est hautement critique, avec une forte exigence de performance, de disponibilité et de sécurité. La mission implique une collaboration étroite avec des spécialistes systèmes, réseaux, stockage et HPC. Objet de la prestation Assurer l'administration, l'exploitation et la maintenance opérationnelle d'infrastructures HPC à grande échelle, incluant plusieurs milliers de nœuds de calcul et leurs systèmes associés. Activités principales Administration & exploitation HPC Administration des systèmes GNU/Linux HPC (CentOS, RedHat ou équivalent) Installation logicielle, configuration et optimisation des environnements HPC MCO de milliers de nœuds de calcul Gestion du stockage HPC (Lustre, DDN, ClusterStor) Maintenance & haute disponibilité Préparation et exécution des opérations de maintenance logicielle Mise en œuvre de solutions HA : Pacemaker, Corosync Gestion des services systèmes Linux (DNS, DHCP, Web, FTP, authentification, déploiement) Automatisation & scripting Automatisation des tâches d'exploitation via Bash, Python, Perl Utilisation d'outils d'orchestration : Puppet, Ansible Support & résolution d'incidents Analyse, diagnostic et résolution d'incidents de production Qualification et traitement des tickets (L1/L2), escalade vers L3 si nécessaire Suivi des escalades techniques internes ou partenaires Support sur la stack logicielle client (base CentOS) Documentation & procédures Rédaction de documentation technique, procédures d'exploitation et guides (Wiki) Environnement technique Systèmes : GNU/Linux (RedHat, CentOS) Stockage HPC : Lustre, DDN, ClusterStor Réseaux : InfiniBand, Ethernet, RoCE Conteneurs : Docker, OpenStack Orchestration : Puppet, Ansible Supervision : Nagios Matériel : serveurs x86, switches réseau, baies de stockage Langages : Bash, Python, Perl, notions de C Profil recherché Formation Bac +5 (ou équivalent ingénieur / informatique / HPC) Compétences techniques Administration Linux avancée HPC (obligatoire) Stockage distribué (Lustre) Réseaux haut débit (InfiniBand, RoCE) Automatisation (Ansible, Puppet) Scripting (Shell, Python, Perl) Haute disponibilité (Pacemaker, Corosync) Supervision (Nagios) Bases en langage C (analyse & compilation) Langues Anglais technique requis Contraintes de la mission Participation à un dispositif d'astreinte 24/7 (environ 1 semaine par mois) Environnement classifié → Habilitation Secret Défense obligatoire
- Type de contrat
-
CDI
Contrat travail - Salaire
- Salaire brut : Annuel de 45000.0 Euros à 55000.0 Euros sur 0.0 mois
Profil souhaité
Expérience
- Expérience exigéeCette expérience est indispensable
Informations complémentaires
- Qualification : Cadre
Employeur
Nyou
Nyou c'est voir les choses autrement Changeons de point de vue, traçons une nouvelle route. Performants Évoluer dans le bon sens Nos consultants sont la clé de voûte de notre organisation. Avec l'aide de nos clients, ils 'engagent sur la voie de l'excellence. Résilients Se remettre en question continuellement Le secteur des hautes technologies est en mutation constante. Apprenons à suivre et prédire les évolutions du marché. R...
D'autres offres peuvent vous intéresser :
Découvrez d'autres services web

Réussir son CV et sa lettre de motivation
Suscitez l’intérêt du recruteur et donnez-lui envie de vous rencontrer.

B.A.BA Entretien
Apprenez à préparer votre prochain entretien.

Informations sur le marché du travail
Accédez aux informations et statistiques sur ce métier.

Simulateur en cas de reprise d'emploi salarié
Estimez vos droits aux allocations et aides.
- Voir plus de services (Emploi store)



.



