SRE (Site Reliability Engineer) Observability H/F
OVH
Paris, France
il y a 13j

L'équipe Platform d'OVH a pour mission principale d'offrir à nos clients un ensemble de solutions (produits et services) leur permettant de construire facilement leurs plateformes d'applications de demain, scalables, et évolutives.

Le but ? Réduire considérablement l'effort et le temps consacrés à l'onboarding, l'exploitation et au monitoring des plateformes applicatives de nos clients.

Compte tenu des forts enjeux pour le groupe, nous renforçons l'équipe de plusieurs SRE afin de construire notre offre Observability et assurer une qualité de service irréprochable.

Votre rôle ?

Dans le langage courant, le rôle de cette équipe n'est rien d'autre que de dépenser beaucoup d'énergie pour en économiser plus tard (malin, non ?

tout en s'amusant avec des nouvelles technos du marché.

Si on précise un peu les choses, voici les missions associées :

  • Évaluer l'importance des problèmes impactant l'infrastructure internes et externes.
  • Dépister les problèmes complexes et coordonner les efforts de l'équipe pour les corriger.
  • Suggérer et aider à mettre en oeuvre les meilleures pratiques pour que les incidents ne se reproduisent qu'une seule fois, et jamais plus.
  • Assurer la continuité du service avec des responsabilités d'astreinte
  • Travailler avec les équipes pour identifier, éliminer les goulots d'étranglement afin d'améliorer la performance et réduire les coûts.
  • Mettre à jour et tenir à jour un rapport mensuel contenant les indicateurs systèmes clés de santé (KPI / SLA) et analyser nos performances
  • Organisation post-mortem et suivi post-actions
  • Fournir une assistance aux propriétaires de l'application et une intégration continue
  • Vos atouts ?

  • Très bonnes connaissances en systèmes Unix
  • Vous maitrisez Python et / ou GO
  • Des compétences sur Java et Rust seraient un plus
  • Vous avez l'habitude de participer à des revues de code
  • Bonnes compétences en réseau
  • Vous êtes à l'aise avec l'exploitation de systèmes distribués
  • Vous maitrisez les outils CI / CD / CA, plateformes et outils associés
  • Messaging / Pub-Sub system (Redis, Kafka) sont des mots que vous utilisez quotidiennement
  • Vous maîtrisez un ou plusieurs outils de monitoring, de plateformes, et des processus organisationnels liés.
  • Vous êtes à l'aise avec les Stacks Observability standard du marché (ELK, Prometheus )
  • Vous avez l'habitude d'être impliqué directement dans le design des solutions et des choix techniques tactiques.
  • Vous avez une bonne capacité à écouter et à communiquer, à évaluer et résoudre des problèmes, à accomplir plusieurs tâches en même temps et à établir des priorités dans un environnement parfois stressant et critique
  • Vous êtes ouvert aux changements réguliers, force de proposition. Vous avez une âme de facilitateur. Passionné de technologies, vous êtes en veille permanente
  • Ce que vous faites, vous le faites d'abord pour le client, puis pour vous faire plaisir. Pas dans l'autre sens : -)
  • Vous maitrisez l'anglais dans un contexte professionnel
  • Votre parcours ?

  • 3 ans minimum d'expérience en tant qu'ingénieur système / software engineer dans un environnement critique et exigeant.
  • 2 ans en tant que SRE / DevOps au sein d'infrastructures Cloud critiques
  • En tant que membre de notre équipe, votre expertise ne ravira pas seulement nos clients en leur fournissant des services fiables et performants, mais vous contribuerez également à façonner le rôle majeur du SRE dans l'entreprise.

    Step 2
    Postuler
    Ajouter aux favoris
    Retirer des favoris
    Postuler
    Mon email
    En cliquant sur « Continuer », je consens au traitement de mes données et à recevoir des alertes email, tel que détaillé dans la Politique de confidentialité de neuvoo. Je peux retirer mon consentement ou me désinscrire à tout moment.
    Continuer
    Formulaire de candidature