DATA ENGINEER (H/F)
Itnovem
Saint-Denis
il y a 11j

L’ENTREPRISE

Filiale technologique du groupe SNCF, intégrée à la Direction du Digital et des Systèmes d’information, Itnovem. se positionne comme expert de l’Internet Industriel.

Porteuse de grands projets de la révolution digitale, notre société est en constante recherche de profils pour rejoindre la grande aventure de l’Internet des objets, de la data science et de l’accompagnement des projets digitaux.

Qu’il s’agisse de maintenance prédictive, d’aide à la décision sur la maintenance des infrastructures, de gare 4.0, d’usine du futur, ou de sécurisation des assets, nos équipes font valoir à la fois une expérience métier et une expertise technique sans cesse renouvelée, dans le respect des valeurs du groupe : Excellence , Innovation , Collectif , Agile , Engagement.

LE POSTE

Au sein de la division Data Science et Engineering, notre futur data engineer (H / F) interviendra pour les projets de la Direction du Digital SNCF et notamment au sein la Big Data Fab.

Structure transverse qui réunit infrastructures Big Data et expertise Big Data pour l’ensemble du groupe, la Fab s’est constituée en juillet 2015 afin de traiter avec les différentes entités les projets nécessitant des moyens Big Data pour être menés à bien.

Elle se compose de 5 pôles : Pilotage et valorisation projet, Datascience et Developpement, Usine IT, Qualité de Service et Sécurité, Datalake.

Le pôle Data Science & Engineering d’ITNOVEM. recherche un(e) data engineer (H / F) , en soutien du pilotage et du développement de son activité.

Le pôle comprend environ 20 personnes (50% data scientists, 50% data engineers), dont la moitié est expérimentée. Vous travaillerez sur des thématiques très variées liées aux problématiques industrielles, opérationnelles et stratégiques des métiers du groupe SNCF , comme par exemple :

  • La maintenance du matériel roulant et l’optimisation des process ;
  • La maintenance des voies et caténaires ;
  • La surveillance du réseau et des cartographies déclinées sur les problématiques prioritaires ;
  • L’analyse du langage naturel, notamment sur des enquêtes et rapports techniques
  • L’optimisation des plans horaires, la prévision de perturbations ;
  • L’analyse des données IoT.
  • MISSIONS

  • Travailler sur des analyses Data Science / Data Engineering en réponse aux problématiques des métiers du Groupe SNCF portées par les clients internes de la Fab Big Data (POC, prototypes et industrialisation) ;
  • Participer comme expert à la démarche de conseil technique et scientifique du pôle d’expertise auprès des métiers du groupe SNCF ;
  • En étroite collaboration avec les chefs de projet / PO / OPS / architectes, industrialiser les projets ou les services data en développant une chaîne de traitement de données robuste et automatisée : Spécifications techniques ;
  • Release plan des différents livrables ;Ingestion et mise en qualité des données selon les bonnes pratiques de la Fab ;Traitement, agrégation et sauvegarde des données avec Spark-

  • Scala, Spark-Python ou Python ;Intégration continue (versionning, packaging, tests et déploiement) avec Git-SBT-Nexus-Jenkins ;
  • Exposition des APIs sous forme de webservices Rest ;Configuration des briques logicielles ;Monitoring des briques logicielles avec OMS (Azure) ou Nagios ;
  • Participation aux activités d’architecture, conception et développement ;Recette et mise en production.

  • Contribuer proactivement à la veille scientifique et technique, aux projets R&D, et à la construction d’assets et de services techniques orientés data ;
  • Participer à l’animation de la filière Data et à l’implémentation des pratiques Data au sein des métiers (formations, conseil et expertise) ;
  • Participer aux autres activités du pôle Data Science & Engineering (reporting d’activité, communication interne et externe, collaboration avec les universités et laboratoires associés).
  • Compétences techniques

  • Maîtrise théorique et utilisation appliquée : Des langages Scala et / ou Python;Du framework Spark ;De Hive ;De l’intégration continue (sbt / maven, Gitflow, jenkins, nexus) ;
  • D’une ou plusieurs bases de données NoSql (Cassandra, mongoDB).

  • Connaissances théoriques : Des technologies Big Data : Hadoop (Hortonworks, HDF), sécurité et ressources (Yarn, Ranger), monitoring (Ambari) ;
  • D’ Elasticsearch et de Kibana ;Des APIs REST ;Des composants Azure (HDInsight, Azure Databricks, Azure Function, OMS, etc.

    Des cycles de vie des données ;De l’architecture microservice ;De la gouvernance des données, notamment personnelles (Traçabilité, Sécurité (Authentification et Autorisation), Audit).

    Qualités personnelles et compétences fonctionnelles

  • Transversalité et capacité à travailler avec des équipes pluridisciplinaires.
  • Orienté client, qualité et résultat (jusqu’à l’industrialisation des projets).
  • Rigueur, autonomie et organisation.
  • Implication dans la communauté des data engineer (meetups, etc.)
  • Qualité et sérieux dans le développement de code.
  • Bonne communication scientifique et bon sens de la pédagogie.
  • Expériences et formations

    Formation

  • Bac +5 (école d’ingénieur ou / master spécialisé en data engineering)
  • Ou titulaire d’un doctorat en informatique / data engineering
  • Expérience requise

    Vous avez acquis une première expérience sur des projets data (stages, projets étudiants ou personnels ) idéalement sur des cas d’usage industriels.

    De plus, vous savez programmer en suivant les bonnes pratiques et avez une première expérience de travail en équipe.

    Poste basé à La Plaine Saint Denis (RER D, Saint Denis Stade de France) avec des déplacements ponctuels (en moyenne 2-3 fois par mois) à prévoir, généralement en Ile-de-France.

    Postuler
    Postuler
    Mon email
    En cliquant sur « Continuer », je consens au traitement de mes données et à recevoir des alertes email, tel que détaillé dans la Politique de confidentialité de neuvoo. Je peux retirer mon consentement ou me désinscrire à tout moment.
    Continuer
    Formulaire de candidature