Back to list

Data Engineer - Plateforme Big Data de l’AP-HP (2020-86)

On 11 octobre

Offer criteria

  • Paris (75)
  • CDI , CDD
  • Temps Plein
  • Industry: Santé
  • Fields of expertise: Document technique , Java , Big data , Securitisation , Interopérabilité See more , HP , Méthode Agile , Hbase , Oracle , Rédactionnelles , Modélisation , sécurité , Spécifications fonctionnelles , Cluster , Composant , Systèmes d’informations , e santé , Systémique , Programmation , Santé publique , environnement , hopital , Sémantique , Intégration de données , Jenkins , Ap , OpenX , Production ovin , Reporting , Web , Administratif , Analyse des besoins , Données médicales , Entrepôt de données , Risque , Apache , PostgreSQL , Clinique , Base de données , Machinerie , E-services , Python , Brique , Hive , R , Formats , qualité , Windows , Réseau , Santé du travail , Dossier médical , distribution , Statistique , analyse de données , Securities , Chargement , F# Data , LAB , Signalisation , Hospitalisation à domicile , Epidémiologie , Pilotage , Informatique et libertés , Fonctionnel , Centre hospitalier , architecture , Cycle en V , Urgence , ETCS , Réglementaire , Santé , Informatique , DEVOPS , paramédical , APIs , Droit , Direction des systèmes d'information , Architecture technique , Développement de logiciel , Java se , Données informatiques , Transfert de compétences , Evaluation de projets , Optimisation de la performance , Communication , Scala , Health , Sécurité informatique , secrétariat , Veille , Typologie , Programmers , Zookeeper , Structuration , Condition opérationnel , Logiciel Saas , SQL , Médical , Maintenance , Plannification , HL7 , Génétique , Programmation informatique , Cognos , e-distribution , Imagerie , Documentation , Hospitalisation , Cahier des charges , Bash , Partenariats , planification , Back-end , Base de données oracle , Conduite de projet , Règlement , Production , Lucene , Documentation technique , MySQL , HortonWorks , Entrepôt , Assistance , Structure , Hdfs , Signalr , Service public , Bâti , à domicile , Méthode de mézières , Kubernetes , Médecine , Applications web , Api , Optimisation , Processus , Modélisation merise , Processus métiers Show less

Company: Fédération Hospitalière de France

Créée en 1924, la Fédération Hospitalière de France (FHF) réunit plus de 1000 établissements publics de santé (hôpitaux) et autant de structures médico-sociales (maisons de retraite et maisons d'accueil spécialisées autonomes), soit la quasi-totalité des établissements du secteur public.

Job description

Descriptif

L'Assistance Publique - Hôpitaux de Paris (AP-HP) est un centre hospitalier universitaire à dimension européenne mondialement reconnu. Ses 39 hôpitaux assurent un service public de santé pour tous, 24h/24, et accueillent chaque année 8 millions de personnes : en consultation, en urgence, lors d'hospitalisations programmées ou en hospitalisation à domicile.
L'AP-HP est le premier employeur d'Île-de-France : 100 000 personnes - médecins, chercheurs, paramédicaux, personnels administratifs et ouvriers - y travaillent.

PRÉSENTATION DE LA STRUCTURE :
La Direction des Systèmes d'Information (DSI) a pour mission d'assister le Directeur Général de !'Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique système d'information de l'AP-HP. Elle est rattachée au secrétariat général de l'AP-HP.

Le domaine Données s'occupe actuellement de la mise en place de la Plateforme « Mégadonnées » ou Big Data de l'AP-HP brique principale de l'Entrepôt de Données de Santé. Les environnements techniques sur lesquels le cluster est bâti sont : un cluster Hadoop (distribution Hortonworks avec les briques Hive, Spark2, Solr, Phoenix, Hbase, HDFS, Zookeper, Ambari…), un entrepôt de données s'appuyant sur une base de données structurée PostGreSQL, des outils d'explotation de données Jupyter Lab, l'outil I2B2, Cognos…

L'AP-HP souhaite désormais industrialiser et accélérer la mise en place de l'entrepôt de données de santé et créer ainsi un nouveau domaine « Plateforme Big Data » qui aura pour objectifs :
• De finaliser l'architecture de la plateforme dans son ensemble afin de répondre aux besoins métiers, et réglementaires et l'administrer ;
• D'accélérer et consolider les processus d'intégration des données ;
• De développer les outils nécessaires à la mise à disposition de ces données à la communauté de recherche (outils d'analyse, application web permettant la constitution de cohortes de patients et leur visualisation) ;
• De développer les interfaces nécessaires à l'alimentation de l'ensemble des systèmes d'information nécessitant un accès à ces données ;
• De créer les interfaces avec d'autres Systèmes tels que le Health Data Hub ou des réseaux de CH(U) à l'échelle régionale, nationale ou Européenne.

Il s'agit ainsi d'un nouveau domaine à créer et structurer afin de répondre aux objectifs ambitieux que se donne l'AP-HP pour développer l'usage de ses données, et notamment permettre l'émergence et le développement de l'intelligence artificielle dans le domaine médical. Le domaine Plateforme Big Data sera structuré en trois équipes : Une équipe Recherche et Développements, une équipe Administration et Architecture, et une équipe Intégration de Données.

COMPOSITION DE L'EQUIPE :

L'équipe Plateforme Big Data sera composée, d'environ 12 professionnels techniques. Les effectifs seront amenés à s'agrandir suite aux récents partenariats engagés avec le Health Data Hub, certains industriels…

L'équipe Recherche et Développements, sera composée outre son responsable de 5-6 professionnels techniques.

LES MISSIONS :
Mission générale :
Au sein de l'équipe en charge de la Plateforme Big Data de l'APHP, vous aurez pour missions de proposer et de développer des outils ou composants répondant aux attentes des médecins et chercheurs pour l'exploitation des données collectées dans le cadre de leurs projets de recherche. Ces développements s'inscrivent dans un contexte de standardisation des données selon le modèle de données commun OMOP et d'interopérabilité sur la base du standard d'échange HL7-FHIR.

Il s'agira de contribuer à la création d'outils d'intégration, de visualisation, d'exploration et d'enrichissement de données médicales pour la recherche, souvent en lien direct avec des personnels médicaux. Outre l'intégration technique des données cliniques, les développements relèvent globalement de la pseudonymisation des données pour assurer la confidentialité des dossiers médicaux, de la standardisation des modèles de données, de la mise en place de moteurs de recherche performant incluant des notions sémantiques et de l'analyse qualitative et statistique des données collectées. Selon la typologie des données (données structurés, imagerie, voix, signaux physiologiques, etc.) des outils plus spécifiques sont également mise en œuvre.

Vous intervenez dans le cadre de groupes de travail pluridisciplinaires visant la définition de nouvelles fonctionnalités et vous réaliserez le test et la validation des nouvelles fonctionnalités implémentées avant leur mise en production. Par ailleurs, vous participez à l'assistance à la mise en œuvre et à la maintenance en condition opérationnelle des outils développés.

Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique.

Missions principales :
- Réaliser une analyse des besoins exprimés par les médecins et chercheurs de l'AP-HP dans le cadre des projets de recherche ;
- Rédiger des cahiers des charges, spécifications fonctionnelles et techniques ainsi que des dossiers d'architecture technique ;
- Concevoir et développer des outils adaptés au contexte du cluster big data ;
- Développer des web-services ;
- Rédiger la documentation technique ainsi que la documentation utilisateur ;
- Dans le cadre des développements réalisés en Open Source, participer à l'animation de la communauté autour des projets créés par la résolution de bugs, la gestion des suggestions de modification du code (Pull/Request) ou encore la gestion des propositions d'améliorations ;
- Intervenir sur la conception d'outils pour l'annotation de données médicales d'imagerie, textuelles, physiologiques et autres, et ce, afin de permettre aux chercheurs d'entrainer des modèles de Machine Learning/Deep Learning en lien avec l'émergence de l'Intelligence Artificielle à l'AP-HP ;
- Optimisation de la performance des outils dans un contexte big data ;
- Assurer la sécurisation des applications ou outils développés ;
- Réaliser une veille technique dans son domaine d'activité et un transfert de compétence au sein de l'équipe.

LE PROFIL :
Savoir faire requis
Requis :
• Expertise en Programmation Informatique (Windows & UNIX)
• Expertise des langages Java et/ou Scala
• Bonne maitrise des langages Python/R et de bash
• Maitrise des architectures et de l'écosystème Big Data (Hadoop, Hive, HBase, Spark…)
• Bonnes connaissance des bases de données Oracle, Postgresql ou MySQL et langages associés (sql)
• Bonnes connaissances des technologies Back-End et des API Rest/GraphQL
• Connaissance approfondie en méthodes de développement logiciel (dont cycle en V, méthodes agile), méthodes d'analyse et de modélisation (Merise, UML …)
• Connaissance des méthodologies devops et des outils associés (Docker, Kubernetes, Jenkins…)
• Connaissances en méthode de conduite de projet (planification, reporting, analyse de risques, ...)

Apprécié :
• Connaissance du modèle de donnée OMOP et du standard d'interopérabilité HL7-FHIR
• Connaissance du moteur de recherche Apache Lucene et de sa mise en oeuvre
• Connaissances en administration d'environnements Linux
• Connaissance en statistiques
• Connaissances des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé
• Connaissances en droit des données informatiques
• Connaissance des bonnes pratiques de sécurité informatique ;
• Connaissance de la réglementation informatique et libertés.

Connaissances associées
Apprécié :
• Environnement des systèmes d'information hospitaliers
• Enjeux liés à la recherche, à l'analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie…)

Qualités requises
• Recueillir, analyser, formaliser et valider les besoins des utilisateurs ;
• Concevoir des modèles de données, appréhender les formats de données et les procédures d'échange ;
• Autonomie, rigueur, méthode ;
• Curiosité et capacité d'adaptation et d'anticipation
• Esprit d'analyse et de synthèse, bonne aptitude rédactionnelle
• Excellentes aptitudes relationnelles et à la communication, capacité d'écoute et de vulgarisation, capacité de formation
• Esprit d'équipe et fort sens du relationnel
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé.

Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence ;
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine…

Salary and benefits

Salary: Salaire selon profil


Reference: 210042


Create your profile Meteojob to apply for this job

I accept the terms and conditions so that I can create my account, enjoy matching services and apply for jobs. :