Objet et portée de la mission
Le/la scientifique des données consacrera 50 % de son temps à soutenir la construction du modèle prédictif en étroite collaboration avec le/la chef de projet et son équipe, le/la scientifique des données du HCR, l'équipe DIMA, le/la chargé(e) adjoint(e) de gestion de l'information du projet, l'unité de protection et le groupe de protection au Niger.
En parallèle, le consultant devrait consacrer les 50 % restants de son temps à apporter son soutien aux activités principales du Projet 21, en collaboration avec les équipes régionales du P21 et de DIMA.
Ce double rôle garantit une coordination efficace des composantes d'innovation et de suivi de la protection de base et contribue à l'élaboration de programmes de protection fondés sur des données probantes.
Le consultant travaillera sous la supervision du coordonnateur du projet 21.
Projet d'innovation ;
Le/la data scientist pilotera la conception, le développement et le déploiement du modèle d'analyse prédictive, en veillant à sa robustesse technique, à sa conformité éthique et à sa pertinence opérationnelle. Ses missions incluront la conception de méthodologies statistiques, la mise en œuvre d'algorithmes d'apprentissage automatique, la construction d'indices composites et la mise en place de stratégies d'imputation de données robustes.
Principales responsabilités
Acquisition et intégration des données : Collecter, nettoyer et harmoniser les ensembles de données provenant d’ACLED, du PAM, de WorldPop, d’images satellites, de données internes du HCR, etc. ; garantir la qualité des données et leur conformité aux normes de protection des données du HCR. Appliquer l’agrégation spatiale et temporelle pour harmoniser les différentes granularités, assurer le prétraitement et la normalisation, et mettre en œuvre la validation et l’assurance qualité tout au long du processus de traitement des données.
Développement de modèles :
Concevoir et mettre en œuvre des modèles prédictifs à l’aide de diverses techniques d’apprentissage automatique. Entraîner, valider et optimiser les modèles avec des données historiques et en temps réel, en garantissant la transparence, l’interprétabilité et la conformité aux principes humanitaires. Maintenir des flux de travail reproductibles et documenter toutes les décisions, hypothèses et méthodologies.
Construire des indices composites et des indicateurs de vulnérabilité à l'aide de cadres statistiques établis ; développer et mettre en œuvre des algorithmes d'imputation de données et de remplissage des lacunes pour remédier aux données manquantes dans les zones touchées par les conflits et les zones difficiles d'accès.
Tests pilotes et évaluation : Déployer le modèle dans la région de Tillabéri pour des tests pilotes ; comparer les prédictions avec les données de terrain disponibles et affiner le modèle en fonction des retours d’information. Analyse et visualisation géospatiales : Travailler en étroite collaboration avec les équipes de gestion de l’information, de protection et de DIMA pour cartographier les risques de protection et les besoins humanitaires en développant des visualisations conviviales telles que des cartes dynamiques des risques et des cartes thermiques, ainsi que des tableaux de bord interactifs pour divers publics.
Renforcement des capacités : organiser des sessions de formation pour le personnel du HCR et ses partenaires, élaborer des guides d’utilisation et des procédures opérationnelles standard pour le déploiement et la maintenance du modèle, ainsi que des supports de formation.
Gestion éthique et des risques : Mettre en œuvre des mesures de protection pour prévenir toute utilisation abusive des résultats prédictifs ; garantir la transparence et l’explicabilité du modèle.
Activités courantes du projet 21
- Appliquer des techniques d'analyse de données pour surveiller les risques et les tendances en matière de protection liés aux déplacements forcés et à l'apatridie.
- Identifier les tendances en matière de comportement de la population, les vulnérabilités et les besoins de protection grâce à des analyses avancées.
- Élaborer des modèles prédictifs pour anticiper les risques de protection, les flux de déplacement et les vulnérabilités émergentes.
- Utiliser l'apprentissage automatique pour éclairer les interventions de protection proactives.
- Élaborer des indicateurs et des KPI pour évaluer l'efficacité des stratégies de protection.
- Appliquer des méthodes statistiques pour évaluer l’impact des programmes de protection du HCR.
Automatiser les tâches courantes de traitement et de communication des données de protection.
Suivi et contrôle des progrès
Le data scientist devra : définir les objectifs avec son superviseur au début du contrat ;
produire des rapports d’étape hebdomadaires et mensuels qui feront partie du rapport de fin d’année.
Veuillez fournir les principaux résultats ci-dessous :
- Documentation harmonisée des ensembles de données et des métadonnées
- Modèle prédictif avec indicateurs de performance (précision ≥ 70 %)
- Rapport d'évaluation du projet pilote avec recommandations pour son passage à l'échelle
- Matériel de formation et guides d'utilisation pour les équipes de terrain.