Expert en sciences des données (MS)
Présentation
- L’expert en sciences des données réalise la gestion et l’analyse pointue des données massives pour la stratégie et l’opérationnel de l’entreprise.
- Dans ce cadre, il réalise plusieurs activités :
- - dans ce premier grand champ d’activité, il va analyser les données, en procédant à leur analyse dans le cadre de la modélisation des données massives hétérogènes ou non d’une entreprise puis il va élaborer un modèle prédictif de traitement de données afin de modéliser ces données.
- - dans un second grand champ d’activités, il va s’atteler à extraire et collecter des données via une technique d’analyse et de stockage pour chaque donnée ; il va réaliser le traitement et l’exploitation des données collectées et veiller à l’amélioration continue du traitement des données structurées ou non structurées.
- - enfin, il va avoir pour mission d’élaborer une stratégie d’exploitation et de valorisation de la donnée lui permettant d’exploiter les données hétérogènes de la structure, puis d’organiser et planifier des projets de la structure, de façon collaborative et avec les différents services de la structure concernés par la donnée.
Compétences attestées
- Bloc de compétences 1 : Modéliser les données massives d'une structure
- C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte.
- C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter.
- C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes.
- C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser.
- C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle.
- C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre.
- Bloc de compétences 2 : Collecter, structurer et traiter les données d'une structure
- C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données.
- C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles.
- C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter.
- C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives.
- C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données.
- C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre.
- Bloc de compétences 3 : Concevoir une stratégie de valorisation de la donnée
- C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données.
- C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure.
- C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données.
- C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision.
- C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure.
- C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines.
- C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
Blocs de compétences (3)
Modéliser les données massives d'une structure RNCP35197BC01
Compétences
- C1.1. Maitriser les outils d’analyse pour décrire les données en tenant compte du contexte.
- C1.2. Identifier l’outil de modélisation statistique en fonction du type de donnée, structurée ou non structurée, afin de la traiter.
- C1.3. Effectuer l’analyse exploratoire et la description des masses de données au travers d’une méthode statistique pour déterminer les problématiques de description, de projection, de visualisation et de regroupement des données en catégories homogènes.
- C2.1. Sélectionner une méthodologie de traitement statistique au regard du problème posé, du type de donnée pour la modéliser.
- C2.2. Concevoir et réaliser un prototype du modèle à partir de logiciels de programmation haut niveau pour montrer la faisabilité et la pertinence du modèle.
- C2.3. Evaluer la performance du modèle au regard des contraintes de mise en production pour le mettre en œuvre.
Modalités d'évaluation
E1 - Mise en situation professionnelle reconstituée d’analyse de données publiquement disponibles : chaque candidat réalise un support (code, rapport) de son modèle d'analyse exploratoire et de représentation des données E2 - Thèse professionnelle E3 - Projet en groupe E4 : QCM de 10 questions sur les concepts théoriques et pratiques.Exemple de thématiques: -modèle SVM et Bayes - modèle d'apprentissage supervisé vs non supervisé - modèle convolutif et récurrent (IA) - optimisation
Collecter, structurer et traiter les données d'une structure RNCP35197BC02
Compétences
- C1.1. Maitriser et utiliser les outils d’interrogation des bases de données pour extraire et collecter les données.
- C1.2. Concevoir un système d’ingénierie de données en définissant une approche méthodologique de collecte, de stockage et d’interrogation pour l’analyse de masse de données réelles.
- C2.1. Elaborer et mettre en place une stratégie de traitement distribué en ligne ou hors ligne de la donnée structurée et non structurée par un langage de programmation fonctionnel afin de les exploiter.
- C2.2. Développer des implémentations au regard des données à traiter pour cadrer les algorithmes et performances prédictives.
- C3.1. Analyser les retours pour mettre à jour l’exploitation et le stockage des données.
- C3.2. Repérer le type de problème rencontré, d’apprentissage ou de fouille de données, en utilisant des algorithmes d’optimisation pour le résoudre.
Modalités d'évaluation
E2 - Thèse professionnelle E3 - Projet en groupe E5 : Mise en situation professionnelle reconstituée sur le stockage de la donnée:Chaque candidat réalise la conception, la configuration et l'implémentation de systèmes de stockage de la donnée via des outils d'interrogation des bases de données et à partir de données publiquement disponibles. E6 : Mise en situation professionnelle reconstituée portant sur l’architecture de traitement distribuée de données:Chaque candidat conçoit et réalise une architecture de traitement distribuée des données à partir de données publiquement disponibles.
Concevoir une stratégie de valorisation de la donnée RNCP35197BC03
Compétences
- C1.1. Maîtriser les fonctionnalités d’une architecture informatique robuste pour le stockage et le traitement distribué des données.
- C1.2. Traduire un problème business en problème mathématiques/statistiques afin de définir une stratégie de valorisation des données pour exploiter les informations décisionnelles de la structure.
- C1.3. Concevoir une stratégie de valorisation des données en proposant des « entrepôts de données » tenant compte de l’écosystème économique, réglementaire et des contraintes de sécurité liées au traitement des données.
- C.2.1 Formuler et présenter des analyses statistiques décisionnels à viser des différents services de la structure pour les accompagner dans leur prise de décision.
- C.2.2 Communiquer sur le potentiel des outils innovants de représentation, de modélisation et de visualisation pour contribuer à la plus-value et la prise de décisions utiles à la structure.
- C.2.3 Dimensionner les actions du projet en définissant les choix techniques et méthodologiques des interventions pour évaluer et planifier les ressources techniques, budgétaires et humaines.
- C.2.4 Communiquer sur la stratégie de valorisation des données de la structure pour sensibiliser les acteurs, accompagner au changement et améliorer le fonctionnement interne.
Modalités d'évaluation
E2 - Thèse professionnelle E3 - Projet en groupe E7 - Mise en situation professionnelle réelle sur la réglementation, la sécurisation des données:Chaque apprenant(e) traite l'aspect règlementaire sur une problématique de l'entreprise dans laquelle il (elle) réalise son alternance
Voies d'accès
- En contrat d’apprentissage
- Après un parcours de formation continue
- Par candidature individuelle
- En contrat de professionnalisation
- Après un parcours de formation sous statut d’élève ou d’étudiant
- Par expérience
Emplois accessibles
- L’expert en sciences des données (data scientist) détermine et met en œuvre une stratégie de collecte des données massives, complexes et hétérogènes (structurées ou non structurées), afin d’en retirer l’information pour une prise de décision optimale. Il maîtrise les méthodes efficaces de collecte, stockage, mise en forme, visualisation, modélisation et traitement de ces données. Il explore les données de multiples sources dispersées. Suivant les secteurs et les structures, il assure les postes et fonctions suivantes :
- - Data analyst et data scientist : procède à des analyses sur les approches statistiques possibles en relation avec des enjeux métiers. Conçoit et déploie des modèles prédictifs. Maintient, améliore et conçoit des algorithmes d’extraction d’information. Traduit les données en leviers opérationnels, accompagne les développeurs jusqu’au déploiement en production des solutions et assure une veille technologique.
- - Consultant valorisation des données : analyse les besoins clients big data, définit les architectures applicatives et techniques nécessaires au traitement des données, conçoit des modèles de données, participe au développement et à l’implémentation des algorithmes de traitement, à la mise en production, rédige la documentation associée et effectue la veille technologique sur les nouvelles tendances autour de l’exploitation des données.
- - Business analyst/business developer : interface indispensable entre les départements opérationnels de l’entreprise et le service informatique, il analyse le processus d’information et les stratégies au service de la prise de décision quotidienne de sa société afin d’en évaluer l’efficacité ou d’apporter les ajustements nécessaires.
- Autres appellations de fonctions possibles :
- - Ingénieur d’étude et développement de données massives
- - Strategy manager/project manager
- L’expert en sciences des données est un cadre détenant des compétences techniques, scientifiques et transversales faisant de lui un vecteur facilitant la prise de décision en entreprise. Il est à même d’intervenir au plus haut niveau de la stratégie de l’entreprise. Il est l'interlocuteur privilégié du Directeur des Systèmes Informatiques, comme du Directeur Marketing, du Directeur R&D ou Bureaux d’études, comme encore du Président de start up. Son niveau de responsabilité varie en fonction du positionnement de l’entreprise et de sa stratégie de valorisation des données. Il est amené à travailler dans un environnement multi-échelle, à l’interface entre différents services : R&D, informatique, marketing, ressources humaines, direction financière, direction générale, etc.
Secteurs d'activité
- L’expert en sciences des données travaille sur des technologies numériques à haute valeur ajoutée intellectuelle et technique dans des entreprises de toutes tailles : grands groupes, sociétés de prestations (consultants), collectivités territoriales, PME, startups.
- Il peut exercer son activité dans les secteurs suivants : les banques, les compagnies d’assurances, les sociétés de transport, les cabinets de conseil, les entreprises spécialisées dans l’énergie, le web marketing, les plateformes d’e-commerce, l’industrie, la R&D.
Réglementations
La certification tient compte du règlement nᵒ 2016/679, dit règlement général sur la protection des données (RGPD).
Composition des jurys
2 Responsables de la formation et 4 professionnels extérieurs.
2 Responsables de la formation et 4 professionnels extérieurs.
2 Responsables de la formation et 4 professionnels extérieurs.
2 Responsables de la formation et 4 professionnels extérieurs.
2 Responsables de la formation et 4 professionnels extérieurs.
2 Responsables de la formation et 4 professionnels extérieurs.
Métiers visés (codes ROME)
Statistiques de certification
| Année | Certifiés | dont VAE |
|---|---|---|
| 2018 | 16 | — |
| 2017 | 12 | — |
Informations générales
- Code
- RNCP35197
- Type d'enregistrement
- Enregistrement sur demande
- Date de décision
- 19/01/2021
- Date d'effet
- —
- Fin d'enregistrement
- 20/01/2026