Répertoire des certifications
Inactif Niveau 7 RNCP34545

Data scientist

Cette certification est inactive. Elle a été remplacée par RNCP37431.
29 certifiés en 2019

Présentation

  • Le Data scientist est en mesure d’exercer les missions suivantes :
  • - agréger un ensemble de données pour ensuite les nettoyer et les structurer ;
  • - explorer ces données afin d’en déterminer la valeur et y repérer des motifs récurrents ou des irrégularités significatives ;
  • - produire de la valeur à partir des données par la création de modèles prédictifs ;
  • - modéliser le phénomène à l’origine des données pour répondre à un problème de l’entreprise ;
  • - évaluer et améliorer les performances d’un modèle d’apprentissage automatique (machine learning) ;
  • - rendre les données visuelles pour communiquer ses résultats ;
  • - établir des recommandations pour orienter les décisions stratégiques de l’entreprise.

Compétences attestées

  • La certification permet d'attester l'acquisition des compétences suivantes :
  • BLOC 1 – Prétraiter et analyser des données structurées pour répondre à un problème métier.
  • - Déterminer les objectifs d'une analyse de données à partir d’un problème métier.
  • - Effectuer des opérations de nettoyage sur des données structurées.
  • - Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.
  • - Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.
  • - Représenter des données grâce à des graphiques clairs et pertinents.
  • - Formuler des préconisations pour un traitement automatisé des données.
  • BLOC 2 – Entraîner un modèle d’apprentissage automatique supervisé pour réaliser une analyse prédictive.
  • - Sélectionner et/ ou transformer les variables pertinentes pour la modélisation (feature engineering).
  • - Sélectionner et mettre en place un modèle d’apprentissage supervisé adapté à une problématique métier.
  • - Évaluer les performances d’un modèle d’apprentissage supervisé.
  • - Adapter les paramètres d’un modèle d’apprentissage supervisé afin de l’améliorer.
  • BLOC 3 – Entraîner un modèle d’apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données.
  • - Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).
  • - Sélectionner et mettre en place un modèle d’apprentissage non supervisé adapté une problématique métier.
  • - Évaluer les performances d’un modèle d’apprentissage non supervisé.
  • - Adapter les paramètres d’un modèle d’apprentissage non supervisé afin de l’améliorer.
  • BLOC 4 – Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable.
  • - Collecter des données répondant à des critères définis via une interface de programmation (API).
  • - Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.
  • - Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.
  • - Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul.
  • - Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire.
  • BLOC 5 – Présenter et déployer un modèle d’apprentissage automatique auprès de ses utilisateurs finaux.
  • - Déployer un modèle via une interface de programmation (API) dans le web.
  • - Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.
  • - Réaliser la présentation orale d’une démarche de modélisation à un client interne/ externe.
  • - Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.
  • - Assurer l’intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.
  • BLOC 6 – Déployer un modèle d’apprentissage automatique à l’échelle en utilisant les technologies du Big data.
  • - Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data.
  • - Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.
  • - Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.

Blocs de compétences (6)

Prétraiter et analyser des données structurées pour répondre à un problème métier. RNCP34545BC01

Compétences

  • - Déterminer les objectifs d'une analyse de données à partir d’un problème métier.
  • - Effectuer des opérations de nettoyage sur des données structurées.
  • - Effectuer une analyse statistique univariée à partir de données structurées et nettoyées.
  • - Effectuer une analyse statistique multivariée à partir de données structurées et nettoyées.
  • - Représenter des données grâce à des graphiques clairs et pertinents.
  • - Formuler des préconisations pour un traitement automatisé des données.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Entraîner un modèle d’apprentissage automatique supervisé pour réaliser une analyse prédictive. RNCP34545BC02

Compétences

  • - Sélectionner et mettre en place un modèle d’apprentissage supervisé adapté à une problématique métier.
  • - Évaluer les performances d’un modèle d’apprentissage supervisé.
  • - Adapter les paramètres d’un modèle d’apprentissage supervisé afin de l’améliorer.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Entraîner un modèle d’apprentissage non supervisé adapté à une problématique de segmentation ou de réduction de données. RNCP34545BC03

Compétences

  • - Sélectionner, transformer et créer les variables pertinentes pour la modélisation (feature engineering).
  • - Sélectionner et mettre en place un modèle d’apprentissage non supervisé adapté une problématique métier.
  • - Évaluer les performances d’un modèle d’apprentissage non supervisé.
  • - Adapter les paramètres d’un modèle d’apprentissage non supervisé afin de l’améliorer.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Prétraiter et analyser des données non structurées (texte, images) pour obtenir un jeu de données exploitable. RNCP34545BC04

Compétences

  • - Collecter des données répondant à des critères définis via une interface de programmation (API).
  • - Prétraiter des données textuelles non structurées pour obtenir un jeu de données exploitable.
  • - Prétraiter des données sous forme d'images non structurées pour obtenir un jeu de données exploitable.
  • - Réduire la dimension de données de grande dimension afin d'optimiser les temps de calcul.
  • - Représenter graphiquement des données à grandes dimensions afin d'en réaliser l'analyse exploratoire.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Présenter et déployer un modèle d’apprentissage automatique auprès de ses utilisateurs. RNCP34545BC05

Compétences

  • - Déployer un modèle via une interface de programmation (API) dans le web.
  • - Réaliser un tableau de bord (dashboard) pour présenter son travail de modélisation.
  • - Réaliser la présentation orale d’une démarche de modélisation à un client interne/ externe.
  • - Rédiger une note méthodologique afin de communiquer sa démarche de modélisation.
  • - Assurer l’intégration du modèle auprès de collaborateurs en utilisant un logiciel de version de code.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Déployer un modèle d’apprentissage automatique à l’échelle en utilisant les technologies du Big data. RNCP34545BC06

Compétences

  • - Sélectionner les outils du Cloud permettant de disposer d'un environnement Big Data.
  • - Prétraiter, analyser et modéliser des donnés dans un environnement Big data en utilisant les outils du Cloud.
  • - Réaliser des calculs distribués sur des données massives en utilisant les outils adaptés.

Modalités d'évaluation

Chaque bloc de compétences est évalué sous la forme de projet, accompagné et validé par un mentor, puis présenté au jury du titre.

Voies d'accès

  • Par expérience
  • En contrat de professionnalisation
  • Après un parcours de formation continue
  • Après un parcours de formation sous statut d’élève ou d’étudiant
  • En contrat d’apprentissage

Emplois accessibles

Data scientist ; Chef de projet Data ; Consultant Data ; Chief Data scientist ; Ingénieur data ; Ingénieur Big data

Secteurs d'activité

Tous secteurs d'activité

Composition des jurys

Formation initiale

3 personnes : - Le/la responsable pédagogique - 2 professionnels

Contrat d'apprentissage

3 personnes : - Le/la responsable pédagogique - 2 professionnels

Formation continue

3 personnes : - Le/la responsable pédagogique - 2 professionnels

Contrat de professionnalisation

3 personnes : - Le/la responsable pédagogique - 2 professionnels

VAE

3 personnes : - Le/la responsable pédagogique - 2 professionnels

Métiers visés (codes ROME)

Statistiques de certification

AnnéeCertifiésdont VAE
2019 29
2018 19

Informations générales

Code
RNCP34545
Type d'enregistrement
Enregistrement sur demande
Date de décision
31/03/2020
Date d'effet
Fin d'enregistrement
30/03/2023