Apprentissage statistique en grande dimension
Code UE : STA217
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Ndeye NIANG KEITA
Public, conditions d’accès et prérequis
Avoir le niveau des unités d'enseignement : STA201, STA211. Avoir de bonnes connaissances en calcul matriciel, probabilités et inférence statistique.
Objectifs pédagogiques
Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données de grande dimension
Compétences visées
Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données structurées ou non mettant en jeu un grand nombre de variables et/ou d'individus
Contenu
- Définition et enjeux de l’apprentissage statistique
- Présentation des problématiques liées à la grande dimension
- Méthodes statistiques pour la grande dimension
- Méthode non supervisées
- Analyse factorielle sparse
- Méthode de classification : Sparse Kmeans, Subspace clustering, Consensus de partitions
- Méthodes descriptives pour données multiblocs
- ACP fonctionnelle
- Classification de données fonctionnelles
- Méthodes supervisées
- Méthodes de sélection de variables en grande dimension
- Méthodes de régularisation
- Méthodes de classification supervisée
- Méthodes supervisées pour données multiblocs
- Méthodes de régression pour données fonctionnelles
- Méthodes Clusterwise pour un grand nombre d’observations hétérogènes
- Méthode non supervisées
Modalité d'évaluation
Un examen écrit + un projet personnel sanctionneront la fin des cours.
Le projet personnel devra mettre en application les techniques décrites en cours. Il pourra faire l'objet d'un présentation orale
Le projet personnel devra mettre en application les techniques décrites en cours. Il pourra faire l'objet d'un présentation orale
Bibliographie
- Ramsay J.O. and Silverman B.W. : Functional Data Analysis. Second Edition (Springer Series in Statistics, 2005)
- Ramsay J.O. and Silverman B.W. : Applied Functional Data Analysis (Springer, 2002)
- Crainiceanu C.M., Goldsmith J., Leroux A. and Cui E. : Functional Data Analysis with R. (Chapman & Hall, 2024)
- G.GOVAERT : Analyse des données ( Hermes,2003)
- J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)
- G.SAPORTA : Probabilités, analyse des données, statistique 3ème édition (Technip,2011))
- T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : https://www.sas.upenn.edu/~fdiebold/NoHesitations/BookAdvanced.pdf
- James, G., Witten, D., Hastie, T., Tibshirani, R., & Taylor, J. : An introduction to statistical learning: With applications in python. (Springer Nature 2023). Téléchargeable ici:https://www.statlearning.com/
- James, G., Witten, D., Hastie, T., & Tibshirani, R. : An introduction to statistical learning: With applications in R. (Springer Nature 2021). Téléchargeable ici:https://www.statlearning.com/
- Leskovec, J., Rajaraman, A., & Ullman, J. D. : Mining of massive data sets. (Cambridge university press 2020)
- K.V. Mardia, J.T. Kent and J.M. Bibby : Multivariate Analysis, (Academic Press, 1979)
Cette UE apparaît dans les diplômes et certificats suivants
Rechercher une formation
RECHERCHE MULTI-CRITERES
Plus de critères de recherche sont proposés:
-
Vous pouvez sélectionner des formations grâce à un mot ou à une expression (chaîne de caractères) présent dans l’intitulé de la formation, sa description ou ses index (discipline ou métier).
Des mots-clés sont suggérés à partir du 3e caractère saisi, mais vous pouvez aussi rechercher librement. - Les différents items sélectionnés sont croisés.
ex: "Comptabilité" et "Diplôme" - Les résultats comprennent des formations du Cnam Liban (UE, diplômes, certificats, stages) et des formations proposées à distance par d'autres centres du Cnam.
- Les codes des formations du Liban se terminent par le suffixe LIB.
- Dans tous les cas, veillez à ne pas insérer d'espace ni de ponctuation supplémentaire.
Plus de critères de recherche sont proposés:
- Type de diplôme
- Niveau d'entrée
- Modalité de l'enseignement
- Programmation semestrielle
Chargement du résultat...

Intitulé de la formation |
Type |
Modalité(s) |
Lieu(x) |
|
---|---|---|---|---|
Intitulé de la formation
Master Science des données
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation | Type | Modalité(s) | Lieu(x) |
Contact
EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Anne - Solenne Maroulle
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Anne - Solenne Maroulle
Voir le site
Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.
UE
-
-
Paris
-
Centre Cnam Paris
- 2025-2026 2nd semestre : Formation hybride soir ou samedi
- 2026-2027 2nd semestre : Formation hybride soir ou samedi
- 2027-2028 2nd semestre : Formation hybride soir ou samedi
Comment est organisée cette formation ?2025-2026 2nd semestre : Formation hybride soir ou samedi
Dates importantes
- Période des séances du 02/02/2026 au 06/06/2026
- Période d'inscription : du 02/06/2025 à 10:00 au 13/03/2026 à 18:00
- Date de 1ère session d'examen : la date sera publiée sur le site du centre ou l'ENF
- Date de 2ème session d'examen : la date sera publiée sur le site du centre ou l'ENF
Précision sur la modalité pédagogique
- Une formation hybride est une formation qui combine des enseignements en présentiel selon un planning défini et des enseignements à distance avec ou sans planning défini.
-
Centre Cnam Paris
-
Paris
Code UE : STA217
- Cours
- 9 crédits
- Volume horaire de référence
(+ ou - 10%) : 70 heures
Responsable(s)
Ndeye NIANG KEITA