Apprentissage statistique en grande dimension

Code UE : STA217

  • Cours
  • 9 crédits
  • Volume horaire de référence
    (+ ou - 10%) : 70 heures

Responsable(s)

Ndeye NIANG KEITA

Public, conditions d’accès et prérequis

Avoir le niveau des unités d'enseignement : STA201, STA211. Avoir de bonnes connaissances en calcul matriciel, probabilités et inférence statistique. 

Objectifs pédagogiques

Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données de grande dimension
 

Compétences visées

Maîtriser les méthodes d'apprentissage statistique pour l'analyse de données structurées ou non mettant en jeu un grand nombre de variables et/ou d'individus

Contenu

  • Définition et enjeux de l’apprentissage statistique 
  • Présentation des problématiques liées à la grande dimension 
  • Méthodes statistiques pour la grande dimension
    • Méthode non supervisées
      • Analyse factorielle sparse
      • Méthode de classification : Sparse Kmeans, Subspace clustering, Consensus de partitions
      • Méthodes descriptives pour données multiblocs 
      • ACP fonctionnelle 
      • Classification de données fonctionnelles 
    • Méthodes supervisées
      • Méthodes de sélection de variables en grande dimension
      • Méthodes de régularisation  
      • Méthodes de classification supervisée
      • Méthodes supervisées pour données multiblocs
      • Méthodes de régression pour données fonctionnelles 
    • Méthodes Clusterwise pour un grand nombre d’observations hétérogènes
 

Modalité d'évaluation

Un examen écrit  + un projet personnel sanctionneront la fin des cours.
Le projet personnel devra mettre en application les techniques décrites en cours. Il pourra faire l'objet d'un présentation orale

Bibliographie

  • Ramsay J.O. and Silverman B.W. : Functional Data Analysis. Second Edition (Springer Series in Statistics, 2005)
  • Ramsay J.O. and Silverman B.W. : Applied Functional Data Analysis (Springer, 2002)
  • Crainiceanu C.M., Goldsmith J., Leroux A. and Cui E. : Functional Data Analysis with R. (Chapman & Hall, 2024)
  • G.GOVAERT : Analyse des données ( Hermes,2003)
  • J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)
  • G.SAPORTA : Probabilités, analyse des données, statistique 3ème édition (Technip,2011))
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : The Elements of Statistical Learning (Springer 2009). Téléchargeable ici : https://www.sas.upenn.edu/~fdiebold/NoHesitations/BookAdvanced.pdf
  • James, G., Witten, D., Hastie, T., Tibshirani, R., & Taylor, J. : An introduction to statistical learning: With applications in python. (Springer Nature 2023). Téléchargeable ici:https://www.statlearning.com/
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. : An introduction to statistical learning: With applications in R. (Springer Nature 2021). Téléchargeable ici:https://www.statlearning.com/
  • Leskovec, J., Rajaraman, A., & Ullman, J. D. : Mining of massive data sets. (Cambridge university press 2020)
  • K.V. Mardia, J.T. Kent and J.M. Bibby : Multivariate Analysis, (Academic Press, 1979)

Cette UE apparaît dans les diplômes et certificats suivants

Contact

EPN06 Mathématiques et statistiques
2 rue conté Accès 35 3 ème étage porte 19
75003 Paris
Anne - Solenne Maroulle
Voir le site

Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.

UE

    • Paris
      • Centre Cnam Paris
        • 2025-2026 2nd semestre : Formation hybride soir ou samedi
        • 2026-2027 2nd semestre : Formation hybride soir ou samedi
        • 2027-2028 2nd semestre : Formation hybride soir ou samedi
        Comment est organisée cette formation ?
        2025-2026 2nd semestre : Formation hybride soir ou samedi

        Dates importantes

        • Période des séances du 02/02/2026 au 06/06/2026
        • Période d'inscription : du 02/06/2025 à 10:00 au 13/03/2026 à 18:00
        • Date de 1ère session d'examen : la date sera publiée sur le site du centre ou l'ENF
        • Date de 2ème session d'examen : la date sera publiée sur le site du centre ou l'ENF

        Précision sur la modalité pédagogique

        • Une formation hybride est une formation qui combine des enseignements en présentiel selon un planning défini et des enseignements à distance avec ou sans planning défini.