Modèles de régression pour données fonctionnelles hétérogènes : application à la modélisation de données de spectrométrie dans le moyen infrarouge - l'unam - université nantes angers le mans Accéder directement au contenu
Thèse Année : 2019

Regression models for heterogeneous functional data : application to the modelization of mid-infrared spectrometric data

Modèles de régression pour données fonctionnelles hétérogènes : application à la modélisation de données de spectrométrie dans le moyen infrarouge

Résumé

In many application fields, data corresponds to curves. This work focuses on the analysis of spectrometric curves, composed of hundreds of ordered variables that corresponds to the absorbance values measured for each wavenumber. In this context, an automatic statistical procedure is developped, that aims at building a prediction model taking into account the heterogeneity of the observed data. More precisely, a diagnosis tool is built in order to predict a metabolic disease from spectrometric curves measured on a population composed of patients with differents profile. The procedure allows to select portions of curves relevant for the prediction and to build a partition of the data and a sparse predictive model simultaneously, using a mixture of penalized regressions suitable for functional data. In order to study the complexity of the data and of the application case, a method to better understand and display the interactions between variables is built. This method is based on the study of the covariance matrix structure, and aims to highlight the dependencies between blocks of variables. A medical example is used to present the method and results, and allows the use of specific visualization tools.
Dans de nombreux domaines d’application, les données récoltées correspondent à des courbes. Ce travail se concentre sur l’analyse de courbes de spectrométrie, constituées de plusieurs centaines de variables ordonnées, correspondant chacune à une valeur d’absorbance associée aux nombres d’ondes mesurés. Dans ce contexte, une méthode de traitement statistique automatique est développée, avec pour objectif la construction d’un modèle de prédiction prenant en compte l’hétérogénéité des données observées. Plus particulièrement, un modèle de diagnostic d’une maladie métabolique est établi à partir de courbes mesurées sur des individus provenant d’une population constituée de profils de patients différents. La procédure développée permet de sélectionner l’information pertinente sous forme de portions de courbes discriminantes, puis de construire de façon simultanée une partition des données et un modèle de prédiction parcimonieux grâce à un mélange de régressions pénalisées adapté aux données fonctionnelles. Ces données étant complexes, tout comme le cas d’application étudié, une méthode permettant une meilleure compréhension et une meilleure visualisation des interactions entre les portions de courbes a par ailleurs été développée. Cette méthode se base sur l’étude de la structure des matrices de covariance, avec pour but de faire ressortir des blocs de dépendances entre intervalles de variables. Un cas d’application médicale est utilisé pour présenter la méthode et les résultats, et permet l’utilisation d’outils de visualisation spécifiques.
Fichier principal
Vignette du fichier
MORVAN_Marie.pdf (2.27 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-02888695 , version 1 (03-07-2020)

Identifiants

  • HAL Id : tel-02888695 , version 1

Citer

Marie Morvan. Modèles de régression pour données fonctionnelles hétérogènes : application à la modélisation de données de spectrométrie dans le moyen infrarouge. Statistiques [math.ST]. Université de Rennes, 2019. Français. ⟨NNT : 2019REN1S097⟩. ⟨tel-02888695⟩
145 Consultations
237 Téléchargements

Partager

Gmail Facebook X LinkedIn More