APPROCHE NEUROMINETIQUE

POUR L’ANALYSE DES DONNEES MULTIDIMENTIONNELLES

S. Eddarouich , A. Sbihi*

Laboratoire Images et Reconnaissance des Formes, LIRF

Université Ibn Tofail, Faculté des Sciences, Département de Physique, B.P :133, 14000 Kénitra, Maroc

* Corresponding author. E-mail: abderrahmane.sbihi@caramail.com

Received : 22 January 2003 ; revised version accepted : 14 November 2003

Abstract 

This paper presents a new technique for pattern classification by mode detection of the underlying probability density function (pdf) estimated from the input patterns. By means of a neural network with learning based on competitive concepts, this technique proposes a network training procedure whose convergence allows to localize local maxima of the pdf, considered as markers of the modes of this function. As the number of these markers, which is that of the output units of the network, is a priori unknown, an alternative for its determination is proposed here, based on the movable centres technique. The so detected modes are then used for the classification process. Comparably to the K-means clustering or to the clustering approaches based on the different competitive learning schemes, the proposed procedure has a fast convergence and needs no a priori information about the data structure.

Keywords : Mode detection; Competitive learning ; Statistical clustering.

Résumé 

Ce papier présente une nouvelle technique de classification automatique par détection des modes de la fonction de densité de probabilité (fdp) sous-jacente à une distribution de données multidimensionnelles. Utilisant un réseau de neurones à apprentissage basé sur des concepts compétitifs, cette technique propose un apprentissage du réseau dont la convergence aboutit à la localisation des maxima locaux de la fdp, considérés comme des marqueurs des modes de cette fonction.

Le nombre de ces marqueurs qui est celui des neurones de la couche de sortie du réseau étant inconnu a priori, une alternative pour sa détermination est ici proposée, inspirée de la technique des centres mobiles par maximum de vraisemblance. Enfin, la classification des observations se fait sur la base des modes détectés. Les avantages de l’approche proposée par rapport à celle des K-means ou aux approches de classification basées sur les différents modèles de l’apprentissage compétitif sont sa rapidité de convergence et le fait qu’elle ne nécessite aucune information a priori sur la structure, la nature ou le nombre des distributions présentes dans l’échantillon des données.

Mots clés : Détection des modes; Apprentissage compétitif ; Classification statistique.

 

© 2015