analyse en composante principaleFermé

Question

Bonjour,
 je suis entrain de travailler sur mon mémoire de fin d'étude en finance . j'utilise l'analyse en  composante principale sur e views mais j'ai pas compris la méthode et comment faire pour introduire les variables ,je travaille sur quatre variables avec 48 observations mensuelles pour chacune des variables,est ce que quelqu'un peut m'aider svp je suis assez stréssée.merci d'avance.

quendistu · Accepted Answer

Les eigen values (valeurs propres) et la eigen vectors matrix (matrice des vecteurs propres) sont des données de sortie et non d'entrée de la méthode. Autrement dit ce sont les résultats. Seuls sont à saisir ou à injecter les variables. Le logiciel vous demande peut-être un paramétrge : affichage des n premiers vecteurs propres (n ne pouvant être qu'inférieur ou égal à 4, puisque vous n'avez que 4 variables).

Plus généralement le but de l'analyse de données en composantes principales normées est de visualiser sous le meilleur prisme possible les relations supposées linéaires entre les différentes variables (vos 4 variables) d'un phénomème observé, données recueillies sur un certain nombre d'échantillons, expériences, individus, occurences,.. etc. du phénomène

Ce prisme est l'angle d'observation optimal pour relater le phénomène observé. Il s'agit en fait ici d'un hyper angle, compte tenu de notre capacité à considérer un angle en trois dimensions seulement alors que l'espace du phénomène observé est de dimension N, N étant le nombre de variables.

Par exemple si je prends un groupe de 100 décès,  avec 5 variables : 
Taille
Poids
Fumeur ou non
décès par Cancer du poumon
boit de l'Alcool ou pas

La méthode consiste concrètement à :

- déterminer la corrélation entre les variables 2 à 2 : on se doûte qu'on va trouver : une corrélation élevée entre F et C et entre T et P ; on obtient une matrice de corrélation de 5 x 5.

- déterminer les vecteurs propres (le prisme d'observation) par diagonalisation de la matrice de corrélation : ces vecteurs représentent les groupes de variables étant fortement corrélées : 1 premier vecteur propre va être taille poids ; un second fumeur et décès par cancer du poumon ;  la méthode permet de voir que T et P sont a peu près la même information ; idem F et C ; que A est indépendant des deux autres axes ;

- visualiser les variables de chaque échantillon en les passant ai travers de la matrice des vecteurs propres :
autrement dit pour représenter ces 100 personnes on pourra les disposer autour de trois axes au lieu de cinq, les 2 axes restant étant de la poussière (en terme d'information) par rapport au 3 axes principaux.

Bien sûr j'ai pris un exemple simplissime et j'ai imaginé et caricaturé les résultats  pour faciliter la compréhension.

Cordialement,

quendistu · Answer

J'ai utilisé cette méthode pour identifier les paramètres influents d'un processus industriel dans le but d'améliorer l'aspect de pièces visibles pour un constructeur automobile.

C'était il y a une vingtaine d'années dans le cadre d'un stage en entreprise dans ma formation d'ingénieur.

J'ai fait un programme en turbo-pascal, fait les expériences, reporté les résultats, identifié les paramètres significatifs influents, puis modifié ces paramètres sur la machine de production.

Si je peux vous aider ...

pearson · Answer

Sur ce site (http://123soft.franceserv.com/) tu trouveras une explication détaillée de l'ACP dans l'onglet Logiciels.

L'auteur du site propose même un logiciel gratuit faisant l'ACP. Il suffit de le contacter. Bon courage

pearson · Answer

l'adresse exacte c'est :  http://123soft.franceserv.com/analyse-en-composante-principale.html

Anonym · Answer

Bonjour, 

Je travaille en ce moment sur statistica pour des exos en cours et j'ai un peu de mal. Je voudrais donc vous poser la question, avec beaucoup d'espoir ! 

1. tableau de 20 observations et 5 variables 

Une des observations influe beaucoup trop sur le reste (contribution absolue largement trop élevée), je la supprime donc de l'analyse en faisant un clic droit "exclude". 

Ensuite, je souhaite la réincorporer au graphique comme observation supplémentaire mais n'entrant pas dans le calcul. C'est là que je ne comprend pas pourquoi dès que j'ajoute cette observation supplémentaire tous les autres points sont déplacés. 

Pour rajouter un individu supplémentaire j'ai ajouté une variable "actif" puis spécifié sa valeur à 1 sauf mon observation supplémentaire. J'ai ensuite sélection la variable active et entré le code des individus actifs à "1".

tbastien · Answer

Bonjour,

Est ce que tu utilises l'ACP à la française de STATISTICA ?
Est ce que tu es certains que lors de l'analyse initiale, l'observation avait été exclue ?
N'hésite pas à utiliser l'aide en ligne de STATISTICA ou à te rendre sur le site web www.statsoft.fr pour plus d'infos.
Thomas

Analyse en composante principale

6 réponses

Discussions similaires

Newsletters