Les eigen values (valeurs propres) et la eigen vectors matrix (matrice des vecteurs propres) sont des données de sortie et non d'entrée de la méthode. Autrement dit ce sont les résultats. Seuls sont à saisir ou à injecter les variables. Le logiciel vous demande peut-être un paramétrge : affichage des n premiers vecteurs propres (n ne pouvant être qu'inférieur ou égal à 4, puisque vous n'avez que 4 variables).
Plus généralement le but de l'analyse de données en composantes principales normées est de visualiser sous le meilleur prisme possible les relations supposées linéaires entre les différentes variables (vos 4 variables) d'un phénomème observé, données recueillies sur un certain nombre d'échantillons, expériences, individus, occurences,.. etc. du phénomène
Ce prisme est l'angle d'observation optimal pour relater le phénomène observé. Il s'agit en fait ici d'un hyper angle, compte tenu de notre capacité à considérer un angle en trois dimensions seulement alors que l'espace du phénomène observé est de dimension N, N étant le nombre de variables.
Par exemple si je prends un groupe de 100 décès, avec 5 variables :
Taille
Poids
Fumeur ou non
décès par Cancer du poumon
boit de l'Alcool ou pas
La méthode consiste concrètement à :
- déterminer la corrélation entre les variables 2 à 2 : on se doûte qu'on va trouver : une corrélation élevée entre F et C et entre T et P ; on obtient une matrice de corrélation de 5 x 5.
- déterminer les vecteurs propres (le prisme d'observation) par diagonalisation de la matrice de corrélation : ces vecteurs représentent les groupes de variables étant fortement corrélées : 1 premier vecteur propre va être taille poids ; un second fumeur et décès par cancer du poumon ; la méthode permet de voir que T et P sont a peu près la même information ; idem F et C ; que A est indépendant des deux autres axes ;
- visualiser les variables de chaque échantillon en les passant ai travers de la matrice des vecteurs propres :
autrement dit pour représenter ces 100 personnes on pourra les disposer autour de trois axes au lieu de cinq, les 2 axes restant étant de la poussière (en terme d'information) par rapport au 3 axes principaux.
Bien sûr j'ai pris un exemple simplissime et j'ai imaginé et caricaturé les résultats pour faciliter la compréhension.
Cordialement,
Merci de signaler le problème comme résolu si tel est le cas