Examen Analyse des données, Session Principale, 1ère année, ESSAI, Mai 2014 Corrigé

Please download to get full document.

View again

of 3
All materials on our website are shared by users. If you have any questions about copyright issues, please report us to resolve them. We are always happy to assist you.
Categories
Published
Examen Analyse des données, Session Principale, 1ère année, ESSAI, Mai 2014 Corrigé
  E.S.S.A.I Mai 2014 Examen Session Principale Cours Analyse des données Durée : 1h30  D. Malouche,H. Ouaili-Mallek—  Aucun document n’est autorisé pour cet examen. —  Le sujet contient deux pages. —  L’exercice du code R doit être complété et rendu avec la copie. Exercice 1 On considère une matrice  X   =  x  ji  1 ≤ i ≤ n un jeu de données centrées réduites dont la matrice de corré-lation s’écrit sous la forme suivante : S   =  1  a  1 / 2 a  1 01 / 2 0 1  où  a ∈ ] − 1 , 1[ .1. Combien peut-on calculer de composantes principales?Réponse : 32. Calculer les variances des composantes principales.Réponse :  1 ,  1 −   a 2 +  14 ,  1 +   a 2 +  14 3. Calculer le facteur principal associé à la plus grande variance.Réponse :  u  =  1 , a   a 2 +  14 ,  12   a 2 +  14   / √  2 4. Combien peut-on retenir d’axes principaux pour avoir une “bonne” représentation du nuage despoints?Réponse : Une seule composante puisqu’on a obtenu une seule variance supérieure à 15. Pour la suite de l’exercice, on suppose que  a  = 1 / 2 . Quelle est la valeur du cosinus carré entre lapremière et la deuxième variable? (On considère que   1 / 2 ≈ 0 . 707 )Réponse : 1/46. Calculer la corrélation entre la première variable et la première composante principale.Réponse :   1 √  2   1 +   a 2 +  14  2 =  12  (1 +  . 707) =  1 . 72 Exercice 2 Compléter le code  R  suivant > library(FactoMineR)> data(milk)> colnames(milk)[1] "density" "fat" "protein" "casein" "dry" "yield"> dim(milk)[1] 85 6> ### ACP 1> acp1=PCA(milk,scale.unit=T,ncp=3,graph=F)> round(acp1$eig[,1],3)  [1] 4.100 0.796 0.629 0.294 0.144 0.038> round(acp1$eig[,2],2)[1] 68.33 13.26 10.48 4.90 2.39 0.63> round(sum(acp1$ind$coord[,2]),3)[1] 0> sum(acp1$ind$coord[,2]^2)/acp1$eig[2,1][1] 85> round(sum(acp1$ind$coord[,2]*acp1$ind$coord[,1]),3)[1] 0> acp1$var$coordDim.1 Dim.2 Dim.3density 0.7496535 -0.1629700 0.6126850fat 0.7165994 0.6150686 -0.0468600protein 0.8709813 -0.3684986 -0.2732386casein 0.8793697 -0.3971039 -0.1938887dry 0.9092831 0.1337179 0.2385188yield 0.8157867 0.2819148 -0.2869833> acp1$var$cos2Dim.1 Dim.2 Dim.3density 0.5619804 0.02655923 0.37538287fat 0.5135146 0.37830941 0.00219586protein 0.7586084 0.13579121 0.07465934casein 0.7732910 0.15769154 0.03759283dry 0.8267958 0.01788047 0.05689121yield 0.6655080 0.07947598 0.08235939> cor(milk[,2],acp1$ind$coord[,1])[1] 0.7165994> ### ACP2> acp2=princomp(milk,cor=T)> names(acp2)[1] "sdev" "loadings" "center" "scale" "n.obs" "scores" "call"> acp2Call:princomp(x = milk, cor = T)Standard deviations:Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.62.0247711 0.8920246 0.7931466 0.5421949 0.3789565 0.19475426 variables and 85 observations.> cor(acp2$scores[,1],acp1$ind$coord[,1])[1] 1> acp2$loadingsLoadings:Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6density 0.370 -0.183 0.772 -0.136 0.461fat 0.354 0.690 0.572 0.259protein 0.430 -0.413 -0.344 0.202 -0.693casein 0.434 -0.445 -0.244 0.202 0.716dry 0.449 0.150 0.301 -0.824yield 0.403 0.316 -0.362 -0.755 0.188Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6SS loadings 1.000 1.000 1.000 1.000 1.000 1.000Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000> sum(acp2$loadings[,1]^2)  [1] 1>
Similar documents
View more...
We Need Your Support
Thank you for visiting our website and your interest in our free products and services. We are nonprofit website to share and download documents. To the running of this website, we need your help to support us.

Thanks to everyone for your continued support.

No, Thanks