Analyse Statistique des Données
Le but de cette étude est de réaliser des Classifications Hiérarchiques sur l’agriculture de l’ensemble des comtés de l’Ohio aux États-Unis.
Contents
2.1. Les données
2.2. Le programme SAS
2.3. Les Résultats
3.1. Proc Means
Programme | Résultats
3.2. Proc Univariate
Programme | Résultats
3.3. Proc Chart
Programme | Résultats
4.1. Proc Pincomp
Programme | Résultats
4.2. %acp
Programme | Résultats
5.1. Proc cluster
5.1.1 Méthode Average
Programme | Résultats
5.1.2 Méthode Complete
Programme | Résultats
5.1.3 Méthode Median
Programme | Résultats
5.1.4 Méthode Single
Programme | Résultats
5.1.5 Méthode Ward
Programme | Résultats
5.1.5 conclusion
6.1. K-Means sans choisir les centres initiaux
Programme | Résultats
6.2. K-Means avec choix des centres initiaux
6.2.1. Seed avec la méthode Average
Programme | Résultats
6.2.2. Seed avec la méthode Complete
Programme | Résultats
6.2.2. Seed avec la méthode Median
Programme | Résultats
6.2.2. Seed avec la méthode Single
Programme | Résultats
6.2.2. Seed avec la méthode Ward
Programme | Résultats
6.3. conclusion
7.1. Seed avec la Méthode Average
Programme | Résultats
7.2. Seed avec la Méthode Complete
Programme | Résultats
7.3. Seed avec la Méthode Median
Programme | Résultats
7.4. Seed avec la Méthode Single
Programme | Résultats
7.5. Seed avec la Méthode Ward
Programme | Résultats
7.6. Conclusion
1. Introduction :
Nous allons commencer par faire des études simples sur les données pour connaître quelques statistiques élémentaires. SAS a des procédures qui nous donnent ces statistiques. Ces procédures sont Proc Mans, Proc Univariate et Proc Chart.
Ensuite, nous allons réaliser une acp, la procédure SAS qui nous permet de faire une acp est Proc Princomp, mais elle ne nous donne pas de représentations graphiques, c'est pourquoi nous allons nous servir d'une macro qui donne des informations supplémentaires et surtout nous permet d'avoir des graphiques.
Puis nous allons faire des classifications hiérarchiques selon différentes distances que nous allons représenter avec des arbres.
Grâce à ces classifications, nous allons appliquer l'algorithme du K-Means. En effet, nous allons nous servir des moyennes des classes trouvées dans les classifications précédentes comme point de départ pour l'algorithme du K-Means, puis nous itérerons cet algorithme plusieurs fois de suite.
Enfin nous proposerons des classifications en fin d'étude.
|