Page d'accueil

Espace Pro      
 Mon CV                      
  CV intéractif              
  CV Classique          
  CV imprimable        
  Téléchargement      
 Mes Projets              
  Statistiques              
  C.A.O.                        
  Programmation       
  Contact                     
Espace Perso  
 Liste DVD                  

Analyse Statistique des Données

Le but de cette étude est de réaliser des Classifications Hiérarchiques sur l’agriculture de l’ensemble des comtés de l’Ohio aux États-Unis.

Contents 

1. Introduction

2. Données

  2.1. Les données
  2.2. Le programme SAS
  2.3. Les Résultats

3. Première étude

  3.1. Proc Means
     Programme | Résultats
  3.2. Proc Univariate
     Programme | Résultats
  3.3. Proc Chart
     Programme | Résultats

4. A.C.P.

  4.1. Proc Pincomp
     Programme | Résultats
  4.2. %acp
     Programme | Résultats

5. Classifications hiérarchiques

  5.1. Proc cluster
    5.1.1 Méthode Average
       Programme | Résultats
    5.1.2 Méthode Complete
       Programme | Résultats
    5.1.3 Méthode Median
       Programme | Résultats
    5.1.4 Méthode Single
       Programme | Résultats
    5.1.5 Méthode Ward
       Programme | Résultats
    5.1.5 conclusion

6. K-Means

  6.1. K-Means sans  choisir les centres initiaux
     Programme | Résultats
  6.2. K-Means avec choix des centres initiaux
    6.2.1. Seed avec la méthode Average
       Programme | Résultats
    6.2.2. Seed avec la méthode Complete
       Programme | Résultats
    6.2.2. Seed avec la méthode Median
       Programme | Résultats
    6.2.2. Seed avec la méthode Single
       Programme | Résultats
    6.2.2. Seed avec la méthode Ward
       Programme | Résultats
  6.3. conclusion

7. Plusieurs K-Means

  7.1. Seed avec la Méthode Average
     Programme | Résultats
  7.2. Seed avec la Méthode Complete
     Programme | Résultats
  7.3. Seed avec la Méthode Median
     Programme | Résultats
  7.4. Seed avec la Méthode Single
     Programme | Résultats
  7.5. Seed avec la Méthode Ward
     Programme | Résultats
  7.6. Conclusion

8. Conclusion

1. Introduction :

Nous allons commencer par faire des études simples sur les données pour connaître quelques statistiques élémentaires. SAS a des procédures qui nous donnent ces statistiques. Ces procédures sont Proc Mans, Proc Univariate et Proc Chart.

Ensuite, nous allons réaliser une acp, la procédure SAS qui nous permet de faire une acp est Proc Princomp, mais elle ne nous donne pas de représentations graphiques, c'est pourquoi nous allons nous servir d'une macro qui donne des informations supplémentaires et surtout nous permet d'avoir des graphiques.

Puis nous allons faire des classifications hiérarchiques selon différentes distances que nous allons représenter avec des arbres.

Grâce à ces classifications, nous allons appliquer l'algorithme du K-Means. En effet, nous allons nous servir des moyennes des classes trouvées dans les classifications précédentes comme point de départ pour  l'algorithme du K-Means, puis nous itérerons cet algorithme plusieurs fois de suite.

Enfin nous proposerons des classifications en fin d'étude.