|
Retour accueil projet SAS
3. Première étude
3.1 Proc Means
Programme | Résultats
3.2 Proc Univariate
Programme | Résultats
3.3. Proc Chart
Programme | Résultats
3. Première étude
3.1. Proc Means
Proc Means nous donne pour les variables v1 à v7 le nombre d’observations, les
moyennes, l’écart type et les valeurs extrêmes.
Le Programme SAS est le suivant : Proc Means.sas
PROC MEANS
DATA = Proj ;
OUTPUT OUT=Means ;
RUN;
Lorsque l'on exécute le programme, on obtient : Résultats
Pour les variables v2 et v5 on constate que l’on en cultive très peu dans les
différents comtés, leurs valeurs minimales et maximales sont proches ainsi leur
écart type est faible.
Pour les variables v3, v4, v6 et v7 on constate un grand écart type comparé à la
moyenne et des valeurs extrêmes très éloignées, ce doit donc être des cultures
spécifiques à certains comtés.
Pour v1 (blé Brit ou maïs en US) il y a une forte moyenne, l’écart type n’est
pas trop élevé comparé à sa moyenne, on doit donc fortement le cultiver dans
tous les comtés, même si ces valeurs extrêmes sont relativement éloignées, il
doit y avoir quelques comtés qui le cultivent peu.
3.2. Proc Univariate :
Proc Univariate nous donne de nombreuses informations supplémentaires comparée à
Proc Means, nous allons ici juste regarder la valeur médiane qui nous intéresse
pour une meilleure compréhension des moyennes et des écart-types.
Le programme SAS est le suivant : Proc Univariate.sas
PROC UNIVARIATE
DATA = Proj ;
HISTOGRAM v1-v7 / NORMAL CAXIS=RED CBARLINE=BLEU CFILL=ORANGE CFRAME=YELLOW ;
RUN;
Lorsque l'on exécute le programmme, on obtient : Résultats
On obtient aussi des graphiques : Graph
On constate que pour v1 à v5 les valeurs médianes et les moyennes sont très
proches, elles sont donc bien réparties par rapport à la valeur médiane.
Ce n’est pas le cas pour v6 et v7.
La procédure Univariate dispose d’un grand nombre d’instructions, elle permet
notamment de tracer des histogrammes et de pouvoir les comparer à des lois
connus.
Ici, on trace donc les histogrammes que l'on superpose à une fonction normale
prenant comme moyenne et variance celles de l’échantillon.
Pour v1, v2, v3 et v5, l’histogramme est distribué de la même façon que la loi
normale qui lui correspond.
Pour v4 qui a une valeur médiane proche de sa moyenne, on constate que son
histogramme ne suit pas la loi normale (cf. graph.), Mais les valeurs réparties
à gauche et à droite de la moyenne sont à peu près les mêmes, c’est pourquoi les
moyennes et la médiane sont proches alors que l’écart type est relativement
important.
En ce qui concerne v6 et v7, sur l’histogramme, les valeurs qui sont à gauche de
la moyenne sont disproportionnées par rapport à celles de droite, c'est pourquoi
leur moyenne et médiane sont assez éloignées.
3.3. Proc Chart :
Proc Chart permet de tracer quelques graphiques simples (histogramme et
diagramme), les données que l’on obtient ne nous apprennent rien de nouveau,
mais nous permettent quand même d’avoir une meilleure représentation des
données.
Le programme SAS est le suivant : Proc Chart.sas
PROC CHART
DATA = Proj ;
BLOCK v1-v7 ;
VBAR v1-v7 ;
PIE v1-v7 ;
STAR v1-v7 ;
HBAR v1-v7 ;
RUN;
Lorsqu'on exécute le programme, on obtient : Résultats
|
|