projet de sondage(2éme année essai)

32
1 ESSAIT ECOLE SUPERIEURE DE LA STATISTIQUE ET D’ANALYSE D’INFORMATION Enquête Premier salaire d’ingénieur tunisien Elaboré par: ALOUI RYM AOUINI YOSRA WAHADA NIHEL Encadré par : Mme Ouaili Mallek Hela

Upload: essai

Post on 24-Jan-2023

1 views

Category:

Documents


0 download

TRANSCRIPT

1 ESSAIT

ECOLE SUPERIEURE DE LA STATISTIQUE ET D’ANALYSE D’INFORMATION

Enquête Premier salaire d’ingénieur

tunisien

Elaboré par: ALOUI RYM AOUINI YOSRA WAHADA NIHEL

Encadré par : Mme Ouaili Mallek Hela

2 ESSAIT

Remerciement

Nous remercions toutes les personnes qui nous ont aidés pour l’élaboration de ce rapport. Plus particulièrement Mme Ouaili Mallek Hela pour tous ses efforts et son engagement permanant afin

d’accomplir ce travail dans les meilleurs conditions.

3 ESSAIT

Table de matière

Introduction----------------------------------------------------------------------------------4 a) exemplaire de questionnaire-----------------------------------------------------------------5 b) Résumée de l’enquête-----------------------------------------------------------------------6 c) Traitement des données---------------------------------------------------------------------7 Sondage aléatoire simple------------------------------------------------------------------7 Probabilité inégales-----------------------------------------------------------------------9 Stratification---------------------------------------------------------------------------11 Sondage par grappe à plusieurs degrés-----------------------------------------------------15 d) Synthèse---------------------------------------------------------------------------------17 e) code R------------------------------------------------------------------------------------20

Table d’illustration

Figure 1: probabilité égales sans remise ........................................................................................................................... 8

Figure 2: probabilité égale avec remise ............................................................................................................................ 9

Figure 3:probabilité inégales sans remise ....................................................................................................................... 10

Figure 4: probabilités inégales avec remise .................................................................................................................... 11

Figure 5:IC strates sont de taille égales .......................................................................................................................... 12

Figure 6: IC stratification à allocation proportionnelle .................................................................................................. 13

Figure 7: IC stratification à allocation optimale .............................................................................................................. 15

Figure 8: IC sondage par grappe .................................................................................................................................... 16

Figure 9: IC sondage à 2 degrés ...................................................................................................................................... 17

Figure 10: comparaison entre les plan simple et probabilités inégales ......................................................................... 17

Figure 12: comparaison des plans avec stratification ..................................................................................................... 18

Figure 13: comparaison des plans à plusieurs degrés .................................................................................................... 19

Figure 14: comparaison entre pisr et plan de stratification à allocation optimale ........................................................ 20

4 ESSAIT

Introduction

Aujourd’hui l’ingénieur est considéré comme un catalyseur de l’économie et un acteur de progrès. De cette réflexion découle un certain nombre de questions sur son rôle mais bien évidemment sur sa rémunération. Certains pensent que la moyenne des salaires des ingénieurs est une honte pour la profession et pour notre système d’éducation

Ce projet a pour objectif d’avoir une idée sur le premier salaire d’un ingénieur et les facteurs dont dépende tel que la spécialité d’étude, le genre, et le type d’entreprise.

Mais essentiellement on vise à comparer les différentes méthodes d’estimation et ça ce fait en mettant en évidence les variances et les intervalles de confiance.

On a choisi de chercher le premier salaire comme variable d’intérêt puisque durant le cursus de travail de l’ingénieur son salaire va être affecté par d’autres facteurs: généralement personnelle, qui va crée un biais lors des estimations. On a considéré les ingénieurs tunisiens comme population cible et on a choisi le chemin le plus simple pour collecter les réponses: les réseaux sociales et les sites web.

5 ESSAIT

a) Un exemplaire du questionnaire

Enquête Premier salaire de l’ingénieur tunisien

Sexe

Femme Homme

Age

Moins de 24 ans [24-26 [ [26-28[

[28-30[ Plus de 30 ans

Type d’entreprise

Privée Etatique

Quel a été votre premier salaire en tant qu’ingénieur

Moins de 700 DT [700-1000[ [1000-1300[

[1300-1600[ Plus de 1600 DT

Spécialité

Electrique/ Electronique/ Mécanique/ Mécatronique

Statistique/ Informatique

Génie civil/ Architecture

Télécommunication

Génie industriel

Autres à préciser

6 ESSAIT

b) Résumée de l’enquête : étude de population

La première question peut nous donner une idée sur le chômage des ingénieurs tunisien. Ainsi notre population source n’est pas équilibrée entre les deux sexes il est peut être dû à une mauvaise administration du questionnaire ou à un chômage des ingénieurs de sexe féminin. Alors qu’elle est équilibrée sur les différentes tranches d’âge. Les entreprises privées constituent généralement la première expérience professionnelle pour les ingénieurs avec un pourcentage de 65%. Concernant la variable d’intérêt la grande partie des jeunes diplômés reçoivent un salaire moins de 1000 DT

7 ESSAIT

c) Traitement des données

Comme les variables sont qualitatives (sous forme d’intervalles) on a procéder au codage : - pour la variable d’intérêt ( salaire )on prend le milieu des intervalles - pour les autres variables auxiliaires à chaque modalité on a attribut un numéro

I. Sondage aléatoire simple Tous les individus ont la même probabilité de fait partie de l’échantillon 1-sondage aléatoire simple sans remise : PESR Méthode : n tirage au hasard et successifs et sans remplacer l’unité sélectionnée dans la population avant le tirage suivant.

ypesr varypesr binf bsup longueur 865 567993.6 -612.1609 2342.161 2954.322

887.5 597944.2 -628.1064 2403.106 3031.213 880 587875.2 -622.7912 2382.791 3005.582 955 692413.2 -675.9428 2585.943 3261.886

917.5 639075.4 -649.367 2484.367 3133.734 910 628664.4 -644.0519 2464.052 3108.104 835 529256.4 -590.9002 2260.9 2851.8

932.5 660154.1 -659.9973 2524.997 3184.995 985 736622.4 -697.2035 2667.203 3364.407

902.5 618338.8 -638.7367 2443.737 3082.473 880 587875.2 -622.7912 2382.791 3005.582 940 670821.6 -665.3125 2545.313 3210.625

902.5 618338.8 -638.7367 2443.737 3082.473 902.5 618338.8 -638.7367 2443.737 3082.473 850 548454 -601.5305 2301.531 2903.061

902.5 618338.8 -638.7367 2443.737 3082.473 925 649572 -654.6822 2504.682 3159.364 865 567993.6 -612.1609 2342.161 2954.322

887.5 597944.2 -628.1064 2403.106 3031.213 910 628664.4 -644.0519 2464.052 3108.104

Tableau 1: les résultats du pesr

Moyenne des moyennes =901.75

8 ESSAIT

Figure 1: probabilité égales sans remise

2-sondage aléatoire simple avec remise PEAR

Méthode : n tirage indépendants puisqu’à chaque fois en remettant l’unité sélectionnée on réinitialise la population.

ypear varypear binfa bsupa longueur 883.3333 662485.3 -711.9734 2478.64 3190.613

900 687735 -725.4239 2525.424 3250.848 905.2632 736736.5 -777.0706 2587.597 3364.668 857.8947 661612.9 -736.3613 2452.151 3188.512 865.7895 673853.1 -743.1462 2474.725 3217.871 885.2941 626288.3 -665.8181 2436.406 3102.224 929.4118 690301.5 -699.0421 2557.866 3256.908

925 726495 -745.5997 2595.6 3341.199 911.7647 664322.5 -685.7525 2509.282 3195.034

910 785830.5 -827.4828 2647.483 3474.966 900 566370 -575.0481 2375.048 2950.096 910 579033 -581.4467 2401.447 2982.893

971.875 707676.9 -676.9462 2620.696 3297.642 800 543320 -644.7208 2244.721 2889.442

858.3333 625496.1 -691.7976 2408.464 3100.262 850 577320 -639.2389 2339.239 2978.478

902.5 772923.6 -820.655 2625.655 3446.31 966.6667 793456.1 -779.2259 2712.559 3491.785

875 650037.5 -705.2481 2455.248 3160.496 920.5882 677249.7 -692.3973 2533.574 3225.971

Tableau 2: résultats du pear

9 ESSAIT

Moyenne des moyennes = 896.4357

Figure 2: probabilité égale avec remise

Les intervalles de confiance est très vaste puisqu’il comprend des valeurs négatives !

II. Probabilité inégales les probabilités d’inclusion sont en fonction de la variable auxiliaire

1-sans remise PISR

ypisr varypisr binfpisr bsuppisr Longueur 955 215700.2 239.7067 2060.293 1820.587

917.5 198963.5 275.73355 2024.264 1748.529 910 195611.1 -166.8678 1566.868 1733.736

962.5 218750.2 233.2935 2066.706 1833.413 985 229038.8 -88.01679 1788.017 1876.034

947.5 211920.2 -52.28187 1752.282 1804.564 962.5 218923.9 -217.0703 1617.07 1834.141 895 189303.5 297.2231 2002.777 1705.554 955 215756.3 239.5884 2060.412 1820.823 925 202250.9 268.5427 2031.457 1762.915

902.5 192576.9 289.8818 2010.118 1720.236 955 215756.3 239.5884 2060.412 1820.823 940 208770.8 -195.5524 1595.552 1791.105 895 189303.5 297.2231 2002.777 1705.554

1015 243582.8 182.6594 2117.341 1934.681 992.5 233018.5 203.8689 2096.131 1934.681 932.5 205391.6 -188.2748 1588.275 1776.55 955 215417.5 -209.6966 1609.697 1819.393

10 ESSAIT

962.5 218750.2 233.2935 2066.706 1833.413 940 208733.6 -195.4725 1595.473 1790.945

Tableau 3: résultats des pisr

Moyenne des moyennes =945.25

Figure 3:probabilité inégales sans remise

2- avec remise PIAR

y_bar_piar var_piar binfpiar bsuppiar longueur 842.0084 3686.86 490.262 1209.738 719.4761 938.1513 1821.61 449.1735 1250.827 801.6531 931.2269 1211.42 452.1083 1247.892 795.7834 938.1513 1821.61 449.1735 1250.827 801.6531 859.6555 35114.77 482.7169 1217.283 734.5663 938.1513 41821.61 449.1735 1250.827 801.6531 842.0084 33686.86 490.262 1209.738 719.4761 859.6555 35114.77 482.7169 1217.283 734.5663 913.2269 39635.28 459.7912 1240.209 780.4175 887.1849 37393.74 770.9858 1529.014 758.0284 1090.857 56619.65 383.6203 1316.38 932.7594 1170.143 65153.02 199.7082 1200.292 1000.584 919.2269 40157.06 457.2312 1242.769 785.5377 913.2269 39635.28 459.7912 1240.209 780.4175 919.2269 40157.06 457.2312 1242.769 785.5377 984.2941 46036.95 729.458 1570.542 841.0839

11 ESSAIT 938.1513 41821.61 449.1735 1250.827 801.6531 800.3613 30433.96 508.0715 1191.928 683.857 1110.151 58640.25 375.3713 1324.629 949.2573 842.0084 33686.86 490.262 1209.738 719.4761

Tableau 4:résultats piar

Moyenne des moyennes =931.8534

Figure 4: probabilités inégales avec remise

En introduisant l’information auxiliaire on a pu réduire les intervalles de confiance

III. Stratification la population est stratifier selon la variable auxiliaire ; spécialité d’étude

1-les strates ont la même taille : soit nh la taille de l’échantillon tiré de chaque strate nh =c (4,3,3,3,4,3)

y_bar_strata var_y_strata Binfstrat bsupstrat longueur 882.75 1982.938 795.4708 970.0292 174.5583 1065.25 6328.406 909.3295 1221.171 311.841 921.875 2621.828 821.5156 1022.234 200.7189 968.75 3483.156 853.0742 1084.426 231.3516 832.75 631.1875 783.508 881.992 98.48391 921.875 1834.328 837.93 1005.82 167.8899 903.125 1735.891 821.4635 984.7865 163.323

978 3243.406 866.3762 1089.624 223.2476 987.5 2892.531 882.0868 1092.913 210.8265 823.375 901.8906 764.5133 882.2367 117.7235 863.875 2440.266 767.0529 960.6971 193.6443 973.25 2070.906 884.0559 1062.444 178.3883 898.25 2274.438 804.7755 991.7245 186.949

12 ESSAIT 845.125 1751.203 763.1041 927.1459 164.0417

814 532.75 768.7605 859.2395 90.479 860.75 1486.938 785.1708 936.3292 151.1584 976.375 3785.766 855.779 1096.971 241.192 845.25 2193.406 753.4557 937.0443 183.5886

967 2432.25 870.337 1063.663 193.326 790.625 705.0156 738.5828 842.6672 104.0844

Tableau 5: résultats :les states sont de taille égale

moyenne des moyennes =905.9875

Figure 5:IC strates sont de taille égales

2-les strates sont à allocation proportionnelle

nh =Nh*n/N avec Nh la taille de chaque strate, ils sont proportionnelle à la taille de chaque strate.

yprop varyprop binfprop bsupprop longueur 872.5 35484.63 480.7877 1219.212 738.4247 917.5 40007.92 457.9612 1242.039 784.0776 827.5 33632.68 340.5514 1059.449 718.8972 887.5 42720 444.8912 1255.109 810.2177 872.5 32500.38 496.6539 1203.346 706.6921

970 56868.1 982.5981 1917.402 934.8037 880 33853.35 489.3741 1210.626 721.2518 910 35853.51 478.8735 1221.126 742.2529

842.5 37980 768.0262 1531.974 763.9476 865 44096.72 438.4153 1261.585 823.1694

812.5 32244.68 498.0466 1201.953 703.9067 880 33352.93 792.0494 1507.951 715.9011

13 ESSAIT

947.5 48037.6 720.4173 1579.583 859.1653 880 34864.49 784.0281 1515.972 731.9437

872.5 35851.67 478.8831 1221.117 742.2338 910 40779.95 754.1967 1545.803 791.6066 940 40007.92 757.9612 1542.039 784.0776 820 26693.22 829.774 1470.226 640.452 895 49199.03 415.2552 1284.745 869.4895 865 39019.6 462.8337 1237.166 774.3325

Tableau 6: résultats stratification à allocationproportionnelle

Moyenne de la moyenne = 949.3411

Figure 6: IC stratification à allocation proportionnelle

3-Les strates sont à allocation optimale

Les nh sont calculés de sorte que la variance soit minimale

yopt varyopt binfopt bsupopt longueur

14 ESSAIT 1089.554

898.3571

850.2321

926.8393

967.3571

833.1607

1002.554

972.0714

980.1607

902.6786

898.3393

940.0179

912.4464

958.6786

1024.714

1099

819.0357

1028.929

971.1786

911.5179

2744.342

2639.86

1209.295

1495.187

1203.235

1154.472

1503.601

676.7194

1170.062

1064.443

806.124

1102.741

2493.548

871.5855

2834.184

192.8571

75.87628

3960.88

1324.429

744.1342

1047.323 1252.677

1499.296 1700.704

1081.841 1218.159

1374.211 1525.789

1382.012 1517.988

1083.404 1216.596

1373.998 1526.002

1099.013 1200.987

632.9559 767.0441

1086.053 1213.947

1094.351 1205.649

1084.913 1215.087

1352.127 1547.873

792.1357 907.8643

1495.655 1704.345

1122.781 1177.219

832.927 867.073

726.6464 973.3536

778.6703 921.3297

1096.534 1203.466

205.355

201.4079

136.3177

151.5772

135.9757

133.1919

152.0031

101.9742

134.0882

127.8931

111.2979

130.1736

195.7469

115.7287

208.6893

54.43822

34.14594

246.7073

142.6594

106.933

Tableau 7: résultats stratification à allocation optimale

15 ESSAIT

Moyenne des moyenne =949.3411

Figure 7: IC stratification à allocation optimale Avec la stratification l’information auxiliaire a plus de rôle

IV. Sondage par grappe à plusieurs degrés On partitionne la population selon la variable auxiliaire choisie; spécialité d’étude 1-on sélectionne un échantillon de m grappes avec m~M/4

y_bar_grappe var_ygrap binf_grappe bsup_grappe longueur 1021,5 98283000 -18281.01 20581.01 38862.01

949,5 157323000 -23733.98 25433.98 49167.96 1066,5 282747000 -31807.56 6002.974 65915.12

678 6912000 -4302.974 6002.974 10305.95 498 84672000 -18581.01 20281.01 36070.82

1021,5 98283000 -4002.974 6302.974 38862.01 678 6912000 -14286.86 15986.86 10305.95

817,5 59643000 -14286.86 15986.86 30273.72 88605 546987000 -44690 46990 91679.99

1161 23232000 -8597.119 10297.12 18894.24 Tableau 8: résulatats du sondage par grappe

Moyenne des moyennes = 877.8

16 ESSAIT

Figure 8: IC sondage par grappe

2-plan de sondage à 2 degré On sélectionne un échantillon de m unités primaires avec m~M/4.Dans chaque unité primaire h on sélectionne un échantillon de taille nh~Nh/5

y_bar_grappe2 var_ygrap2 binf_grappe_D2 sup_grappe_D2 longueur 1039.5 490163333 -42354.18 44433.18 86787.36 1040.4 629473333 -48134.64 50215.44 98350.08 984.0 582746667 -46330.69 48298.69 94629.37 882.0 508293333 -43306.91 45070.91 88377.82 1035.0 615309333 -47583.64 49653.64 97237.28 1093.5 576843333 -45980.92 48167.92 94148.85 984.0 651738667 -49053.18 51021.18 100074.36 1048.8 539861333 -44491.64 46589.24 91080.87 1096.5 788696667 -53947.64 56140.64 110088.28

1107.9 492515333 -42389.77 44605.57 86995.33

Tableau 9: résultats du sondage à 2 degré

Moyenne des moyennes= 1031.16

17 ESSAIT

Figure 9: IC sondage à 2 degrés

d) Synthèse

Pesr piar

pear pisr

Figure 10: comparaison entre les plan simple et probabilités inégales

D’après la figure 10 en comparons les intervalles de confiances on peut dire que le plan de sondage avec

probabilités inégales sans remise est le plus précis, ce qui parait logique puisque en accordant plus de poids aux

individus qui apportent plus d’information en terme de variable auxiliaire on gagne plus de précision.

18 ESSAIT

strates égales strate à allocation optimale strate à allocation proporsionelle

Figure 11: comparaison des plans avec stratification

La méthode utilisée dans le plan de stratification à allocation optimale est faite de manière à minimiser la variance,

ce qu’est vérifié dans la figure 11 avec les longueurs faibles des intervalles de confiance ainsi que pour les plans où

les strates sont égales.

19 ESSAIT

sondage par grappe

sondage par grappe à 2 degré

Figure 12: comparaison des plans à plusieurs degrés

On peut voir que les longueurs des intervalles de confiances sont très grandes ainsi que les variances. Le plan de sondage à plusieurs degrés donne plus de chance à une catégorie représentée par une grappe qui est généralement constituée par des individus semblables, Ce qu’indique que dans ce cas les plans de sondage à plusieurs grappes ne sont pas les meilleures méthodes cherchées. Strates à allocation optimale pisr

20 ESSAIT

Figure 13: comparaison entre pisr et plan de stratification à allocation optimale

Finalement on peut conclure que les plans de stratification optimale sont les best méthodes, mais ces plans supposent qu’on a les variances intra strates, ce qui n’est pas pratique. Donc d’après les méthodes qu’on a présenté pisr c’est pratiquement le meilleur plan.

D’après les différents estimateurs trouvés, le premier salaire moyen d’un ingénieur est situé dans l’intervalle [878..1032]

e) code R library(sampling) library(Rcmdr) attach(da) y=salaire n=20 N=100 ####1-pesr et pear ###1-1-pesr ##echantillon 20 fois l=NULL k=20 for(i in 1:k) { l[i]=list(as.vector(srswor(20,100)))

21 ESSAIT

} #estimation des moyenne ypesr=NULL ysr=NULL for(i in 1:k) { ysr[i]=list(as.vector(y[unlist(l[i])==1])) ypesr[i]=list(mean(unlist(ysr[i]))) } #estimation des variances f=n/N varypesr=NULL s2c=NULL for(i in 1:k) { s2c[i]=list((1/n-1)*sum(unlist(ysr[i])-unlist(ypesr[i])^2)) varypesr[i]=list((1-f)*unlist(s2c[i])/n) } #la moyenne des ypesr moyesr=mean(unlist(ypesr)) #intervalle de confiance binf=NULL bsup=NULL born=NULL for(i in 1:k){ binf[i]=unlist(ypesr[i])-1.96*sqrt(unlist(varypesr[i])) bsup[i]=unlist(ypesr[i])+1.96*sqrt(unlist(varypesr[i])) born[i]=list(c(binf[i],bsup[i])) } xmininf=min(binf) xmaxinf=max(binf) xminsup=min(bsup) xmaxsup=max(bsup) x1=xmininf x2=xmaxsup plot(1:20,bsup,ylim=c(x1,x2),panel.first = grid(20),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) axis(2,at=c(seq(-1500,3700,500)),yaxt="n") points(1:20,bsup,type="l",col=16) points(1:20,bsup,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binf,type="l",col=16) points(1:20,binf,pch=20,cex=1,col=4) ##1-2pear la=NULL

22 ESSAIT

for(i in 1:k) { la[i]=list(as.vector(srswr(20,100))) } #estimation des moyenne ypear=NULL yar=NULL m=NULL for(i in 1:k) { yar[i]=list(as.vector(y[unlist(la[i])!=0])) ypear[i]=list(mean(unlist(yar[i]))) m[i]=as.vector(sum( unlist(la[i])!=0 )) } #la moyenne des ypear moyear=mean(unlist(ypear)) #estimation des variances varypear=NULL s2y=NULL for(i in 1:k) { s2y[i]=list((1/m[i]-1)*sum(unlist(yar[i])-unlist(ypear[i])^2)) varypear=unlist(s2y)/n } #intervalle de confiance binfa=NULL bsupa=NULL borna=NULL for(i in 1:k){ binfa[i]=unlist(ypear[i])-1.96*sqrt(unlist(varypear[i])) bsupa[i]=unlist(ypear[i])+1.96*sqrt(unlist(varypear[i])) borna[i]=list(c(binfa[i],bsupa[i])) } x1mininf=min(binfa) x1maxinf=max(binfa) x1minsup=min(bsupa) x1maxsup=max(bsupa) x11=x1mininf x21=x1maxsup plot(1:20,bsupa,ylim=c(x11,x21),panel.first = grid(20),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsupa,type="l",col=16) points(1:20,bsupa,pch=20,cex=1,col=4)

23 ESSAIT

par(new=TRUE) points(1:20,binfa,type="l",col=16) points(1:20,binfa,pch=20,cex=1,col=4) ####probabilités inégales ##sans remise pisr s=NULL pik=NULL pik=inclusionprobabilities(y,20) for(i in 1:k){ s[i]=list(as.vector(UPsystematic(pik,eps=1e-6)))#liste des echantillons tirés } ##estimation de la moyenne ypisr=NULL yir=NULL for(i in 1:k){ yir[i]=list(as.vector(y[unlist(s[i])!=0])) ypisr[i]=mean(unlist(yir[i])) } #la moyenne des ypesr moyisr=mean(unlist(ypisr)) #estimation des variances varypisr=NULL a=1/(n*(n-1)*N^2) for(i in 1:k){ varypisr[i]=list(a*sum(((unlist(yir[i])/pik)- N*unlist(ypisr[i]))^2)) } #intervalle de confiance binfpisr=NULL bsuppisr=NULL bornpisr=NULL for(i in 1:k){ binfpisr[i]=unlist(yir[i])-1.96*sqrt(unlist(varypisr[i])) bsuppisr[i]=unlist(yir[i])+1.96*sqrt(unlist(varypisr[i])) bornpisr[i]=list(c(binfpisr[i],bsuppisr[i])) } x2mininf=min(binfpisr) x2maxinf=max(binfpisr) x2minsup=min(bsuppisr) x2maxsup=max(bsuppisr) x12=x2mininf x22=x2maxsup plot(1:20,bsuppisr,ylim=c(x12,x22),panel.first = grid(20),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsuppisr,type="l",col=16) points(1:20,bsuppisr,pch=20,cex=1,col=4)

24 ESSAIT

par(new=TRUE) points(1:20,binfpisr,type="l",col=16) points(1:20,binfpisr,pch=20,cex=1,col=4) ####piar avec remise Nh=as.vector(table(specialité)) sa=NULL pk=NULL;v=NULL ech=NULL ech_piar=NULL y_piar=NULL y_bar_piar=NULL var_piar=NULL pki=Nh/100 v[0]=0 V=NULL for(b in 1:100 ){for(j in 1:6){if(specialité[b]==j) {pk[b]=pki[j]}}} for(b in 1:100 ){V[b]=sum(pk[1:b]);v=c(0,V,20)} for(i in 1:k){ u=runif(1) u=0.8 U=u+0:19 for(bb in 1:20){ for(b in 1:100){ if( (U[bb]<v[b+1]) & (U[bb]>=v[b])){ ech[bb]=b}}} ech v U ech_piar[i]=list(ech) } #estimation de la moyenne for(i in 1:k){ y_piar[i]=list(salaire[unlist(ech_piar[i])]) y_bar_piar[i]=list((1/(n*N))*sum(unlist(y_piar[i])/pk[unlist(ech_piar[i])])) var_piar[i]=list( 1/(N^2*n*(n-1))*sum(( unlist(y_piar[i])/pk[unlist(ech_piar[i])]-N*unlist(y_bar_piar[i]) )^2)) } #moyenne des y_bar_piar moy_piar=mean(unlist(y_bar_piar)) #intevalle de confiance binfpiar=NULL bsuppiar=NULL bornpiar=NULL for(i in 1:k){ binfpiar[i]=unlist(y_piar[i])-1.96*sqrt(unlist(var_piar[i])) bsuppiar[i]=unlist(y_piar[i])+1.96*sqrt(unlist(var_piar[i]))

25 ESSAIT

bornpiar[i]=list(c(binfpiar[i],bsuppiar[i])) } x8mininf=min(binfpiar) x8maxinf=max(binfpiar) x8minsup=min(bsuppiar) x8maxsup=max(bsuppiar) x18=x8mininf x28=x8maxsup plot(1:20,bsuppiar,ylim=c(x18,x28),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsuppiar,type="l",col=16) points(1:20,bsuppiar,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binfpiar,type="l",col=16) points(1:20,binfpiar,pch=20,cex=1,col=4) ###les states ont la meme taille Nh=as.vector(table(specialité)) nh=c(4,3,3,3,4,3) st=NULL y_strata=NULL y_bar_h=NULL y_bar_strata=NULL s2yh=NULL var_y_strata=NULL for(i in 1:k){ st=strata(data,stratanames=c("specialité"),size=nh,method="srswor") y_strata[i]=list(as.vector(getdata(data,st)$salaire)) y_bar_h=(1/nh[1])*sum(unlist(y_strata[i])[1:nh[1]]) #estimation de la moyenne for(j in 2:6){ y_bar_h[j]=as.vector((1/nh[j])*sum(unlist(y_strata[i])[(nh[j-1]+1):(nh[j]+nh[j-1])])) } y_bar_strata[i]=list(sum((Nh/N)*y_bar_h)) #estimation de la variance s2yh[1]=(1/(nh[1]-1))*sum((unlist(y_strata[i])[1:nh[1]]-ybarh[1])^2) for(j in 2:6){s2yh[j]=as.vector((1/(nh[j]-1))*sum( (unlist(y_strata[i])[(nh[j-1]+1):(nh[j]+nh[j-1])]-ybarh[j])^2))} var_y_strata[i]=list((1/N^2)*sum(Nh*((Nh-nh)/nh)*s2yh)) } #la moyenne des ystrat moystrat=mean(unlist(y_bar_strata)) #intervalle de confiance binfstrat=NULL bsupstrat=NULL bornstrat=NULL for(i in 1:k){ binfstrat[i]=unlist(yst[i])-1.96*sqrt(unlist(varystrat[i])) bsupstrat[i]=unlist(yst[i])+1.96*sqrt(unlist(varystrat[i])) bornstrat[i]=list(c(binfstrat[i],bsupstrat[i])) }

26 ESSAIT

x3mininf=min(binfstrat) x3maxinf=max(binfstrat) x3minsup=min(bsupstrat) x3maxsup=max(bsupstrat) x13=x3mininf x23=x3maxsup plot(1:20,bsupstrat,ylim=c(x13,x23),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsupstrat,type="l",col=16) points(1:20,bsupstrat,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binfstrat,type="l",col=16) points(1:20,binfstrat,pch=20,cex=1,col=4) ###les strats sont à allocation proporsionnelle nhp=round(Nh*n/N) f=n/N yprop=NULL ypr=NULL varyprop=NULL sp=NULL ybarhp=NULL s2yh1=NULL for(i in 1:k){ sp=strata(data,stratanames=c("specialité"),size=nhp,method="srswor") ypr[i]=list(as.vector(getdata(data,sp)$salaire)) yprop[i]=mean(unlist(ypr[i])) ybarhp[1]=(1/n)*sum(unlist(ypr[i])[1:nh[1]]) #estimation de la moyenne for(j in 2:6){ ybarhp[j]=as.vector((1/n)*sum(unlist(ypr[i])[(nh[j-1]+1):(nh[j]+nh[j-1])])) } s2yh1[1]=(1/(nh[1]-1))*sum((unlist(ypr[i])[1:nh[1]]-ybarhp[1])^2)#estimation de la variance for(j in 2:6){s2yh1[j]=as.vector((1/(nh[j]-1))*sum( (unlist(ypr[i])[(nh[j-1]+1):(nh[j]+nh[j-1])]-ybarhp[j])^2))} varyprop[i]=list((1-f)/n*sum(Nh/N*s2yh1)) } #la moyenne des yprop moyprop=mean(unlist(yprop)) #intervalle de confiance binfprop=NULL bsupprop=NULL bornprop=NULL for(i in 1:k){ binfprop[i]=unlist(ypr[i])-1.96*sqrt(unlist(varyprop[i])) bsupprop[i]=unlist(ypr[i])+1.96*sqrt(unlist(varyprop[i])) bornprop[i]=list(c(binfprop[i],bsupprop[i])) } x4mininf=min(binfprop) x4maxinf=max(binfprop) x4minsup=min(bsupprop)

27 ESSAIT

x4maxsup=max(bsupprop) x14=x4mininf x24=x4maxsup plot(1:20,bsupprop,ylim=c(x14,x24),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsupprop,type="l",col=16) points(1:20,bsupprop,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binfprop,type="l",col=16) points(1:20,binfprop,pch=20,cex=1,col=4) ##les strats sont à allocation optimale nhop=NULL shc=NULL yop=NULL yhop=NULL yopt=NULL so=NULL s2yhop=NULL varyopt=NULL for(j in 1:6){shc[j]=sqrt(var(salaire[specialité==j]));nhop=round(n*Nh*shc/(sum(Nh*shc)))} for( i in 1:k){ so=strata(data,stratanames=c("specialité"),size=nhop,method="srswor") yop[i]=list(as.vector(getdata(data,so)$salaire)) ybarhop=(1/nhop[1])*sum(unlist(yst[i])[1:nhop[1]]) for(j in 2:6){ ybarhop[j]=as.vector((1/nhop[j])*sum(unlist(yop[i])[(nhop[j-1]+1):(nhop[j]+nhop[j-1])])) } yopt[i]=list(sum((Nh/N)*ybarhop)) s2yhop[1]=(1/(nhop[1]-1))*sum((unlist(yop[i])[1:nhop[1]]-ybarhop[1])^2) for(j in 2:6){ if(nhop[j]==1){s2yhop[j]=0} else{ s2yhop[j]=as.vector((1/(nhop[j]-1))*sum( (unlist(yop[i])[(nhop[j-1]+1):(nhop[j]+nhop[j-1])]-ybarhop[j])^2))}} varyopt[i]=list((1/N^2)*sum(Nh*((Nh-nhop)/nhop)*s2yhop)) } #intervalle de confiance binfopt=NULL bsupopt=NULL bornopt=NULL for(i in 1:k){ binfopt[i]=unlist(yopt[i])-1.96*sqrt(unlist(varyopt[i])) bsupopt[i]=unlist(yopt[i])+1.96*sqrt(unlist(varyopt[i])) bornopt[i]=list(c(binfopt[i],bsupopt[i])) } mean(unlist(yopt)) x5mininf=min(binfopt)

28 ESSAIT

x5maxinf=max(binfopt) x5minsup=min(bsupopt) x5maxsup=max(bsupopt) x15=x3mininf x25=x3maxsup plot(1:20,bsupopt,ylim=c(x15,x25),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) points(1:20,bsupopt,type="l",col=16) points(1:20,bsupopt,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binfopt,type="l",col=16) points(1:20,binfopt,pch=20,cex=1,col=4) #####sondage par grappe #1-sondage aléatoire simple p=10 grappe=NULL sg=NULL y_bar_grappe=NULL var_ygrap=NULL y_grappe=NULL M=6 mg=round(M/4) p1h=mg/M for(j in 1:6){grappe[j]=list(salaire[specialité==j]) } for(i in 1:p){ sg=sample(1:6,mg,replace=F) Nhh=Nh[sg] ygrap=grappe[sg] y_grappe[i]=list(unlist(ygrap)) ng[i]=list(length(unlist(ygrap))) y_bar_h[1]=mean(unlist(ygrap[1])) y_bar_h[2]=mean(unlist(ygrap[2])) y_bar_grappe[i]=list(M/(mg*N)*sum(Nhh*y_bar_h)) th[1]=sum(unlist(ygrap[1])) th[2]=sum(unlist(ygrap[2])) var_ygrap[i]=list(((M-mg)*M)/((M-1)*mg)*sum((th-(N/M)*y_bar_h)^2)) } #moyenne des y_bar_grappe moygrap=mean(unlist(y_bar_grappe)) #intervalle de confiance binf_grappe=NULL bsup_grappe=NULL

29 ESSAIT

born_grappe=NULL for(i in 1:p){ binf_grappe[i]=unlist(y_grappe[i])-1.96*sqrt(unlist(var_ygrap[i])) bsup_grappe[i]=unlist(y_grappe[i])+1.96*sqrt(unlist(var_ygrap[i])) born_grappe[i]=list(c(binf_grappe[i],bsup_grappe[i]))} x6mininf=min(binf_grappe) x6maxinf=max(binf_grappe) x6minsup=min(bsup_grappe) x6maxsup=max(bsup_grappe) x16=x6mininf x26=x6maxsup plot(1:10,bsup_grappe,ylim=c(x16,x26),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:10)) points(1:10,bsup_grappe,type="l",col=16) points(1:10,bsup_grappe,pch=20,cex=1,col=4) par(new=TRUE) points(1:10,binf_grappe,type="l",col=16) points(1:10,binf_grappe,pch=20,cex=1,col=4) ##sondage par grappe à 2 degré sg1=NULL grappe1=NULL ng1=NULL nh1=round(Nh/5) sg2=NULL y_bar_h2=NULL th2=NULL var_ygrap2=NULL y_grappe_D2=NULL y_bar_grappe2=NULL for(j in 1:6){grappe1[j]=list(salaire[specialité==j])} for(i in 1:p){ sg1=sample(1:6,mg,replace=F) Nhh1=Nh[sg1] ygrap1=grappe1[sg1] y_grappe_D2[i]=list(unlist(ygrap1)) ng1[i]=list(length(unlist(ygrap1))) sg2[1]=list(sample(unlist(ygrap1[1]),nh1[sg1][1],replace=F)) sg2[2]=list(sample(unlist(ygrap1[2]),nh1[sg1][2],replace=F)) y_bar_h2[1]=mean(unlist(sg2[1])) y_bar_h2[2]=mean(unlist(sg2[2])) y_bar_grappe2[i]=list(M/(mg*N)*sum(Nhh*y_bar_h2)) th2[1]=sum(unlist(sg2[1])) th2[2]=sum(unlist(sg2[2]))

30 ESSAIT

var_ygrap2[i]=list(((M-mg)*M)/((M-1)*mg)*sum((th2-(N/M)*y_bar_h2)^2))} #moyenne des y_bar_grappe moygrap2=mean(unlist(y_bar_grappe2)) #intervalle de confiance binf_grappe_D2=NULL bsup_grappe_D2=NULL born_grappe_D2=NULL for(i in 1:p){ binf_grappe_D2[i]=unlist(y_grappe_D2[i])-1.96*sqrt(unlist(var_ygrap2[i])) bsup_grappe_D2[i]=unlist(y_grappe_D2[i])+1.96*sqrt(unlist(var_ygrap2[i])) born_grappe_D2[i]=list(c(binf_grappe_D2[i],bsup_grappe_D2[i]))} x7mininf=min(binf_grappe_D2) x7maxinf=max(binf_grappe_D2) x7minsup=min(bsup_grappe_D2) x7maxsup=max(bsup_grappe_D2) x17=x7mininf x27=x7maxsup plot(1:10,bsup_grappe_D2,ylim=c(x17,x27),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:10)) points(1:10,bsup_grappe_D2,type="l",col=16) points(1:10,bsup_grappe_D2,pch=20,cex=1,col=4) par(new=TRUE) points(1:10,binf_grappe_D2,type="l",col=16) points(1:10,binf_grappe_D2,pch=20,cex=1,col=4) #############################synthèse x1=min(x1,x11,x12,x18) y1=max(x2,x21,x22,x28) #1sondage simple sans remise plot(1:20,bsup,ylim=c(x1,y1),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) par(new=TRUE) points(1:20,bsup,type="l",col=5) points(1:20,bsup,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binf,type="l",col=5) points(1:20,binf,pch=20,cex=1,col=4) #2sondage simple avec remise par(new=TRUE) points(1:20,bsupa,type="l",col=1) points(1:20,bsupa,pch=20,cex=1,col=2)

31 ESSAIT

par(new=TRUE) points(1:20,binfa,type="l",col=1) points(1:20,binfa,pch=20,cex=1,col=2) #sondage à proba inégale avec remise par(new=TRUE) points(1:20,bsuppiar,type="l",col=16) points(1:20,bsuppiar,pch=20,cex=1,col=4) par(new=TRUE) points(1:20,binfpiar,type="l",col=16) points(1:20,binfpiar,pch=20,cex=1,col=4) #sondage à probabilité inégales sans remise par(new=TRUE) points(1:20,bsuppisr,type="l",col=6) points(1:20,bsuppisr,pch=20,cex=1,col=8) par(new=TRUE) points(1:20,binfpisr,type="l",col=6) points(1:20,binfpisr,pch=20,cex=1,col=8) #3 les startes sont à taille égale x2=min(x13,x14,x15) y2=min(x23,x24,x25) plot(1:20,bsupstrat,ylim=c(x2,y2),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:20)) par(new=TRUE) points(1:20,bsupstrat,type="l",col=6) points(1:20,bsupstrat,pch=20,cex=1,col=8) par(new=TRUE) points(1:20,binfstrat,type="l",col=6) points(1:20,binfstrat,pch=20,cex=1,col=8) #4 stratification à allocation proportionnelle par(new=TRUE) points(1:20,bsupprop,type="l",col=3) points(1:20,bsupprop,pch=20,cex=1,col=7) par(new=TRUE) points(1:20,binfprop,type="l",col=3) points(1:20,binfprop,pch=20,cex=1,col=7) #5 staratification à allocation optimale par(new=TRUE) points(1:20,bsupopt,type="l",col=4) points(1:20,bsupopt,pch=20,cex=1,col=6) par(new=TRUE) points(1:20,binfopt,type="l",col=4)

32 ESSAIT

points(1:20,binfopt,pch=20,cex=1,col=6) #sondage par grappe x3=min(x16,x17) y3=max(x26,x27) plot(1:10,bsup_grappe,ylim=c(x3,y3),panel.first = grid(),xaxt="n",type="n",xlab="echantillon",ylab="intervalle de confiance") axis(1,at=c(1:10)) par(new=TRUE) points(1:10,bsup_grappe,type="l",col=16) points(1:10,bsup_grappe,pch=20,cex=1,col=4) par(new=TRUE) points(1:10,binf_grappe,type="l",col=16) points(1:10,binf_grappe,pch=20,cex=1,col=4) #sondage par grappe à 2 degré par(new=TRUE) points(1:10,bsup_grappe_D2,type="l",col=6) points(1:10,bsup_grappe_D2,pch=20,cex=1,col=8) par(new=TRUE) points(1:10,binf_grappe_D2,type="l",col=6) points(1:10,binf_grappe_D2,pch=20,cex=1,col=8)