tema 2. estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/tema 2....

189
TEMA 2. Estadística descriptiva unidimensional Material de suport docent de les sessions teòriques elaborat a partir de la bibliografia referenciada al Pla docent de l’assignatura Estadística econòmica i empresarial I Grau d’Economia Facultat d’Economia i Empresa Universitat de Barcelona Autora: Elisabet Motellón Corral Professora Associada Departament d’Econometria, Estadística i Economia Aplicada

Upload: others

Post on 28-Jan-2020

27 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

TEMA 2. Estadística descriptiva unidimensional

Material de suport docent de les sessions teòriques elaborat a partir de la bibliografia referenciada al Pla docent de l’assignatura

Estadística econòmica i empresarial I Grau d’Economia Facultat d’Economia i Empresa Universitat de Barcelona

Autora: Elisabet Motellón Corral Professora Associada Departament d’Econometria, Estadística i Economia Aplicada

Page 2: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Objectiu del Tema 2: “En aquest bloc temàtic es presenten les principals tècniques d’estadística descriptiva unidimensional que han de permetre a l’estudiant de saber tabular i construir una taula de freqüències a partir d’un conjunt de dades, conèixer les diferents mesures descriptives per sintetitzar la informació, i els avantatges i inconvenients de cadascuna, així com les diferents possibilitats de representació gràfica de les dades. Els conceptes clau d’aquest bloc són els següents: dades agrupades, dades sense agrupar, distribució de freqüències, taula de freqüències, freqüències absoluta, relativa, absoluta acumulada i relativa acumulada, interval, límit inferior, límit superior, marca de classe, amplada, alçada, estadístic, mesura de posició, moda, mediana, mitjana aritmètica, mitjana ponderada, quantils, quartils, decils, percentils, mesura de dispersió, recorregut o rang, recorregut interquartílic, variància, desviació típica o estàndard, coeficient de variació, gràfic de sectors, de barres, d’escala, de caixa («box plot»), de tija i fulles, histograma, mesura de forma, coeficient de simetria, coeficient d’apuntament, coeficient de curtosi, concentració, equidistribució, corba de Lorenz, índex de Gini, transformacions lineals, canvi d’origen, canvi d’escala, tipificació o estandardització”

Pla docent de l’assignatura E. Motellón Estadística econòmica i empresarial I

Page 3: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

ÍNDEX 2.1. Tabulació

•  Presentació de les dades •  Ordenació de les dades i concepte de freqüència absoluta •  Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar •  Interval: límit inferior i superior, marca de classe, amplada, alçada •  Freqüència relativa •  Freqüència absoluta i relativa acumulades

2.2. Representació gràfica •  Dades qualitatives sense agrupar: diagrama de sectors, de barres, d’escala, de caixa

(box plot) i de tija i fulles •  Dades qualitatives agrupades: histograma, polígon de freqüències no acumulades i

polígon de freqüències acumulades

2.3. Mesures de síntesi •  Mesures de posició o localització •  Mesures de dispersió absolutes i relatives •  Concentració versus equidistribució

2.4. Transformacions lineals

E. Motellón Estadística econòmica i empresarial I

Page 4: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Tema 2.1. Tabulació

•  Presentació de les dades

•  Ordenació de les dades i concepte de freqüència absoluta

•  Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar

•  Interval: límit inferior i superior, marca de classe, amplada, alçada

•  Freqüència relativa

•  Freqüència absoluta i relativa acumulades

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Page 5: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2.1. Tabulació. Taula de freqüències

Ordenació, classificació i agrupació de sèries estadístiques Objectiu:

Facilitar la interpretació i l’anàlisi de les dades obtingudes pel mesurament o observació de variable o atribut

Construcció de distribució de freqüències

Primera fase del descriptiu, desprès de l’obtenció de dades (2a etapa de l’anàlisi estadístic)

E. Motellón Estadística econòmica i empresarial I

Page 6: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Variable: Gènere → 2 valors (modalitats): H = Home D = Dona

D H H D D H D D D H H H H H D D D D D D

Gènere Freqüència

Absoluta (nre.) Relativa (%)

Home 4 4/10=0,4=40%

Dona 6 6/10=0,6=60%

Mida mostra 10

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades desordenades i ordenades

Mostra

Equival

Page 7: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

En funció(≠ valors q pot prendre variable i nre. d'observacions) X (variable) ; xi (observació) ; N (nre. total d’observacions)

Tipus I: reduït nombre d’observacions amb valors tots diferents x1, x2, …, xN-1, xN

Tipus II: nombre elevat d’observacions amb nre. reduït de valors. Treballarem amb dades individuals (nivell educatiu dels ocupats)

x1, x2, …, xk on k<N

Tipus III: nombre elevat d’observacions i de valors. Treballarem amb dades agrupades (salari dels ocupats)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

Page 8: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

OBSERVACIONS

POQUES MOLTES

VALO

RS POCS Dades individuals Dades individuals

MOLTS (sense sentit) Dades agrupades

Habitualment variables discretes

variables discretes o continues

Tipo I Tipo II

Tipo III

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

Page 9: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

OBSERVACIONS

POQUES MOLTES

VALO

RS POCS Dades individuals Dades individuals

MOLTS (sense sentit) Dades agrupades

Construcció de taula de freqüències formalment diferent, encara que la metodologia és la mateixa

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

Page 10: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

�  Freqüència Absoluta (ni)

�  Freqüència Relativa (fi)

�  Freqüència Absoluta Acumulada (Ni)

�  Freqüència Relativa Acumulada (Fi)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Freqüències

Page 11: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1a. Etapa: Ordenació dels diferents valors de la variable X

2.1. Tabulació. Creació de taules de freqüències (etapes)

E. Motellón Estadística econòmica i empresarial I

Page 12: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

E. Motellón Estadística econòmica i empresarial I

Page 13: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

•  Variable a analitzar: “nombre de patents” (X) •  20 observacions (N) •  Variable X (nre. de patents) pot prendre 5 valors diferents (k = 5)

0,1, 2, 3, 4

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

E. Motellón Estadística econòmica i empresarial I

Page 14: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

X

0

1

2

3

4

E. Motellón Estadística econòmica i empresarial I

Page 15: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2a. Etapa: Càlcul de la Freqüència Absoluta (ni) Nombre de vegades q es repeteix un valor d’una variable

o una modalitat d’un atribut

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Page 16: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X

ni

0 5

1 5

2 4

3 3

4 3

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Interessats en l’estudi del nombre de patents que realitza un sector determinat.. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

El valor “0” apareix 5 vegades: Freqüència absoluta de valor “0” = 5

E. Motellón Estadística econòmica i empresarial I

El valor “4” apareix 3 vegades: Freqüència absoluta de valor “4” = 3

Page 17: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2a. Etapa: Càlcul de la Freqüència Absoluta (ni) Nombre de vegades q es repeteix un valor d’una variable

o una modalitat d’un atribut

Propietats:

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

ni = n1 + n2 +…+ nk = Ni=1

K

Nombre de valors diferents de la variable X

Freqüència absoluta (valor xi o modalitat ai apareix ni vegades)

Total d’observacions (grandària de la mostra o població)

Page 18: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

X

ni

0 5

1 5

2 4

3 3

4 3

20

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

5+5+4+3+3=20=N

E. Motellón Estadística econòmica i empresarial I

Interpretació de la Freqüència Absoluta (ni): n1: Del total d’empreses enquestades, hi ha 5 q no han fet cap patent. n2: 5 empreses q només han patentat una innovació. Aquestes categories són les que més vegades és presenten a la mostra donat que són les que tenen una major freqüència absoluta

Page 19: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions

fi =niN

i =1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Page 20: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

f1 =n1N=520

= 0.25

E. Motellón Estadística econòmica i empresarial I

Page 21: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

fi = f1 + f2 + ...+ fk =n1N

+n2N

+ ...+ nkN

=i=1

K

=n1 + n2 + ...+ nk

N⎡ ⎣ ⎢

⎤ ⎦ ⎥

=NN

= 1

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Propietat de la Freqüència Absoluta

Page 22: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

0.25+0.25+0.2+0.15+0.15=1

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Page 23: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

•  Facilita comparació amb altres distribucions •  És una mesura de la probabilitat

Page 24: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Quin % d’empreses han registrat 4 patents?

Resultat: 15%

Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra aquesta hagi registrat 4 patents?

Resultat: 15 %

Page 25: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

•  Facilita comparació amb altres distribucions •  És una mesura de la probabilitat •  Per calcular fi , N ha de ser prou gran •  N<50 + adequat donar ni (nre. de casos)

Page 26: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

4a. Etapa: Càlcul de la Freqüències Acumulades 4.1. Freqüència Absoluta Acumulada (Ni) Nombre d’observacions o dades amb un valor ≤ al valor considerat

Ni = n1 + n2 + ...+ ni i = 1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Page 27: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

10=5+5 → N2= n1+n2

E. Motellón Estadística econòmica i empresarial I

X

ni fi Ni

0 5 0.25 5

1 5 0.25 10

2 4 0.20 14

3 3 0.15 17

4 3 0.15 20

20 1

Page 28: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes) 4a. Etapa: Càlcul de la Freqüències Acumulades 4.1. Freqüència Absoluta Acumulada (Ni) Nombre d’observacions o dades amb un valor ≤ al valor considerat

Propietats

Ni = n1 + n2 + ...+ ni i = 1,...,k

N1 = n1

Nk = n1 + n2 + ...+ nk = N

Per a la 1r valor/categoria de la variable (x1): Freqüència absoluta acumulada = Freqüència absoluta

Per al darrer valor/categoria de la variable (xk): Freqüència absoluta acumulada = Total observacions

Page 29: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X

ni fi Ni

0 5 0.25 5

1 5 0.25 10

2 4 0.20 14

3 3 0.15 17

4 3 0.15 20

20 1

N1= n1

Nk= N

Page 30: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Page 31: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

F2=0.50=10/20=N2/N

F2=0.50=0.25+0.25= f1+f2

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

Page 32: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Propietats:

Fk =1€

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

F1 = f1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

1r valor/categoria de la variable (x1): Freqüència relativa acumulada = Freqüència relativa

Darrer valor/categoria de la variable (xk): Freqüència absoluta acumulada = 1

Page 33: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Propietats:

Fk =1€

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

F1 = f1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

1

1

21

121

===+++

=

==+++= ∑=

NN

NN

NnnnF

ffffF

kkk

k

iikk

Page 34: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

F1= f1

Fk= Nk/N = 1

Page 35: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

Resultat: 50%

Quin % d’empreses han realitzat com a màxim una patent?

Resultat: 50%

Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra aquesta hagi registrat 1 o menys patents?

Page 36: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

I la probabilitat de haver registrat tres o més patents?

Resultat: 30%

F3=0.7 (realitzar 0,1 o 2 patents)

1 - 0.7 = 0.3 = 30%

Page 37: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X ni fi Ni Fi

x1 n1 f1 N1=n1 F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2

x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …

xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1

N 1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Page 38: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

X ni fi Ni Fi

x1 n1 f1 N1=n1 F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2

x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …

xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1

N 1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Fins ara hem treballat amb dades individuals pq la variable d’estudi prenia pocs valors diferents

Què passa si la nostra variable pren un nombre elevat de valors?

Elaboració d’una taula de freqüències amb dades agrupades en intervals

Page 39: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Consideracions inicials

1. Objectiu: agrupar els valors de la variable en un nre. d'intervals que no sigui excessivament gran

2.  Perdem informació. Només sabrem en nre. d'observacions q hi ha en cada interval però no el valor exacte d'aquestes observacions

3.  Intervals creats de forma artificial per l’investigador/a pq les dades es recullen de forma individualitzada

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades agrupades

Page 40: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2 N

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Però si N=100 tindríem q fer 20 intervals i és excessiu. Què s’entén per un nombre excessiu? En general 15 intervals com a màxim. Per tant, és una decisió ad hoc (segons la circumstància).

Page 41: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

ai =rang

nºde classes€

2 N

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Rang (Recorregut) = (valor +gran de X) – (valor +petit de X)

ReX = MaxX – MinX

•  Si nombre intervals predefinits, tenim automàticament ai

•  Si ai predefinida, tenim automàticament nombre intervals

Page 42: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

ai =rang

nºde classes€

2 N

(Li−1,Li ] ]Li−1,Li ]

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Extrem superior (obert)

Extrem inferior (tancat)

(a,b] = ]a,b] a fora del interval i b sí pertany

Page 43: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

4.  ai pot ser constant o variable. Per tant,

ai =rang

nºde classes€

2 N

(Li−1,L1] ]Li−1,L1]

ai = Li − Li−1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Exemple:

En estudi de Wmensual poques observacions entre 5500€ i 12000€.

Útil: (5500-12000], independentment de la grandària de la resta d’intervals

Page 44: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

4.  ai pot ser constant o variable. Per tant,

5.  Marca de classe (ci): Punt representatiu (mitjà) de l’interval

ai =rang

nºde classes€

2 N

(Li−1,L1] ]Li−1,L1]

ai = Li − Li−1

ci =Li + Li−12

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Page 45: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

6.  Alçada d’un interval (hi). Important quan l'amplitud dels intervals és variable per la realització de gràfics.

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

hi =niai

; hi =fiai

Superfície del rectangle de l'histograma, coincideixi amb la freqüència absoluta

Superfície del rectangle de l'histograma, coincideixi amb la freqüència relativa

Page 46: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

6.  Alçada d’un interval (hi). Important quan l'amplitud dels intervals és variable per la realització de gràfics.

7.  Selecció punt inicial (L0). Límit inferior de l'interval +petit (el primer).

Recomanació: Valor mínim de X o preveure valor inferior

8.  Selecció punt final. Límit superior de l’interval + gran (l’ últim)

Recomanació: Incloure valor màxim de X o preveure valor superior

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

hi =niai

; hi =fiai

Page 47: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

•  Variable a analitzar: “despesa en innovació” (X) •  20 observacions (N) •  Variable X: Variable continua discretalitzada

•  Amplitud de l’interval (ai) constant i igual a 20

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

E. Motellón Estadística econòmica i empresarial I

Page 48: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X

(L0,L1]

(L1,L2]

(L2,L3]

(L3,L4]

(L4,L5]

(L7,L6]

E. Motellón Estadística econòmica i empresarial I

Page 49: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X

(0,20]

(20,40]

(40,60]

(60,80]

(80,100]

(100,120]

E. Motellón Estadística econòmica i empresarial I

Page 50: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20]

(20,40]

(40,60]

(60,80]

(80,100]

(100,120]

8

24, 32, 36, 38, 39

42, 47, 51, 59

64, 71, 73, 74, 76

83, 91, 92

108, 109

E. Motellón Estadística econòmica i empresarial I

Page 51: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20] 1

(20,40] 5

(40,60] 4

(60,80] 5

(80,100] 3

(100,120] 2

E. Motellón Estadística econòmica i empresarial I

?

Page 52: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20] 1

(20,40] 5

(40,60] 4

(60,80] 5

(80,100] 3

(100,120] 2

N=20

E. Motellón Estadística econòmica i empresarial I

Empresa amb despesa de 40.000 €?

?

Page 53: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi (0,20] 1 0.05

(20,40] 5 0.25

(40,60] 4 0.20

(60,80] 5 0.25

(80,100] 3 0.15

(100,120] 2 0.1

N=20 1

fi =niN

1/20

5/20

4/20

5/20

3/20

2/20

E. Motellón Estadística econòmica i empresarial I

?

Page 54: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni

(0,20] 1 0.05 1

(20,40] 5 0.25 6

(40,60] 4 0.20 10

(60,80] 5 0.25 15

(80,100] 3 0.15 18

(100,120] 2 0.1 20

N=20 1

N1=n1=1

N2=n1+n2=6

N3=n1+n2+n3=10

N4=n1+n2+n3+n4=15

N5=n1+n2+n3+n4+n5=15

N6=n1+n2+n3+n4+n5+n6=20

E. Motellón Estadística econòmica i empresarial I

Page 55: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi

(0,20] 1 0.05 1 0.05

(20,40] 5 0.25 6 0.30

(40,60] 4 0.20 10 0.50

(60,80] 5 0.25 15 0.75

(80,100] 3 0.15 18 0.90

(100,120] 2 0.1 20 1

N=20 1

E. Motellón Estadística econòmica i empresarial I

Fi =Ni

N= f1 + f2 ++ fi

F1=N1/N=f1

F2=N2/N=f1+f2

F3=N3/N=f1+f2+f3

F4=N4/N=f1+f2+f3+f4

F5=N5/N=f1+f2+f3+f4+f5

F6=N6/N=f1+f2+f3+f4+f5+f6

Propietats

Page 56: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci

(0,20] 1 0.05 1 0.05 10

(20,40] 5 0.25 6 0.30 30

(40,60] 4 0.20 10 0.50 50

(60,80] 5 0.25 15 0.75 70

(80,100] 3 0.15 18 0.90 90

(100,120] 2 0.1 20 1 110

N=20 1

Estadística econòmica i empresarial I

ci =Li−1 + Li2

c1=(0+20)/2

c2=(20+40)/2

c3=(40+60)/2

c5=(80+100)/2

c6=(100+120)/2

c4=(60+80)/2

Propietats

Page 57: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

ai = Li + Li−1c1=20-0

c2=40-20

c3=60-40

c4=80-60

c5=100-80

c6=120-100

Page 58: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

•  Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra tingui una despesa en innovació inferior a 40.000€?

Resultat: 30%

•  Quina probabilitat hi ha que en escollir una empresa a l'atzar hagi realitzat una despesa en innovació entre 80.000 i 100.000 €?

Resultat: 15%

Page 59: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

hi

0.05

0.25

0.20

0.25

0.15

0.10

hi =niai

Page 60: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

hi

0.0025

0.0125

0.0100

0.0125

0.0075

0.0050

hi =f iai

Page 61: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Qualitatives nominals (Observacions només és poden classificar)

•  Taules amb dades individuals o  Normalment poques categories o  No és poden agrupar en intervals

•  No calcular les freqüències acumulades (ni absolutes ni relatives)

Qualitatives ordinals (classificació + ordenació)

•  Taules amb dades individuals i agrupades •  És poden calcular freqüències acumulades (absolutes i relatives)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades qualitatives

Page 62: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 5 =5/20 =5 =(5/20)

1 5 =5/20 =5+5 =(5+5)/20

2 4 =4/20 =5+5+4 =(5+5+4)/20

3 3 =3/20 =5+5+4+3 =(5+5+4+3)/20

4 3 =3/20 =5+5+4+3+3 =(5+5+4+3+3)/20

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

fi =niN

Page 63: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =20*0.05 0.05

1 =20*0.25 0.25

2 =20*0.20 0.20

3 =20*0.25 0.25

4 =20*0.15 0.15

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

fi =niN→ ni = N ⋅ f i

Page 64: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =5 5

1 =10-5 10

2 =14-10 14

3 =17-14 17

4 =20-17 20

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

n1 = N1ni = Ni − Ni−1 ∀i = 2,3,…,n

Page 65: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =0.25*20 0.25

1 =0.50*20 0.50

2 =0.70*20 0.70

3 =0.70*20 0.85

4 =1*20 1

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

Fi =NiN→ Ni = Fi ⋅N

Page 66: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Tema 2.2. Representació gràfica •  Dades quantitatives sense agrupar: diagrama de sectors, de

barres, d’escala, de caixa (box plot) i de tija i fulles

•  Dades quantitatives agrupades: histograma, polígon de freqüències no acumulades i polígon de freqüències acumulades

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Page 67: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Representació gràfica proporciona de forma ràpida i visual una idea aproximada de l’aspecte que s’estudia.

Auxiliars de la interpretació, i les conclusions s’haurien d’obtenir de l’estudi de la taula estadística

Representació gràfica en funció de la tipus de dades �  Quantitatives discretes o continues �  Qualitatives nominals o ordinals

�  Dades sense agrupar �  Dades agrupades

E. Motellón Estadística econòmica i empresarial I

2.2. Representació gràfica. Introducció

Page 68: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Dades quantitatives sense agrupar 1.  Sectors 2.  Barres 3.  Escala 4.  Diagrama de caixa (Box-Plot) 5.  Tall i fulles

•  Dades quantitatives agrupades 6.  Histograma 7.  Polígon de freqüències no acumulades 8.  Polígon de freqüències acumulades

2.2. Representació gràfica. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 69: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Nota: Adequat per variable qualitatives nominals

Cercle apareix dividit en sectors de manera que els angles i, per tant, les àrees respectives siguin proporcionals a les freqüències (absolutes o relatives)

0

12

3

4Patents registrades

Gràfic amb freqüències absolutes

= Gràfic amb freqüencies relatives

2.2. Representació gràfica. Dades quantitatives sense agrupar

1. Gràfic de sectors

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

E. Motellón Estadística econòmica i empresarial I

Page 70: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o relativa). Buit entre barres per indicar els valors que no són possibles

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

2. Gràfic de barres

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1 0

1

2

3

4

5

6

0 1 2 3 4

Gràfic de barres amb freqüències absolutes

Nota: Adequat per variable qualitatives E. Motellón Estadística econòmica i empresarial I

Page 71: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4

Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o relativa). Buit entre barres per indicar els valors que no són possibles

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

2. Gràfic de barres

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic de barres amb freqüències relatives

Nota: Adequat per variable qualitatives E. Motellón Estadística econòmica i empresarial I

Page 72: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Representació de les freqüències acumulades. Pren forma d’una escala integrada per graons que pugen des del nivell zero de les freqüències fins al màxim (N per absolutes i 1 per relatives).

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

3. Gràfic d’escala

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic d’escala amb freqüències absolutes acumulades

0

4

8

12

16

20

0 1 2 3 4 Nota: Adequat per variable qualitatives ordinals

E. Motellón Estadística econòmica i empresarial I

Page 73: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Representació de les freqüències acumulades. Pren forma d’una escala integrada per graons que pugen des del nivell zero de les freqüències fins al màxim (N per absolutes i 1 per relatives).

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

3. Gràfic d’escala

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic d’escala amb freqüències relatives acumulades

Nota: Adequat per variable qualitatives ordinals 0.00

0.20

0.40

0.60

0.80

1.00

0 1 2 3 4

E. Motellón Estadística econòmica i empresarial I

Page 74: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Sintetitza en un gràfic diverses mesures estadístiques

4. Diagrama de caixa (Box-Plot)

EDAD

20,00

40,00

60,00

80,00

Mediana = Q2(0,5)

Valors atípics (outliers)

1,5RI

1,5RI

Valor màxim no atípic

RI =Q3-Q1

Valor mínim no atípic

2.2. Representació gràfica. Dades quantitatives sense agrupar

Q3(0,75)

Q1(0,25)

E. Motellón Estadística econòmica i empresarial I

Page 75: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

4. Diagrama de caixa (Box-Plot)

2.2. Representació gràfica. Dades quantitatives sense agrupar

Simetria Asimetria dreta

Asimetria esquerra

E. Motellón Estadística econòmica i empresarial I

Page 76: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

5. Gràfic tall i fulles

2.2. Representació gràfica. Dades quantitatives sense agrupar

Procediment semi-gràfic + útil quan la mostra no és molt gran. Avantatge: - arbitrari que histograma i + senzill de construir

E. Motellón Estadística econòmica i empresarial I

Page 77: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

5. Gràfic tall i fulles

2.2. Representació gràfica. Dades quantitatives sense agrupar

Procediment semi-gràfic + útil quan la mostra no és molt gran. Avantatge: - arbitrari que histograma i + senzill de construir

1 10 8 31 10 9 31 10 9 31 10 9 3

Tall Valor Tall FullesCasos per

fulles18 18 1819 19 1919 19 1919 19 19

E. Motellón Estadística econòmica i empresarial I

Page 78: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

6. Histograma

Conjunt de rectangles juxtaposats amb les següents característiques:

• Eix horitzontal escala adequada i uniforme

• Punt central de base = marca de classe

• Amplada rectangle = amplada interval

• Àrea proporcional a ni de classe

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular l’alçada (hi) pq les superfícies coincideixin amb les freqüències.

2.2. Representació gràfica. Dades quantitatives agrupades

0

2

4

6

8

10

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Histograma de la despesa en innovació (ni)

E. Motellón Estadística econòmica i empresarial I

Page 79: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

6. Histograma

Conjunt de rectangles juxtaposats amb les següents característiques:

• Eix horitzontal escala adequada i uniforme

• Punt central de base = marca de classe

• Amplada rectangle = amplada interval

• Àrea proporcional a ni de classe

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular l’alçada (hi) pq les superfícies coincideixin amb les freqüències.

2.2. Representació gràfica. Dades quantitatives agrupades

Histograma de la despesa en innovació (fi)

0

0.1

0.2

0.3

0.4

0.5

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Page 80: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0

1

2

3

4

5

6

7

8

9

10

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de l’interval) situats a la part superior del rectangles de d'histograma (freqüències absolutes)

7. Polígon de freqüències no acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències absolutes de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

Page 81: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Unint els punts mitjos (marca de classe de l’interval) situats a la part superior del rectangles de d'histograma (freqüències relatives)

7. Polígon de freqüències no acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències absolutes de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Page 82: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0

2

4

6

8

10

12

14

16

18

20

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència absoluta acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

Page 83: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0

2

4

6

8

10

12

14

16

18

20

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència absoluta acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

Page 84: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència relativa acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Page 85: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència relativa acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Page 86: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Tema 2.3. Mesures de síntesi •  Mesures de posició o localització •  Mesures de dispersió absolutes i relatives

•  Mesures de forma •  Concentració versus Equidistribució

•  Transformacions lineals

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Page 87: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  La utilització d’estadístics (valors numèrics que calculem a partir de les dades, si és possible abans d’agrupar-les) permet evitar alguna de les arbitrarietats de taules i gràfics.

•  Normalment es treballa amb diferents estadístics que recullen característiques d’interès dels fenòmens analitzats.

•  Per exemple, estadístics de: –  posició: central i localització –  dispersió: absoluta i relativa –  forma (simetria i curtosi) i concentració

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 88: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Estadístic, mesura d’interès q serà operativa si compleix tres condicions: 1.  En la seva determinació intervenen tots el valors de X

2.  Sempre calculable 3.  Única per cada distribució de freqüències

•  Mesures referides a la mostra: contrastar-les i inferir-les a la població

E. Motellón Estadística econòmica i empresarial I

2.3. Mesures de síntesi. Introducció

Page 89: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 90: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Mesures de tendència central •  Mitjana aritmètica, mediana i moda •  Relació entre mitjana aritmètica, mediana i moda

•  Mesures de tendència no central •  Quartils •  Decils •  Percentils

•  Moments

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició o localització

Page 91: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda Mitjana geomètrica Mitjana harmònica Mitjana quadràtica

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 92: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

x =xini

i=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica

Page 93: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

X ni fi 0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

N=20

E. Motellón Estadística econòmica i empresarial I

Page 94: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (I)

1.  La suma de les desviacions de totes les observacions de la variable respecte a la mitjana és 0

R  Pq mitjana és el veritable valor central de la distribució: centre de gravetat i punt

d’equilibri de la distribució

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

(xi − x ) =i=1

N

∑ xi − x =i=1

N

∑i=1

N

∑ xi − Ni=1

N

∑ x = xi − Ni=1

N

∑xi

i=1

N

∑N

= xi − xi = 0i=1

N

∑i=1

N

Page 95: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

X ni fi 0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

N=20

E. Motellón Estadística econòmica i empresarial I

Propietat 1

Page 96: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (I)

1.  La suma de les desviacions de totes les observacions de la variable respecte a la mitjana és 0

2.  L’expressió matemàtica que representa la mitjana aritmètica coincideix amb el moment ordinari (o respecte l’origen) de 1r ordre “a1”

xa =1

(xi − x ) =i=1

N

∑ xi − x =i=1

N

∑i=1

N

∑ xi − Ni=1

N

∑ x = xi − Ni=1

N

∑xi

i=1

N

∑N

= xi − xi = 0i=1

N

∑i=1

N

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

Page 97: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X ni a=2 b=4

0 5 2 4

1 5 3 5

2 4 4 6

3 3 5 7

4 3 6 8

N=20

Propietat 2

Page 98: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (II) 3.  La mitjana aritmètica queda afectada pels canvis d’origen. Si a tots els valors que

pren una variable li sumem (restem) una constant a, la mitjana aritmètica queda augmentada (disminuïda) en aquesta constant

!xi = xi + a

!x =!xi

i=1

N

∑N

=xi + a( )

i=1

N

∑N

=xi + a

i=1

N

∑i=1

N

∑N

=xi

i=1

N

∑N

+a

i=1

N

∑N

=

=xi

i=1

N

∑N

+N ⋅aN

= x + a

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 99: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X ni a=2 b=4

0 5 2 4

1 5 3 5

2 4 4 6

3 3 5 7

4 3 6 8

N=20

Propietat 3

Page 100: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (III) 4.  La mitjana aritmètica queda afectada pels canvis d’escala. Si a tots els valors que

pren una variable li vam multipliquem (dividim) una constant a, la mitjana aritmètica queda multiplicada (dividida) en aquesta constant

2.3.1 Mesures de posició central. Mitjana aritmètica

E. Motellón Estadística econòmica i empresarial I

!xi = axi

!x =!xi

i=1

N

∑N

=axi( )

i=1

N

∑N

=a xii=1

N

∑N

= ax

x =xini

i=1

k

∑N

= xi fii=1

K

Page 101: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (IV) 5.  En base a les propietats 3 i 4:

si

i definim: , llavors baxx ii +=ʹ

N

nx

xx

N

iii

i

∑==→ 1

x = axi + b

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 102: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (V) 6.  Si una variable pren sempre el mateix valor, la mitjana aritmètica serà igual a aquest

valor constant

X = edat = 20;20;20;20;20N = 5Llavors :

x =xi

i=1

N

∑N

=20+ 20+ 20+ 20+ 20

5= 20

x =xini

i=1

K

∑N

=20 ⋅55

= 20

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 103: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (VI) 7.  Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal

que , dels quals es coneix la seva corresponent mitjana aritmètica. La mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

NN...NNdondeN

xN...xNxNx ZBAZZBBAA =+++

+++=

Ni = N∑

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 104: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

Propietat 7 X ni

0 5

1 5

2 4

3 3

4 3

N=20

XA nj

0 5

1 5

2 4

NA=14

XB nl

3 3

4 3

NB=6

Page 105: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (VI) 7.  Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal

que , dels quals es coneix la seva corresponent mitjana aritmètica. La mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

NN...NNdondeN

xN...xNxNx ZBAZZBBAA =+++

+++=

x =xini

i=1

k

∑N

=(x1n1)+...+ (x jnj )"# $%+ (x j+1nj+1)+...+ (xknk )"# $%

N

NNN BA =+Demostració:

Ni = N∑

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 106: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats (VII) 8.  La mitjana aritmètica d’una suma és la suma de mitjanes aritmètiques.

9.  La mitjana aritmètica és la quantitat que fa mínima la suma del quadrat de les desviacions respecte a un valor

z =zini

i=1

k

∑N

=xi + yi( )ni

i=1

k

∑N

=xini

i=1

k

∑N

+yini

i=1

k

∑N

= x + y

(xi − a)2 és mínim si a = x

i=1

k

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 107: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Propietats mitjana

Heu contractat una empresa per realitzar una campanya de publicitat. L'empresa contractada us dóna un pressupost on s'especifica que el salari mensual d'un publicista novell és de 850€ i el salari d'un publicista qualificat de 1350€. Al final del projecte l’empresa de publicitat ha pagat un salari mitjà de 966.07 €. Quants publicistes novells han emprat en la vostra campanya i quants publicistes qualificats han participat en ella?

E. Motellón Estadística econòmica i empresarial I

Page 108: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Avantatges •  Considera tots els valors de la variable •  És una mesura calculable tant en escales d'interval com de raó •  Pren sempre un valor únic •  Representa el centre de gravetat de la distribució •  Sol ser la mesura de posició central més adequada per a

distribucions en escala d'intervals o de proporcions

Inconvenients •  Es veu afectada pels valors extrems que poden distorsionar el seu

valor fent-ho poc representatiu

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Page 109: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: mitjana i valors extrems

Es disposa del W mensual del 9 treballadors en dos centres de treball. Calcula la mitjana aritmètica i comenta els seus resulta

E. Motellón Estadística econòmica i empresarial I

1 2 3 4 5 6 7 8 9 X 600 900 1200 850 2100 600 2300 790 4800

Y 600 900 1200 850 2100 600 2300 790 1900

Page 110: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

=

=

=

= == K

ii

k

iiii

N

ii

N

iii

w

nwx

w

wx

x

1

1

1

1

2.3.1 Mesures de posició central. Mitjana aritmètica ponderada

E. Motellón Estadística econòmica i empresarial I

Page 111: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Mitjana ponderada

En procés de selecció d'una empresa es fan quatre proves puntuades del 0 a 10 cadascuna d'elles. Si un aspirant ha obtingut un 9 a la Prova1, un 6 a la Prova2, a 8 en la Prova3 i a la Prova4 un 6.

1.  Quin és la nota mitjana de l'aspirant? 2.  Si la prova 2 i 3 puntuen el doble que la resta i la quarta el triple.

Canvia la nota mitjana?

1) La nota mitjana de l’aspirant és 7.25 punts 2) La incorporació de les ponderacions a les diferents proves suposa una

modificació de la seva nota mitjana que ara és de 6.87 punts

E. Motellón Estadística econòmica i empresarial I

Nota 9 6 8 6

Pes (w) 1 2 2 3

Page 112: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 113: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Valor que ocupa el centre de la distribució. Valor tal q, ordenades les dades de forma creixent o decreixent, deixa per damunt i per sota el mateix nombre d'observacions. Me té associada una Ni = N/2 Dades tipus I •  N senar, valor de la variable que ocupa posició (N+1)/2:

•  N par, mitjana aritmètica de dos valors centrals:

Dades Tipus II: primer valor de la variable que ocupa el lloc Ni ≥ N/2

Dades Tipus III: detectar el interval medià (acumula la freqüència N/2)

Me = Li−1 +

N2− Ni−1

ni·ai

Me =xN /2 + x(N /2)+1

2

Me = x(N+1)/2

2.3.1 Mesures de posició central. Mediana

E. Motellón Estadística econòmica i empresarial I

Page 114: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats: 1. Fa mínima la suma de totes les desviacions absolutes

2. No l’afecta l'existència de valors extrems/atípics (era la gran inconveniència de la mitjana aritmètica)

3. Es pot calcular (té sentit) per dades qualitatives ordinals

⟶ Mitjana aritmètica i mediana diferiran molt quan les distribucions siguin molt asimètriques (suggereix q dades són heterogènies)

x i−ki=1

N

∑ mínima si k = Me

2.3.1 Mesures de posició central. Mediana

E. Motellón Estadística econòmica i empresarial I

Page 115: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 116: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Valor de la variable amb major freqüència (absoluta o relativa). Aquell q més vegades és repeteix. Al diagrama de barres, la barra amb més alçada.

Casos particulars: Distribucions sense moda, bimodals, trimodals o, amb caràcter general, multimodals

Avantatges: Donat q per calcular-la no requereix l'ordenació de la variable, és la mesura de posició més representativa (i única) de les variables qualitatives nominals

Inconvenients: •  En el seu càlcul no intervenen totes les observacions de la variable •  La dificultat de obtenir-la en variables continues.

Mo ≈ 3Me− 2x

2.3.1 Mesures de posició central. Moda

E. Motellón Estadística econòmica i empresarial I

Page 117: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Tres mesures de posició (tendència central) que persegueixen sintetitzar la informació que disposem (observacions) en un únic valor

2.  No tenen perquè coincidir

3.  Proporcionen informació complementaria, no substitutives

4.  En f(relació entre elles) podem analitzar la simetria de la distribució

x =Me =Mo→ Distribució simètrica

Mo <Me < x→ Distribució asimètrica a la dreta ( positiva)

Mo >Me > x→ Distribució asimètrica a l 'esquerra (negativa)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Page 118: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

El valor que més es repeteix (Moda), també deixa el 50% d'observacions a cada costat (Mediana) i és el centre de gravetat de la distribució (Mitjana aritmètica)

x = Me = Mo→ Distribució simètrica

ni

Xi

ni + elevada

x50% observacions 50% observacions

Centre de gravetat

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Page 119: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

La Mitjana aritmètica i la Mediana estan a la dreta de la Moda, llavors la distribució presenta asimetria a la dreta o positiva

ni

Xi Me50% observacions 50% observacions

Centre de gravetat

ni + elevada

xMo

Mo < Me < x → Distribució asimètrica a la dreta (positiva)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Page 120: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

La Mitjana aritmètica i la Mediana estan a l’ esquerra de la Moda, llavors la distribució presenta asimetria a l’esquerra o negativa

ni

Xi Me

50% observacions 50% observacions

Centre de gravetat

ni + elevada

x Mo

Mo > Me > x → Distribució asimètrica a l 'esquerra (negativa)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Page 121: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

ni

X xMe

MoMo

Per a corbes de freqüències unimodals lleugerament asimètriques, es té la següent relació empírica entre la mitjana, la mediana i la moda:

(Mitjana-Moda)=3(Mitjana-Mediana)

Inconvenients (exemple)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Page 122: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de posició. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 123: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Són els quantils que són valors de la variable que divideixen la distribució en parts amb igual nombre d’observacions.

En f(percentatge en la partició) els quantils més utilitzats són: •  Quartils •  Decils •  Percentils

Nota: ordenar el conjunt de dades

2.3.1 Mesures de posició no central. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 124: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Els 3 valors de la variable (Q1,Q2,Q3) que permeten dividir la distribució en 4 parts iguals (contenen el 25% dels valors de la distribució)

•  Q1 ocupa el lloc N/4

•  Q2 ocupa el lloc 2N/4 (mediana=N/2)

•  Q3 ocupa el lloc 3N/4

Valor q el 25% de les dades són anteriors a ell i el 75% són posteriors

Valor q el 75% de les dades són anteriors a ell i el 25% són posteriors

2.3.1 Mesures de posició no central. Cuartils

E. Motellón Estadística econòmica i empresarial I

Page 125: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Són els 9 valors de la variable que divideixen la distribució en 10 parts iguals (contenen el 10% dels valors de la distribució)

•  D1 ocupa el lloc N/10

•  D2 ocupa el lloc 2N/10

•  ..........

•  D9 ocupa el lloc 9N/10

Valor q el 20% de les dades són anteriors a ell i el 80% són posteriors

2.3.1 Mesures de posició no central. Decils

E. Motellón Estadística econòmica i empresarial I

Page 126: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Són els 99 valors de la distribució que divideixen la distribució en 100 parts iguals (contenen el 1% dels valors de la distribució)

•  P1 ocupa el lloc N/100

•  P2 ocupa el lloc 2N/100

•  ..........

•  P99 ocupa el lloc 99N/100

Valor q el 1% de les dades són anteriors a ell i el 99% són posteriors

Valor q el 99% de les dades són anteriors a ell i el 1% són posteriors

2.3.1 Mesures de posició no central. Percentils

E. Motellón Estadística econòmica i empresarial I

Page 127: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Moments (I)

•  Valors que caracteritzen totalment a una distribució

•  2 distribucions són iguals si tenen tots els seus moments igual

•  Es calculen com a potencies successives de la variable observada

•  Expressió general:

•  Dos tipus:

–  Respecte al origen (ordinaris)

–  Respecte a la mitjana aritmètica (centrals)

N

nOxM

k

ii

rti

r

∑=

⋅−= 1

)(

Sent: xi: valors de la variable Ot: origen arbitrari r: ordre del moment (0,1,2,3,...) ni: freqüència absoluta de xi N: Total d’observacions

E. Motellón Estadística econòmica i empresarial I

Page 128: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Respecte al origen (ar)à Origen (Ot) = 0

...2,1,0)(

11 =∀⋅

=⋅−

=∑∑== rN

nx

N

nOxa

k

ii

ri

k

ii

rti

r

111

0

0 ===⋅

=∑∑==

NN

N

n

N

nxa

k

ii

k

iii

xN

nx

N

nxa

k

iii

k

iii

=⋅

=⋅

=∑∑== 11

1

1

N

nxa

k

iii∑

=

⋅= 1

2

2

El moment ordinari (a1), o respecte al origen, d’ordre 0 és sempre la mitjana aritmètica

El moment ordinari (a0), o respecte al origen, d’ordre 0 és sempre 1

Moments (II)

E. Motellón Estadística econòmica i empresarial I

Page 129: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Respecte a la (mr)à Origen (Ot) =

( )...2,1,0

)(11 =∀

⋅−=

⋅−=

∑∑== r

N

nxx

N

nOxm

k

ii

rii

k

ii

rti

r

( )111

0

0 ===⋅−

=∑∑==

NN

N

n

N

nxxm

k

ii

k

iiii

m1 =xi − x( )1 ⋅ni

i=1

k

∑N

=xi − x( ) ⋅ni

i=1

k

∑N

= 0 El moment central (m1), o respecte a la mitjana, de ordre 1 és sempre 0

El moment central (m0), o respecte a la mitjana, de ordre 0 és sempre 1

x x

m2 =xi − x( )2 ⋅ni

i=1

k

∑N

Aquesta és l'expressió de la variància (estadístic de dispersió)

Moments (II)

E. Motellón Estadística econòmica i empresarial I

Page 130: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

m1 =xi − x( )1 ⋅ni

i=1

k

∑N

=xi − x( ) ⋅ni

i=1

k

∑N

= 0

1.  Propietat de la mitjana: suma de les desviacions dels valors de la variable respecte a la mitjana es sempre 0

2.  d

xi − x( ) = 0i=1

N

∑ → xi − x( )ni = 0i=1

k

∑ →m1 =0N= 0

xi − x( )nii=1

k

∑N

=xini

i=1

k

∑N

−xni

i=1

k

∑N

=xini

i=1

k

∑N

− xni

i=1

k

∑N

= x − x = 0

Demostració

E. Motellón Estadística econòmica i empresarial I

Page 131: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats 1.  Tots els moments d’ordre 0 (ordinaris i centrals) són igual a la unitat

2.  Tots els moments centrals (mr) es poden expressar en funció dels moments ordinaris o respecte l'origen

mr = ir⎛

⎝⎜⎞

⎠⎟

i=0

r

∑ a1i ar−i (−1)

i

m0 =1 / a0 =1M0 =1

Exemple

Moments (IV)

E. Motellón Estadística econòmica i empresarial I

Page 132: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

núm. combinatori “r sobre i”

Recordatori:

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

Page 133: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

Page 134: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

Page 135: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Mesures de dispersió absoluta •  Recorregut o rang, recorregut inerquartílic, variància, desviació

típica o estàndard

•  Mesures de dispersió relativa •  Coeficient de variació de Pearson

E. Motellón Estadística econòmica i empresarial I

2.3.2 Mesures de dispersió

Page 136: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 137: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 138: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Fins a quin punt són representatius els estadístics de tendència central? ⟶ Dades + agrupades (- dispersió)⇒ + representativa

DISPERSIÓ (variabilitat): •  Major o menor separació dels valors de la variable respecte a un

altre que sigui la seva síntesi

•  no suficient: necessitem saber si es representativa de la distribució

x

x

Mesures de dispersió (estadístics q quantifiquen el grau de dispersió

de X entorn de la seva tendència central)

2.3.2 Mesures de dispersió. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 139: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Mesures de dispersió ABSOLUTES (unitats de mesures) •  Recorregut (rang): màxim-mínim •  Rang interquartilic: tercer quartil (Q3) – primer quartil (Q1) •  Variància •  Desviació estàndard •  etc.

2.  Mesures de dispersió RELATIVES (indicadors adimensionals) •  Coeficient de variació •  etc.

2.3.2 Mesures de dispersió. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 140: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 141: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Diferència entre el valor màxim i mínim de la variable Dades tipus III (agrupades):

Avantatge: •  La forma més senzilla d’indicar la dispersió

Inconvenients: •  Molt simple, només utilitza dos valors de la variable •  Molt sensible als valors extrems (outliers) •  Només recomanable si els valors és distribueixen uniformement

Re = Max xi −Min xi i =1,...,n

Re = Lk − L0

2.3.2 Mesures de dispersió. Recorregut o rang (Re)

E. Motellón Estadística econòmica i empresarial I

Page 142: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Diferència entre el primer quartil (Q1) i el tercer quartil (Q3) Quant menor és el recorregut interquartílic, menor dispersió presenta la variable

Indica q en un interval de longitud RI estan compreses el 50% de les observacions centrals (+ representatiu q Re pq no està afectat per la presencia de valors extrems)

13 QQRI −=

2.3.2 Mesures de dispersió. Rang interquartílic (RI)

E. Motellón Estadística econòmica i empresarial I

Page 143: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 144: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Mesura l'error que cometem en triar a la mitjana aritmètica com valor representatiu de la distribució

•  Mesura el grau de variabilitat de les dades de la distribució d’una variable quantitativa respecte a la mitjana aritmètica

•  ∆ valor ⇒ ∇ pèrdua de representativitat de la (valors + allunyats d’aquesta mesura de posició central)

N

nxxS

k

iii∑

=

−= 1

2

2)(

x

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Page 145: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Formes alternatives d'expressar-la:

1. 

2. 

N

nxxS

k

iii∑

=

−= 1

2

2)(

S2 =(xi − x )

2

i=1

N

∑N

=(x

i

2 − 2xix + x2 )

i=1

N

∑N

=

=xi

2

i=1

N

∑N

− 2xxi

i=1

N

∑N

+x 2

i=1

N

∑N

=xi

2

i=1

N

∑N

− 2xx + Nx2

N=

=xi

2

i=1

N

∑N

− x 2 =xi

2 − Nx 2i=1

N

∑N

∑∑∑

=

== −=−=−

=k

iii

k

ii

k

iii

fxxxN

nx

N

nxxS

i

1

221

2

1

2

2 )()(

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Page 146: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Característiques: 1.  Mesura de la variabilitat o dispersió de les dades

d’una variable respecte a la mitjana aritmètica

2.  Coincideix amb el moment central de 2n ordre (m2)

3.  Si xi=k ∀1=1,2,...,k , llavors S2=0 4.  S2≥0

5.  No li afecten els canvis d'origen

N

nxxS

k

iii∑

=

−= 1

2

2)(

22

22

2

ii

ii

i

xxii

xxii

xi

SSkxx

SSkxx

Sx

=→−=ʹ́

=→+=ʹ

ʹ́

ʹSi a tots els valors de la variable els sumem (restem) una constant

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Page 147: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietat 5 de S2. No li afecten els canvis d'origen

Demostració

E. Motellón Estadística econòmica i empresarial I

Page 148: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Característiques: 1.  Mesura de la variabilitat o dispersió de les dades

d’una variable respecte a la mitjana aritmètica

2.  Coincideix amb el moment central de 2n ordre (m2)

3.  Si xi=k ∀1=1,2,...,k , llavors S2=0 4.  S2≥0

5.  No li afecten els canvis d'origen

6.  Sí li afecten els canvis d'escala

N

nxxS

k

iii∑

=

−= 1

2

2)(

22

22

2

ii

ii

i

xxii

xxii

xi

SSkxx

SSkxx

Sx

=→−=ʹ́

=→+=ʹ

ʹ́

ʹ

2

22

222

2

kS

Skxx

kSSkxx

Sx

i

i

ii

i

xx

ii

xxii

xi

=→=ʹ́

⋅=→⋅=ʹ

ʹ́

ʹSi a tots els valors de la variable els multipliquem (dividim) per una constant

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Page 149: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietat 6 de S2. Sí li afecten els canvis d’escala

Demostració

E. Motellón Estadística econòmica i empresarial I

Page 150: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Inconvenients:

•  Donat q utilitza les desviacions al quadrat , la seva unitat de mesura és la de la variable original al quadrat.

•  Dificulta la seva interpretació

Solució: DESVIACIÓ ESTÀNDARD

N

nxxS

k

iii∑

=

−= 1

2

2)(2.3.2 Mesures de dispersió.

Variància (S2)

2)( xxi −

N

nxxSS

k

iii∑

=

−+=+= 1

2

2)(

u.m. X = u.m. x = u.m. S

E. Motellón Estadística econòmica i empresarial I

Page 151: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Característiques: 1.  No pot ser negativa:

2.  Igual que la variància, el valor més petit que pot prendre és 0

3.  Igual que la variància, també es pot obtenir a partir dels moments ordinaris

4.  No li afecten els canvis d’origen 5.  Sí li afecten els canvis d’escala

N

nxxS

k

iii∑

=

−= 1

2)(

02 ≥+= xx SS

2122 aamS −==

kS

kS

SkS

Skxx

kSkSSkSSkxx

SSSx

ii

i

i

i

iiiii

iii

xxx

xx

ii

xxxxxii

xxxi

==→=→=ʹ́

=⋅=→⋅=→⋅=ʹ

=→→

ʹ́ʹ́

ʹʹ

2

2

2

22

22222

22

2.3.2 Mesures de dispersió. Desviació Estàndard (S)

E. Motellón Estadística econòmica i empresarial I

Page 152: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 153: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Quocient entre la desviació estàndard i la mitjana aritmètica

•  Habitualment s’expressa en %

interpretació: variació del x% respecte a la mitjana

CV =Sx

CV =Sx·100

2.3.2 Mesures de dispersió. Coeficient de variació de Pearson (CV)

E. Motellón Estadística econòmica i empresarial I

Page 154: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Propietats: 1.  És una mesura adimensional 2.  Representa en nre. de vegades que la S conté la 3.  Mesura q utilitza tota la ! de la variable 4.  Cota inferior és 0 (màxima representativitat de la mitjana) 5.  Quan no és significatiu 6.  Sí li afecten els canvis d’origen 7.  No li afecten els canvis d’escala

x

0=x

2.3.2 Mesures de dispersió. Coeficient de variació de Pearson (CV)

CV =Sx

E. Motellón Estadística econòmica i empresarial I

Page 155: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

•  Asimetria – Simetria •  Coeficient de Fisher •  Coeficient de Pearson

•  Apuntament – curtosis •  Coeficient de curtosis

2.3.3 Mesures de forma

E. Motellón Estadística econòmica i empresarial I

Page 156: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficients de Fisher

Coeficient de curtosis

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 157: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Mesuren grau de simetria o d’asimetria d’una distribució sense representar-la gràficament

Simetria Hi ha un nombre igual de valors a ambdós costats d’un eix perpendicular que la divideix.

2.3.3 Mesures de forma. Mesures d’asimetria

E. Motellón Estadística econòmica i empresarial I

Page 158: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Indicador adimensional per distribucions unimodals i campaniformes

•  Si Ap= 0 Distribució simètrica •  Si Ap> 0 Distribució asimètrica positiva (esbiaixada a la dreta) •  Si Ap< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)

ü Relació empírica entre Mitjana, Mediana i Moda:

Ap =x −MoS

Ap =3 x −Me( )

S

x −Mo ≅ 3 x −Me( )

I si la distribució no és unimodal i campaniforme?

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Pearson

E. Motellón Estadística econòmica i empresarial I

Page 159: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Indicador adimensional aplicable a totes les distribucions estadístiques •  Si g1= 0 Distribució simètrica

•  Si g1> 0 Distribució asimètrica positiva (esbiaixada a la dreta)

•  Si g1< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)

Estadística econòmica i empresarial I

g1 =1S3·

xi − x( )3i=0

K

∑ ni

N= m3

S3

Mo = Me = x

Mo < Me < x

Mo > Me > x

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Fisher

E. Motellón

Page 160: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

g1 =1S3·

xi − x( )3i=0

K

∑ ni

N= m3

S3

g1 =1S3·

x13

i=0

K

∑ ni

N−

xii=0

K

∑ ni

x12

i=0

K

∑ ni

N+ 2

xii=0

K

∑ ni

N

⎜⎜⎜⎜

⎟⎟⎟⎟

3⎡

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

g1 =1S3· a3 − 3a1a2 + 2a1

3( )Estadística econòmica i empresarial I

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Fisher

E. Motellón

Page 161: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficients de Fisher

Coeficient de curtosis

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 162: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2.3.3 Mesures de forma. Mesures de curtosis (g2)

E. Motellón Estadística econòmica i empresarial I

Page 163: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Indicador adimensional que mesura les deformacions en sentit vertical (apuntament) respecte a la normal. •  Si g2= 0 Distribució mesocúrtica (normal) •  Si g2> 0 Distribució leptocúrtica (apuntada) •  Si g2< 0 Distribució platicúrtica (aplanada)

g2 =1S4·

xi − x( )4i=0

K

∑ ni

N− 3 = m4

S4− 3

xi − x( )4

i=0

K

∑ ni

N= 3·S 4

2.3.3 Mesures de forma. Mesures d’asimetria

E. Motellón Estadística econòmica i empresarial I

Page 164: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

2.3.4 Mesures de concentració

•  Concentració versus equidistribució •  Corba de Lorenz •  Índex de Gini

E. Motellón Estadística econòmica i empresarial I

Page 165: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Estadístics

Posició Dispersió Forma Concentració

Índex de Gini Corba de Lorenz

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Page 166: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

En estadística, CONCENTRACIÓ relacionada amb el grau d’igualtat o d’equitat en el repartiment d’una variable

Concentració NO com a antònim de dispersió

Molt rellevant en C. Socials •  Igualtat en distribució salaris, rendes, etc. •  Equitat en repartiments inversions, ajuts, etc.

X molt concentrada: pocs individus es queden amb la majoria del repartiment de la variable (renda, salaris, inversions, ajuts, etc.)

pi: com es reparteix la població en categories (= Fi) qi: com es reparteix la variable

2.3.4 Mesures de concentració. Introducció. Concentració vs Equidistribució

E. Motellón Estadística econòmica i empresarial I

Page 167: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Objectiu: mesurar el grau de repartiment del valor total d’una variable

Exemple: Disposem de la distribució W de N individus (ordenada)

Situacions extremes: 1.  Concentració màxima: 1 individu percep tota la massa salarial

2.  Concentració mínima: Tots els individus reben el mateix salari

nxxxxx ≤≤≤≤≤ ...4321

nxxxxx ===== ...4321

0014321 ≠====== − nn xx...xxxx

2.3.4 Mesures de concentració. Introducció. Concentració vs Equidistribució

E. Motellón Estadística econòmica i empresarial I

➞ equidistribució

Page 168: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

1.  Ordenar els valors (xi) de menor a major i calcular les Ni 2.  Calcular el total de la variable que rep el grup d’individus amb ni

ui=xi·ni

3.  Suma de tot el repartiment de la variable Uk (en exemple W seria la massa salarial)

4.  Dos opcions:

a.  Calcular el repartiment de la variable en termes acumulats: Ui = ui-1+ui

b.  Relativitzar la xifra de ui à si = ui/Uk 5.  Calcular pi: Freqüència relativa acumulada expressada en % (pi=(Ni/N)·100)

6.  Calcular qi: Proporció acumulada del valor total de la variable per als diferents grups, expressada en %

1)  qi = Ui/Uk

2)  qi = si-1+si

Ui= Salari acumulat del grup i-èsim Uk= Total massa salarial

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

Page 169: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

xi ni Ni ui=xi·ni Ui= ui+ui-1 pi=(Ni/N)·100 qi=(Ui/U)·100

18700 21 21 392700 392700 14.00 6.84

20400 25 46 510000 902700 30.67 15.73

28000 30 76 840000 1742700 50.67 30.37

32500 17 93 552500 2295200 62.00 40.00

45000 15 108 675000 2970200 72.00 51.76

50000 18 126 900000 3870200 84.00 67.45

62000 14 140 868000 4738200 93.33 82.57

100000 10 150 1000000 5738200 100.00 100.00

150 5738200 Com es reparteixen els treballadors en grups

(Fi)

Com es reparteixen els salaris

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

Page 170: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

xi ni Ni ui=xi·ni Ui= ui+Ui-1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

x1 n1 N1 u1=x1·n1 U1= u1 p1=(N1/N)·100 q1=(U1/Uk)·100

x2 n2 N2 u2=x2·n2 U2= u2+u1 p2=(N2/N)·100 q2=(U2/Uk)·100

… … … … … … …

… … … … … … …

xi ni Ni ui=xi·ni Ui= ui+ui-1+…+u1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

… … … … … … …

… … … … … … …

xk nk Nk uk=xk·nk Uk= uk+uk-1+…+u1 100 100

pk=(Nk/N)·100 qk=(Uk/Uk)·100

2.3.4 Mesures de concentració. Càlcul de pi i qi

Estadística econòmica i empresarial I E. Motellón

Page 171: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

xi ni ui=xi·ni si=(ui/Uk)·100 Ui= ui+Ui-1 qi=(Ui/U)·100 qi=qi-1+si

18700 21 392700 6.84 392700 6.84 6.84

20400 25 510000 8.89 902700 15.73 15.73

28000 30 840000 14.64 1742700 30.37 30.37

32500 17 552500 9.63 2295200 40.00 40.00

45000 15 675000 11.76 2970200 51.76 51.76

50000 18 900000 15.68 3870200 67.45 67.45

62000 14 868000 15.13 4738200 82.57 82.57

100000 10 1000000 17.43 5738200 100.00 100.00

150 5738200

Amb l’opció b) dels punts 4 i 6

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

Page 172: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Representació gràfica del repartiment de la variable. Compara pi (com es reparteix la població) amb qi (com es reparteix la variable)

Procés:

1.  Dibuixem quadre (costats dividits en una escala que va del 0 al 100)

2. Costat inferior eix d’ordenades (vertical): valors de qi

3. Costat esquerre eix d’abscisses (horitzontal): valors de pi

4. Projectar, en aquest eixos, punts formats per les coordenades que marquen els punts de concentració: pi i qi

5. Unim punts formant una corba poligonal (corba de Lorenz)

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

Page 173: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

pi qi 14.00 6.84 30.67 15.73 50.67 30.37 62.00 40.00 72.00 51.76 84.00 67.45 93.33 82.57

100.00 100.00 0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

Page 174: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

pi qi 14 0 30 0 50 0 62 0 72 0 84 0 90 0 93 0 95 0 96 0 97 0 98 0 99 100

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

Page 175: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

pi qi 14.00 14.00 30.67 30.67 50.67 50.67 62.00 62.00 72.00 72.00 84.00 84.00 93.33 93.33

100.00 100.00 0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

Page 176: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

1.  Corba situada necessàriament per sota de la bisectriu (recta ), atès q la distribució està ordenada de menor a major

2.  Per ordenació de menor a major, la corba tindrà sempre una tendència creixent, partint del punt de l’origen (0,0) fins arribar al màxim (100,100)

3.  Corba de concentració mínima (equidistribució) coincideix amb la bisectriu , donat que qi = pi

4.  La corba de concentració màxima formada pels costats del quadre

5.  + a prop corba de Lorenz de la bisectriu à + equitativa (- concentració)

2.3.4 Mesures de concentració. Corba de Lorenz

OB

nxxxxx ≤≤≤≤≤ ...4321

⇒ Sempre s’ha de complir que qi ≤ pi

OBABOA

OB

O A

B

corba q representa distribució + equitativa (- concentració)

E. Motellón Estadística econòmica i empresarial I

Page 177: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Expressió numèrica de l’anàlisi de concentració:

•  Índex de Gini pren valors compresos entre 0 i 1: 0 ≤ Ig ≤ 1

–  Ig = 0 ⇒ Concentració mínima (equidistribució) à qi = pi

–  Ig = 1 ⇒ Concentració màxima

•  Sí li afecten els canvis d’origen

•  No li afecten els canvis d’escala

nxxxxx ===== ...4321

%)100(0,1,...,2,1,00... 14321

=≠−=∀=

≠===== −

kki

nn

qqikiqxxxxxx

( )

∑−

=

=

−= 1

1

1

1k

ii

k

iii

p

qpIg

2.3.4 Mesures de concentració. Índex de Gini (Ig)

E. Motellón Estadística econòmica i empresarial I

Page 178: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Exemple: Índex de Gini xi ni Ni pi qi pi-qi

18700 21 21 14.00 6.84 7.16

20400 25 46 30.67 15.73 14.94

28000 30 76 50.67 30.37 20.30

32500 17 93 62.00 40.00 22.00

45000 15 108 72.00 51.76 20.24

50000 18 126 84.00 67.45 16.55

62000 14 140 93.33 82.57 10.76

100000 10 150 100.00 100.00 ---

150 67,406

1

1

=∑−

=

k

iip ( ) 94,111

1

1

=−∑−

=

k

iii qp

( )2753,0

67,40694,111

1

1

1

1 ==−

=

∑−

=

=k

ii

k

iii

g

p

qpI

E. Motellón Estadística econòmica i empresarial I

Page 179: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Ig proper a 0 ⇒ corba de Lorenz + a prop de diagonal (bisectriu)

Ig proper a 1 ⇒ corba de Lorenz + a lluny de diagonal

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

O A

B

O A

B

Ig < Ig

Major concentració (distribució + equitativa)

Ig = 0

Concentració mínima (equidistribució)

Ig = 1

Concentració màxima

2.3.4 Mesures de concentració. Corba de Lorenz i Índex de Gini

E. Motellón Estadística econòmica i empresarial I

Page 180: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

Ig= superfície OB / superfície OAB

E. Motellón Estadística econòmica i empresarial I

2.3.4 Mesures de concentració. Corba de Lorenz i Índex de Gini

Page 181: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Tema 2.4. Transformacions lineals

•  Canvis d’escala

•  Canvis d’origen

•  Estandarització i tipificació

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Page 182: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Situació: X analitzada experimenta algun tipus de transformació

Objectiu: Establir els valors dels estadístics de la variable transformada sense repetir tots els càlculs

Transformacions: •  Canvis d’origen. Si a tots els valors que pren una variable

li sumem (restem) una constant a

•  Canvis d’escala. Si a tots els valors que pren una variable els multipliquem (dividim) per una constant b

Xi + a = ʹXi

Xi ·b = ′′Xi

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

E. Motellón Estadística econòmica i empresarial I

Page 183: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Situació: X analitzada experimenta algun tipus de transformació

Objectiu: Establir els valors dels estadístics de la variable transformada sense repetir tots els càlculs

Transformacions: •  Canvis d’origen. Si a tots els valors que pren una variable

li sumem (restem) una constant a

•  Canvis d’escala. Si a tots els valors que pren una variable els multipliquem (dividim) per una constant b

Xi + a = ʹXi

Xi ·b = ′′Xi

E. Motellón Estadística econòmica i empresarial I

Afecten aquestes transformacions

als estadístics analitzats?

Com?

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Page 184: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Afecta No afecta

Canvis d’origen

Canvis d’escala

g

Kr

ICV

QMeMox /,,,

21

2

,,,,,

ggASSRR

p

xxeI

xxIe

Kr

SSRRQMeMox,,,

,,,2

/

g

p

IggA

CV

21,,

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Page 185: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Page 186: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Situació: Comparar valors de diferents variables que estan expressades en distintes u.m. o també les posicions relatives que ocupen determinats valors

Objectiu: Generar nova variable (Z), a partir dels valor de la variable (X), que presenti les següents característiques:

1.  2. 

Com?

z = 0SZ2 =1 , SZ =1

Zi =Xi − xSX

Variable estandaritzada, normalitzada, tipificada

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Page 187: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Resultat: �  Centrem les variables al mateix punt (= centre de gravetat)

i les dotem de la mateixa escala (desviació típica)

�  Valors tipificats: perden la unitat de la variable (Z adimensional)

Zi =Xi − xSX

Propietat: fer comparable individus q pertanyen a distintes distribucions (fins i tot expressades en ≠ u.m.)

2.4 Transformacions lineals. Estandarització o tipificació

E. Motellón Estadística econòmica i empresarial I

Page 188: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Dos graduats en economia en el mateix sector d’activitat.

-  Individu A guanya 30.000€ i treballa a l’Empresa T

-  Individu B guanya 35.000€ i treballa a l’Empresa P

En ambdues situacions WGraduat > WMitjà. Però, quin graduat ocupa una millor posició relativa dintre de la seva empresa?

Exemple estandarització o tipificació

Solució: En termes absoluts el graduat B guanya més que l’A, Però, en relació al conjunt dels empleats de cada ESA l'individu A ocupa millor posició

E. Motellón Estadística econòmica i empresarial I

Page 189: TEMA 2. Estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/Tema 2. Estadística descriptiva...Objectiu del Tema 2: “En aquest bloc temàtic es presenten

Com a RECORDATORI final ...

�  Aquest material s’utilitza com a guia per realitzar les sessions presencials a l’aula. NO són els apunts de l’assignatura.

�  Reviseu amb atenció el document “Conceptes bàsics 2” penjat al campus, en ell trobareu un major detall de la informació referida al tema 2 publicada al Pla docent (contingut, objectius, conceptes claus, bibliografia, etc.)

�  No oblideu ampliar els coneixements. Trobareu la bibliografia recomanada a la biblioteca de la Facultat, conjuntament amb un ampli ventall de manuals d’estadística també interessants.

E. Motellón Estadística econòmica i empresarial I