tema 2. estadística descriptiva unidimensionaldiposit.ub.edu/dspace/bitstream/2445/124391/1/tema 2....

Post on 28-Jan-2020

29 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

TEMA 2. Estadística descriptiva unidimensional

Material de suport docent de les sessions teòriques elaborat a partir de la bibliografia referenciada al Pla docent de l’assignatura

Estadística econòmica i empresarial I Grau d’Economia Facultat d’Economia i Empresa Universitat de Barcelona

Autora: Elisabet Motellón Corral Professora Associada Departament d’Econometria, Estadística i Economia Aplicada

Objectiu del Tema 2: “En aquest bloc temàtic es presenten les principals tècniques d’estadística descriptiva unidimensional que han de permetre a l’estudiant de saber tabular i construir una taula de freqüències a partir d’un conjunt de dades, conèixer les diferents mesures descriptives per sintetitzar la informació, i els avantatges i inconvenients de cadascuna, així com les diferents possibilitats de representació gràfica de les dades. Els conceptes clau d’aquest bloc són els següents: dades agrupades, dades sense agrupar, distribució de freqüències, taula de freqüències, freqüències absoluta, relativa, absoluta acumulada i relativa acumulada, interval, límit inferior, límit superior, marca de classe, amplada, alçada, estadístic, mesura de posició, moda, mediana, mitjana aritmètica, mitjana ponderada, quantils, quartils, decils, percentils, mesura de dispersió, recorregut o rang, recorregut interquartílic, variància, desviació típica o estàndard, coeficient de variació, gràfic de sectors, de barres, d’escala, de caixa («box plot»), de tija i fulles, histograma, mesura de forma, coeficient de simetria, coeficient d’apuntament, coeficient de curtosi, concentració, equidistribució, corba de Lorenz, índex de Gini, transformacions lineals, canvi d’origen, canvi d’escala, tipificació o estandardització”

Pla docent de l’assignatura E. Motellón Estadística econòmica i empresarial I

ÍNDEX 2.1. Tabulació

•  Presentació de les dades •  Ordenació de les dades i concepte de freqüència absoluta •  Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar •  Interval: límit inferior i superior, marca de classe, amplada, alçada •  Freqüència relativa •  Freqüència absoluta i relativa acumulades

2.2. Representació gràfica •  Dades qualitatives sense agrupar: diagrama de sectors, de barres, d’escala, de caixa

(box plot) i de tija i fulles •  Dades qualitatives agrupades: histograma, polígon de freqüències no acumulades i

polígon de freqüències acumulades

2.3. Mesures de síntesi •  Mesures de posició o localització •  Mesures de dispersió absolutes i relatives •  Concentració versus equidistribució

2.4. Transformacions lineals

E. Motellón Estadística econòmica i empresarial I

Tema 2.1. Tabulació

•  Presentació de les dades

•  Ordenació de les dades i concepte de freqüència absoluta

•  Taula de freqüències amb dades agrupades en intervals i amb dades sense agrupar

•  Interval: límit inferior i superior, marca de classe, amplada, alçada

•  Freqüència relativa

•  Freqüència absoluta i relativa acumulades

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Taula de freqüències

Ordenació, classificació i agrupació de sèries estadístiques Objectiu:

Facilitar la interpretació i l’anàlisi de les dades obtingudes pel mesurament o observació de variable o atribut

Construcció de distribució de freqüències

Primera fase del descriptiu, desprès de l’obtenció de dades (2a etapa de l’anàlisi estadístic)

E. Motellón Estadística econòmica i empresarial I

Variable: Gènere → 2 valors (modalitats): H = Home D = Dona

D H H D D H D D D H H H H H D D D D D D

Gènere Freqüència

Absoluta (nre.) Relativa (%)

Home 4 4/10=0,4=40%

Dona 6 6/10=0,6=60%

Mida mostra 10

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades desordenades i ordenades

Mostra

Equival

En funció(≠ valors q pot prendre variable i nre. d'observacions) X (variable) ; xi (observació) ; N (nre. total d’observacions)

Tipus I: reduït nombre d’observacions amb valors tots diferents x1, x2, …, xN-1, xN

Tipus II: nombre elevat d’observacions amb nre. reduït de valors. Treballarem amb dades individuals (nivell educatiu dels ocupats)

x1, x2, …, xk on k<N

Tipus III: nombre elevat d’observacions i de valors. Treballarem amb dades agrupades (salari dels ocupats)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

OBSERVACIONS

POQUES MOLTES

VALO

RS POCS Dades individuals Dades individuals

MOLTS (sense sentit) Dades agrupades

Habitualment variables discretes

variables discretes o continues

Tipo I Tipo II

Tipo III

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

OBSERVACIONS

POQUES MOLTES

VALO

RS POCS Dades individuals Dades individuals

MOLTS (sense sentit) Dades agrupades

Construcció de taula de freqüències formalment diferent, encara que la metodologia és la mateixa

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Tipus de taules de freqüències

�  Freqüència Absoluta (ni)

�  Freqüència Relativa (fi)

�  Freqüència Absoluta Acumulada (Ni)

�  Freqüència Relativa Acumulada (Fi)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Freqüències

1a. Etapa: Ordenació dels diferents valors de la variable X

2.1. Tabulació. Creació de taules de freqüències (etapes)

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

•  Variable a analitzar: “nombre de patents” (X) •  20 observacions (N) •  Variable X (nre. de patents) pot prendre 5 valors diferents (k = 5)

0,1, 2, 3, 4

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Exemple: Taules de freqüències

X

0

1

2

3

4

E. Motellón Estadística econòmica i empresarial I

2a. Etapa: Càlcul de la Freqüència Absoluta (ni) Nombre de vegades q es repeteix un valor d’una variable

o una modalitat d’un atribut

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

X

ni

0 5

1 5

2 4

3 3

4 3

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

Interessats en l’estudi del nombre de patents que realitza un sector determinat.. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

El valor “0” apareix 5 vegades: Freqüència absoluta de valor “0” = 5

E. Motellón Estadística econòmica i empresarial I

El valor “4” apareix 3 vegades: Freqüència absoluta de valor “4” = 3

2a. Etapa: Càlcul de la Freqüència Absoluta (ni) Nombre de vegades q es repeteix un valor d’una variable

o una modalitat d’un atribut

Propietats:

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

ni = n1 + n2 +…+ nk = Ni=1

K

Nombre de valors diferents de la variable X

Freqüència absoluta (valor xi o modalitat ai apareix ni vegades)

Total d’observacions (grandària de la mostra o població)

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

X

ni

0 5

1 5

2 4

3 3

4 3

20

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

5+5+4+3+3=20=N

E. Motellón Estadística econòmica i empresarial I

Interpretació de la Freqüència Absoluta (ni): n1: Del total d’empreses enquestades, hi ha 5 q no han fet cap patent. n2: 5 empreses q només han patentat una innovació. Aquestes categories són les que més vegades és presenten a la mostra donat que són les que tenen una major freqüència absoluta

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions

fi =niN

i =1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

f1 =n1N=520

= 0.25

E. Motellón Estadística econòmica i empresarial I

fi = f1 + f2 + ...+ fk =n1N

+n2N

+ ...+ nkN

=i=1

K

=n1 + n2 + ...+ nk

N⎡ ⎣ ⎢

⎤ ⎦ ⎥

=NN

= 1

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Propietat de la Freqüència Absoluta

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

0.25+0.25+0.2+0.15+0.15=1

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

•  Facilita comparació amb altres distribucions •  És una mesura de la probabilitat

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X

ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Quin % d’empreses han registrat 4 patents?

Resultat: 15%

Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra aquesta hagi registrat 4 patents?

Resultat: 15 %

3a. Etapa: Càlcul de la Freqüència Relativa (fi) Freqüència absoluta entre el total de les observacions Propietat:

fi =niN

i =1,...,k

fi = 1i=1

K

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

•  Facilita comparació amb altres distribucions •  És una mesura de la probabilitat •  Per calcular fi , N ha de ser prou gran •  N<50 + adequat donar ni (nre. de casos)

4a. Etapa: Càlcul de la Freqüències Acumulades 4.1. Freqüència Absoluta Acumulada (Ni) Nombre d’observacions o dades amb un valor ≤ al valor considerat

Ni = n1 + n2 + ...+ ni i = 1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

10=5+5 → N2= n1+n2

E. Motellón Estadística econòmica i empresarial I

X

ni fi Ni

0 5 0.25 5

1 5 0.25 10

2 4 0.20 14

3 3 0.15 17

4 3 0.15 20

20 1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes) 4a. Etapa: Càlcul de la Freqüències Acumulades 4.1. Freqüència Absoluta Acumulada (Ni) Nombre d’observacions o dades amb un valor ≤ al valor considerat

Propietats

Ni = n1 + n2 + ...+ ni i = 1,...,k

N1 = n1

Nk = n1 + n2 + ...+ nk = N

Per a la 1r valor/categoria de la variable (x1): Freqüència absoluta acumulada = Freqüència absoluta

Per al darrer valor/categoria de la variable (xk): Freqüència absoluta acumulada = Total observacions

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X

ni fi Ni

0 5 0.25 5

1 5 0.25 10

2 4 0.20 14

3 3 0.15 17

4 3 0.15 20

20 1

N1= n1

Nk= N

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

F2=0.50=10/20=N2/N

F2=0.50=0.25+0.25= f1+f2

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Propietats:

Fk =1€

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

F1 = f1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

1r valor/categoria de la variable (x1): Freqüència relativa acumulada = Freqüència relativa

Darrer valor/categoria de la variable (xk): Freqüència absoluta acumulada = 1

4a. Etapa: Càlcul de la Freqüències Acumulades 4.2. Freqüència Relativa Acumulada (Fi) → 2 opcions:

•  Freqüència absoluta acumulada entre el total d’observacions •  Suma de les freqüències relatives dels valors ≤ al valor considerat

Propietats:

Fk =1€

Fi =Ni

N= fii + f2 + ...+ fk i =1,...,k

F1 = f1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

1

1

21

121

===+++

=

==+++= ∑=

NN

NN

NnnnF

ffffF

kkk

k

iikk

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

F1= f1

Fk= Nk/N = 1

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

Resultat: 50%

Quin % d’empreses han realitzat com a màxim una patent?

Resultat: 50%

Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra aquesta hagi registrat 1 o menys patents?

X

ni fi Ni Fi

0 5 0.25 5 0.25

1 5 0.25 10 0.50

2 4 0.20 14 0.70

3 3 0.15 17 0.85

4 3 0.15 20 1

20 1

Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

Exemple: Taules de freqüències

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

I la probabilitat de haver registrat tres o més patents?

Resultat: 30%

F3=0.7 (realitzar 0,1 o 2 patents)

1 - 0.7 = 0.3 = 30%

X ni fi Ni Fi

x1 n1 f1 N1=n1 F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2

x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …

xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1

N 1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

X ni fi Ni Fi

x1 n1 f1 N1=n1 F1=f1

x2 n2 f2 N2=n1+n2 F2=f1+f2

x3 n3 f3 N3=n1+n2+n3 F3=f1+f2+f3

… … … … …

xk nk fk Nk=n1+n2+n3+…+nk=N Fk=f1+f2+f3+…+fk=1

N 1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació de taules de freqüències (etapes)

Fins ara hem treballat amb dades individuals pq la variable d’estudi prenia pocs valors diferents

Què passa si la nostra variable pren un nombre elevat de valors?

Elaboració d’una taula de freqüències amb dades agrupades en intervals

Consideracions inicials

1. Objectiu: agrupar els valors de la variable en un nre. d'intervals que no sigui excessivament gran

2.  Perdem informació. Només sabrem en nre. d'observacions q hi ha en cada interval però no el valor exacte d'aquestes observacions

3.  Intervals creats de forma artificial per l’investigador/a pq les dades es recullen de forma individualitzada

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades agrupades

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2 N

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Però si N=100 tindríem q fer 20 intervals i és excessiu. Què s’entén per un nombre excessiu? En general 15 intervals com a màxim. Per tant, és una decisió ad hoc (segons la circumstància).

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

ai =rang

nºde classes€

2 N

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Rang (Recorregut) = (valor +gran de X) – (valor +petit de X)

ReX = MaxX – MinX

•  Si nombre intervals predefinits, tenim automàticament ai

•  Si ai predefinida, tenim automàticament nombre intervals

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

ai =rang

nºde classes€

2 N

(Li−1,Li ] ]Li−1,Li ]

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Extrem superior (obert)

Extrem inferior (tancat)

(a,b] = ]a,b] a fora del interval i b sí pertany

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

4.  ai pot ser constant o variable. Per tant,

ai =rang

nºde classes€

2 N

(Li−1,L1] ]Li−1,L1]

ai = Li − Li−1

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

Exemple:

En estudi de Wmensual poques observacions entre 5500€ i 12000€.

Útil: (5500-12000], independentment de la grandària de la resta d’intervals

1.  Decisió sobre el nre. de classes (intervals) No existeix cap regla, però es suggereix emprar:

2.  Amplada de l’interval (ai) ⟶

3.  Interval definit pels seus extrems ⟶

4.  ai pot ser constant o variable. Per tant,

5.  Marca de classe (ci): Punt representatiu (mitjà) de l’interval

ai =rang

nºde classes€

2 N

(Li−1,L1] ]Li−1,L1]

ai = Li − Li−1

ci =Li + Li−12

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

6.  Alçada d’un interval (hi). Important quan l'amplitud dels intervals és variable per la realització de gràfics.

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

hi =niai

; hi =fiai

Superfície del rectangle de l'histograma, coincideixi amb la freqüència absoluta

Superfície del rectangle de l'histograma, coincideixi amb la freqüència relativa

6.  Alçada d’un interval (hi). Important quan l'amplitud dels intervals és variable per la realització de gràfics.

7.  Selecció punt inicial (L0). Límit inferior de l'interval +petit (el primer).

Recomanació: Valor mínim de X o preveure valor inferior

8.  Selecció punt final. Límit superior de l’interval + gran (l’ últim)

Recomanació: Incloure valor màxim de X o preveure valor superior

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Creació d’intervals

hi =niai

; hi =fiai

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

•  Variable a analitzar: “despesa en innovació” (X) •  20 observacions (N) •  Variable X: Variable continua discretalitzada

•  Amplitud de l’interval (ai) constant i igual a 20

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X

(L0,L1]

(L1,L2]

(L2,L3]

(L3,L4]

(L4,L5]

(L7,L6]

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X

(0,20]

(20,40]

(40,60]

(60,80]

(80,100]

(100,120]

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20]

(20,40]

(40,60]

(60,80]

(80,100]

(100,120]

8

24, 32, 36, 38, 39

42, 47, 51, 59

64, 71, 73, 74, 76

83, 91, 92

108, 109

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20] 1

(20,40] 5

(40,60] 4

(60,80] 5

(80,100] 3

(100,120] 2

E. Motellón Estadística econòmica i empresarial I

?

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni

(0,20] 1

(20,40] 5

(40,60] 4

(60,80] 5

(80,100] 3

(100,120] 2

N=20

E. Motellón Estadística econòmica i empresarial I

Empresa amb despesa de 40.000 €?

?

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi (0,20] 1 0.05

(20,40] 5 0.25

(40,60] 4 0.20

(60,80] 5 0.25

(80,100] 3 0.15

(100,120] 2 0.1

N=20 1

fi =niN

1/20

5/20

4/20

5/20

3/20

2/20

E. Motellón Estadística econòmica i empresarial I

?

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni

(0,20] 1 0.05 1

(20,40] 5 0.25 6

(40,60] 4 0.20 10

(60,80] 5 0.25 15

(80,100] 3 0.15 18

(100,120] 2 0.1 20

N=20 1

N1=n1=1

N2=n1+n2=6

N3=n1+n2+n3=10

N4=n1+n2+n3+n4=15

N5=n1+n2+n3+n4+n5=15

N6=n1+n2+n3+n4+n5+n6=20

E. Motellón Estadística econòmica i empresarial I

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi

(0,20] 1 0.05 1 0.05

(20,40] 5 0.25 6 0.30

(40,60] 4 0.20 10 0.50

(60,80] 5 0.25 15 0.75

(80,100] 3 0.15 18 0.90

(100,120] 2 0.1 20 1

N=20 1

E. Motellón Estadística econòmica i empresarial I

Fi =Ni

N= f1 + f2 ++ fi

F1=N1/N=f1

F2=N2/N=f1+f2

F3=N3/N=f1+f2+f3

F4=N4/N=f1+f2+f3+f4

F5=N5/N=f1+f2+f3+f4+f5

F6=N6/N=f1+f2+f3+f4+f5+f6

Propietats

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci

(0,20] 1 0.05 1 0.05 10

(20,40] 5 0.25 6 0.30 30

(40,60] 4 0.20 10 0.50 50

(60,80] 5 0.25 15 0.75 70

(80,100] 3 0.15 18 0.90 90

(100,120] 2 0.1 20 1 110

N=20 1

Estadística econòmica i empresarial I

ci =Li−1 + Li2

c1=(0+20)/2

c2=(20+40)/2

c3=(40+60)/2

c5=(80+100)/2

c6=(100+120)/2

c4=(60+80)/2

Propietats

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

ai = Li + Li−1c1=20-0

c2=40-20

c3=60-40

c4=80-60

c5=100-80

c6=120-100

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

•  Quina probabilitat hi ha que en escollir una empresa a l'atzar de la nostra mostra tingui una despesa en innovació inferior a 40.000€?

Resultat: 30%

•  Quina probabilitat hi ha que en escollir una empresa a l'atzar hagi realitzat una despesa en innovació entre 80.000 i 100.000 €?

Resultat: 15%

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

hi

0.05

0.25

0.20

0.25

0.15

0.10

hi =niai

Interessats en l’estudi de la despesa en innovació que va realitzar al darrer trimestre les empreses de la mostra (dades en milers d’euros)

Exemple: Taules de freqüències amb dades agrupades

73 76 38 59 108 8 71 63 32 39

92 47 51 83 91 74 42 109 24 36

X ni fi Ni Fi ci ai

(0,20] 1 0.05 1 0.05 10 20

(20,40] 5 0.25 6 0.30 30 20

(40,60] 4 0.20 10 0.50 50 20

(60,80] 5 0.25 15 0.75 70 20

(80,100] 3 0.15 18 0.90 90 20

(100,120] 2 0.1 20 1 110 20

N=20 1

Estadística econòmica i empresarial I

hi

0.0025

0.0125

0.0100

0.0125

0.0075

0.0050

hi =f iai

Qualitatives nominals (Observacions només és poden classificar)

•  Taules amb dades individuals o  Normalment poques categories o  No és poden agrupar en intervals

•  No calcular les freqüències acumulades (ni absolutes ni relatives)

Qualitatives ordinals (classificació + ordenació)

•  Taules amb dades individuals i agrupades •  És poden calcular freqüències acumulades (absolutes i relatives)

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Dades qualitatives

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 5 =5/20 =5 =(5/20)

1 5 =5/20 =5+5 =(5+5)/20

2 4 =4/20 =5+5+4 =(5+5+4)/20

3 3 =3/20 =5+5+4+3 =(5+5+4+3)/20

4 3 =3/20 =5+5+4+3+3 =(5+5+4+3+3)/20

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

fi =niN

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =20*0.05 0.05

1 =20*0.25 0.25

2 =20*0.20 0.20

3 =20*0.25 0.25

4 =20*0.15 0.15

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

fi =niN→ ni = N ⋅ f i

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =5 5

1 =10-5 10

2 =14-10 14

3 =17-14 17

4 =20-17 20

E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

n1 = N1ni = Ni − Ni−1 ∀i = 2,3,…,n

Determinar distribució de freqüències necessitem:

•  Diferents valors q pren la variable (xi)

•  Total d’observacions (N)

•  Qualsevol de les freqüències (ni, fi, Ni, Fi)

X ni fi Ni Fi

0 =0.25*20 0.25

1 =0.50*20 0.50

2 =0.70*20 0.70

3 =0.70*20 0.85

4 =1*20 1

20 E. Motellón Estadística econòmica i empresarial I

2.1. Tabulació. Comentaris addicionals

Fi =NiN→ Ni = Fi ⋅N

Tema 2.2. Representació gràfica •  Dades quantitatives sense agrupar: diagrama de sectors, de

barres, d’escala, de caixa (box plot) i de tija i fulles

•  Dades quantitatives agrupades: histograma, polígon de freqüències no acumulades i polígon de freqüències acumulades

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Representació gràfica proporciona de forma ràpida i visual una idea aproximada de l’aspecte que s’estudia.

Auxiliars de la interpretació, i les conclusions s’haurien d’obtenir de l’estudi de la taula estadística

Representació gràfica en funció de la tipus de dades �  Quantitatives discretes o continues �  Qualitatives nominals o ordinals

�  Dades sense agrupar �  Dades agrupades

E. Motellón Estadística econòmica i empresarial I

2.2. Representació gràfica. Introducció

•  Dades quantitatives sense agrupar 1.  Sectors 2.  Barres 3.  Escala 4.  Diagrama de caixa (Box-Plot) 5.  Tall i fulles

•  Dades quantitatives agrupades 6.  Histograma 7.  Polígon de freqüències no acumulades 8.  Polígon de freqüències acumulades

2.2. Representació gràfica. Introducció

E. Motellón Estadística econòmica i empresarial I

Nota: Adequat per variable qualitatives nominals

Cercle apareix dividit en sectors de manera que els angles i, per tant, les àrees respectives siguin proporcionals a les freqüències (absolutes o relatives)

0

12

3

4Patents registrades

Gràfic amb freqüències absolutes

= Gràfic amb freqüencies relatives

2.2. Representació gràfica. Dades quantitatives sense agrupar

1. Gràfic de sectors

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

E. Motellón Estadística econòmica i empresarial I

Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o relativa). Buit entre barres per indicar els valors que no són possibles

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

2. Gràfic de barres

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1 0

1

2

3

4

5

6

0 1 2 3 4

Gràfic de barres amb freqüències absolutes

Nota: Adequat per variable qualitatives E. Motellón Estadística econòmica i empresarial I

0.00

0.05

0.10

0.15

0.20

0.25

0.30

0 1 2 3 4

Sobre l’eix horitzontal els valors de la variable X, aixecar sobre cadascun dels punts una barra l’alçada de la qual sigui igual a la seva freqüència (absoluta o relativa). Buit entre barres per indicar els valors que no són possibles

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

2. Gràfic de barres

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic de barres amb freqüències relatives

Nota: Adequat per variable qualitatives E. Motellón Estadística econòmica i empresarial I

Representació de les freqüències acumulades. Pren forma d’una escala integrada per graons que pugen des del nivell zero de les freqüències fins al màxim (N per absolutes i 1 per relatives).

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

3. Gràfic d’escala

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic d’escala amb freqüències absolutes acumulades

0

4

8

12

16

20

0 1 2 3 4 Nota: Adequat per variable qualitatives ordinals

E. Motellón Estadística econòmica i empresarial I

Representació de les freqüències acumulades. Pren forma d’una escala integrada per graons que pugen des del nivell zero de les freqüències fins al màxim (N per absolutes i 1 per relatives).

Patents registrades

2.2. Representació gràfica. Dades quantitatives sense agrupar

3. Gràfic d’escala

X ni fi

0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

20 1

Gràfic d’escala amb freqüències relatives acumulades

Nota: Adequat per variable qualitatives ordinals 0.00

0.20

0.40

0.60

0.80

1.00

0 1 2 3 4

E. Motellón Estadística econòmica i empresarial I

Sintetitza en un gràfic diverses mesures estadístiques

4. Diagrama de caixa (Box-Plot)

EDAD

20,00

40,00

60,00

80,00

Mediana = Q2(0,5)

Valors atípics (outliers)

1,5RI

1,5RI

Valor màxim no atípic

RI =Q3-Q1

Valor mínim no atípic

2.2. Representació gràfica. Dades quantitatives sense agrupar

Q3(0,75)

Q1(0,25)

E. Motellón Estadística econòmica i empresarial I

4. Diagrama de caixa (Box-Plot)

2.2. Representació gràfica. Dades quantitatives sense agrupar

Simetria Asimetria dreta

Asimetria esquerra

E. Motellón Estadística econòmica i empresarial I

5. Gràfic tall i fulles

2.2. Representació gràfica. Dades quantitatives sense agrupar

Procediment semi-gràfic + útil quan la mostra no és molt gran. Avantatge: - arbitrari que histograma i + senzill de construir

E. Motellón Estadística econòmica i empresarial I

5. Gràfic tall i fulles

2.2. Representació gràfica. Dades quantitatives sense agrupar

Procediment semi-gràfic + útil quan la mostra no és molt gran. Avantatge: - arbitrari que histograma i + senzill de construir

1 10 8 31 10 9 31 10 9 31 10 9 3

Tall Valor Tall FullesCasos per

fulles18 18 1819 19 1919 19 1919 19 19

E. Motellón Estadística econòmica i empresarial I

6. Histograma

Conjunt de rectangles juxtaposats amb les següents característiques:

• Eix horitzontal escala adequada i uniforme

• Punt central de base = marca de classe

• Amplada rectangle = amplada interval

• Àrea proporcional a ni de classe

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular l’alçada (hi) pq les superfícies coincideixin amb les freqüències.

2.2. Representació gràfica. Dades quantitatives agrupades

0

2

4

6

8

10

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Histograma de la despesa en innovació (ni)

E. Motellón Estadística econòmica i empresarial I

6. Histograma

Conjunt de rectangles juxtaposats amb les següents característiques:

• Eix horitzontal escala adequada i uniforme

• Punt central de base = marca de classe

• Amplada rectangle = amplada interval

• Àrea proporcional a ni de classe

Nota: Si els intervals tenen amplades diferents (ai) s’ha de calcular l’alçada (hi) pq les superfícies coincideixin amb les freqüències.

2.2. Representació gràfica. Dades quantitatives agrupades

Histograma de la despesa en innovació (fi)

0

0.1

0.2

0.3

0.4

0.5

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

0

1

2

3

4

5

6

7

8

9

10

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de l’interval) situats a la part superior del rectangles de d'histograma (freqüències absolutes)

7. Polígon de freqüències no acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències absolutes de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

Unint els punts mitjos (marca de classe de l’interval) situats a la part superior del rectangles de d'histograma (freqüències relatives)

7. Polígon de freqüències no acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències absolutes de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

0

2

4

6

8

10

12

14

16

18

20

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència absoluta acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

0

2

4

6

8

10

12

14

16

18

20

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència absoluta acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

E. Motellón Estadística econòmica i empresarial I

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència relativa acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Unint els punts mitjos (marca de classe de d'interval) situats a la part superior del rectangles de d'histograma (freqüència relativa acumulada)

8. Polígon de freqüències acumulades

2.2. Representació gràfica. Dades quantitatives agrupades

Polígon de freqüències acumulades de la despesa en innovació

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

(0,20] (20,40] (40,60] (60,80] (80,100] (100,120]

Freq

üènc

ia

E. Motellón Estadística econòmica i empresarial I

Tema 2.3. Mesures de síntesi •  Mesures de posició o localització •  Mesures de dispersió absolutes i relatives

•  Mesures de forma •  Concentració versus Equidistribució

•  Transformacions lineals

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

•  La utilització d’estadístics (valors numèrics que calculem a partir de les dades, si és possible abans d’agrupar-les) permet evitar alguna de les arbitrarietats de taules i gràfics.

•  Normalment es treballa amb diferents estadístics que recullen característiques d’interès dels fenòmens analitzats.

•  Per exemple, estadístics de: –  posició: central i localització –  dispersió: absoluta i relativa –  forma (simetria i curtosi) i concentració

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

•  Estadístic, mesura d’interès q serà operativa si compleix tres condicions: 1.  En la seva determinació intervenen tots el valors de X

2.  Sempre calculable 3.  Única per cada distribució de freqüències

•  Mesures referides a la mostra: contrastar-les i inferir-les a la població

E. Motellón Estadística econòmica i empresarial I

2.3. Mesures de síntesi. Introducció

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

•  Mesures de tendència central •  Mitjana aritmètica, mediana i moda •  Relació entre mitjana aritmètica, mediana i moda

•  Mesures de tendència no central •  Quartils •  Decils •  Percentils

•  Moments

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició o localització

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda Mitjana geomètrica Mitjana harmònica Mitjana quadràtica

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

x =xini

i=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

X ni fi 0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

N=20

E. Motellón Estadística econòmica i empresarial I

Propietats (I)

1.  La suma de les desviacions de totes les observacions de la variable respecte a la mitjana és 0

R  Pq mitjana és el veritable valor central de la distribució: centre de gravetat i punt

d’equilibri de la distribució

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

(xi − x ) =i=1

N

∑ xi − x =i=1

N

∑i=1

N

∑ xi − Ni=1

N

∑ x = xi − Ni=1

N

∑xi

i=1

N

∑N

= xi − xi = 0i=1

N

∑i=1

N

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

X ni fi 0 5 0.25

1 5 0.25

2 4 0.20

3 3 0.15

4 3 0.15

N=20

E. Motellón Estadística econòmica i empresarial I

Propietat 1

Propietats (I)

1.  La suma de les desviacions de totes les observacions de la variable respecte a la mitjana és 0

2.  L’expressió matemàtica que representa la mitjana aritmètica coincideix amb el moment ordinari (o respecte l’origen) de 1r ordre “a1”

xa =1

(xi − x ) =i=1

N

∑ xi − x =i=1

N

∑i=1

N

∑ xi − Ni=1

N

∑ x = xi − Ni=1

N

∑xi

i=1

N

∑N

= xi − xi = 0i=1

N

∑i=1

N

E. Motellón Estadística econòmica i empresarial I

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X ni a=2 b=4

0 5 2 4

1 5 3 5

2 4 4 6

3 3 5 7

4 3 6 8

N=20

Propietat 2

Propietats (II) 3.  La mitjana aritmètica queda afectada pels canvis d’origen. Si a tots els valors que

pren una variable li sumem (restem) una constant a, la mitjana aritmètica queda augmentada (disminuïda) en aquesta constant

!xi = xi + a

!x =!xi

i=1

N

∑N

=xi + a( )

i=1

N

∑N

=xi + a

i=1

N

∑i=1

N

∑N

=xi

i=1

N

∑N

+a

i=1

N

∑N

=

=xi

i=1

N

∑N

+N ⋅aN

= x + a

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

X ni a=2 b=4

0 5 2 4

1 5 3 5

2 4 4 6

3 3 5 7

4 3 6 8

N=20

Propietat 3

Propietats (III) 4.  La mitjana aritmètica queda afectada pels canvis d’escala. Si a tots els valors que

pren una variable li vam multipliquem (dividim) una constant a, la mitjana aritmètica queda multiplicada (dividida) en aquesta constant

2.3.1 Mesures de posició central. Mitjana aritmètica

E. Motellón Estadística econòmica i empresarial I

!xi = axi

!x =!xi

i=1

N

∑N

=axi( )

i=1

N

∑N

=a xii=1

N

∑N

= ax

x =xini

i=1

k

∑N

= xi fii=1

K

Propietats (IV) 5.  En base a les propietats 3 i 4:

si

i definim: , llavors baxx ii +=ʹ

N

nx

xx

N

iii

i

∑==→ 1

x = axi + b

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Propietats (V) 6.  Si una variable pren sempre el mateix valor, la mitjana aritmètica serà igual a aquest

valor constant

X = edat = 20;20;20;20;20N = 5Llavors :

x =xi

i=1

N

∑N

=20+ 20+ 20+ 20+ 20

5= 20

x =xini

i=1

K

∑N

=20 ⋅55

= 20

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Propietats (VI) 7.  Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal

que , dels quals es coneix la seva corresponent mitjana aritmètica. La mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

NN...NNdondeN

xN...xNxNx ZBAZZBBAA =+++

+++=

Ni = N∑

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Exemple: Mitjana aritmètica Interessats en l’estudi del nombre de patents que realitza un sector determinat. Seleccionem 20 empreses i obtenim les següents dades

0 1 1 2 3 0 0 4 4 2

2 3 1 0 3 2 1 1 0 4

E. Motellón Estadística econòmica i empresarial I

Propietat 7 X ni

0 5

1 5

2 4

3 3

4 3

N=20

XA nj

0 5

1 5

2 4

NA=14

XB nl

3 3

4 3

NB=6

Propietats (VI) 7.  Si el total d'observacions està dividit en subgrups de diferents grandàries, Ni, tal

que , dels quals es coneix la seva corresponent mitjana aritmètica. La mitjana aritmètica del total d'observacions es pot calcular a partir de les mitjanes aritmètiques parcials ponderades per les seves respectives grandàries mostrals.

NN...NNdondeN

xN...xNxNx ZBAZZBBAA =+++

+++=

x =xini

i=1

k

∑N

=(x1n1)+...+ (x jnj )"# $%+ (x j+1nj+1)+...+ (xknk )"# $%

N

NNN BA =+Demostració:

Ni = N∑

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Propietats (VII) 8.  La mitjana aritmètica d’una suma és la suma de mitjanes aritmètiques.

9.  La mitjana aritmètica és la quantitat que fa mínima la suma del quadrat de les desviacions respecte a un valor

z =zini

i=1

k

∑N

=xi + yi( )ni

i=1

k

∑N

=xini

i=1

k

∑N

+yini

i=1

k

∑N

= x + y

(xi − a)2 és mínim si a = x

i=1

k

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Exemple: Propietats mitjana

Heu contractat una empresa per realitzar una campanya de publicitat. L'empresa contractada us dóna un pressupost on s'especifica que el salari mensual d'un publicista novell és de 850€ i el salari d'un publicista qualificat de 1350€. Al final del projecte l’empresa de publicitat ha pagat un salari mitjà de 966.07 €. Quants publicistes novells han emprat en la vostra campanya i quants publicistes qualificats han participat en ella?

E. Motellón Estadística econòmica i empresarial I

Avantatges •  Considera tots els valors de la variable •  És una mesura calculable tant en escales d'interval com de raó •  Pren sempre un valor únic •  Representa el centre de gravetat de la distribució •  Sol ser la mesura de posició central més adequada per a

distribucions en escala d'intervals o de proporcions

Inconvenients •  Es veu afectada pels valors extrems que poden distorsionar el seu

valor fent-ho poc representatiu

2.3.1 Mesures de posició central. Mitjana aritmètica x =

xinii=1

k

∑N

= xi fii=1

K

E. Motellón Estadística econòmica i empresarial I

Exemple: mitjana i valors extrems

Es disposa del W mensual del 9 treballadors en dos centres de treball. Calcula la mitjana aritmètica i comenta els seus resulta

E. Motellón Estadística econòmica i empresarial I

1 2 3 4 5 6 7 8 9 X 600 900 1200 850 2100 600 2300 790 4800

Y 600 900 1200 850 2100 600 2300 790 1900

=

=

=

= == K

ii

k

iiii

N

ii

N

iii

w

nwx

w

wx

x

1

1

1

1

2.3.1 Mesures de posició central. Mitjana aritmètica ponderada

E. Motellón Estadística econòmica i empresarial I

Exemple: Mitjana ponderada

En procés de selecció d'una empresa es fan quatre proves puntuades del 0 a 10 cadascuna d'elles. Si un aspirant ha obtingut un 9 a la Prova1, un 6 a la Prova2, a 8 en la Prova3 i a la Prova4 un 6.

1.  Quin és la nota mitjana de l'aspirant? 2.  Si la prova 2 i 3 puntuen el doble que la resta i la quarta el triple.

Canvia la nota mitjana?

1) La nota mitjana de l’aspirant és 7.25 punts 2) La incorporació de les ponderacions a les diferents proves suposa una

modificació de la seva nota mitjana que ara és de 6.87 punts

E. Motellón Estadística econòmica i empresarial I

Nota 9 6 8 6

Pes (w) 1 2 2 3

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Valor que ocupa el centre de la distribució. Valor tal q, ordenades les dades de forma creixent o decreixent, deixa per damunt i per sota el mateix nombre d'observacions. Me té associada una Ni = N/2 Dades tipus I •  N senar, valor de la variable que ocupa posició (N+1)/2:

•  N par, mitjana aritmètica de dos valors centrals:

Dades Tipus II: primer valor de la variable que ocupa el lloc Ni ≥ N/2

Dades Tipus III: detectar el interval medià (acumula la freqüència N/2)

Me = Li−1 +

N2− Ni−1

ni·ai

Me =xN /2 + x(N /2)+1

2

Me = x(N+1)/2

2.3.1 Mesures de posició central. Mediana

E. Motellón Estadística econòmica i empresarial I

Propietats: 1. Fa mínima la suma de totes les desviacions absolutes

2. No l’afecta l'existència de valors extrems/atípics (era la gran inconveniència de la mitjana aritmètica)

3. Es pot calcular (té sentit) per dades qualitatives ordinals

⟶ Mitjana aritmètica i mediana diferiran molt quan les distribucions siguin molt asimètriques (suggereix q dades són heterogènies)

x i−ki=1

N

∑ mínima si k = Me

2.3.1 Mesures de posició central. Mediana

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Valor de la variable amb major freqüència (absoluta o relativa). Aquell q més vegades és repeteix. Al diagrama de barres, la barra amb més alçada.

Casos particulars: Distribucions sense moda, bimodals, trimodals o, amb caràcter general, multimodals

Avantatges: Donat q per calcular-la no requereix l'ordenació de la variable, és la mesura de posició més representativa (i única) de les variables qualitatives nominals

Inconvenients: •  En el seu càlcul no intervenen totes les observacions de la variable •  La dificultat de obtenir-la en variables continues.

Mo ≈ 3Me− 2x

2.3.1 Mesures de posició central. Moda

E. Motellón Estadística econòmica i empresarial I

1.  Tres mesures de posició (tendència central) que persegueixen sintetitzar la informació que disposem (observacions) en un únic valor

2.  No tenen perquè coincidir

3.  Proporcionen informació complementaria, no substitutives

4.  En f(relació entre elles) podem analitzar la simetria de la distribució

x =Me =Mo→ Distribució simètrica

Mo <Me < x→ Distribució asimètrica a la dreta ( positiva)

Mo >Me > x→ Distribució asimètrica a l 'esquerra (negativa)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

El valor que més es repeteix (Moda), també deixa el 50% d'observacions a cada costat (Mediana) i és el centre de gravetat de la distribució (Mitjana aritmètica)

x = Me = Mo→ Distribució simètrica

ni

Xi

ni + elevada

x50% observacions 50% observacions

Centre de gravetat

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

La Mitjana aritmètica i la Mediana estan a la dreta de la Moda, llavors la distribució presenta asimetria a la dreta o positiva

ni

Xi Me50% observacions 50% observacions

Centre de gravetat

ni + elevada

xMo

Mo < Me < x → Distribució asimètrica a la dreta (positiva)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

La Mitjana aritmètica i la Mediana estan a l’ esquerra de la Moda, llavors la distribució presenta asimetria a l’esquerra o negativa

ni

Xi Me

50% observacions 50% observacions

Centre de gravetat

ni + elevada

x Mo

Mo > Me > x → Distribució asimètrica a l 'esquerra (negativa)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

ni

X xMe

MoMo

Per a corbes de freqüències unimodals lleugerament asimètriques, es té la següent relació empírica entre la mitjana, la mediana i la moda:

(Mitjana-Moda)=3(Mitjana-Mediana)

Inconvenients (exemple)

2.3.1 Mesures de posició central. Relació entre mitjana, mediana i moda

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de posició. Introducció

E. Motellón Estadística econòmica i empresarial I

Són els quantils que són valors de la variable que divideixen la distribució en parts amb igual nombre d’observacions.

En f(percentatge en la partició) els quantils més utilitzats són: •  Quartils •  Decils •  Percentils

Nota: ordenar el conjunt de dades

2.3.1 Mesures de posició no central. Introducció

E. Motellón Estadística econòmica i empresarial I

Els 3 valors de la variable (Q1,Q2,Q3) que permeten dividir la distribució en 4 parts iguals (contenen el 25% dels valors de la distribució)

•  Q1 ocupa el lloc N/4

•  Q2 ocupa el lloc 2N/4 (mediana=N/2)

•  Q3 ocupa el lloc 3N/4

Valor q el 25% de les dades són anteriors a ell i el 75% són posteriors

Valor q el 75% de les dades són anteriors a ell i el 25% són posteriors

2.3.1 Mesures de posició no central. Cuartils

E. Motellón Estadística econòmica i empresarial I

Són els 9 valors de la variable que divideixen la distribució en 10 parts iguals (contenen el 10% dels valors de la distribució)

•  D1 ocupa el lloc N/10

•  D2 ocupa el lloc 2N/10

•  ..........

•  D9 ocupa el lloc 9N/10

Valor q el 20% de les dades són anteriors a ell i el 80% són posteriors

2.3.1 Mesures de posició no central. Decils

E. Motellón Estadística econòmica i empresarial I

Són els 99 valors de la distribució que divideixen la distribució en 100 parts iguals (contenen el 1% dels valors de la distribució)

•  P1 ocupa el lloc N/100

•  P2 ocupa el lloc 2N/100

•  ..........

•  P99 ocupa el lloc 99N/100

Valor q el 1% de les dades són anteriors a ell i el 99% són posteriors

Valor q el 99% de les dades són anteriors a ell i el 1% són posteriors

2.3.1 Mesures de posició no central. Percentils

E. Motellón Estadística econòmica i empresarial I

Moments (I)

•  Valors que caracteritzen totalment a una distribució

•  2 distribucions són iguals si tenen tots els seus moments igual

•  Es calculen com a potencies successives de la variable observada

•  Expressió general:

•  Dos tipus:

–  Respecte al origen (ordinaris)

–  Respecte a la mitjana aritmètica (centrals)

N

nOxM

k

ii

rti

r

∑=

⋅−= 1

)(

Sent: xi: valors de la variable Ot: origen arbitrari r: ordre del moment (0,1,2,3,...) ni: freqüència absoluta de xi N: Total d’observacions

E. Motellón Estadística econòmica i empresarial I

1.  Respecte al origen (ar)à Origen (Ot) = 0

...2,1,0)(

11 =∀⋅

=⋅−

=∑∑== rN

nx

N

nOxa

k

ii

ri

k

ii

rti

r

111

0

0 ===⋅

=∑∑==

NN

N

n

N

nxa

k

ii

k

iii

xN

nx

N

nxa

k

iii

k

iii

=⋅

=⋅

=∑∑== 11

1

1

N

nxa

k

iii∑

=

⋅= 1

2

2

El moment ordinari (a1), o respecte al origen, d’ordre 0 és sempre la mitjana aritmètica

El moment ordinari (a0), o respecte al origen, d’ordre 0 és sempre 1

Moments (II)

E. Motellón Estadística econòmica i empresarial I

1.  Respecte a la (mr)à Origen (Ot) =

( )...2,1,0

)(11 =∀

⋅−=

⋅−=

∑∑== r

N

nxx

N

nOxm

k

ii

rii

k

ii

rti

r

( )111

0

0 ===⋅−

=∑∑==

NN

N

n

N

nxxm

k

ii

k

iiii

m1 =xi − x( )1 ⋅ni

i=1

k

∑N

=xi − x( ) ⋅ni

i=1

k

∑N

= 0 El moment central (m1), o respecte a la mitjana, de ordre 1 és sempre 0

El moment central (m0), o respecte a la mitjana, de ordre 0 és sempre 1

x x

m2 =xi − x( )2 ⋅ni

i=1

k

∑N

Aquesta és l'expressió de la variància (estadístic de dispersió)

Moments (II)

E. Motellón Estadística econòmica i empresarial I

m1 =xi − x( )1 ⋅ni

i=1

k

∑N

=xi − x( ) ⋅ni

i=1

k

∑N

= 0

1.  Propietat de la mitjana: suma de les desviacions dels valors de la variable respecte a la mitjana es sempre 0

2.  d

xi − x( ) = 0i=1

N

∑ → xi − x( )ni = 0i=1

k

∑ →m1 =0N= 0

xi − x( )nii=1

k

∑N

=xini

i=1

k

∑N

−xni

i=1

k

∑N

=xini

i=1

k

∑N

− xni

i=1

k

∑N

= x − x = 0

Demostració

E. Motellón Estadística econòmica i empresarial I

Propietats 1.  Tots els moments d’ordre 0 (ordinaris i centrals) són igual a la unitat

2.  Tots els moments centrals (mr) es poden expressar en funció dels moments ordinaris o respecte l'origen

mr = ir⎛

⎝⎜⎞

⎠⎟

i=0

r

∑ a1i ar−i (−1)

i

m0 =1 / a0 =1M0 =1

Exemple

Moments (IV)

E. Motellón Estadística econòmica i empresarial I

núm. combinatori “r sobre i”

Recordatori:

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

Exemple 2a propietat dels moments

E. Motellón Estadística econòmica i empresarial I

•  Mesures de dispersió absoluta •  Recorregut o rang, recorregut inerquartílic, variància, desviació

típica o estàndard

•  Mesures de dispersió relativa •  Coeficient de variació de Pearson

E. Motellón Estadística econòmica i empresarial I

2.3.2 Mesures de dispersió

Estadístics

Posició Dispersió Forma Concentració

Tendència central

Tendència no central

Mitjana aritmètica Mediana Moda

Quartils Decils Percentils

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Fins a quin punt són representatius els estadístics de tendència central? ⟶ Dades + agrupades (- dispersió)⇒ + representativa

DISPERSIÓ (variabilitat): •  Major o menor separació dels valors de la variable respecte a un

altre que sigui la seva síntesi

•  no suficient: necessitem saber si es representativa de la distribució

x

x

Mesures de dispersió (estadístics q quantifiquen el grau de dispersió

de X entorn de la seva tendència central)

2.3.2 Mesures de dispersió. Introducció

E. Motellón Estadística econòmica i empresarial I

1.  Mesures de dispersió ABSOLUTES (unitats de mesures) •  Recorregut (rang): màxim-mínim •  Rang interquartilic: tercer quartil (Q3) – primer quartil (Q1) •  Variància •  Desviació estàndard •  etc.

2.  Mesures de dispersió RELATIVES (indicadors adimensionals) •  Coeficient de variació •  etc.

2.3.2 Mesures de dispersió. Introducció

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Diferència entre el valor màxim i mínim de la variable Dades tipus III (agrupades):

Avantatge: •  La forma més senzilla d’indicar la dispersió

Inconvenients: •  Molt simple, només utilitza dos valors de la variable •  Molt sensible als valors extrems (outliers) •  Només recomanable si els valors és distribueixen uniformement

Re = Max xi −Min xi i =1,...,n

Re = Lk − L0

2.3.2 Mesures de dispersió. Recorregut o rang (Re)

E. Motellón Estadística econòmica i empresarial I

Diferència entre el primer quartil (Q1) i el tercer quartil (Q3) Quant menor és el recorregut interquartílic, menor dispersió presenta la variable

Indica q en un interval de longitud RI estan compreses el 50% de les observacions centrals (+ representatiu q Re pq no està afectat per la presencia de valors extrems)

13 QQRI −=

2.3.2 Mesures de dispersió. Rang interquartílic (RI)

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

•  Mesura l'error que cometem en triar a la mitjana aritmètica com valor representatiu de la distribució

•  Mesura el grau de variabilitat de les dades de la distribució d’una variable quantitativa respecte a la mitjana aritmètica

•  ∆ valor ⇒ ∇ pèrdua de representativitat de la (valors + allunyats d’aquesta mesura de posició central)

N

nxxS

k

iii∑

=

−= 1

2

2)(

x

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Formes alternatives d'expressar-la:

1. 

2. 

N

nxxS

k

iii∑

=

−= 1

2

2)(

S2 =(xi − x )

2

i=1

N

∑N

=(x

i

2 − 2xix + x2 )

i=1

N

∑N

=

=xi

2

i=1

N

∑N

− 2xxi

i=1

N

∑N

+x 2

i=1

N

∑N

=xi

2

i=1

N

∑N

− 2xx + Nx2

N=

=xi

2

i=1

N

∑N

− x 2 =xi

2 − Nx 2i=1

N

∑N

∑∑∑

=

== −=−=−

=k

iii

k

ii

k

iii

fxxxN

nx

N

nxxS

i

1

221

2

1

2

2 )()(

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Característiques: 1.  Mesura de la variabilitat o dispersió de les dades

d’una variable respecte a la mitjana aritmètica

2.  Coincideix amb el moment central de 2n ordre (m2)

3.  Si xi=k ∀1=1,2,...,k , llavors S2=0 4.  S2≥0

5.  No li afecten els canvis d'origen

N

nxxS

k

iii∑

=

−= 1

2

2)(

22

22

2

ii

ii

i

xxii

xxii

xi

SSkxx

SSkxx

Sx

=→−=ʹ́

=→+=ʹ

ʹ́

ʹSi a tots els valors de la variable els sumem (restem) una constant

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Propietat 5 de S2. No li afecten els canvis d'origen

Demostració

E. Motellón Estadística econòmica i empresarial I

Característiques: 1.  Mesura de la variabilitat o dispersió de les dades

d’una variable respecte a la mitjana aritmètica

2.  Coincideix amb el moment central de 2n ordre (m2)

3.  Si xi=k ∀1=1,2,...,k , llavors S2=0 4.  S2≥0

5.  No li afecten els canvis d'origen

6.  Sí li afecten els canvis d'escala

N

nxxS

k

iii∑

=

−= 1

2

2)(

22

22

2

ii

ii

i

xxii

xxii

xi

SSkxx

SSkxx

Sx

=→−=ʹ́

=→+=ʹ

ʹ́

ʹ

2

22

222

2

kS

Skxx

kSSkxx

Sx

i

i

ii

i

xx

ii

xxii

xi

=→=ʹ́

⋅=→⋅=ʹ

ʹ́

ʹSi a tots els valors de la variable els multipliquem (dividim) per una constant

2.3.2 Mesures de dispersió. Variància (S2)

E. Motellón Estadística econòmica i empresarial I

Propietat 6 de S2. Sí li afecten els canvis d’escala

Demostració

E. Motellón Estadística econòmica i empresarial I

Inconvenients:

•  Donat q utilitza les desviacions al quadrat , la seva unitat de mesura és la de la variable original al quadrat.

•  Dificulta la seva interpretació

Solució: DESVIACIÓ ESTÀNDARD

N

nxxS

k

iii∑

=

−= 1

2

2)(2.3.2 Mesures de dispersió.

Variància (S2)

2)( xxi −

N

nxxSS

k

iii∑

=

−+=+= 1

2

2)(

u.m. X = u.m. x = u.m. S

E. Motellón Estadística econòmica i empresarial I

Característiques: 1.  No pot ser negativa:

2.  Igual que la variància, el valor més petit que pot prendre és 0

3.  Igual que la variància, també es pot obtenir a partir dels moments ordinaris

4.  No li afecten els canvis d’origen 5.  Sí li afecten els canvis d’escala

N

nxxS

k

iii∑

=

−= 1

2)(

02 ≥+= xx SS

2122 aamS −==

kS

kS

SkS

Skxx

kSkSSkSSkxx

SSSx

ii

i

i

i

iiiii

iii

xxx

xx

ii

xxxxxii

xxxi

==→=→=ʹ́

=⋅=→⋅=→⋅=ʹ

=→→

ʹ́ʹ́

ʹʹ

2

2

2

22

22222

22

2.3.2 Mesures de dispersió. Desviació Estàndard (S)

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Absoluta Relativa

RecorregutRang InterquartílicVariància Desviació Estàndard

Coeficient de variació (de Pearson)

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

•  Quocient entre la desviació estàndard i la mitjana aritmètica

•  Habitualment s’expressa en %

interpretació: variació del x% respecte a la mitjana

CV =Sx

CV =Sx·100

2.3.2 Mesures de dispersió. Coeficient de variació de Pearson (CV)

E. Motellón Estadística econòmica i empresarial I

Propietats: 1.  És una mesura adimensional 2.  Representa en nre. de vegades que la S conté la 3.  Mesura q utilitza tota la ! de la variable 4.  Cota inferior és 0 (màxima representativitat de la mitjana) 5.  Quan no és significatiu 6.  Sí li afecten els canvis d’origen 7.  No li afecten els canvis d’escala

x

0=x

2.3.2 Mesures de dispersió. Coeficient de variació de Pearson (CV)

CV =Sx

E. Motellón Estadística econòmica i empresarial I

•  Asimetria – Simetria •  Coeficient de Fisher •  Coeficient de Pearson

•  Apuntament – curtosis •  Coeficient de curtosis

2.3.3 Mesures de forma

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficients de Fisher

Coeficient de curtosis

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

Mesuren grau de simetria o d’asimetria d’una distribució sense representar-la gràficament

Simetria Hi ha un nombre igual de valors a ambdós costats d’un eix perpendicular que la divideix.

2.3.3 Mesures de forma. Mesures d’asimetria

E. Motellón Estadística econòmica i empresarial I

Indicador adimensional per distribucions unimodals i campaniformes

•  Si Ap= 0 Distribució simètrica •  Si Ap> 0 Distribució asimètrica positiva (esbiaixada a la dreta) •  Si Ap< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)

ü Relació empírica entre Mitjana, Mediana i Moda:

Ap =x −MoS

Ap =3 x −Me( )

S

x −Mo ≅ 3 x −Me( )

I si la distribució no és unimodal i campaniforme?

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Pearson

E. Motellón Estadística econòmica i empresarial I

Indicador adimensional aplicable a totes les distribucions estadístiques •  Si g1= 0 Distribució simètrica

•  Si g1> 0 Distribució asimètrica positiva (esbiaixada a la dreta)

•  Si g1< 0 Distribució asimètrica negativa (esbiaixada a l’esquerra)

Estadística econòmica i empresarial I

g1 =1S3·

xi − x( )3i=0

K

∑ ni

N= m3

S3

Mo = Me = x

Mo < Me < x

Mo > Me > x

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Fisher

E. Motellón

g1 =1S3·

xi − x( )3i=0

K

∑ ni

N= m3

S3

g1 =1S3·

x13

i=0

K

∑ ni

N−

xii=0

K

∑ ni

x12

i=0

K

∑ ni

N+ 2

xii=0

K

∑ ni

N

⎜⎜⎜⎜

⎟⎟⎟⎟

3⎡

⎢⎢⎢⎢⎢

⎥⎥⎥⎥⎥

g1 =1S3· a3 − 3a1a2 + 2a1

3( )Estadística econòmica i empresarial I

2.3.3 Mesures de forma. Mesures d’asimetria. Coeficient de Fisher

E. Motellón

Estadístics

Posició Dispersió Forma Concentració

Simetria Curtosis

Coeficient de Pearson Coeficients de Fisher

Coeficient de curtosis

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

2.3.3 Mesures de forma. Mesures de curtosis (g2)

E. Motellón Estadística econòmica i empresarial I

Indicador adimensional que mesura les deformacions en sentit vertical (apuntament) respecte a la normal. •  Si g2= 0 Distribució mesocúrtica (normal) •  Si g2> 0 Distribució leptocúrtica (apuntada) •  Si g2< 0 Distribució platicúrtica (aplanada)

g2 =1S4·

xi − x( )4i=0

K

∑ ni

N− 3 = m4

S4− 3

xi − x( )4

i=0

K

∑ ni

N= 3·S 4

2.3.3 Mesures de forma. Mesures d’asimetria

E. Motellón Estadística econòmica i empresarial I

2.3.4 Mesures de concentració

•  Concentració versus equidistribució •  Corba de Lorenz •  Índex de Gini

E. Motellón Estadística econòmica i empresarial I

Estadístics

Posició Dispersió Forma Concentració

Índex de Gini Corba de Lorenz

2.3. Mesures de síntesi. Introducció

E. Motellón Estadística econòmica i empresarial I

En estadística, CONCENTRACIÓ relacionada amb el grau d’igualtat o d’equitat en el repartiment d’una variable

Concentració NO com a antònim de dispersió

Molt rellevant en C. Socials •  Igualtat en distribució salaris, rendes, etc. •  Equitat en repartiments inversions, ajuts, etc.

X molt concentrada: pocs individus es queden amb la majoria del repartiment de la variable (renda, salaris, inversions, ajuts, etc.)

pi: com es reparteix la població en categories (= Fi) qi: com es reparteix la variable

2.3.4 Mesures de concentració. Introducció. Concentració vs Equidistribució

E. Motellón Estadística econòmica i empresarial I

Objectiu: mesurar el grau de repartiment del valor total d’una variable

Exemple: Disposem de la distribució W de N individus (ordenada)

Situacions extremes: 1.  Concentració màxima: 1 individu percep tota la massa salarial

2.  Concentració mínima: Tots els individus reben el mateix salari

nxxxxx ≤≤≤≤≤ ...4321

nxxxxx ===== ...4321

0014321 ≠====== − nn xx...xxxx

2.3.4 Mesures de concentració. Introducció. Concentració vs Equidistribució

E. Motellón Estadística econòmica i empresarial I

➞ equidistribució

1.  Ordenar els valors (xi) de menor a major i calcular les Ni 2.  Calcular el total de la variable que rep el grup d’individus amb ni

ui=xi·ni

3.  Suma de tot el repartiment de la variable Uk (en exemple W seria la massa salarial)

4.  Dos opcions:

a.  Calcular el repartiment de la variable en termes acumulats: Ui = ui-1+ui

b.  Relativitzar la xifra de ui à si = ui/Uk 5.  Calcular pi: Freqüència relativa acumulada expressada en % (pi=(Ni/N)·100)

6.  Calcular qi: Proporció acumulada del valor total de la variable per als diferents grups, expressada en %

1)  qi = Ui/Uk

2)  qi = si-1+si

Ui= Salari acumulat del grup i-èsim Uk= Total massa salarial

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

xi ni Ni ui=xi·ni Ui= ui+ui-1 pi=(Ni/N)·100 qi=(Ui/U)·100

18700 21 21 392700 392700 14.00 6.84

20400 25 46 510000 902700 30.67 15.73

28000 30 76 840000 1742700 50.67 30.37

32500 17 93 552500 2295200 62.00 40.00

45000 15 108 675000 2970200 72.00 51.76

50000 18 126 900000 3870200 84.00 67.45

62000 14 140 868000 4738200 93.33 82.57

100000 10 150 1000000 5738200 100.00 100.00

150 5738200 Com es reparteixen els treballadors en grups

(Fi)

Com es reparteixen els salaris

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

xi ni Ni ui=xi·ni Ui= ui+Ui-1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

x1 n1 N1 u1=x1·n1 U1= u1 p1=(N1/N)·100 q1=(U1/Uk)·100

x2 n2 N2 u2=x2·n2 U2= u2+u1 p2=(N2/N)·100 q2=(U2/Uk)·100

… … … … … … …

… … … … … … …

xi ni Ni ui=xi·ni Ui= ui+ui-1+…+u1 pi=(Ni/N)·100 qi=(Ui/Uk)·100

… … … … … … …

… … … … … … …

xk nk Nk uk=xk·nk Uk= uk+uk-1+…+u1 100 100

pk=(Nk/N)·100 qk=(Uk/Uk)·100

2.3.4 Mesures de concentració. Càlcul de pi i qi

Estadística econòmica i empresarial I E. Motellón

xi ni ui=xi·ni si=(ui/Uk)·100 Ui= ui+Ui-1 qi=(Ui/U)·100 qi=qi-1+si

18700 21 392700 6.84 392700 6.84 6.84

20400 25 510000 8.89 902700 15.73 15.73

28000 30 840000 14.64 1742700 30.37 30.37

32500 17 552500 9.63 2295200 40.00 40.00

45000 15 675000 11.76 2970200 51.76 51.76

50000 18 900000 15.68 3870200 67.45 67.45

62000 14 868000 15.13 4738200 82.57 82.57

100000 10 1000000 17.43 5738200 100.00 100.00

150 5738200

Amb l’opció b) dels punts 4 i 6

2.3.4 Mesures de concentració. Càlcul de pi i qi

E. Motellón Estadística econòmica i empresarial I

Representació gràfica del repartiment de la variable. Compara pi (com es reparteix la població) amb qi (com es reparteix la variable)

Procés:

1.  Dibuixem quadre (costats dividits en una escala que va del 0 al 100)

2. Costat inferior eix d’ordenades (vertical): valors de qi

3. Costat esquerre eix d’abscisses (horitzontal): valors de pi

4. Projectar, en aquest eixos, punts formats per les coordenades que marquen els punts de concentració: pi i qi

5. Unim punts formant una corba poligonal (corba de Lorenz)

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

pi qi 14.00 6.84 30.67 15.73 50.67 30.37 62.00 40.00 72.00 51.76 84.00 67.45 93.33 82.57

100.00 100.00 0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

pi qi 14 0 30 0 50 0 62 0 72 0 84 0 90 0 93 0 95 0 96 0 97 0 98 0 99 100

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

pi qi 14.00 14.00 30.67 30.67 50.67 50.67 62.00 62.00 72.00 72.00 84.00 84.00 93.33 93.33

100.00 100.00 0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

2.3.4 Mesures de concentració. Corba de Lorenz

E. Motellón Estadística econòmica i empresarial I

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

1.  Corba situada necessàriament per sota de la bisectriu (recta ), atès q la distribució està ordenada de menor a major

2.  Per ordenació de menor a major, la corba tindrà sempre una tendència creixent, partint del punt de l’origen (0,0) fins arribar al màxim (100,100)

3.  Corba de concentració mínima (equidistribució) coincideix amb la bisectriu , donat que qi = pi

4.  La corba de concentració màxima formada pels costats del quadre

5.  + a prop corba de Lorenz de la bisectriu à + equitativa (- concentració)

2.3.4 Mesures de concentració. Corba de Lorenz

OB

nxxxxx ≤≤≤≤≤ ...4321

⇒ Sempre s’ha de complir que qi ≤ pi

OBABOA

OB

O A

B

corba q representa distribució + equitativa (- concentració)

E. Motellón Estadística econòmica i empresarial I

Expressió numèrica de l’anàlisi de concentració:

•  Índex de Gini pren valors compresos entre 0 i 1: 0 ≤ Ig ≤ 1

–  Ig = 0 ⇒ Concentració mínima (equidistribució) à qi = pi

–  Ig = 1 ⇒ Concentració màxima

•  Sí li afecten els canvis d’origen

•  No li afecten els canvis d’escala

nxxxxx ===== ...4321

%)100(0,1,...,2,1,00... 14321

=≠−=∀=

≠===== −

kki

nn

qqikiqxxxxxx

( )

∑−

=

=

−= 1

1

1

1k

ii

k

iii

p

qpIg

2.3.4 Mesures de concentració. Índex de Gini (Ig)

E. Motellón Estadística econòmica i empresarial I

Exemple: Índex de Gini xi ni Ni pi qi pi-qi

18700 21 21 14.00 6.84 7.16

20400 25 46 30.67 15.73 14.94

28000 30 76 50.67 30.37 20.30

32500 17 93 62.00 40.00 22.00

45000 15 108 72.00 51.76 20.24

50000 18 126 84.00 67.45 16.55

62000 14 140 93.33 82.57 10.76

100000 10 150 100.00 100.00 ---

150 67,406

1

1

=∑−

=

k

iip ( ) 94,111

1

1

=−∑−

=

k

iii qp

( )2753,0

67,40694,111

1

1

1

1 ==−

=

∑−

=

=k

ii

k

iii

g

p

qpI

E. Motellón Estadística econòmica i empresarial I

Ig proper a 0 ⇒ corba de Lorenz + a prop de diagonal (bisectriu)

Ig proper a 1 ⇒ corba de Lorenz + a lluny de diagonal

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

O A

B

O A

B

Ig < Ig

Major concentració (distribució + equitativa)

Ig = 0

Concentració mínima (equidistribució)

Ig = 1

Concentració màxima

2.3.4 Mesures de concentració. Corba de Lorenz i Índex de Gini

E. Motellón Estadística econòmica i empresarial I

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

p i

qi

O A

B

Ig= superfície OB / superfície OAB

E. Motellón Estadística econòmica i empresarial I

2.3.4 Mesures de concentració. Corba de Lorenz i Índex de Gini

Tema 2.4. Transformacions lineals

•  Canvis d’escala

•  Canvis d’origen

•  Estandarització i tipificació

(veure Conceptes bàsics 2.pdf)

E. Motellón Estadística econòmica i empresarial I

Situació: X analitzada experimenta algun tipus de transformació

Objectiu: Establir els valors dels estadístics de la variable transformada sense repetir tots els càlculs

Transformacions: •  Canvis d’origen. Si a tots els valors que pren una variable

li sumem (restem) una constant a

•  Canvis d’escala. Si a tots els valors que pren una variable els multipliquem (dividim) per una constant b

Xi + a = ʹXi

Xi ·b = ′′Xi

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

E. Motellón Estadística econòmica i empresarial I

Situació: X analitzada experimenta algun tipus de transformació

Objectiu: Establir els valors dels estadístics de la variable transformada sense repetir tots els càlculs

Transformacions: •  Canvis d’origen. Si a tots els valors que pren una variable

li sumem (restem) una constant a

•  Canvis d’escala. Si a tots els valors que pren una variable els multipliquem (dividim) per una constant b

Xi + a = ʹXi

Xi ·b = ′′Xi

E. Motellón Estadística econòmica i empresarial I

Afecten aquestes transformacions

als estadístics analitzats?

Com?

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Afecta No afecta

Canvis d’origen

Canvis d’escala

g

Kr

ICV

QMeMox /,,,

21

2

,,,,,

ggASSRR

p

xxeI

xxIe

Kr

SSRRQMeMox,,,

,,,2

/

g

p

IggA

CV

21,,

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Situació: Comparar valors de diferents variables que estan expressades en distintes u.m. o també les posicions relatives que ocupen determinats valors

Objectiu: Generar nova variable (Z), a partir dels valor de la variable (X), que presenti les següents característiques:

1.  2. 

Com?

z = 0SZ2 =1 , SZ =1

Zi =Xi − xSX

Variable estandaritzada, normalitzada, tipificada

E. Motellón Estadística econòmica i empresarial I

2.4 Transformacions lineals. Canvis d’origen i canvis d’escala

Resultat: �  Centrem les variables al mateix punt (= centre de gravetat)

i les dotem de la mateixa escala (desviació típica)

�  Valors tipificats: perden la unitat de la variable (Z adimensional)

Zi =Xi − xSX

Propietat: fer comparable individus q pertanyen a distintes distribucions (fins i tot expressades en ≠ u.m.)

2.4 Transformacions lineals. Estandarització o tipificació

E. Motellón Estadística econòmica i empresarial I

Dos graduats en economia en el mateix sector d’activitat.

-  Individu A guanya 30.000€ i treballa a l’Empresa T

-  Individu B guanya 35.000€ i treballa a l’Empresa P

En ambdues situacions WGraduat > WMitjà. Però, quin graduat ocupa una millor posició relativa dintre de la seva empresa?

Exemple estandarització o tipificació

Solució: En termes absoluts el graduat B guanya més que l’A, Però, en relació al conjunt dels empleats de cada ESA l'individu A ocupa millor posició

E. Motellón Estadística econòmica i empresarial I

Com a RECORDATORI final ...

�  Aquest material s’utilitza com a guia per realitzar les sessions presencials a l’aula. NO són els apunts de l’assignatura.

�  Reviseu amb atenció el document “Conceptes bàsics 2” penjat al campus, en ell trobareu un major detall de la informació referida al tema 2 publicada al Pla docent (contingut, objectius, conceptes claus, bibliografia, etc.)

�  No oblideu ampliar els coneixements. Trobareu la bibliografia recomanada a la biblioteca de la Facultat, conjuntament amb un ampli ventall de manuals d’estadística també interessants.

E. Motellón Estadística econòmica i empresarial I

top related