aula 01 dist frequencia

50
1 Por que estudar estatística ? para extrairmos informações significativas de pilhas de dados brutos; para fazer inferência sobre a natureza de uma população com base em observações sobre uma amostra; entender e interpretar cálculos estatísticos efetuados por outra pessoa.

Upload: independent

Post on 09-Dec-2023

0 views

Category:

Documents


0 download

TRANSCRIPT

1

Por que estudar estatística ?

para extrairmos informações significativas de pilhas de dados brutos;

para fazer inferência sobre a natureza de uma população com base em observações sobre uma amostra;

entender e interpretar cálculos estatísticos efetuados por outra pessoa.

2

Por que estudar estatística?

Apoio ao processo de decisão;

Apoio ao planejamento.

3

Qualidade mágica da estatística Predições razoavelmente precisas sobre o resultado de

uma eleição de um universo de 250 milhões de eleitores, consultando apenas alguns milhares deles.

Estimativa de audiência de um programa de televisão com base em uma pequena amostra de domicílios escolhidos aleatoriamente.

Estatística descritiva

Processo de obtenção de informações

significativas a partir de conjuntos de números.

Estatística inferencial ou indutiva

Consiste em estimar propriedades de uma grande

população a partir de observações feitas em uma

amostra da mesma.

População e amostra

População- todos os indivíduos ou objetos do grupo que estamos interessados.Amostra

- é um conjunto de elementos extraídos da população.

7

Por quê estudar amostra em lugar de população?

pelo custo;

pela dificuldade de estudar toda a população;

pois, o processo de pesquisa pode destruir o elemento pesquisado.

8

Variável: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Tipos de variáveis:

• qualitativas e quantitativas;

• dependentes e independentes.

9

• Variável qualitativa (categórica): Quando seus valores são expressos por atributos: sexo, cor da pele, etc.

Tipos de variáveis qualitativas: Nominal e Ordinal.

10

Escalas de medidas das variáveis qualitativas:

Nominal

Ordinal

11

Escala nominal:

Mede atributos que só conhecem relações de equivalência (igual ou diferente) e, por isso, não tem sentido de direção, nem unidade de distância definida e, tampouco, reconhece um valor nulo.

Exemplos: sexo, nacionalidade, cor, estado civil, etc.

12

Escala ordinal:

Classificam os indivíduos segundo a ordem que ocupam.

Exemplos: primeiro, segundo, etc.

13

Grande Premio da Alemanha 20081º. Hamilton, 2º. Piquet, 3º. Massa

Exemplo:

14

Variável quantitativa: Quando os dados são de caráter nitidamente quantitativo (medida), e o conjunto dos resultadospossui uma estrutura numérica.

Tipos de variáveis quantitativas: Discreta ou Descontínua Contínua

15

Variável discreta ou descontínua: Seus valores são expressos, geralmente, através de números inteiros não negativos.

Resulta normalmente de contagens.

Ex: Número de alunos presentes às aulas de Indicadores Geoespaciais no 2º semestre de 2016:

jul = 18ago = 30set = 35out = 36

Variável contínua:

Resulta normalmente de uma mensuração, e a escala numérica de seus valores corresponde ao conjunto dos números reais, ou seja, pode assumir, teoricamente, qualquer valor entre dois limites.

Ex.: Quando se mede a temperatura de uma pessoa com um termômetro de mercúrio, ocorre o seguinte: o filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo.

16

17

Escalas de medidas das variáveis continuas:

Escala Intervalar;

Escala Proporcional (razão).

18

Escala intervalar:

Quantifica as distâncias, mas não há um ponto nulo natural; Tem-se a definição de unidade de mensuração; A escala intervalar tem um zero, mas ele é um ponto arbitrado para a origem das unidades de medida e não tem correspondência com a situação de zero absoluto.

19

Escala intervalar:

20

O exemplo típico de escala intervalar é o da medida de temperatura. Não há um zero de temperatura que corresponda a uma ausência de temperatura.

Percebe-se que dizer que 10oC é o dobro de 5oC não é verdade pois, se a escala de temperatura for Fahrenheit, os mesmos valores serão dados, respectivamente, por 50oF e 41oF (observe que 50 não é o dobro de 41).

O que pode ser dito é que a mudança de 5 para 10 graus Celsius equivale à passagem de 10 para 15 graus Celsius, assim como a passagem de 41 para 50 graus Fahrenheit equivale à passagem de 50 para 59 graus Fahrenheit.

Prof. Dr. Celso Correia de Souza

21

Escala proporcional (ou escala razão)

Nesta escala é possível quantificar as medições, como também, um ponto de nulidade (zero absoluto).

É possível fazer: diferença, quociente, conversão de unidades, etc.

22

Exemplos: -comprimento.

-peso.

23

Variável dependente É aquela que mede o fenômeno que se estuda.

Ex: Produção mensal de peças: quantitativa discreta - número de peças

produzidas por mês em uma empresa;

qualitativa ordinal - menos que 300, entre 300 e 500, mais que 500.

24

Variável independente: É aquela candidata a explicar a dependente.

Ex: Se a maioria das funcionárias produz mais que 500 peças por mês e a maioria dos funcionários produz menos que 300 peças por mês, pode-se “suspeitar” que sexo e produção estão intimamente relacionados, ou seja, que mulheres são mais competentes/rápidas que homens na mesma função.

Variável dependente: produção de peças. Variável independente: sexo

25

Dados nominais e dados em classe

Dados nominais

São aqueles nos quais todos os valores da variável foram enumerados, nominados (variável discreta).

Dados em classe

São aqueles nos quais todos os valores da variável estão na forma de razão ou intervalar (variável contínua).

26

Dados agrupados nominalmente

São aqueles em que as observações são agrupadas pelo nome ou pelo rótulo.

As variáveis qualitativas devem ser agrupadas nominalmente.

27

Dados agrupados em classes

Dados agrupados em classe são aqueles em que as observações são agrupadas em intervalos.

As variáveis quantitativas podem ser agrupadas nominalmente ou em classes.

28

Agrupamento de dados nominais

Os dados nominais são descritos das seguintes maneiras:

Tabela de Freqüências.Gráfico de Barras.Gráfico de Setores.

29

Tabela de frequências

A tabela de frequências é uma tabela na qual numa das colunas aparecem os valores observados da variável e nas demais colunas aparecem as frequências de ocorrência dos respectivos valores.

30

As colunas de frequências contém:

Frequências observadas;

Frequências acumuladas;

Frequências relativas;

Frequências relativas acumuladas.

31

Exemplo:

Suponha que foi realizado um estudo junto ao público consumidor feminino de uma determinada loja de calçados. Foi coletada uma amostra de 20 clientes. De cada uma foi anotado o número do calçado usado.

O resultado foi o seguinte:

32

Frequência observada

35 38 36 37 37

39 37 38 36 37

39 37 37 35 36

37 36 38 36 37

NÚMERO DO CALÇADO

Neste exemplo a variável é o número do calçado. Essa variável é qualitativa e é numérica.

A frequência do valor “37”

é 8

33

Tabela de distribuição de frequência

34

Freqüência acumulada

Contabiliza as observações até o valor considerado.

35

Frequência relativa

Fornece a relação entre a frequência observada de um determinado valor e o número total de observações realizadas no experimento.

36

A Frequência relativa acumulada Fornece a relação entre a frequência acumulada e o número total de observações realizadas.

37

Dados agrupados em classes

Os dados agrupados em classes são descritos usando-se os seguintes recursos:

Tabela de frequênciasHistogramasPolígono de frequênciasCurvas de frequênciasGráfico de barras.Gráfico de setores.

38

Tabela de frequências: dados agrupados em classe

É constituída da mesma forma que para dados nominais, com a diferença de que agora os valores da variável são organizados por classes.

O número de classes k deve ficar entre 5 e 20.Se k for menor do que 5, aproximar para 5;

Se k for maior do que 20, aproximar para 20.

39

Cálculo do número de classes k:

- fórmula de Sturges.

n: número de elementos da série;

Se k for menor do que 5, aproximar para 5;

Se k for maior do que 20, aproximar para 20.

nk log22,31

nk

40

Cálculo da amplitude de classe h:

classesdenumerovalormenorvalormaiorh )(

41

Exemplo: Suponhamos uma compra de uniformes para 40

alunos da escola X. Necessitamos das estaturas, em cm, dos alunos.

166 160 161 150 162 160 165 167 164 160

162 162 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 162

42

O que é importante saber ?

Na realidade, não nos interessa saber quantas pessoas têm altura 170 cm, o que nos interessa é saber quantas pessoas têm altura na faixa, por exemplo, de 160 a 170 cm.

Dados apresentados nessa forma chamam-se dados agrupados em distribuição de freqüência.

43

Passos para a obtenção da Distribuição de Frequências

-Colocar na ordem crescente (ról)

150 151 152 153 154 155 155 155 155 156

156 156 157 158 158 160 160 160 160 160

161 161 161 161 162 162 163 163 164 164

164 165 166 167 168 168 169 170 172 173

44

- Amplitude total:

- Número de classes:

- Amplitude de classe (usando k = 6)

23150173.min.máx xxAT

616,640log22,31log22,31 knk

483,3623

hhkATh

45

ESTATURAS (cm) FREQUÊNCIA

150 |----- 154154 |----- 158158 |----- 162162 |----- 166166 |----- 170170 |----- 174

49

11853

40

- Distribuição de frequência

46

Histograma: é a apresentação gráfica de uma distribuição de freqüências por meio de retângulos justapostos.

Exemplo: Idade de alunos da escola X

Classes

10

65

32

1 2 4 6 8 10 120

ifClasses fi

2 |---- 4 3

4 |---- 6 5

6 |---- 8 10

8 |---- 10 6

10 |---- 12 2

47

Polígonos de frequênciasNesse gráfico as classes são representadas pelos seus pontos médios.

O polígono é formado pela união de retas pelos pontos médios das partes superiores de cada retângulo do histograma.

O polígono é fechado unindo-se os pontos médios da menor e da maior classes aos pontos médios das classes imediatamente inferior e superior, respectivamente.

48

Exemplo: Idade de alunos da escola X.

Classes

10

65

32

1 2 4 6 8 10 12

Polígono de Freqüência

Histograma

0

ifIDADE fi Fi

2 |---- 4 3 3

4 |---- 6 5 8

6 |---- 8 10 18

8 |---- 10 6 24

10 |----12 2 26

26  

49

Ogiva ou polígono de frequência acumulada

É um gráfico estatístico, em forma de uma linha poligonal aberta, construído a partir da coluna das frequências acumuladas. Exemplo: Idade de alunos da escola X.

128642

8

18

2426

classes0

ifIDADE fi Fi

2 |---- 4 3 3

4 |---- 6 5 8

6 |---- 8 10 18

8 |---- 10 6 24

10 |----12 2 26

26  

50

Exemplo

Um gerente de uma loja mandou realizar um estudo a respeito do valor das compras feitas por seus clientes. Foi colhida uma amostra aleatória de 50 compras realizadas por seus clientes e o resultado foi o seguinte:

315,10 129,00 174,80 202,30 218,20 224,50 236,10 249,20 269,00 284,10

328,00 228,30 238,00 289,00 252,40 270,80 142,50 175,40 204,30 219,70

152,40 186,80 149,30 180,40 208,40 219,90 161,80 195,40 211,50 220,80

169,70 199,10 213,00 215,80 221,90 229,10 239,20 259,30 271,60 293,20

232,80 242,50 262,80 274,50 296,10 235,40 246,70 265,10 281,00 302,10

VALORES DAS COMPRAS (R$)