aula 01 dist frequencia
TRANSCRIPT
1
Por que estudar estatística ?
para extrairmos informações significativas de pilhas de dados brutos;
para fazer inferência sobre a natureza de uma população com base em observações sobre uma amostra;
entender e interpretar cálculos estatísticos efetuados por outra pessoa.
3
Qualidade mágica da estatística Predições razoavelmente precisas sobre o resultado de
uma eleição de um universo de 250 milhões de eleitores, consultando apenas alguns milhares deles.
Estimativa de audiência de um programa de televisão com base em uma pequena amostra de domicílios escolhidos aleatoriamente.
Estatística descritiva
Processo de obtenção de informações
significativas a partir de conjuntos de números.
Estatística inferencial ou indutiva
Consiste em estimar propriedades de uma grande
população a partir de observações feitas em uma
amostra da mesma.
População e amostra
População- todos os indivíduos ou objetos do grupo que estamos interessados.Amostra
- é um conjunto de elementos extraídos da população.
7
Por quê estudar amostra em lugar de população?
pelo custo;
pela dificuldade de estudar toda a população;
pois, o processo de pesquisa pode destruir o elemento pesquisado.
8
Variável: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno.
Tipos de variáveis:
• qualitativas e quantitativas;
• dependentes e independentes.
9
• Variável qualitativa (categórica): Quando seus valores são expressos por atributos: sexo, cor da pele, etc.
Tipos de variáveis qualitativas: Nominal e Ordinal.
11
Escala nominal:
Mede atributos que só conhecem relações de equivalência (igual ou diferente) e, por isso, não tem sentido de direção, nem unidade de distância definida e, tampouco, reconhece um valor nulo.
Exemplos: sexo, nacionalidade, cor, estado civil, etc.
12
Escala ordinal:
Classificam os indivíduos segundo a ordem que ocupam.
Exemplos: primeiro, segundo, etc.
14
Variável quantitativa: Quando os dados são de caráter nitidamente quantitativo (medida), e o conjunto dos resultadospossui uma estrutura numérica.
Tipos de variáveis quantitativas: Discreta ou Descontínua Contínua
15
Variável discreta ou descontínua: Seus valores são expressos, geralmente, através de números inteiros não negativos.
Resulta normalmente de contagens.
Ex: Número de alunos presentes às aulas de Indicadores Geoespaciais no 2º semestre de 2016:
jul = 18ago = 30set = 35out = 36
Variável contínua:
Resulta normalmente de uma mensuração, e a escala numérica de seus valores corresponde ao conjunto dos números reais, ou seja, pode assumir, teoricamente, qualquer valor entre dois limites.
Ex.: Quando se mede a temperatura de uma pessoa com um termômetro de mercúrio, ocorre o seguinte: o filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo.
16
18
Escala intervalar:
Quantifica as distâncias, mas não há um ponto nulo natural; Tem-se a definição de unidade de mensuração; A escala intervalar tem um zero, mas ele é um ponto arbitrado para a origem das unidades de medida e não tem correspondência com a situação de zero absoluto.
20
O exemplo típico de escala intervalar é o da medida de temperatura. Não há um zero de temperatura que corresponda a uma ausência de temperatura.
Percebe-se que dizer que 10oC é o dobro de 5oC não é verdade pois, se a escala de temperatura for Fahrenheit, os mesmos valores serão dados, respectivamente, por 50oF e 41oF (observe que 50 não é o dobro de 41).
O que pode ser dito é que a mudança de 5 para 10 graus Celsius equivale à passagem de 10 para 15 graus Celsius, assim como a passagem de 41 para 50 graus Fahrenheit equivale à passagem de 50 para 59 graus Fahrenheit.
Prof. Dr. Celso Correia de Souza
21
Escala proporcional (ou escala razão)
Nesta escala é possível quantificar as medições, como também, um ponto de nulidade (zero absoluto).
É possível fazer: diferença, quociente, conversão de unidades, etc.
23
Variável dependente É aquela que mede o fenômeno que se estuda.
Ex: Produção mensal de peças: quantitativa discreta - número de peças
produzidas por mês em uma empresa;
qualitativa ordinal - menos que 300, entre 300 e 500, mais que 500.
24
Variável independente: É aquela candidata a explicar a dependente.
Ex: Se a maioria das funcionárias produz mais que 500 peças por mês e a maioria dos funcionários produz menos que 300 peças por mês, pode-se “suspeitar” que sexo e produção estão intimamente relacionados, ou seja, que mulheres são mais competentes/rápidas que homens na mesma função.
Variável dependente: produção de peças. Variável independente: sexo
25
Dados nominais e dados em classe
Dados nominais
São aqueles nos quais todos os valores da variável foram enumerados, nominados (variável discreta).
Dados em classe
São aqueles nos quais todos os valores da variável estão na forma de razão ou intervalar (variável contínua).
26
Dados agrupados nominalmente
São aqueles em que as observações são agrupadas pelo nome ou pelo rótulo.
As variáveis qualitativas devem ser agrupadas nominalmente.
27
Dados agrupados em classes
Dados agrupados em classe são aqueles em que as observações são agrupadas em intervalos.
As variáveis quantitativas podem ser agrupadas nominalmente ou em classes.
28
Agrupamento de dados nominais
Os dados nominais são descritos das seguintes maneiras:
Tabela de Freqüências.Gráfico de Barras.Gráfico de Setores.
29
Tabela de frequências
A tabela de frequências é uma tabela na qual numa das colunas aparecem os valores observados da variável e nas demais colunas aparecem as frequências de ocorrência dos respectivos valores.
30
As colunas de frequências contém:
Frequências observadas;
Frequências acumuladas;
Frequências relativas;
Frequências relativas acumuladas.
31
Exemplo:
Suponha que foi realizado um estudo junto ao público consumidor feminino de uma determinada loja de calçados. Foi coletada uma amostra de 20 clientes. De cada uma foi anotado o número do calçado usado.
O resultado foi o seguinte:
32
Frequência observada
35 38 36 37 37
39 37 38 36 37
39 37 37 35 36
37 36 38 36 37
NÚMERO DO CALÇADO
Neste exemplo a variável é o número do calçado. Essa variável é qualitativa e é numérica.
A frequência do valor “37”
é 8
35
Frequência relativa
Fornece a relação entre a frequência observada de um determinado valor e o número total de observações realizadas no experimento.
36
A Frequência relativa acumulada Fornece a relação entre a frequência acumulada e o número total de observações realizadas.
37
Dados agrupados em classes
Os dados agrupados em classes são descritos usando-se os seguintes recursos:
Tabela de frequênciasHistogramasPolígono de frequênciasCurvas de frequênciasGráfico de barras.Gráfico de setores.
38
Tabela de frequências: dados agrupados em classe
É constituída da mesma forma que para dados nominais, com a diferença de que agora os valores da variável são organizados por classes.
O número de classes k deve ficar entre 5 e 20.Se k for menor do que 5, aproximar para 5;
Se k for maior do que 20, aproximar para 20.
39
Cálculo do número de classes k:
- fórmula de Sturges.
n: número de elementos da série;
Se k for menor do que 5, aproximar para 5;
Se k for maior do que 20, aproximar para 20.
nk log22,31
nk
41
Exemplo: Suponhamos uma compra de uniformes para 40
alunos da escola X. Necessitamos das estaturas, em cm, dos alunos.
166 160 161 150 162 160 165 167 164 160
162 162 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 162
42
O que é importante saber ?
Na realidade, não nos interessa saber quantas pessoas têm altura 170 cm, o que nos interessa é saber quantas pessoas têm altura na faixa, por exemplo, de 160 a 170 cm.
Dados apresentados nessa forma chamam-se dados agrupados em distribuição de freqüência.
43
Passos para a obtenção da Distribuição de Frequências
-Colocar na ordem crescente (ról)
150 151 152 153 154 155 155 155 155 156
156 156 157 158 158 160 160 160 160 160
161 161 161 161 162 162 163 163 164 164
164 165 166 167 168 168 169 170 172 173
44
- Amplitude total:
- Número de classes:
- Amplitude de classe (usando k = 6)
23150173.min.máx xxAT
616,640log22,31log22,31 knk
483,3623
hhkATh
45
ESTATURAS (cm) FREQUÊNCIA
150 |----- 154154 |----- 158158 |----- 162162 |----- 166166 |----- 170170 |----- 174
49
11853
40
- Distribuição de frequência
46
Histograma: é a apresentação gráfica de uma distribuição de freqüências por meio de retângulos justapostos.
Exemplo: Idade de alunos da escola X
Classes
10
65
32
1 2 4 6 8 10 120
ifClasses fi
2 |---- 4 3
4 |---- 6 5
6 |---- 8 10
8 |---- 10 6
10 |---- 12 2
47
Polígonos de frequênciasNesse gráfico as classes são representadas pelos seus pontos médios.
O polígono é formado pela união de retas pelos pontos médios das partes superiores de cada retângulo do histograma.
O polígono é fechado unindo-se os pontos médios da menor e da maior classes aos pontos médios das classes imediatamente inferior e superior, respectivamente.
48
Exemplo: Idade de alunos da escola X.
Classes
10
65
32
1 2 4 6 8 10 12
Polígono de Freqüência
Histograma
0
ifIDADE fi Fi
2 |---- 4 3 3
4 |---- 6 5 8
6 |---- 8 10 18
8 |---- 10 6 24
10 |----12 2 26
26
49
Ogiva ou polígono de frequência acumulada
É um gráfico estatístico, em forma de uma linha poligonal aberta, construído a partir da coluna das frequências acumuladas. Exemplo: Idade de alunos da escola X.
128642
8
18
2426
classes0
ifIDADE fi Fi
2 |---- 4 3 3
4 |---- 6 5 8
6 |---- 8 10 18
8 |---- 10 6 24
10 |----12 2 26
26
50
Exemplo
Um gerente de uma loja mandou realizar um estudo a respeito do valor das compras feitas por seus clientes. Foi colhida uma amostra aleatória de 50 compras realizadas por seus clientes e o resultado foi o seguinte:
315,10 129,00 174,80 202,30 218,20 224,50 236,10 249,20 269,00 284,10
328,00 228,30 238,00 289,00 252,40 270,80 142,50 175,40 204,30 219,70
152,40 186,80 149,30 180,40 208,40 219,90 161,80 195,40 211,50 220,80
169,70 199,10 213,00 215,80 221,90 229,10 239,20 259,30 271,60 293,20
232,80 242,50 262,80 274,50 296,10 235,40 246,70 265,10 281,00 302,10
VALORES DAS COMPRAS (R$)