aula2 cap 02

27
Estatística e Probabilidade Prof. Dr . Alysson Steimache r Prof. Dr . Alysson Steimache r Aula 2 – Cap 02 Estatística Descritiva

Upload: alysson-steimacher

Post on 21-Jul-2015

239 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Aula 2 – Cap 02

Estatística Descritiva

Page 2: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

estudaremos formas de organizar e descrever conjuntos de dados. O objetivo

é tornar os dados mais compreensíveis de modo a enxergar neles tendências,

médias e variações.

Neste capítulo...

Page 3: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Dados etários da população de Akhiok-Alasca

6356555453525150504948474645424139363433333232313130292828272726252524232221211717161615131212111111101010988776666555444332221110

Sem uma maneira de organizar estes dados é difícil enxergar padrões.

Page 4: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Distribuição de freqüência e seus gráficosDistribuição de freqüências é uma tabela que mostra classes ou intervalo de entrada de dados com um número total de entradas em cada classe. A freqüência f de uma classe é o número de entrada de dados na classe.

As classes possuem amplitudes iguais e cada classe possui um limite inferior da classe, que é menor número que pode pertencer à classe, e o limite superior que é o maior número que pode pertencer a classe.426-30

521-25816-20611-1586-1051-5

Frequência, fClasse

Page 5: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Amplitude das classes: Distância entre os limites inferiores (ou superiores) de classes consecutivas.

Amplitude total:

426-30521-25816-20611-1586-1051-5

Frequência,fClasse

O número de classes deve estar entre 5 e 20.

Diferença entre o máximo e o mínimo das entradas.

Amplitude total:

30 - 1 = 29

Amplitude das classes:

6 - 1 = 5

Page 6: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

102 124 108 86 103 8271 104 112 118 87 95

103 116 85 122 87 100105 97 107 67 78 125109 99 105 99 101 92

Faça uma tabela de distribuição de freqüência com5 classes.

Minutos/mês gastos na internet para 30 assinantes

Valores-chave: Valor mínimo =Valor máximo =

67125

Exemplo:

Page 7: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher4. Marque um risco | em cada entrada de dado na classe apropriada.

1. Decida o número de classes, que deve ficar entre 5 e 20.

2. Calcule a amplitude das classes.

3. Calcule os limites das classes.

(Para este problema use 5.)

Primeiro calcule: amplitude total = valor máximo – mínimo. Em seguida, divida o resultado pelo número de classes. Por fim, arredonde até o próximo número conveniente. (125 – 67)/5 = 11,6 (arredondado para 12)

O limite inferior da classe é o valor mais baixo que pertence a ela e o limite superior é o mais alto. Use o valor mínimo (67) como limite inferior da primeira classe.

Quando todos os valores estiverem marcados, conte os riscos em cadaclasse para determinar a freqüência dessa classe.

Como construir uma distribuição de frequências

Page 8: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Mínimo = 67, Máximo = 125Número de classes = 5Amplitude de classe = 12

5| | | |115 - 1269| | | | | | | |103 - 1138| | | | | | | 91 - 1025| | | |79 - 903| | |67 - 78

FreqüênciaRiscosClasse

Dica: Faça primeiro todos os limites inferiores.

Page 9: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Ponto médio de uma classe: é a caracteristica de uma classe. É a metade da soma entre os limites inferior e superior da classe

(limite inferior + limite superior) / 2

Freqüência relativa de uma classe: é a porção ou porcentagem dos dados que entra nessa classe.

frel = (freqüência da classe) / (tamanho da amostra n)

Freqüência cumulativa de uma classe: é a soma da frequencia daquelaclasse com a de todas as classes anteriores. A frequencia cumulativa da última classe é igual ao tamanho da amostra n.

Definições importantes

Page 10: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher0,17

0,30

0,27

(5 / 30) = 0,17

(3 / 30) = 0,10

Freqüência relativa ( f / n)

120,5

108

96,5

84,5

72,5

Ponto médio(67 + 78)/2

5

9

8

5

3

f

30115-126

25103-113

1691-102

879-90

367-78

Freqüência cumulativa

Classe

Definições importantes

Tabela: possibilidade de identificar padrões

Page 11: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Gráficos das distribuiçõesde freqüência

Page 12: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Histograma de freqüênciaé um gráfico de barras que representa a distribuição de freqüência de um conjunto de dados. Um histograma possui as seguintes propriedades:

1 – A escala horizontal é quantitativa2 – A escala vertical mede as freqüências das classes3 – Barras consecutivas devem estar encostadas umas as outras

Como as barras de freqüência devem se encostar elas começam e terminam na fronteira das classes, e não nos limites das classes.

Fronteira das classes são os números que separam as classes sem deixaruma falha entre elas.

Page 13: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

126,5114,5102,590,578,566,5

9

8

7

6

5

4

3

2

1

0

5

98

5

3

Tempo na internet

minutos

5

9

8

5

3

f

114,5–126,5115-126

102,5–114,5103-113

90,5–102,591-102

78,5–90,579-90

66,5–78,567-78

FronteirasClasse

Para determinar a fronteira de classe encontre a média do valor entre o limite inferior da segunda classe e o limite superior da primeira classe.

Subtraia este valor da fronteira inferior da primeira classe e some ao valor superior da primeira classe e assim sucessivamente para as outras classes.

(79 – 78) / 2 = 0,5

Page 14: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Para traçar um polígono de freqüência marque o ponto médio no topo de cada barra. Conecte os pontos médios consecutivos. Estenda o polígono até os eixos.

98

7654

3210

5

98

5

3

Tempo na internet

minutos72,5 84,5 96,5 108,5 120,5

Polígono de freqüênciaé um gráfico em forma de linha que enfatiza a mudança contínua nas freqüências.

Page 15: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Apresenta em sua escala vertical as freqüências relativas.

Tempo na internet

minutos

Freq

üênc

iare

lativ

a

0,30

0,20

0,10 0,10

0,17

0,270,30

0,17

66,5 78,5 90,5 102,5 114,5 126,50

Histograma de freqüência relativa

Page 16: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Um gráfico de freqüência cumulativa (ou ogiva) mostra o número de valores, em um conjunto de dados, que são iguais ou inferiores a um dado valor x.

03

8

16

25

30

66,5 78,5 90,5 102,5 114,5 126,50

10

20

30

Freq

üênc

iacu

mul

ativ

a

minutos

Tempo na internet

Gráfico de freqüência cumulativa

Page 17: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Mais gráficos e representações

Page 18: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

102 124 108 86 103 8271 104 112 118 87 95103 116 85 122 87 100105 97 107 67 78 125109 99 105 99 101 92

Diagrama de tronco e folhasé similar ao histograma, mas com a vantagem de que o gráfico aindacontém os valores dos dados originais.

Se o valor mais baixo é 67 e o mais alto é 125, o tronco vai de 6 a 12.

Page 19: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

102 124 108 82 103 8571 104 112 118 86 95103 116 87 122 87 100105 97 107 67 78 125109 99 105 99 101 92

Diagrama de tronco e folhas

6 | 77 | 1 88 | 2 5 6 7 79 | 2 5 7 9 910 | 0 1 2 3 3 4 5 5 7 8 911 | 2 6 812 | 2 4 5

Chave: 6|7 significa 67tronco

folhas

Page 20: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

6 | 6 | 77 | 17 | 88 | 28 | 5 6 7 79 | 29 | 5 7 9 9

10 | 0 1 2 3 3 410 | 5 5 7 8 911 | 211 | 6 812 | 2 412 | 5

Chave: 6|7 significa 67

Dígitos da 1a linha 0 1 2 3 4

Dígitos da 2a linha 5 6 7 8 9

Dígitos da 1a linha 0 1 2 3 4

Dígitos da 2a linha 5 6 7 8 9

Diagrama de tronco e folhas – 2 linhas/tronco

Page 21: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Plote de pontosEm um plote de pontos cada entrada é desenhada, usando um ponto ●sobre um eixo horizontal.

Um plote de pontos permite que se veja como os dados estão distribuídos e se determinem entradas específicas de dados.

66 76 86 96 106 116 126

minutos/mês na Internet

minutos

Page 22: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Diagrama de Pizzatem a forma de um círculo que mostra as relações das partes como um todo.

Para encontrar o angulo central para uma entrada de dados multiplique3600 pela frequência relativa da entrada de dados.

O orçamento da Nasa (em bilhões de dólares) dividido emtrês categorias

Construa um diagrama de pizza para esses dados.

Vôo espacial humano 5,7Tecnologia 5,9Apoio às missões 2,7

Bilhões de US$

Exemplo

Page 23: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher Orçamento da Nasa(em bilhões de dólares)

Vôo espacialhumano

40%

Total

Bilhões de US$

Vôo espacial humano 5,7Tecnologia 5,9Apoio às missões 2,7

14,3

Graus

14314968

360Apoio àsmissões

19%

Tecnologia41%

5,7

14,35,9

14,3

Page 24: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Diagrama de Paretoé um gráfico de dados qualitativos no qual a altura de cada barra representa a freqüência ou a freqüência relativa. É frequentementeusado no contexto de negócios.

Exemplo: Recentemente uma industria varejista perdeu 45 milhões de dólares de seus ativos. Os dados das perdas são mostrados na tabela abaixo:

2,9fraudes nas

vendas

14,7assaltos a lojas

15,6furtos de

funcionários

7,8administrativas

Valores (em milhões) Causas

Se você fosse o varejista qual causaescolheria para atacar primeiro?

02468

1012141618

administrativas furtos defuncionários

assaltos alojas

fraudes nasvendas

Causas

Milh

ões

de d

ólar

es

Page 25: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Gráficos de conjuntos de dadosemparelhados

Se dois conjuntos de dados têm o mesmo número de entradas e cada entrada do primeiro corresponde a uma entrada do segundo, eles sãochamados de conjuntos de dados emparelhados.

Uma maneira de fazer o gráfico de dados emparelhados é usar um mapa de dispersão.

Page 26: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

é um plote dos pares (x,y) de dados sendo a horizontal o eixo x e a vertical o eixo y.

Exemplo:Na tabela abaixo temos a duração do vínculo empregatício e o salário anual correspondente de dez trabalhadores

280003

451009

392256

416507

4300010

250002

273504

400008

325004

320005

Salário (R$)Permanência no emprego (anos)

Mapa de Dispersão

2 4 6 8 10

25000

30000

35000

40000

45000

sala

rio (e

m re

ais)

Permanência no emprego (anos)

Page 27: Aula2 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Gráfico da série temporal

Exemplo: Na tabela ao lado, número de assinantes de telefones celulares em milhões e o valor médio da conta mensal local.

41.24861999

39.4369.21998

42.7855.31997

47.7441996

5133.81995

56.2124.11994

61.48161993

68.68111992

72.747.61991

80.95.31990

89.33.51989

98.022.11988

96.831.21987

Conta média(em reais)

Assinantes (em milhões)Ano

é um plote de um conjunto de entradas de dados tomadas a intervalos regulares durante um período de tempo.

1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 20000

20

40

60

80

100

Ass

inan

tes (

em m

ilhoe

s)

Anos