apostila 219

110
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL Instituto de Matemática Departamento de Estatística PROBABILIDADE E ESTATÍSTICA MAT02219 Professor: Marco Antônio Giacomelli www.mat.ufrgs.br/~giacomo/ Porto Alegre, agosto de 2015.

Upload: independent

Post on 15-Nov-2023

3 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

Instituto de Matemática Departamento de Estatística

PROBABILIDADE E ESTATÍSTICA MAT02219

Professor: Marco Antônio Giacomelli www.mat.ufrgs.br/~giacomo/

Porto Alegre, agosto de 2015.

2

1- INTRODUÇÃO

1.1. Ciências Estatísticas Na medida em que foi sendo colocado diante de novos desafios, decorrentes especialmente do crescimento da população – quando as atividades e as relações sócio-econômicas tornaram-se mais complexas – o ser humano precisou aprimorar, sistematicamente, os instrumentos existentes, além de criar outros para continuar garantindo sua sobrevivência. Nesse processo de evolução, que perdura até os dias atuais, novas necessidades e dificuldades foram se sucedendo, sempre desafiando o ser humano a ultrapassá-las. Para registrar, classificar, controlar e estudar, mais adequadamente, fenômenos, fatos, eventos e ocorrências foram sendo criadas, desenvolvidas e aperfeiçoadas muitas técnicas de análise de informações e métodos quantitativos. Esses avanços facilitaram a resolução de inúmeros problemas que o homem encontrava para realizar as atividades básicas de produção, comércio, transportes, etc. Nestes últimos anos houve necessidade de aprofundar estudos, realizar experimentos e pesquisas mais específicas, inclusive para avaliar os resultados das atividades desenvolvidas. Por essa razão, os conhecimentos teóricos e os métodos de análise de dados quantitativos vêm sendo aprimorados continuamente. O conjunto de técnicas e métodos de pesquisa, experimentação e inferências mais utilizadas para alcançar esses objetivos são o que modernamente se conhece como Ciências Estatísticas, onde se destaca a seguinte gama de conhecimentos: Teoria dos Jogos, Planejamento de Experimentos, Teoria das Filas, Controle de Qualidade, Teoria das Decisões, Séries Temporais, Econometria e outras técnicas.

1.2. Divisão da Estatística: Estatística Descritiva: descrição, resumo e organização das informações. Compreende o uso de tabelas, gráficos e medidas-resumo. Estatística Inferencial: através do particular (amostra) faz induções a respeito do todo (população), controlando a probabilidade de erro (por isso estudaremos a Teoria das Probabilidades).

3

Exemplo 1: projeção da percentagem de votos para um candidato numa eleição. Exemplo 2: comparação de adubos

Os três canteiros são expostos à mesma incidência de luz, tipo de solo, mas recebem adubos diferentes. No final do experimento será medida a altura das plantas.

4

2 - ESTATÍSTICA DESCRITIVA 2.1. Definições População: conjunto universo de elementos que possuem ao menos uma característica em comum. O tamanho da população é representado por N. Exemplo 1: total de eleitores que compareceram ao último pleito. Dimensão de uma população: finita ( N< ) infinita enumerável ( N= ) não enumerável ( N= ) Censo: é a investigação exaustiva de toda a população. Exemplo 2: Censo Demográfico Brasileiro, Censo Escolar do MEC

Amostra: é um subconjunto da população, isto é, uma parte da população retirada segundo alguns critérios. O tamanho da amostra é representado por n . Exemplo 3: pesquisa pré-eleitoral do instituto IBOPE, Pesquisa Nacional por Amostragem de Domicílios (PNAD). Amostragem: é o processo de obtenção de uma amostra da população.

5

2.2. Escalas de mensuração Variáveis: são as características de interesse em uma população ou amostra. Variáveis Qualitativas: Expressam qualidade e subdividem-se em: Nominais: os níveis da variável são categorias de qualidade. Exemplo 4: tipo de variedade de batata, cor, etc. Ordinais: os níveis da variável são ordenados de acordo com a intensidade do fenômeno. Exemplo 5: atribuir graus de 1 a 4 para uma característica não mensurável como aderência de uma tinta numa superfície metálica. Z “Grau de aderência da tinta” 1 pouca ; 2 regular; 3 boa ; 4 ótima Exemplo 6: (Contra-exemplo): X “Marca da tinta”, Y “Cor da tinta” 1 branca; 2 preta; 3 prata ; 4 vermelha Marca Cor Aderência

A 1 4 B 2 4 C 4 3 D 3 1 E 2 2

média= 2,4 2,8 As médias na tabela acima foram obtidas pelo EXCEL. Observe que as variáveis Y e Z não são quantitativas, portanto não se poderia calcular média para estas. A média de 2,4 para Y não tem interpretação, pois não faz sentido “cor média”!

6

Variáveis Quantitativas: expressam uma quantidade numérica, subdividem-se em: Discretas: podem assumir valores observados somente em pontos isolados em uma escala. Exemplo 7: número de defeitos num lote de 100 peças, números de falhas diárias numa máquina, etc. Contínuas: Podem assumir qualquer valor em um conjunto não enumerável. Exemplo 8: comprimento, área, velocidade, temperatura.

2.3. Arredondamentos de números Regras: (1a ) quando o primeiro algarismo a ser descartado for 0,1,2,3 ou 4 deverá ser sumariamente abandonado (arredondamento por falta) e o último algarismo a permanecer fica inalterado. (2a) quando, porém, for 5, 6, 7, 8 ou 9, o último algarismo a permanecer será aumentado de uma unidade ( arredondamento por excesso).

Exemplo 9: 72,8 73 (arredondamento para a unidade) 72,8146 72,81 (arredondamento para o centésimo) 72,8146 72,815 (arredondamento para o milésimo) 72,465 72,47 (arredondamento para o centésimo) 183,575 183,58 (arredondamento para o centésimo) 737,638 740 (arredondamento para a dezena)

7

Exemplo 10: arredondamentos em divisões podem causar grandes diferenças (A) 894737,263157

000019,05

(B) 25000000002,0

5

(C) 500000

00001,05

diferença de 90% em relação a (A) Exemplo 11:

00000084,00003,00028,0)( A 0000009,00003,0003,0)( B diferença de 7,14% em relação a (A)

Exemplo 12: arredondamentos em potências podem causar diferenças

38180577,399982,2)(

25763921,411483,2)(

4639174,4056825,2)(

8

8

8

C

B

A

01998336,37788,2)( 8 D diferença de 7,37% em relação a (A) Exemplo 13: calculadoras podem cometer erros de truncamento Sabemos que 33890560989,71lim 22 en

nn . Vamos observar a convergência através da calculadora.

n nn21

1 5 20 50 100

1000 10000

100000 1E6 1E8 1E11 1E12

3 5,37824 6,72749

7,1066833 7,244646 7,37431 7,387578 7,388908 7,38904

7,389005595 7,38905609

1

8

Para n=1E12 11 2 nn , pois a calculadora arredondou a fração soma

n2 para zero.

Considerações: (1ª) Recomenda-se utilizar toda a precisão de sua calculadora, ou seja, utilizar o modo standard (padrão). Arredondamentos somente para resultados finais. Resultados intermediários devem ser armazenados nas memórias secundárias (variáveis). (2ª) Estrutura de memória em calculadoras cientificas comuns

MS ( memory store ) armazena diretamente um valor na memória RM (recover memory) recupera o conteúdo da memória MC (memory clear) limpa a memória , faça isto antes de qualquer nova operação M+ acumula valores na memória A tecla 2ndf aciona a segunda função correspondente a uma tecla . Por exemplo, pressionando-se a tecla ln o resultado será o logaritmo natural. Se for necessário calcular a exponencial, deve-se pressionar a tecla 2ndf e depois ln. 2.4. Resumo de conjuntos de dados Um conjunto de valores será representado por: nxxx ,....,, 21 (no caso de amostra) e Nxxx ,....,, 21 (no caso de população).

9

2.4.1. Medidas de posição (tendência central) Média: requer escala de mensuração quantitativa. Média aritmética

Na amostra: n

x

nxxxX

n

ii

n

121

Na população: N

x

Nxxx

N

ii

N

121

Observação: em uma seqüência aritmética (progressão aritmética) o termo central entre dois termos é obtido pela média aritmética. Por exemplo: 25 nan , isto é, { 7 12

17 .......}. Então, 122177

231

2

aaa .

Exemplo 14: realize a soma dos seguintes quocientes, truncando-os em duas casas decimais:

96,322,033,022,088,077,066,044,033,011,092

93

92

98

97

96

94

93

91

Observe que o truncamento em cada fração resultou em erro na resposta final É mais

eficiente realizar uma única divisão, ou seja: 49

369

232876431

. Média geométrica Na amostra: n

ng xxxm 21 , 0ix para i Na população: N

Ng xxx 21 , 0ix para i Observação: em uma seqüência geométrica (progressão geométrica) o termo central entre dois termos é obtido pela média geométrica. Por exemplo: n

na 36 , isto é, {18 54

162 ......}. Então, 541621822312 aaa

10

Média harmônica Na amostra:

n

i i

h

x

nm

1

1 , 0ix para i

Na população:

N

i i

h

x

N

1

1 , 0ix para i

Observação: em uma seqüência harmônica o termo central entre dois termos é obtido

pela média harmônica. Por exemplo: n

an1

, isto é, {1 1/2 1/3 .......}. Então,

21

312

2

a

Observações: (1ª) A média mais conhecida e utilizada é a aritmética, pois sua fórmula é mais simples, além de não ficar restrita a valores positivos. (2ª) Na expressão do cálculo da média harmônica, pode-se verificar que ela é definida como sendo o inverso da média aritmética dos inversos. (3ª) Interpretação da média aritmética: é o centro de gravidade (equilíbrio) de um conjunto, e é empregada com a finalidade de representatividade dos valores. (4ª) As três médias mantém a seguinte relação entre elas, desde que os valores sejam

positivos: hg mmX

Exemplo 15: interpretação física da média aritmética

11

ii xm é o momento de massa da i-ésima partícula

n

i im1

é a massa total; in

i i xm 1 é o momento de massa do sistema

n

i i

in

i i

m

xmX

1

1 é o centro de massa do sistema

Exemplo 16: produto interno bruto no Brasil

8213,23311

519,719073,44614,27

X

9199,151519,719073,44614,2711 gm

5663,95

519,7191

073,441

614,271

11

hm

Note que a média harmônica ameniza o efeito do crescimento exponencial da série. A diferença percentual entre média harmônica e aritmética é de 144,67%.

12

Exemplo 17: um concurso público, para um certo cargo, consiste em uma prova, dividida em quatro áreas. Cada área contém 20 questões. Para aprovação é preciso que o candidato obtenha média harmônica ponderada no mínimo igual a 13. Um candidato apresentou o seguinte desempenho:

Área Peso No. de acertos Português 3 17

Matemática 3 7 Conhecimentos Gerais 2 16

Informática 1 14 Façamos as médias aritmética, geométrica e harmônica:

11111,139

1181233

14116273173

X

21177,1214167179 1233 gm , 22935,11

141

162

73

173

9

hm

Como a média harmônica do candidato foi inferior a 13, então ele não foi aprovado no concurso. Note que se o critério de aprovação fosse pela média aritmética, então ele seria aprovado! A mediana: requer escala de medida ordinal ou quantitativa. A mediana de um conjunto ordenado de valores, denotada por Med, é definida como o valor que separa o conjunto em dois subconjuntos de mesmo tamanho.

Med =

par én se , 2

) x (x

ímpar én se , x

12n

2n

21n

sendo x a amostra ordenada em ordem crescente.

13

Exemplo 18: (a) pesos em kg de cinco pessoas: {66; 62; 60; 70; 58}

(b) alturas em cm de seis pessoas: {180; 165; 175; 182; 177; 160}

A moda A moda de um conjunto de valores, denotada por Mo, é definida como o valor mais freqüente no conjunto. Convém lembrar que a moda pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. No caso em que todas freqüências forem iguais diremos que não há moda. Exemplo 19: (a) dado o conjunto {1; 2; 2; 3; 3; 4; 4; 4; 7; 9; 15} a moda é Mo=4, pois este valor é o mais freqüente. (b) para o conjunto { 1; 1 ; 2 ; 2 ; 2 ; 3 ; 4 ; 4 ; 4} teremos duas modas: Mo )1( =2 e Mo )2( =4

14

Observações: a mediana exige ordenação das categorias e, por sua vez, é indicada nas seguintes situações: (1ª) quando se deseja obter o ponto que divide o conjunto em duas partes de mesmo tamanho. (2ª) quando há resultados extremos que afetariam a Média de maneira acentuada. Exemplo 20: peso de bovinos em kg {508 543 560 562 2500}

Med=560; 60,934

x O peso de 2500 kg é dito uma observação estranha (outlier), e por isso elevou consideravelmente o peso médio. Escalas de mensuração e medidas de tendência central Nominal: moda Ordinal: moda, mediana Quantitativa discreta e contínua: moda, mediana e média

15

2.4.2. Medidas de dispersão (variabilidade): Observação: as medidas de dispersão são para variáveis com escala quantitativa Amplitude: a medida de dispersão mais simples, porém “rústica”, é a amplitude, anotada por “h”, e definida como a diferença entre os valores extremos do conjunto, isto é: h = xmax – xmin 0

Variância e o desvio padrão absolutos As medidas mais utilizadas são a variância e o desvio padrão. Estas medidas têm como ponto de referência a média aritmética. Na amostra:

111

222

2

2

12

n

Xx

n

XxXxXxS

n

iin

é a variância.

A variância é a soma dos quadrados das distâncias em relação à

X :

16

Comparação de três amostras com mesma média aritmética:

Observação: Uma expressão alternativa é 1

1

22

2

n

XnxS

n

ii

.

A variância, por ser um quadrado, não permite comparações com a unidade que estamos trabalhando. Para se ter uma medida de variabilidade com a mesma unidade da variável utiliza-se a raiz quadrada da variância, denominado de desvio padrão:

2SS .

Na população: 21

2

2

N

xN

ii

é a variância e 2 é o desvio padrão.

17

Observações: (1ª) variância e desvio padrão são não negativos. (2ª) Em Mecânica a variância tem como interpretação o momento de inércia de uma massa, em relação a um eixo perpendicular que passe pelo centro de gravidade (que é a média) (3ª) o desvio padrão mede o grau de dispersão dos valores em torno da média, ou seja, é variabilidade média (em unidades de medida) em torno da média aritmética. Exemplo 21: número de pessoas por domicílio: {5; 6; 3; 3; 2; 3; 3; 3; 4; 4; 3; 2; 7; 4} h = xmax - xmin = 7-2=5 ; 71435,3

X

0659,213

71435,3144765 222222

S ; 4373,1S

Cada observação pode ser escrita em função da média e do desvio padrão, por exemplo: 6,14373,171435,36 kk

Exemplo 22 (o problema do truncamento de números): os valores seguintes são espessuras em mm de chapas de alumínio: { 6,34 6,38 6,40 6,38 6,36 6,36 6,38 6,20 6,42 6,28}. Obtenha média, desvio padrão e coeficiente de variação. Solução:

10n , 5,63xf , 2628,4032 fx ;

35,6

X ; 0042,02 S ; 064807,0S ; %020589,1CV Se o valor do somatório dos quadrados for arredondado para décimos, então:

18

00833333,09

35,6103,403 22

S ; 09128709,0S ; %437592,1CV , que é

diferente do resultado sem fazer arredondamento. A variância e o desvio padrão relativos A variância relativa, representada por VR, é o quociente entre a variância absoluta e o quadrado da média, isto é:

%1002

2

X

SVR , se 0

X .

O coeficiente de variação é a raiz quadrada da variância relativa, isto é:

%100

X

SCV .

Observação: o coeficiente de variação é interpretado como o grau de variabilidade relativa em torno da média.

Exemplo 23: em relação ao exemplo 21, %6963,38%1007143,34373,1

CV

19

Propriedades das medidas Seja },,,{ 21 nxxx uma amostra onde foi observada a variável X :

(i) cxy ii i , Rc cXY

e 22XY SS

(ii) ii cxy i , 0c

XcY e 222XY ScS

(iii) bcxy ii i , 0c , Rb bXcY

e 222XY ScS

(iv) X

ii S

Xxy

i 0

Y e 12 YS

2.5. Distribuições de freqüências Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agrupá-los. O agrupamento é feito em tabelas, denominadas de distribuições de freqüências. Para se construir uma distribuição de freqüências fazemos distinção entre dois tipos de variáveis: a variável contínua que é o resultado de uma mensuração e a variável de contagem. Em geral, variáveis discretas são agrupadas em distribuições por ponto ou valores e variáveis contínuas em distribuições por classes ou intervalos. A separação não é rígida e depende basicamente dos dados considerados. Pode-se construir uma distribuição por classes mesmo quando a variável é discreta.

2.5.1. Distribuições de freqüências por ponto (ou valores) Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, o número de irmãos dos alunos da turma U, disciplina de Estatística. Exemplo 24: número de irmãos dos alunos da turma U - disciplina Estatística 0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1 1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0

20

Distribuição de freqüências por ponto do número de irmãos dos alunos No. de irmãos ( x ) No. de alunos ( f ) xf fx 2

0 7 0 0 1 21 21 21 2 8 16 32 3 5 15 45 4 4 16 64 5 3 15 75 6 2 12 72

Total 50 95 309 Medidas de tendência central e dispersão: no caso de uma tabela de distribuição de freqüência por ponto as fórmulas ficam:

n

fx

f

fxX

k

iii

k

ii

k

iii

1

1

1 , 1

1

22

2

n

XnfxS

k

iii

sendo if a freqüência absoluta (ou simples), que é o número de vezes que ocorre o valor

ix , e k o número de valores distintos no conjunto. Observação: as outras medidas: mediana, moda, desvio padrão e coeficiente de variação, têm as mesmas fórmulas.

Exemplo 25: em relação ao exemplo acima, 9,15095

X ; Mo=1; Med=1

6224,249

9,150309 22

S ; 6194,1S ; CV=85%.

21

2.5.2. Distribuições de freqüências por classes (ou intervalos) Ao construirmos a distribuição de freqüências por classes haverá perda de informação, mas haverá uma melhor organização na apresentação e compreensão, como ilustra o exemplo a seguir. Exemplo 26: vendas semanais (em mil reais) de gêneros alimentícios: 30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5 40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9 49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6 49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45 47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5 48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9 50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6 52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2 52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6 55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5 59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2 63,5 60,4 64,4 61 62,4 66 68 Por exemplo, com 5 classes e com amplitudes iguais a oito a tabela fica: Tabela de distribuição de freqüências com 5 classes

Vendas ix if iF Percentual

ii fx ii fx 2 30.0000 |— 38.0000 38.0000 |— 46.0000 46.0000 |— 54.0000 54.0000 |— 62.0000 62.0000 |— 70.0000

34 42 50 58 66

8 31 78 41 14

8 39 117 158 172

4.6512 % 18.0233 % 45.3488 % 23.8372 % 8.1395 %

272 1302 3900 2378 924

9248 54684 195000 137924 60984

Total -------- 172 -------- 100% 8776 457840

22

Algoritmo para a construção de uma tabela de distribuição freqüências por intervalos (1º) Determinar a amplitude dos dados: minmax xxh . (2º) Decidir sobre o número de classes k a ser utilizado. Recomenda-se um número de classes entre 5 e 15. Para que a decisão não seja totalmente arbitrária, pode-se usar a raiz quadrada do número de valores, ou seja, nk . (3º) Determinar a amplitude de cada classe. Sempre que possível manter todas as amplitudes iguais. Para tanto, deve-se dividir a amplitude dos dados “h” pelo número de

classes “k”, arredondando para mais, ou seja, khhi .

(4º) Contar o número de valores pertencentes a cada classe. As classes devem ser disjuntas (sem intersecção). Em geral, utiliza-se a notação (|--- ), para indicar um intervalo fechado à esquerda e aberto à direita. Também poderia ser utilizado o intervalo aberto à esquerda e fechado à direita (---|), aberto de ambos os lados ( --- ) ou ainda fechado de ambos os lados (|---|). Elementos de uma tabela de distribuição de freqüências por intervalos

Intervalos ix

if iF ifr iFr ii fx ii fx 2

1l |------- 1L 1x 1f 1F 1fr 1Fr 11 fx 121 fx

2l |------- 2L 2x 2f 2F 2fr 2Fr 22 fx 222 fx

kl |------- kL kx kf n kfr 1 kk fx kk fx 2 Total ---- n ---- 1 ---- ii fx ii fx 2 k é o número de classes

il é o limite inferior de classe

iL é o limite superior de classe

23

2ii

iLlx

é o ponto médio de classe

iii lLh é a amplitude de classe

if é a freqüência absoluta de classe

iF é a freqüência acumulada de classe, ou seja,

11 fF ; 212 ffF ; ......; nfffF kk 21

ifr é a frequência relativa de classe, isto é, nffr i

i

iFr é a frequência relativa acumulada de classe, ou seja,

11 frFr ; 212 frfrFr ; ......; 121 kk frfrfrFr Medidas de tendência central e dispersão No caso de uma tabela de distribuição de freqüência por intervalos as fórmulas para média e variância ficam as mesmas do caso de distribuições por ponto, exceto que onde tiver ix você deve utilizar o ponto médio de classe. As fórmulas da mediana e moda são o resultado de interpolações. Mediana: para localizar a classe mediana procuramos na coluna das freqüências

absolutas acumuladas a primeira iF tal que 2nFi .

Med =

m

m

mm f

Fn

hl12

24

ml o limite inferior da classe mediana mh a amplitude da classe mediana mf a freqüência simples da classe mediana 1mF a freqüência acumulada da classe anterior à mediana Moda pelo processo de King: O primeiro passo é localizar a classe modal, aquela com maior freqüência absoluta.

Mo =

11

1

mm

mmm ff

fhl .

ml o limite inferior da classe modal mh a amplitude da classe modal 1mf a freqüência simples da classe posterior à modal

1mf a frequência simples da classe anterior à modal Exemplo 27: com relação ao exemplo 26, para a tabela com 5 classes:

02325,511728776

X ; 82986,58

17102325,51172457840 2

2

S ; 67006,7S ,

%0325,1510002325,51

670101,7CV . Uma vez que 86

2117

n então a classe mediana é

46|-------54. Aplicando a fórmula: 82051,5078

3986846

Med . A classe modal

é 46|-------54, pois tem maior freqüência absoluta. Assim,

55555,503141

41846

Mo .

25

Medidas descritivas para os dados não agrupados:

87034,50

X ; Med= 50,5 ; Mo=49,7; 6735,522 S ; 2576,7S %2668,14CV .

N de classes

Amplitude

X Med Mo S CV

5 8 51,02325 50,8205 50,55555 7,67006 15,0325% 8 5 50,98837 50,7143 48,5 7,13569 13,99478%

13 3,10 51,91234 49,2870 50 7,18284 13,83653% Dados Não agrupados

----------- 50,87034 50,5 49,7 7,2576 14,2668%

Histograma para a distribuição de freqüências com 13 classes

26

3 - FUNDAMENTOS DA PROBABILIDADE 3.1. Objeto de estudo da Teoria da Probabilidade A Teoria da Probabilidade tem como objeto de estudo os fenômenos aleatórios. No dicionário Michaelis da língua portuguesa “aleatório” tem o sentido de eventual, fortuito, incerto. Fenômenos determinísticos: o resultado observado é completamente determinado pelas condições sob as quais o fenômeno ocorreu. Exemplo 1 (fenômeno determinístico): desconsiderando a resistência do ar, e sob a presença de gravidade, dois corpos de massa diferente atingem o solo ao mesmo instante.

Modelos Determinísticos: amF , sendo F a força resultante, m a massa do corpo e a a aceleração

2cmE , sendo E energia, c a velocidade da luz Fenômenos aleatórios: o resultado não é determinado pelas condições de realização do fenômeno. Exemplo 2: Teoria do Caos para a origem do Universo Exemplo 3: leitura da tensão, em volts, em diferentes instantes: {124 126 127 120 127}.

27

3.2. Modelos Probabilísticos Modelos probabilísticos são modelos matemáticos que descrevem fenômenos aleatórios. Experimentos aleatórios são fenômenos aleatórios executados por nós. Exemplo 4 (Exemplos de Experimentos Aleatórios): EX1: Jogue um dado e observe o nº da face de cima EX2: Jogue uma moeda 3 vezes e observe o nº de caras EX3:Jogue uma moeda 3 vezes e observe a seqüência de faces EX4: no. de peças defeituosas em um lote contendo N EX5: tempo de duração de uma lâmpada até esta queimar EX6: lance uma moeda até que ocorra a face cara pela primeira vez Espaço Amostral: é o conjunto de todos os resultados possíveis de um experimento aleatório. Notação: , . Exemplo 5 (Exemplos de espaços amostrais): com relação aos exemplos anteriores,

}6,5,4,3,2,1{1

}3,2,1,0{2

3 {KKK, CCC, KKC, KCK, CKK, CCK, CKC, KCC} C ”cara” K ”coroa”

},....,2,1,0{4 N

TtRt 0:5

6 = { C, KC, KKC, KKKC, ........}

28

Tipos de espaços amostrais Finito: 4321 ,,, Infinito enumerável: 6 Não-enumerável: 5 Evento: é um subconjunto do espaço amostral. Notação: CBA ,, ,A ,B ,C Observação: é dito evento certo e Ø evento impossível.

Tipos de eventos: Simples: formado por um único elemento do espaço amostral. Composto: é a combinação de dois ou mais elementos do espaço amostral. Exemplo 6: lance um dado e observe a face de cima. Escreva os seguintes eventos: A: “ocorre a face 6” B: “ocorre face par” C: “ocorre face superior a 6 ” D: “ocorre face menor ou igual a 6” Solução: }6,5,4,3,2,1{ ; A={6}; B={2,4,6}; C= Ø; D= 3.3. Operações com eventos Seja um espaço amostral e A,B eventos. Então, as seguintes operações com eventos são definidas:

29

(1º ) Evento união: BA : “ ocorre somente A, ou ocorre somente B, ou ocorrem ambos”

(2º ) Evento intersecção: BA : “ocorre A e B simultaneamente”

(3º) evento complementar: cA : “não ocorre A”

(4º) evento diferença: BA : “ocorre A e não B” nota: ABBA c ; BAABA e ABBAA c

30

3.4. Alguns resultados sobre a teoria dos conjuntos (1º) AAA

AAA

(2º) CABACBA

CABACBA

(3º) AA A

AA Ø ØØ A

(4º) ccc BABA ccc BABA AA cc Eventos exclusivos: BA, são mutuamente exclusivos se ØB A . Eventos não exclusivos: ØB A . Definição: Seja uma família de eventos ,...., 21 AA . Os eventos ,....},{ 21 AA são mutuamente exclusivos (disjuntos) dois a dois se e somente se ØA j iA , ji . Definição: uma união de eventos BA, tais que ØBA é dita união disjunta.

Notação:

BA

Exemplo 7: lance uma moeda 3 vezes e observe a seqüência de faces “C Cara” e “KCoroa”. Enumere os eventos: A: “ocorre pelo menos uma coroa” B: “ocorre coroa no primeiro lançamento” C: “ocorre cara no segundo lançamento”

cA , cB , CB , CB solução: cada elemento do espaço amostral é da forma: ( ______ ______ _______ ) 1º lanç 2º lanç 3º lanç Assim,

{CCC, KKK, CCK,CKC, KCC,KKC, KCK, CKK} O experimento de lançar 3 moedas também tem o mesmo espaço amostral , sendo que cada elemento é da forma : ( ________ _________ ________) 1ª moeda 2ª moeda 3ª moeda

31

A = { KKK, KKC, KCK, CKK,CCK,CKC,KCC}; B= { KKK, KCC, KKC, KCK} C= { CCC, CCK, KCC, KCK}; cA {CCC}; cB = {CCC,CCK,CKC, CKK} CB ={ KKK, KCC, KKC, KCK, CCC, CCK}; CB = { KCK, KCC}

3.5. Concepções de Probabilidade A concepção clássica de probabilidade: todos resultados possíveis do experimento

são igualmente prováveis. N

P 1)( , , #N .

Exemplo 8: lançamento de um dado honesto, observando-se a face de cima.

}6,5,4,3,2,1{ , 61)6(.....)2()1( PPP

Nota: a concepção clássica de probabilidade é válida somente para espaços amostrais finitos. Observações: (1ª) P(A) lemos como a “probabilidade do evento A”. (2ª) Uma probabilidade não tem unidade de medida. É um grau entre 0 e 1 (ou 0% e 100%).

A concepção freqüencista de probabilidade: a probabilidade de um evento é medida observando-se a freqüência relativa do mesmo em uma sucessão de realizações do experimento. A freqüência relativa é definida como:

32

nArAf nn

r)(

)()( ,

)(Arn = ”número de ocorrências do evento A em n realizações do experimento”.

A frequência relativa é um número entre zero e 1. A probabilidade do evento A será )(lim)( )( AfAP n

rn , se o limite existir, ou seja, se a seqüência }1:)({ nAf n convergir. Exemplo 9: Defina A como sendo a face resultante no lançamento da moeda foi cara. n Resultado )(Arn )()( Af n

r 1 2 3 4 . . .

C C K C

1 2 2 3

1 1 2/3 3/4

A concepção axiomática de probabilidade: construção de uma teoria matemática para as probabilidades, com base em “axiomas”.

33

Exemplo 9: axiomática de Kolmogorov

3.6. Axiomas da Teoria das Probabilidades (Kolmogorov) Uma medida é dita probabilidade se e somente se: (1) AAP ,0)( (2) 1P (3) 21 AAP ,)()( 21 APP se ,,, 21 AA estiverem contidos em e

forem disjuntos dois a dois.

3.7. Propriedades das Probabilidades As propriedades a seguir decorrem imediatamente dos axiomas: (1ª) )(1 APAP C :

cAA )(1)()()()( APAPAPAPP cc

(2ª) 0P : 011)(1)()( PPP c

(3ª) Se BA , então )()( BPAP e :)()()( APBPABP

(4ª) :1)( AP por (3ª), 1)()( PAP (5ª) para BA, eventos quaisquer, BAPBPAPBAP )()( (6ª) para CBA ,, , eventos quaisquer CBAPCBPCAPBAPCPBPAPCBAP

34

Exemplo 10: suponha que A,B,C sejam eventos tais que 41 =P(C)=P(B)=P(A) ,

BCBA e 81)( CAP . Qual a probabilidade de que ao menos um dos

eventos A,B ou C ocorram?

Solução: pela propriedade (6ª) , 85

81

413)( CBAP , pois CBA

3.8. Métodos de enumeração Princípio da multiplicação: tarefas realizadas seqüencialmente, isto é, knnn 21

Princípio da adição: tarefas realizadas de forma mutuamente exclusivas, isto é, knnn 21

Seja uma população finita constituída de N elementos. Considere uma amostra de tamanho n. Então:

35

(1º) o número de amostras com reposição, considerando a ordenação, é nN . Amostras diferem pela ordenação. (2º) o número de amostras sem reposição, considerando a ordenação é.

)!(!nN

NAnN ; n≤N

(3º) o número de amostras sem reposição, desconsiderando a ordenação é !n

AC

nNn

N .

Também vale que !)!(

!nnN

NC nN ; n≤N

Exemplo 11: seja um conjunto 321 ,, e considere uma amostra de tamanho dois. Então: N=3 e n=2. No processo com reposição sempre é considerada a ordenação, assim, as amostras possíveis são:

),( 11 ),( 21 ),( 31 ),( 12 ),( 22 ),( 32 ),( 13 ),( 23 ),( 33 ,

portanto: 231

31

31, jiP

No Processo sem reposição, considerando ordenação, teremos: ),( 21 ),( 31 ),( 12

),( 32 ),( 13 ),( 23 , e portanto:

23

161

21

31,

AP ji

No Processo sem reposição, desconsiderando ordem, teremos: ),( 21 ),( 31 ),( 32 . Note que no caso em que a ordem é desconsiderada, algumas pessoas respondem que

61

21

31, jiP , que está errado, pois a soma de todas as probabilidades não será

1. Quando a ordem não é considerada, jiP , é multiplicada por !n , que é o número de réplicas da amostra, isto é:

23

131

21

312,

CP ji

36

Isto acontece porque as réplicas, que eram do caso com ordenação, serão consideradas iguais, como mostra a figura abaixo:

Exemplo 12: considere um congresso onde compareceram 35 engenheiros, 25 matemáticos e 15 físicos. Se for formada, ao acaso, uma comissão de 10 membros, qual a probabilidade de que esta seja constituída de:

(a) 5 engenheiros, 3 matemáticos e 2 físicos? (b) Exclusivamente de engenheiros, ou de matemáticos, ou de físicos?

Solução: (a) pelo princípio da multiplicação,

094577978,0

362880066676869707172737475

21415

6232425

1203132333435

1075

215

325

535

CCCC

(b) pelo princípio da adição,

0002254,01075

1015

1075

1025

1075

1035

CC

CC

CC

37

3.9. Probabilidade condicional Definição: seja um espaço amostral e BA, eventos. Definimos a probabilidade condicional de A , dado que ocorreu B , por :

..,0

0)(,)(

)()|(

cc

BPBP

BAPBAP

Observação: A interpretação de )|( BAP é que uma vez conhecido o fato de que o evento B ocorreu, então não é mais necessário pensar em todo o espaço amostral. Na verdade, agora B passa a ser o “espaço amostral reduzido ”.

38

Exemplo 13: extrair sem reposição, considerando a ordem das cores, duas bolas de uma urna com 5 azuis e 3 brancas.

Para facilitar, faremos distinção apenas nas cores das bolinhas. Assim,

),();,();,();,( aabaabbb Defina B = “1ª bola é branca” e A = “a 2ª bola é azul”

)},();,{( abbbB ; )},();,{( aabaB c

)},();,{( aaabA ; )},();,{( babbAc

)},{( abAB ; )},{( aaAB c

5615)( 2

8

15

13

A

AAABP .

Outra maneira de obter )( ABP é através da probabilidade condicional, isto é,

5615

75

83|)( BAPBPABP .

Exemplo 14: outra maneira de resolver o Exemplo 12 (a). Note que algumas pessoas responderiam que a solução é

6614

6715

6823

7025

7131

7434

7535

, que está errada!, pois a ordem em que os

membros são formados não está fixada, ou seja, é preciso levar em conta todas as posições dos membros dentro da comissão! A resposta correta é:

094577978,06614

6715

6823

7025

7131

7434

7535

!2!3!5!10

1075

215

325

535

CCCC

39

Note que !2!3!5

!10

é dito coeficiente trinomial.

3.10. Propriedades das probabilidades condicionais (1ª) 1)|(0 BAP : (2ª) )|()()( BAPBPBAP )|()()( ABPAPBAP

))(|()|()(|)()( CBAPCBPCPCBAPCBPCBAP Exemplo 15: considere uma urna contendo 5 bolas brancas, 4 verdes e 3 pretas. Uma pessoa retira, sem reposição, 3 bolas. Qual a probabilidade: (a) ocorrer a seguinte seqüência de cores: verde, preta e branca? (b) saírem três cores diferentes? (c) ocorrer pelo menos uma branca? (d) sabendo-se que na 1ª extração saiu uma verde, qual a probabilidade de saírem mais duas verdes? Solução: se fizermos distinção entre bolas de mesma cor, então a cardinalidade do espaço amostral será 13203

12 A . Logo, será um trabalho árduo escrever todo . Fazendo distinção apenas das cores, },,,,,,{ pppvpbvbbbvbbbvbbb , # 2733 .

(a) 105

113

124

(b) Defina A o evento “ocorrem três cores diferentes”. Note que algumas pessoas

responderiam que )(AP92

276

##

A , que está errado! Este raciocínio somente valeria

se houvesse mesmo número de bolas para as três cores e, além disso, se o processo fosse

com reposição! O correto é 113

103

114

125!33

12

13

14

15

C

CCC.

40

(c) 4437

103

114

125

107

114

1253

106

117

12533

12

35

312

17

25

312

27

15

CC

CCC

CCC

ou 4437

105

116

1271

(d) 102

113

)()(|

vPvvvPvvvP

3.11. Teorema de Bayes Definição: Seja um espaço amostral. Um conjunto de eventos kBBB ,.....,, 21 forma uma partição de se e somente se: (1º ) Ø ji BB , ji

(2º) k

iiB

1

(3ª) 0)( iBP , },....,2,1{ ki

Teorema da Probabilidade Total: Seja um espaço amostral, kBBB ,.....,, 21 uma partição de e A um evento qualquer. Então:

k

i ii BAPBPAP1

)|()()(

41

Prova: kBABABAA 21 . Assim,

)|()()|()()|()(

)(

2211

21

kk

k

BAPBPBAPBPBAPBP

BAPBAPBAPAP

Teorema de Bayes: Seja espaço amostral, kBBB ,.....,, 21 uma partição e A evento qualquer. Então,

k

iii

jjj

BPBAP

BPBAPABP

1)()|(

)()|()|( , kj ,.....,2,1 .

Prova:

k

iii

jjjj

BPBAP

BPBAPAP

BAPABP

1

)()|(

)()|()(

)|(

Exemplo 16: Numa fábrica de parafusos, as máquinas A,B,C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4 e 2 por cento, respectivamente, são defeituosos. Escolhe-se ao acaso um parafuso e verifica-se que ele é defeituoso. Qual a probabilidade de que o parafuso seja oriundo das máquinas: (a) A ? (b) B ? (c) C ?

42

Solução: Representação das percentagens de produção das 3 máquinas

As informações de “entrada” são:

25,0)( AP , 35,0)( BP , 40,0)( CP 05,0| ADP , 04,0| BDP , 02,0| CDP

Pelo Teorema da Probabilidade Total:

0345,02,040,004,035,005,025,0)|()()|()()|()(

)()()()(

CDPCPBDPBPADPAP

DCPDBPDAPDP

Pela fórmula de Bayes:

3623,00345,0

05,025,0)(

)|()()|(

DP

ADPAPDAP

4058,00345,0

04,035,0)(

)|()()|(

DP

BDPBPDBP

43

2319,00345,0

02,040,0)(

)()()(

DPCDPCP

DCP

3.12 - Independência Probabilística Definição: dois eventos são probabilisticamente independentes se e somente se

)()()( BPAPBAP . Observação: da definição acima segue que )()|( APBAP e )()|( BPABP , ou seja, a ocorrência de um deles não altera a probabilidade de ocorrência do outro. Definição: três eventos CBA ,, são ditos mutuamente independentes se e somente se: (1º) são independentes dois a dois (2º) )()()()( CPBPAPCBAP . Observação: eventos mutuamente disjuntos não têm nenhuma relação com eventos mutuamente independentes. (a) suponha 0)( AP , 0)( BP e Ø BA Então, 0)( BAP , mas

0)()( BPAP , ou seja, são exclusivos mas não são independentes. (b) 0)( BAP e )()()( BPAPBAP , ou seja, independentes, mas não exclusivos. (c) 0)( BAP e )()()( BPAPBAP , ou seja, não exclusivos e não independentes. (d) A Ǿ e B Ω. Então, PBAP )( (Ǿ)=0 e 0)()( BPAP , ou seja, independentes e exclusivos. Exemplo 17: A finalidade deste exemplo é mostrar que extração de amostras com reposição possui a propriedade de independência probabilística, mas se o processo for sem reposição não haverá independência. Suponha uma urna contendo 7 bolas vermelhas e 5 bolas pretas. Considere o experimento aleatório de extrair 4 bolas ao acaso. Descreva o espaço amostral com as respectivas probabilidades, nos casos com e sem reposição. Na extração sem reposição considere a ordenação interna da amostra.

44

Solução: (1ª) com reposição: se fizermos distinção entre bolas de mesma cor então a cardinalidade do espaço amostral será 2073612# 4 . Logo, será um trabalho árduo escrever todo . Se não fizermos distinção entre bolas de mesma cor então

},.....,,,{ ppppvvpvvvvpvvvv , ou seja, 162# 4 .

)()()()(127

127

127

127

127)|()|()|()()(

4

vPvPvPvP

vvvvPvvvPvvPvPvvvvP

)()()()(125

127

125

127

127

127)|()|()|()()(

3

pPvPvPvP

vvvpPvvvPvvPvPvvvpP

125

127)()()()(

3

vvvpPpvvvPvpvvPvvpvP

)()()()(125

125

125

125

125)|()|()|()()(

4

pPpPpPpP

ppppPpppPppPpPppppP

Concluímos que os eventos são independentes. (2ª) sem reposição: agora neste tipo de extração a mesma bola não pode aparecer mais que uma vez.

412

47

94

105

116

127)|()|()|()()(

AA

vvvvPvvvPvvPvPvvvvP

4

127)()()()(

vPvPvPvP

Como )()()()()( vPvPvPvPvvvvP , não há independência probabilística.

412

15

37)()()()(A

AAvvvpPpvvvPvpvvPvvpvP

; 4

12

45)(

AA

ppppP

45

)()()()()()( pvpvPpvvpPvpvpPpvvpPvppvPvvppP

)()()()( pppvPppvpPpvppPvpppP

Exemplo 18 (Confiabilidade de Sistemas):

E “o sistema funciona” iA “i-ésimo componente do sistema” A probabilidade de iA funcionar é p Assuma que os componentes sejam mutuamente independentes. (a) dois componentes em série

22121)( pppAPAPAAPEP

(b) dois componentes em paralelo

2212121 2)( ppppppAAPAPAPAAPEP

46

(c) três componentes em sistema misto

32322

31213121 2)( pppppAAAAPAAPAAPEP

47

4 - VARIÁVEIS ALEATÓRIAS DISCRETAS 4.1. Variáveis aleatórias Definição: seja um experimento aleatório e o espaço amostral associado a esse experimento. Uma função X , que associe a cada elemento um número real

)(X , é denominada de variável aleatória (v.a).

Observação: em algumas situações o resultado do espaço amostral já constitui uma característica numérica que desejamos registrar. Assim, tomamos )(X . Exemplo 1: lançamento de duas moedas. Considere a v.a. X sendo o número de faces CARA.

},,,{ KCCKKKCC C ”cara” e K ”Coroa”

Definição: uma v.a X é dita discreta quando o conjunto dos valores possíveis de X é finito ou infinito enumerável.

},.....,,{ 21 nX xxx ou ,.....},{ 21 xxX .

48

4.2. Função massa de probabilidade (fmp) Definição: a função massa de probabilidade (f.m.p) de uma v.a. discreta é:

]1,0[: Xf ; )()( iii xXPxfx Condições para ser uma f.m.p: (1ª) 1)(0 ixf , Xix (2ª) 1)(

Xix ixf ,

(3ª) 0)( ixf se Xix Exemplo 2: seja X o número de faces cara em 3 lançamentos de uma moeda tal que

43)( CP e

41)( KP .

ix 0 1 2 3

)( ixf 1/64 9/64 27/64 27/64 1

641

41

41

41)()0()0( KKKPXPf

649

643

643

643)()()(

)()()()1()1(

KKCPKCKPCKKP

KKCKCKCKKPXPf

6427

649

649

649)()()(

)()()()2()2(

CKCPKCCPCCKP

CKCKCCCCKPXPf

6427

43

43

43)()3()3( CCCPXPf

49

Representação gráfica da fmp do exemplo 2

4.3. Esperança matemática de uma v.a. discreta A esperança matemática da v.a. X é definida como: )()( ix i xfxXE

Xi

.

notações: EXXE ,),( Observações:

(1ª) A esperança matemática é a média da população, enquanto

X é a média da amostra, ou seja, uma estimativa de EX. (2ª) Interpretamos a esperança matemática como sendo o centro de gravidade (equilíbrio) de uma fmp, e é empregada com a finalidade de representatividade dos valores de X . Exemplo 3: Uma fábrica opera com 3 marcas de máquinas: A, B, C. O gerente deseja saber qual marca tem menor custo médio de manutenção.

50

Marca A Marca B Marca C

Tipo de defeito

Custo do Conserto(X)

Probab. de

Falha

Custo do Conserto(Y)

Probab. de

falha

Custo do Conserto(Z)

Probab. de

falha Mecânico 33 0,50 32 0,48 34 0,45 Elétrico 34 0,20 36 0,21 35 0,27

Hidráulico 50 0,30 47 0,31 51 0,28

3,3830,05020,03450,033 EX ; 49,37EY ; 03,39EZ A marca B tem menor custo médio, logo deve ser a preferida. Propriedades da Esperança: (1ª) ,)( kkE se k for uma constante (2ª) )()( XkEkXE , se k for uma constante (3ª) ,)()( bXaEbaXE Rba , (4ª) )()()( YEXEYXE (5ª) )()(

11

n

i in

i i XEXE 4.4. Variância e desvio padrão de uma v.a. discreta Definição: Seja X v.a discreta com f.m.p f e espaço amostral ,......},{ 21 xxX . Definimos a variância de X por )()( 2

ix i xfEXxXVarXi

.

Definição: o desvio padrão é definido como )()( XVarXDP . Notações: XX XDPXVarXV ),(,),(),( 2 .

51

Observações: (1ª) uma fórmula alternativa para a variância é 22 )()( EXxfxXVar ix i

Xi

.

(2ª) 0)( XVar . (3ª) a variância tem como unidade de medida o quadrado da unidade de medida de X . (4ª) o DP (desvio padrão) tem mesma unidade de medida que a v.a. X , e mede o grau de dispersão dos valores de X em torno de EX . (5ª) podemos também utilizar o coeficiente de variação de X , definido como

%100||

EXDPCV . O CV é interpretado como o grau de variabilidade relativa em torno

da esperança, ou seja, CV é uma medida relativa, enquanto DP é absoluta. Exemplo 4: ix 0 1 2 3 )( ixf 1/8 3/8 3/8 1/8 1

5,1)( XE , 43

23

824)(

2

XVar ,

43)( XDP e %735,57CV .

Propriedades da variância (1ª) ,0)( cVar c constante; (2ª) )()( 2 XVarccXVar ; (3ª) ),()( 2 XVarabaXVar Rba , .

52

4.5. Modelos probabilísticos discretos 4.5.1. Modelo Binomial Seja um experimento aleatório com dois resultados possíveis, isto é, },{ 21 , com pP )( 1 e qpP 1)( 2 . A variável aleatória X , tal que 1)( 1 X (ocorreu um sucesso) e 0)( 2 X (ocorreu um fracasso) é dita modelo de Bernoulli. O que é um “sucesso” ou um “fracasso” é subjetivo.

Exemplo 5: lançamento de uma moeda equilibrada ={cara, coroa}

5,01 XP e 5,00 XP .

Exemplo 6: ={ fator RH+ ; fator RH-}

Sabe-se, da Biologia, que 85,01 XP e 15,00 XP .

53

Sendo nXXX ,....,, 21 v.a’s. independentes e identicamente distribuídas segundo

uma Bernoulli de parâmetro p , então

n

i iXX1

é dita binomial de parâmetros n e p . Notação: ),(~ pnBinomialX fmp: xnxx

n qpCpnxf ),,( , nx .....,2,1,0 Esperança e Variância de uma v.a. Binomial

n

i

n

iin

i i nppXEXEEX1 11

)(

)1( pnpVarX

Exemplo 7: suponha que 40% dos moradores de um município são favoráveis à implantação de um novo sistema de coleta e reciclagem de lixo. Se 5 pessoas forem entrevistadas (independentemente), qual a probabilidade de: (a) nenhuma ser favorável (b) no máximo 2 serem favoráveis (c) no mínimo 4 serem favoráveis (d) entre 2 (incluso) e 5 (excluso) serem favoráveis Solução: vamos denotar X como o número de pessoas favoráveis ao projeto )40,0;5(~ BinomialX (a) 07776,060,040,0)0( 500

5 CXP

54

(b) 68256,060,040,060,040,060,040,0

)2()1()0()2(322

5411

5500

5

CCCXPXPXPXP

(c) 08704,060,040,060,040,0)5()4()4( 055

5144

5 CCXPXPXP

(d) 6528,060,040,060,040,060,040,0

)4()3()2()52(144

5233

5322

5

CCCXPXPXPXP

Exemplo 8: no exemplo anterior, se 50 pessoas forem entrevistadas, qual o número esperado de favoráveis? Solução: 2040,050)( XE ; 1260,040,050)( XVar , %3205,17CV

4.5.2. Modelo Uniforme Discreto

fmp: ,1)(N

xf i }.....,2,1{ Ni .

caso particular:

Nif

Nix Xi

1)(

},.....,2,1{

Notação: )(~ NUnifX Gráfico da função massa de probabilidade de uma uniforme discreta

55

Esperança e variância de uma Uniforme discreta: 2

1

NEX ; 12

)1()(2

NXVar .

Exemplo 9: X= “no. de pontos marcados na face superior de um dado”. x 1 2 3 4 5 6

)(xf 1/6 1/6 1/6 1/6 1/6 1/6 1

5,32

16)(

XE

Exemplo 10: a amostra a seguir é o resultado de 24 lançamentos de um dado equilibrado Face 1 2 3 4 5 6 Total No. ocorrências 4 4 5 4 3 4 24

416666,32482

24463544534241

X

Em n lançamentos de um dado a soma das faces divida por n é aproximadamente 3,5.

4.5.3. Modelo Hipergeométrico Nota: a denominação do modelo tem relação com a série hipergeométrica. Experimento aleatório: Seja uma população de tamanho N com r elementos possuindo uma característica em comum. O experimento consiste em extrair uma amostra, sem reposição, e observar se a unidade amostral possui a característica. Se tiver diremos que ocorreu um “sucesso”. A v.a. X ”número de sucessos na amostra” é tal que

)},min(,....,1,0{ rnX .

f.m.p: ,)(),,,( nN

xnrN

xr

CCC

xXPrnNxf

)},min(,....,1,0{ rnx .

Notação: ),,(~ rnNHX

56

Esperança e variância de uma Hipergeométrica:

npXE )( ,

1

)1()(N

nNpnpXVar , Nrp

Observação: para N e mantendo Nrp constante, a fmp de uma hipergeométrica

converge para a binomial . Logo, para uma população grande, os processos com e sem reposição ficam muito próximos. Exemplo 11: pequenos motores são guardados em caixas de 25 unidades. Um inspetor de qualidade examina cada caixa, antes da posterior remessa, testando cinco motores. Se houver no máximo dois motores defeituosos, a caixa é aceita, caso contrário todos os 25 deverão ser testados. Sabendo-se que há 4 motores defeituosos numa caixa, qual a probabilidade de que seja necessário testar todos motores dessa caixa? Solução: X “número de motores defeituosos”

}4,3,2,1,0{ X ; 25N , 5n e 4r P(examinar toda a caixa) = )3(XP

0162055,0)4()3( 525

121

44

525

221

34

CCC

CCCXPXP

Agora assuma que 250N e 40r . Então }5,4,3,2,1,0{ X : P (examinar toda a caixa) = 03027575,0)5()4()3()3( XPXPXPXP

Usando a aproximação pela binomial, com 16,025040

p :

0317587,084,016,084,016,084,016,0)3( 0555

1445

2335 CCCXP

57

4.5.4. Modelo de Poisson A distribuição de Poisson é o modelo probabilístico que descreve um experimento aleatório, cuja variável aleatória X é o número de sucessos em um intervalo de comprimento t . Exemplo 12: aplicações do modelo de Poisson: (1º) no. de chamadas telefônicas recebidas por um PBX durante um período de tempo. (2º) no. de falhas de um computador durante 1 dia. (3º) no. de veículos que chegam a um pedágio durante 1 hora. (4º) no. de falhas em 1 metro de tecido de algodão.

fmp: !

)(),(x

tetxfxt

, ,.......2,1,0x

sendo .....7182882,2e , e 0t o número médio de “sucessos” no intervalo de comprimento t . Notação: );(~ tPoisX

Esperança e variância de uma Poisson: tEX tXVar )( .

58

Gráfico da fmp de uma Poisson

Exemplo 13: Numa central telefônica chegam 300 chamadas por hora. Qual a probabilidade de que: (a) em 1 minuto não haja nenhuma chamada? (b) em 2 minutos ocorram 8 chamadas? (c) em 0,5 minutos ocorram no mínimo 2 chamadas? Solução: X ”número de chamadas em um intervalo de t minutos”

560

300 é o número esperado de chamadas em 1 minuto ( 1t )

(a) 00673,0!0

)0( 50

eeXP

(b) 1126,0!8

10!8

2)8(8

108

2 eeXP

(c) 7127,02873,015,31!15,2

!05,21

)1()0(1)1(1)2(1)2(

5,210

5,2

ee

XPXPXPXPXP

59

5 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS De uma maneira geral, medidas de grandezas físicas, como coordenadas espaciais, peso, tempo, temperatura e voltagem, são descritas mais adequadamente como variáveis aleatórias contínuas. 5.1. Função densidade de probabilidade (fdp) Definição: Diz-se que X é variável aleatória contínua se existir uma função f , denominada de função densidade de probabilidade (f.d.p), tal que: (1º) 0)( xf , Rx

(2º)

1)( dxxf

(3º) para ba , b

a

dxxfbXaP )()(

Observações: (1ª) )(xf não é probabilidade.

(2ª) Uma vez que 0)()( x

x

dyyfxXP , então no caso contínuo:

)()()()( bXaPbXaPbXaPbXaP , ou seja, 0)()( bXPaXP .

(3ª) Se g é tal que 0)( xg e 1)(

Kdxxg , então a função

Kxgxf )()( é uma função densidade.

60

Exemplo 1: : um cano cilíndrico para escoamento de água tem raio 2 cm e comprimento 10 cm.

O volume de água que escoa pelo cano é dado por .1022 V A taxa de água que passa pelo cano no intervalo [0, x] , 0< x<10, é a derivada do volume, ou seja, .2)( 2 xg A função g não é densidade de probabilidade, pois

. Mas, é f.d.p. A percentagem de volume de água que passa pelo cano, no intervalo [0, x], 0< x<10, é .

5.2. Função de Distribuição Acumulada de uma v.a. contínua

]1,0[: RF

x

xXPdyyfxF )()( , onde f é f.d.p

Propriedades: (1ª) 0)(lim xFx e 1)(lim xFx (2ª) F é contínua e não-decrescente em R

(3ª) )()( xFdxdxf se F for derivável em x

0 se F não for derivável em x (4ª) )()()( aFbFbXaP ; )(1)( aFaXP .

61

Exemplo 2: seja a função a seguir

(a) Mostre que é fdp (b) Obtenha a fda (c) Usando a fda obtenha )6,0( XP , )4,0( XP e )5,02,0( XP Solução:

(a) 12 10

21

0

xxdx

(b)

:0x 00)()(

xx

dydyyfxF

:10 x 20

2

0

0

20)()( xyydydydyyfxF xxx

:1x 1020)()( 10

21

0 1

0

ydyydydydyyfxFxx

Nota: em 1x ,

2)1(lim

11lim

1)1()(

lim

01

0lim111lim

1)1()(lim

1

2

11

111

xx

xx

FxFxxx

FxF

xxx

xxx

,

logo, F não é derivável em x=1 (veja a figura abaixo).

62

(c) 36,06,0)6,0()6,0( 2 FXP , 84,04,01)4,0(1)4,0( 2 FXP 21,02,05,0)2,0()5,0()5,02,0( 22 FFXP

5.3. Esperança e variância de v.a’s contínuas

Esperança:

dxxxfEX )(

condição de existência:

dxxfxXE )(||||

Variância: 222 )()()()()( EXXEdxxfEXxXVar

, onde

dxxfxXE )()( 22

condição de existência: 2|| XE Importante: mesmas propriedades da esperança e variância são válidas para o caso contínuo. Exemplo 3: o conteúdo de cinzas (em percentagem) no carvão pode ser considerado uma variável aleatória contínua com f.d.p :

..;0

2510;4875

1)(

2

cc

xxxf

63

O conteúdo de cinzas esperado em um particular espécime de carvão é:

5,19)(4875

1)(25

10

2 dxxfxXE por cento.

Exemplo 4: seja X v.a. com densidade a seguir

Mostre que f é densidade e encontre EX e Var(X).

Solução: 132

6)( 10

310

21

0

xxdxxf

21

1216

436)( 1

0

410

31

0

xxdxxxfEX ;

206

546)()( 1

0

510

41

0

22

xxdxxfxXE ; 201)( XVar

64

5.4. Modelos probabilísticos contínuos

5.4.1. Modelo Uniforme contínuo Função densidade de probabilidade:

Notação: ],[~ baUX Função de distribuição acumulada

65

Esperança e variância

2)(2))((

)(2)(21 222 ba

ababab

abab

abxdx

abxEX b

a

b

a

12)()(

2abXarV

Exemplo 5: Os geradores de números pseudo-aleatórios, de calculadoras e computadores, têm distribuição uniforme contínua em [0,1). Por exemplo, no EXCEL o comando é : ALEATORIO( ) Por exemplo, foram gerados 18 números: 0,156829637 0,846649578 0,469263346 0,577564193 0,664633565 0,462117229 0,973857121 0,964847015 0,968308066 0,981239892 0,322957938 0,118940193 0,937166033 0,135396175 0,840436215 0,023279616 0,431708782 0,587640809 A média desses valores gerados é 0,495327. Exemplo 6: considere um relógio circular de ponteiros. O relógio pode parar, por falta de bateria, em qualquer quadrante. Defina X o ângulo formado pelo ponteiro maior quando o relógio parar. Determinar: (a) fdp (b) fda (c) probabilidade do ponteiro parar entre -90 e 0 graus Solução:

(a)

..,0

0360,360

1)(

cc

xxf (b)

0,1

0360,360

360360,0

)(

x

xxx

xF

66

5.4.2. Modelo Exponencial Este modelo possui aplicações em diversas áreas: Biologia, Engenharia, Computação. Na Teoria da Confiabilidade está associada à probabilidade de falha de componentes em um sistema.

Função densidade de probabilidade:

0,0,0

),(xe

xxf x ; 0

O parâmetro é a taxa (intensidade) de falhas. Notação: )(~ ExponX Exemplo 7: distribuições exponenciais de parâmetros 2; 1,5 e 0,6

67

Função de distribuição acumulada:

0,10,0

),(xe

xxF x

Esperança e variância da exponencial: 1

EX , 2

1)(

XVar .

Exemplo 8: o tempo de duração (em horas) de um componente eletrônico é exponencial de

parâmetro 500

1 . Qual a probabilidade de que o componente:

(a) tenha duração entre 300 e 600 horas? (b) dure mais do que a média? Solução: X denota o tempo de duração do componente em horas (a)

247617,011)300()600()600300( 2,16,0300600 eeeeFFXP

(b) A media de X é 5001

. Assim,

367879,011)500(1)500( 1500 eeFXP

68

5.4.3. A distribuição Normal (Gaussiana) A distribuição Normal é de grande importância em Probabilidade e em Inferência Estatística. A distribuição normal foi introduzida pela primeira vez por Abraham de Moivre em um artigo no ano 1733. O nome "distribuição normal" foi criado por Charles S. Peirce, Francis Galton e Wilhelm Lexis, por volta de 1875. Exemplo 9 ( Exemplos de aplicação da normal): (1º) distribuição das alturas de pessoas (2º) distribuição dos valores de depósitos bancários (3º) distribuição do quociente intelectual (QI) (4º) distribuição da produção de cereais

Função densidade: ,21exp

21),,(

2

2

xxf x ;

; ),0( Notação: ),(~ NX . Gráfico da densidade normal

Propriedades da distribuição normal: (1ª) 0)( xf . (2ª) A área sob a densidade f é igual a 1. Para mostrar isto faz-se mudança para coordenadas polares.

69

(3ª) Para três distribuições normais 321 ,, XXX de mesmo parâmetro , se 321 , então a v.a 3X é mais leptocúrtica (afinada) que 2X e por sua vez 2X é mais leptocúrtica que 1X .

(4ª) ponto de máximo: x , pontos de inflexão: x e x . (5ª)

(6ª) MoMdEX ; 2)( XVar .

70

(7ª) Se ),(~ NX então )||;(~ bbaNbXaY e )1;0(~ NXZ

.

Função de distribuição acumulada da Normal padrão Seja )1;0(~ NZ . A função de distribuição acumulada de Z é denotada por

dvvzz

2exp

21)(

2

.

Propriedades de (1ª) 0)(lim zz e 1)(lim zz (2ª) 5,0)0( (3ª) )()()( abbZaP e )(1)( bbZP (4ª) Pela simetria da densidade, )(1)( zz (5ª) Se );(~ NX é preciso padronizá-la , para poder usar a tabela da normal padrão:

71

abbZaPbXaPbXaP )(

Nota: As áreas A e B têm formas diferentes, mas tem igual valor. Tabela de : fornece )( zZP , ]79,3;79,3[z , que é área hachurada na figura abaixo. No exemplo, 8980,0)27,1( ZP .

72

Exemplo 10: Seja )1;0(~ NZ (a) 8413,0)1()1( ZP (b) 9418,0)57,1()57,1( ZP (c) 95,0025,09750,0)96,1()96,1()96,196,1( ZP (d) 0505,09495,01)64,1(1)64,1( ZP (e) 012,00102,00222,0)32,2()01,2()01,232,2( ZP (f) 0)4()4( ZP e 011)4(1)4( ZP . Mas, pelo computador

420000316712,0)4( ZP , ou seja, na tabela a área foi arredondada para zero. Exemplo 11: os depósitos efetuados por clientes de um banco têm distribuição normal com média 100,00 e desvio padrão 15,00 unidades monetárias. Um cliente é selecionado ao acaso. Qual a probabilidade de que o depósito efetuado por ele seja: (a) 100,00 u.m. ou menos ? (b) pelo menos 110,00 u.m.? (c) um valor entre 120,00 e 150,00 u.m.? (d) maior que 140,00 u.m.? Solução: denotemos por X o valor dos depósitos

(a) 5,0)0()0(00,15

00,10000,10000,15

00,10000,100

ZPXPXP

(b)

2514,00.74861)67,0(132

00,1500,10000,110

00,1500,10000,110

ZPXPXP

(c)

0,09140.9082-0.9996)33,1()33,3(33,333,100,15

00,10000,15000,15

00,10000,15

00,10000,12000,15000,120

ZP

XPXP

(d)

0038,00.99621

)67,2(167,200,15

00,10000,14000,15

00,10000,140

ZPXPXP

73

Tabela da Normal Padrão Inversa: 1 : fornece as coordenadas tais que )(1 z , ou seja:

2)( zZP (áreas unilaterais superiores)

)|(| zZP (áreas bilaterais)

Exemplo 12: Para uma normal padrão, obtenha z tal que : (a) 9750,0)( zZP (b) 95,0)( zZP (c) 01,0)( zZP (d) 95,0)( zZzP Solução: (a)

96,1z

74

Também poderá utilizar a tabela da normal inversa, com a área unilateral de 0,025, como mostra a figura abaixo:

(b) Neste caso não encontraremos a área 0,95 na tabela da normal padrão. Isto acontece porque a tabela é limitada em duas decimais para as coordenadas. O valor exato, usando o computador, é 56448536269,1z .

Você pode utilizar a media aritmética das duas coordenadas:

645,12

65,164,1

z . Também poderá utilizar a tabela inversa da normal padrão, cujo

valor da coordenada é z=1,6445.

75

(c) Neste caso, a área deseja é a cauda inferior. Pela tabela da normal inversa, obtemos z = 2,3263, e portanto - z = -2,3263.

(d) Pela tabela da normal inversa , z=1,96.

Exemplo 13: as alturas de 10000 alunos de uma escola têm distribuição normal de média 170 cm e desvio padrão 5cm. (a) qual o número esperado de alunos com altura superior a 165 cm? (b) qual o intervalo simétrico em torno da média que conterá 75% das alturas dos alunos? Solução: denotemos por X a altura dos alunos

(a) 8413,01587,01)1(115

1701655170165

ZPXPXP

O nº de esperado é 100000,8413 = 8413 alunos.

76

(b) Temos que encontrar k tal que 75,0)()()( kkkZkPkXkP Pela Tabela Inversa da Normal Padrão, para área bilateral de 0,25, obtêm-se que

15,1k . Portanto, o intervalo em torno de é

75,175;25,164515,1170;515,1170 .

77

6 - AMOSTRAGEM E ESTIMAÇÃO DE PARÂMETROS 6.1. Parâmetros e Estatísticas Definição: denomina-se amostra aleatória a uplan nXXX ,,, 21 de v.a´s com mesma distribuição de probabilidade. Exemplo 1: nXXX ,,, 21 com distribuição binomial de parâmetros m e p . Definição: um parâmetro é uma medida usada para descrever uma característica numérica da população. Exemplo 2: 85,0 é a proporção de pessoas com fator RH+ Exemplo 3: a função-produção é definida como BQKY , sendo Y o valor do produto e Q a quantidade produzida, K e B parâmetros. Definição: uma estatística (ou estimador) é uma característica numérica da amostra, isto é, uma estatística T é uma função de nXXXfT ,,, 21 .

Exemplo 4: n

XP

n

ii

1 , onde iX 1, se for RH+

= 0, se for RH- Nota: uma vez que T é função de v’as, então também será aleatória. Definição: uma estimativa é um valor particular assumido pelo estimador

),....,( 21 nxxxft

Exemplo 5: numa amostra de 30 pessoas, 25 tem RH+. Assim, 83,03025

p .

Observação: por convenção representamos a amostra observada (e as estimativas) por letras minúsculas.

78

Notações usuais:

Medidas Parâmetro Estimador Estimativa Média

nXf

Xk

i ii

1 n

xfx

k

i ii

1

Variância

2

1

2

1

2

2

n

XnXfS

k

iii

1

2

1

2

2

n

xnxfs

k

iii

Desvio padrão S

s

Amplitude

H h

Proporção

P p

Correlação R r

6.2. Propriedades dos Estimadores: (1ª) Um estimador é dito não tendencioso ou não enviesado, se )(TE , onde é um parâmetro populacional Exemplo 6: “a média de todas médias amostrais possíveis é igual à média populacional”,

ou seja,

)(XE .

Exemplo 7: 22 SE , mas 22 VE , onde 2

1

2

2

Xn

XfV

k

iii

.

(2ª) Uma seqüência 1nnT de estimadores de é dita consistente se:

)(lim nn TE e 0)(lim nn TVar

Exemplo 8: como

)(XE e 0lim2

nn , então

X é consistente.

(3ª) Se T e H são dois estimadores não tendenciosos de e )()( HVarTVar então dizemos que T é mais eficiente que H.

79

Exemplificação de quatro estimadores onde foram feitas 18 observações

6.3. Estimação por ponto e por intervalo Estimação por ponto: é a estimativa resultante da amostra. Estimação por intervalo: a estimação por ponto não permite julgar a magnitude do erro que estamos cometendo. Daí surge a idéia de construir os intervalos de confiança, que são fundamentados na distribuição amostral do estimador. ..CIP

é dito grau de confiança, que é a probabilidade do parâmetro pertencer ao intervalo

1 é a probabilidade de não pertencer ao intervalo

80

Construção de intervalos de confiança: o teorema a seguir é o alicerce dos Intervalos de Confiança. Teorema (Teorema Central do Limite): Para uma amostra aleatória ),....,( 1 nXX e um estimador ),....,( 1 nn XXfT de máxima verossimilhança do parâmetro , tal que

)( nTE , tem-se:

)1,0()()( N

TVarTETZ

n

n

nnn

6.4. Intervalos de confiança

6.4.1. IC para a média populacional quando o desvio padrão é conhecido Pelo Teorema Central do Limite,

11n

zXn

zXPzXVar

XEXzP tabtabtabtab ,

onde tabz é tal que )(12 tabz .

81

Assim, o intervalo de confiança para , de grau %100)1( , é dado por

XIC , onde n

ztab é dito erro de estimação (ou erro amostral).

Observação: note que o erro de estimação é a semi-amplitude do I.C. Exemplo 9: suponha que se esteja estudando a altura de pessoas numa certa população.

Sabe-se que =15. A amostra de 100 indivíduos resultou em

x =170 . Construa intervalos de confiança para a média populacional com: (a) 1 =0,90 (b) 1 =0,95 (c) 1 =0,99 solução:

(a) 46,172;54,16710015645,1170;

10015645,1170

(b) 94,172;06,1671001596,1170;

1001596,1170

(c) 85,173;14,16610015575,2170;

10015575,2170

82

Interpretação do Intervalo de Confiança: espera-se que %100)1( dos intervalos originados de amostras de mesmo tamanho contenham o parâmetro .

Observações: (1ª) Não se utiliza grau de confiança igual a 100%, pois neste caso o intervalo fica a própria reta real! De fato, para que 1 tabtab zZzP , então é preciso que

tabz . (2ª) Um grau de confiança igual a 0% resulta em um intervalo degenerado (que é a própria estimativa por ponto!). De fato, para que 0 tabtab zZzP , então é preciso que

0tabz . (3ª) Não existe um valor ideal para o grau de confiança. Nunca se deve utilizar os extremos 0% e 100%. Os valores mais usuais são 0,99; 0,95 e 0,90, mas não há uma justificativa formal para usá-los, são apenas valores de referência mais encontrados em artigos e livros. (4ª) O desvio padrão influencia diretamente na amplitude do I.C., ou seja, se for grande, então o I.C. será amplo. O grau de confiança também é responsável pela amplitude do I.C. Mantendo fixado, se n aumentar então a amplitude do I.C. irá diminuir, ou seja, ficará mais preciso.

83

6.4.2. IC para a média populacional quando o desvio padrão é desconhecido A distribuição t-student: Foi introduzida por William Gosset, que utilizou o pseudônimo “um estudante”. Essa distribuição aparece quando substituímos o desvio padrão pelo respectivo estimador S . A t-student é similar à normal padrão, isto é, e simétrica em torno do zero e tem a forma de um sino, sendo mais baixa (achatada) que a normal. Além disso, a t-student converge à normal padrão. Notação: )(~ vtX , onde 0v é o parâmetro da distribuição. Comparação entre a normal padrão e a t-student

84

Em inferência estatística esse parâmetro assume valores inteiros positivos e tem a denominação de “graus de liberdade”. O conceito de graus de liberdade (GL) é o número de valores que poderemos atribuir de maneira arbitrária. Por exemplo, suponha que temos três parcelas, cujos valores devem ser não negativos e somarem 14: 4 + 7 + = 14 Então, teremos a “liberdade” de atribuir apenas dois valores, pois o último ficará “amarrado” (determinado). A tabela da t-student é tal que se você entrar com GL=n-1 e a área, você obterá a coordenada. Para GL maior que 120, utiliza-se a normal padrão.

85

Modelo de Tabela t-student

nStXIC tab , onde tabt é tal que )|(| tabtTP , )1(~ ntT

Exemplo 10: de 1500 placas de memória fabricadas retirou-se uma amostra de 30 unidades, observando-se o tempo até a primeira falha. Obteve-se as seguintes estatísticas:

800

x h e 100s h. Construa um IC de 99% para a média da população.

Solução: IC = 31,850;68,74930

1007564,2800;30

1007564,2800

Observação: o desvio padrão amostral S influencia diretamente na amplitude do I.C. Se a variabilidade na amostra for alta, o I.C. será mais amplo. Aumentando-se a amostra, o I.C. deverá ficar mais preciso (com menor amplitude).

86

6.4.3. IC para a variância populacional 2 A distribuição Qui-Quadrado: a distribuição origina-se da soma de quadrados de distribuições normais. A densidade dessa distribuição é assimétrica à direita. O nome “QUI” vem da letra grega . Algumas distribuições Qui-Quadrado

Notação: )(~ vQuadradoQuiX , onde 0v é o parâmetro da distribuição. Assim como na t-student, em inferência estatística esse parâmetro assume valores inteiros positivos, e denomina-se “graus de liberdade”. A tabela da Qui-Quadrado é tal que se você entrar com GL e a área, você irá obter a coordenada.

87

Modelo de Tabela Qui-Quadrado

O intervalo de confiança para a variância é:

inf

2

sup

2 )1(,)1(q

Snq

SnIC , onde

1)( supinf qXqP ; )1(~ nQuadradoQuiX

O intervalo de confiança para o desvio padrão é:

inf

2

sup

2 )1(,)1(q

Snq

SnIC

Exemplo 11: O setor de qualidade de uma indústria de parafusos deseja estimar a variação dos comprimentos de parafusos produzidos. Obtenha intervalo de confiança de grau 95% para . A amostra foi a seguinte: 12,2 12,4 12,1 12,0 12,7 12,4 14,0 13,7 13,9 14,1 13,9 13,7 13,5 12,2 12,5 13,6.

Solução: 05625,13

x 634624,02 s 796633,0s

23295,1;58848,02621,6634624,015;

4884,27634624,015

IC

88

6.4.4. IC para a proporção populacional

n

PPzPIC tab)1(

, onde P é a proporção amostral e tabz é tal que

)(12 tabz .

Exemplo 12: suponha a seguinte amostra sobre a intenção de voto em um candidato: {1; 0; 1; 1; 1; 1; 0; 0; 1; 1; 0; 0; 0; 0; 0; 1; 0; 0; 1; 0} 1 “a favor”; 0 “contra” Construa um IC de 98% para a proporção.

Solução: 45,0209

p

IC = 7086,0;1913,020

55,045,0325,245,0;20

55,045,0325,245,0

6.5. Dimensionamento de amostras Estimação da média

Vimos que para a média populacional,

XXCI ,.. , onde

nz tab

é o erro de estimação absoluto. Isolando n nesta última equação obtemos

o tamanho da amostra:

população infinita: 2

22

tabzn , onde tabz é tal que )(12 tabz .

população finita: nN

Nnm

.

89

Observações: (1ª) se for desconhecido então utiliza-se algum valor já utilizado em uma pesquisa semelhante que já foi realizada, ou realiza-se uma pesquisa incial (amostra piloto) para obter uma estimativa. (2ª) O tamanho da amostra n e o erro de estimação tem relação inversa, como mostra a figura:

Exemplo 13: deseja-se estimar a renda dos moradores do bairro da Gávea , no Rio de Janeiro, sabendo-se que o desvio padrão da renda é de 300,00. Exige-se um erro absoluto máximo de 20,00 e um grau de confiança de 95%. Qual deve ser o tamanho da amostra?

Solução: 86536,86420

30096,12

22

n

Supondo N=5000, 73796,73636,864500036,8645000

m

90

Estimação da proporção

r é o erro de estimação relativo

população infinita: 22 )1(

rtabzn

, onde tabz é tal que )(12 tabz .

população finita: nN

Nnm

.

Observações: (1ª) o erro de estimação para a proporção está em termos relativos, visto que uma proporção é uma medida relativa (sem unidade de medida).

(2ª) Se for desconhecida, pode-se utilizar alguma estimativa de uma pesquisa anterior. Também pode-se assumir o maior valor possível 25,0)1( . Desta forma,

2

2 25,0

r

tabzn

.

Exemplo 14: Uma amostra preliminar de 50 famílias foi selecionada de N=4000 famílias. Constatou-se que na amostra 30 famílias possuíam renda superior a 1000,00. Qual deve ser o tamanho da amostra, com grau de confiança de 99% e erro de estimação máximo de 5%? Solução:

6,05030

p ; 575,2tabz

63754,63605,0

4,06,0575,22

2

n ; 55015,54954,636400054,6364000

m

Se usarmos 25,05,05,0)1( , 66306,66305,0

25,0575,22

2

n e 569m

91

7 – TESTES DE HIPÓTESES 7.1. Definições Hipótese conceitual: é a hipótese formulada utilizando termos específicos na área em estudo. Hipótese operacional: é a formulação matemática da hipótese conceitual Exemplo 1: o biodiesel é menos poluente que o diesel convencional Como trabalhar matematicamente com essa hipótese? Iremos comparar as médias de emissões de partículas de óxido de enxofre por cm 3 . Um grupo de veículos vai rodar com biodiesel e outro com o convencional. Vamos denotar por B a média de emissão de partículas por cm 3 usando biodiesel, e por C usando o diesel comum. Hipóteses : B = C e B < C Hipóteses estatísticas Em inferência estatística uma hipótese é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações. Esta hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada. Ela somente será rejeitada se o resultado da amostra for improvável de ocorrer sob a suposição da hipótese ser verdadeira. Denominaremos por 0H (hipótese nula) a hipótese a ser testada, e por 1H (hipótese alternativa) a negação de 0H . Através de um teste aceitaremos ou rejeitaremos 0H . A nossa decisão terá uma probabilidade de erro. Essa probabilidade de erro é controlada (escolhida pelo pesquisador). Um pesquisador nunca poderá escrever num artigo ou relatório frases do tipo: “o teste de hipótese mostrou que....”, mas deverá apresentar qual a probabilidade de erro que ele admitiu no teste. O quadro abaixo apresenta o que pode acontecer em um teste de hipóteses:

92

Exemplo 2: suponha um julgamento num tribunal

As probabilidades desses erros são chamadas e respectivamente, ou seja: = P(erro tipo I) = P(rejeitar 0H | 0H é verdadeira) P(aceitar 0H | 0H é verdadeira), que é o grau de confiança = P(erro tipo II) = P(aceitar 0H | 0H é falsa) = P(rejeitar 0H | 0H é falsa) Nível de significância de um teste: é o valor de no teste, ou seja, é a probabilidade de rejeitar 0H , dado que é verdadeira. Os valores mais utilizados para são: 0,01; 0,05 e 0,10. Observações: (1ª) No enfoque de Fisher, a preocupação é com os testes de significância, dando exclusiva atenção ao erro tipo I. Neste curso seguiremos o enfoque de Fisher. (2ª) Fisher, um dos precursores da Teoria Estatística, usou o valor de 5% para facilitar o ensino da Teoria, e por isso ficou como um valor “consagrado”.

7.2. Etapas de um teste de hipóteses (1ª) Formular as hipóteses estatísticas: a hipótese nula a respeito de um parâmetro deve conter a igualdade e alternativa pode ser bilateral ou unilateral.

0H : 0 1H : 0 (bilateral) 0 (unilateral à esquerda) 0 (unilateral à direita).

93

(2ª) Fixar o nível de significância do teste. (3ª) Calcular a estatística do teste. (4ª) Tomada de decisão: rejeitar 0H se a estatística do teste estiver na região crítica (região onde a hipótese nula é rejeitada), caso contrário não se rejeita 0H . A região crítica dependerá de e do tipo de hipótese alternativa. Observações:

7.3. Testes de hipóteses

7.3.1.Teste de hipóteses para a média de uma população (a) conhecido

00 : H

estatística do teste: nX

zc

0

1H bilateral ( 01 : H ): rejeita 0H se || cz > tabz , tal que )(12 tabz .

1H unilateral à direita ( 01 : H ): rejeita 0H se cz > tabz , tal que )(1 tabz .

1H unilateral à esquerda ( 01 : H ): rejeita 0H se cz < tabz , tal que )(1 tabz .

94

Observações: (1ª) se for grande, a estatística cz não será sensível o bastante para detectar diferença

significante entre

X e 0 . (2ª) aumentando a amostra, o teste ficará mais sensível para detectar diferenças significativas. (3ª) O teste unilateral é mais rigoroso que o bilateral. Na figura abaixo, o valor tabelado do teste unilateral é menor que no bilateral. Se )()( b

tabcu

tab zzz , então o teste unilateral irá rejeitar a hipótese nula, mas o bilateral não.

95

(4ª) Para ∝ fixado, tabz também ficará fixado. Variando os valores de 0 , pode-se “manipular” cz de maneira que leve à aceitação ou rejeição de 0H .

Fixando 0 , cz também ficará fixado. Variando ∝ poderemos “manipular” tabz de maneira que leve à aceitação ou rejeição de 0H .

A manipulação de ∝ ou 0 é uma clara evidência de que o pesquisador está sendo tendencioso, protegendo seus próprios interesses!

96

Exemplo 3: uma linha de produção fabrica parafusos cujo diâmetro tem desvio padrão

22716,1 . Tomou-se uma amostra de tamanho 20, cujas estatísticas foram 735,3

x e 8756,3s . Com 05,0 , teste 0H : 5 contra

(a) 1H : 5 (b) 1H : 5 (c) Em relação ao item (b), apresente um que levaria à aceitação de 0H . Solução:

61,42022716,1

5735,3

cz

(a) 96,1tabz . Como tabc zz || , rejeitamos 0H . (b) 645,1 tabz . Como tabc zz , rejeitamos 0H . (c) Temos que encontrar um - tabz tal que tabc zz . Note que 65,4 tabz leva-nos à aceitação! Mas, 000001659,0)( tabzZP , que é um absurdo! Exemplo 4: Na tabela constam as medidas mensais dos comprimentos de parafusos (em mm) de uma linha de produção.

97

Mês

X1 X2 X3 X4 X5 Média

1 0,65 0,7 0,65 0,65 0,85 0,7 2 0,75 0,85 0,75 0,7 0,65 0,74 3 0,75 0,72 0,8 0,7 0,75 0,744 4 0,6 0,7 0,7 0,75 0,65 0,68 5 0,7 0,75 0,65 0,8 0,8 0,74 6 0,6 0,75 0,75 0,85 0,7 0,73 7 0,75 0,8 0,65 0,75 0,7 0,73 8 0,6 0,7 0,8 0,75 0,75 0,72 9 0,65 0,8 0,85 0,74 0,75 0,758 10 0,6 0,7 0,6 0,8 0,65 0,67 11 0,8 0,75 0,7 0,76 0,7 0,742 12 0,85 0,75 0,79 0,65 0,7 0,748 13 0,7 0,7 0,75 0,75 0,7 0,72 14 0,65 0,7 0,85 0,75 0,6 0,71 15 0,74 0,75 0,74 0,75 0,79 0,754 16 0,75 0,9 0,92 0,8 0,65 0,804 17 0,69 0,9 0,8 0,93 0,88 0,84 18 0,78 0,88 1,02 0,98 1,03 0,938 19 1 1 1,02 0,98 1,04 1,008 20 0,99 1,01 1,02 0,99 1,04 1,01 21 1,03 1,05 1,06 0,99 1,03 1,032 22 1,06 1,07 1,09 1,1 1,1 1,084 23 1,08 1,08 1,1 1,12 1,14 1,104 24 1,1 1,12 1,15 1,13 1,14 1,128 25 1,12 1,14 1,16 1,18 1,2 1,16

O departamento de controle de qualidade deseja informações acerca da uniformidade dos comprimentos dos parafusos. Segundo as normas da empresa, o processo de produção estará sob controle se o comprimento médio dos parafusos tiver 0,7 mm. Sabe-se, do manual das máquinas que produzem as peças, que a média e o desvio padrão dos comprimentos são 0,70 e 0,07 mm, respectivamente. Gráfico de controle é uma ferramenta amplamente utilizada em controle de qualidade. Consiste em construir uma “banda de confiabilidade” em torno da média. Para cada nova amostra, se constrói um intervalo de confiança para a média populacional. Traduzindo para testes de hipóteses: 0H : 70,0 contra 1H : 70,0 , onde o nível de significância adotado geralmente é 0,05. No gráfico, aparecerão os limites inferiores e superiores do intervalo de confiança. Se a média amostral estiver dentro do intervalo então não haverá evidências para rejeitar 0H , que é a hipótese de que o processo de produção está sob controle.

98

iX ; i=1,2,3,4,5 são as cinco medidas observadas para cada mês Os limites dos intervalos de confiança são:

64,0507,096,170,0 e 76,0

507,096,170,0

Como se pode observar pelo gráfico, a partir do 16º mês as médias amostrais começam a “cair” fora da “banda” de segurança (confiança) evidenciando claros indícios de que o processo está fora da especificação. (b) desconhecido

00 : H

Estatística do teste: nS

Xtc

0

1H bilateral: rejeita 0H se || ct > tabt , )|(| tabtTP , )1(~ ntT

1H unilateral à direita: rejeita 0H se ct > tabt , )( tabtTP

1H unilateral à esquerda: rejeita 0H se ct < - tabt , )( tabtTP

99

Exemplo 5: em relação ao Exemplo 3, vamos supor que era desconhecido. Use

05,0 .

Solução: 4597,1208756,3

5735,3

ct

(a) 093,2tabt . Como tabc tt || , não rejeitamos 0H . (b) 7291,1tabt . Como tabc tt , não rejeitamos 0H .

Nota: como %76,103%100735,3

8756,3CV é elevado, o teste não foi sensível o

bastante para detectar diferença significativa!

100

7.3.2.Teste de hipóteses para a proporção de uma população

00 : H

Estatística do teste: nPzc

)1( 00

0

, sendo P a proporção amostral.

1H bilateral( 0 ): rejeita 0H se || cz > tabz , tal que )(12 tabz

1H unilateral à direita( 0 ): rejeita 0H se cz > tabz , tal que )(1 tabz .

1H unilateral à esquerda( 0 ): rejeita 0H se cz < tabz , tal que )(1 tabz .

Exemplo 6: uma estação de TV afirma que 60% dos televisores estavam ligados no seu programa especial de sábado. Uma rede concorrente deseja contestar essa afirmação, e decide entrevistar 200 domicílios. Desses 200, 104 deram respostas afirmativas. Teste a hipóteses 6,0:0 H e 6,0:1 H , com : (a) 01,0 (b) 05,0 .

Solução: 31,2

20024,0

6,052,0

cz

(a) 325,2 tabz , então não rejeitamos 0H para 1% de significância . (b) 645,1 tabz , logo rejeitamos 0H para 5% .

101

7.3.3. Teste de hipóteses para a igualdade de médias de duas populações (a) desvios padrões populacionais conhecidos

YXH :0

Estatística do teste:

mn

YXzYX

c 22 , n é o tamanho da amostra para X e m para Y

1H bilateral( YX ): rejeita 0H se || cz > tabz , tal que )(12 tabz

1H unilateral à direita( YX ): rejeita 0H se cz > tabz , tal que )(1 tabz .

1H unilateral à esquerda( YX ): rejeita 0H se cz < - tabz , tal que )(1 tabz . Exemplo 7: deseja-se verificar se duas máquinas de empacotar café são homogêneas com relação ao peso neto. Sabe-se, pelo manual das máquinas, que o desvio padrão de ambas é

20 YX gramas. Foram obtidas amostras de 60 unidades para cada máquina. Teste se a média da máquina X é significativamente maior que a de Y, utilizando

10,0 . Estatísticas X Y

Média 500,01 g 497 g Amostra 60 60

Solução: YXH :0 contra YXH :1

8243,0

6020

6020

00,49701,50022

cz ; 2816,1tabz

Como tabc zz então não rejeita-se 0H .

102

(b) desvios padrões populacionais desconhecidos

YXH :0

Estatística do teste:

mnS

YXtc 11,

2)1()1( 22

mn

SmSnS YX

1H bilateral: rejeita 0H se || ct > tabt , )|(| tabtTP , )2(~ mntT

1H unilateral à direita: rejeita 0H se ct > tabt , )( tabtTP

1H unilateral à esquerda: rejeita 0H se ct < - tabt , )( tabtTP Exemplo 8: duas técnicas de vendas são aplicadas por duas equipes de vendedores: a técnica A por 12 vendedores e a B por 15. No final de um mês obtiveram-se os seguintes resultados: Estatísticas A B

Média 68 76 Variância 50 50,8 Amostra 12 15

Teste se a média do grupo B é maior que a do A, usando 05,0 . Solução: ABH :0 contra ABH :1 .

1026,725

50118,5014

s ; 908,2

121

1511026,7

6876

ct ; 7081,1tabt

Como tabc tt rejeitamos 0H .

103

7.3.4.Teste de hipóteses para a igualdade de proporções de populações

YXH :0

Estatística do teste: )

)1()1(m

PPn

PPPPz

YYXX

YXc

, YX PP , são as proporções amostrais

1H bilateral( YX ): rejeita 0H se || cz > tabz , tal que )(12 tabz .

1H unilateral à direita( YX ): rejeita 0H se cz > tabz , tal que )(1 tabz .

1H unilateral à esquerda ( YX ): rejeita 0H se cz < - tabz , tal que )(1 tabz . Exemplo 9: a matriz de uma empresa de embalagens quer comparar a proporção de itens que são rejeitados pelo setor de qualidade em duas de suas filiais. As amostras resultaram no seguinte: 200n ; 05,0Xp e 210m ; 052,0Yp . (a) Teste YXH :0 contra YXH :0 , com 05,0 . (b) Em (a), qual levaria à rejeição de 0H Solução:

092,0

210)052,01(052,0

200)05,01(05,0

052,005,0

cz

(a) Para teste unilateral à esquerda, com 05,0 , aceita-se 0H , pois 645,1 tabz .

(b) Mas, qual valor de levaria à rejeição de 0H ? Temos que encontrar um tabz tal que

tabc zz . Note que 09,0 tabz leva-nos à rejeição. Mas, 4641,04641,0)09,0( ZP , que é um absurdo!

104

7.4 – Significância amostral

Quando realizamos testes de hipóteses partimos de um valor fixado para , permitindo tomar uma decisão entre 0H e 1H . Quando utilizamos o computador, o programa não irá utilizar um pré-fixado, ou seja, o programa deixa a critério do usuário fixar o nível de significância. O computador calcula o valor-p ( ou significância amostral) . De posse do valor-p comparamos com utilizando a seguinte regra de decisão: se valor-p < então rejeitamos 0H . Valores pequenos de p significam que a probabilidade de rejeitar 0H , supondo que seja verdadeira, é pequena. O conceito de “pequeno” é incumbência do usuário, que decide qual utilizar. Contudo, há três interpretações freqüentemente utilizadas em trabalhos de pesquisa:

Significativa, quando p for menor que 0,05

Muito significativa, quando p for menor que 0,01;

Altamente significativa, quando p for menor que 0,001;

105

Exemplo 10: teste a hipótese de que o diâmetro médio de parafusos seja de 57 mm. Diâmetro 56,5 56,6 56,7 56,8 56,9 57 57,1 57,2 57,3 Total Freqüência 1 2 2 4 10 5 4 2 1 31 Solução: 57:0 H contra 57:1 H

9161,56

x 18275,0s ;

555,2ct ; 0157,0p . Como 05,0p então é significativo.

106

8 – CORRELAÇÃO E REGRESSÃO LINEAR

8.1. O coeficiente de correlação linear de Pearson O diagrama de dispersão nos fornece uma idéia do tipo de relacionamento entre duas variáveis quantitativas X e Y. Uma forma de quantificar a relação entre duas variáveis quantitativas é através do coeficiente de correlação linear de Pearson. Exemplo 1: Carga aplicada em uma mola, em kg (X): 1 2 3 4 5 6 7 8 9 10 Alongamento da mola, em cm (Y): 0,5 1,0 2,0 2,5 4,0 5,0 5,3 6,2 6,8 7,2

Definição: o coeficiente de correlação linear de Pearson para duas variáveis é definido como:

2

22

2 YnYXnX

YXnYXR

i ii i

i ii

107

Exemplo 2: para o exemplo anterior, Planilha do Excel

992,0

05,41011,2175,510385

05,45,5104,28822

r .

O Excel também tem o comando que calcula diretamente a correlação linear: Correl( ) Resultados: (1º) 11 R (2º) se Y e X tiverem uma relação linear perfeita diretamente proporcional ( bXaY ) então 1R

108

(3º) se Y e X tiverem uma relação linear perfeita inversamente proporcional ( bXaY ) então 1R

(4º) se Y e X forem independentes então 0R . Contudo, a recíproca não vale, 0R não implica Y e X independentes. Na figura, há uma relação perfeita 2XY , contudo,

0R .

(5º)

|| R Interpretação da correlação 0 a 0,40 Fraca

0,40 a 0,70 Regular 0,70 a 0,80 Boa 0,80 a 0,99 Ótima

1 Perfeita

109

Teste de hipóteses para o coeficiente de correlação

0H : 0 contra 1H : 0

Estatística do teste : 21

2

RnRtc

Regra de decisão: rejeita-se 0H se tabc tt , onde )|(| tabtTP , )2(~ ntT .

Exemplo 3: para o exemplo anterior, 2263,22)992,0(1

210992,02

ct e 8107748,1 p ,

que é altamente significante. 8.2. O modelo linear simples O modelo linear simples é definido como iii XY 10 , i=1,.....,n., onde:

10 , são os parâmetros do modelo que deverão ser estimados; X é dita variável preditora; Y é dita variável resposta (dependente). é ditto erro aleatório

110

O método que usaremos para estimar os parâmetros do modelo é o dos Mínimos Quadrados. Neste método, minimiza-se a soma dos quadrados das distâncias id (ver figura). Os estimadores de 0 e 1 são, respectivamente:

2

1

2

11

XnX

YXnYXb

n

ii

i

n

ii

,

XbYb 10 .

Observação: da relação 2

1

2

2

1

2

1

XnX

YnYRb

n

ii

n

ii

segue que 1b e R têm o mesmo

sinal. Exemplo 4: para o exemplo anterior,

795758,0

5,51038505,45,5104,288

21

b ; 326667,05,5795758,005,40 b

O modelo ajustado ficou XY 795758,0326667,0^

. Para x=7,5 kg, o valor estimado para y será 5,6415 cm. Pelo EXECEL os comandos são: inclinação() e intercepção().

8.3. Modelos não lineares Modelo Exponencial: }exp{ xY , Rx Modelo Logaritmico: )ln(xY , 0x

Modelo Hiperbólico:

xxY ,

x

Modelo Logístico: }exp{1

}exp{

xxY , Rx