apostila 219
TRANSCRIPT
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
Instituto de Matemática Departamento de Estatística
PROBABILIDADE E ESTATÍSTICA MAT02219
Professor: Marco Antônio Giacomelli www.mat.ufrgs.br/~giacomo/
Porto Alegre, agosto de 2015.
2
1- INTRODUÇÃO
1.1. Ciências Estatísticas Na medida em que foi sendo colocado diante de novos desafios, decorrentes especialmente do crescimento da população – quando as atividades e as relações sócio-econômicas tornaram-se mais complexas – o ser humano precisou aprimorar, sistematicamente, os instrumentos existentes, além de criar outros para continuar garantindo sua sobrevivência. Nesse processo de evolução, que perdura até os dias atuais, novas necessidades e dificuldades foram se sucedendo, sempre desafiando o ser humano a ultrapassá-las. Para registrar, classificar, controlar e estudar, mais adequadamente, fenômenos, fatos, eventos e ocorrências foram sendo criadas, desenvolvidas e aperfeiçoadas muitas técnicas de análise de informações e métodos quantitativos. Esses avanços facilitaram a resolução de inúmeros problemas que o homem encontrava para realizar as atividades básicas de produção, comércio, transportes, etc. Nestes últimos anos houve necessidade de aprofundar estudos, realizar experimentos e pesquisas mais específicas, inclusive para avaliar os resultados das atividades desenvolvidas. Por essa razão, os conhecimentos teóricos e os métodos de análise de dados quantitativos vêm sendo aprimorados continuamente. O conjunto de técnicas e métodos de pesquisa, experimentação e inferências mais utilizadas para alcançar esses objetivos são o que modernamente se conhece como Ciências Estatísticas, onde se destaca a seguinte gama de conhecimentos: Teoria dos Jogos, Planejamento de Experimentos, Teoria das Filas, Controle de Qualidade, Teoria das Decisões, Séries Temporais, Econometria e outras técnicas.
1.2. Divisão da Estatística: Estatística Descritiva: descrição, resumo e organização das informações. Compreende o uso de tabelas, gráficos e medidas-resumo. Estatística Inferencial: através do particular (amostra) faz induções a respeito do todo (população), controlando a probabilidade de erro (por isso estudaremos a Teoria das Probabilidades).
3
Exemplo 1: projeção da percentagem de votos para um candidato numa eleição. Exemplo 2: comparação de adubos
Os três canteiros são expostos à mesma incidência de luz, tipo de solo, mas recebem adubos diferentes. No final do experimento será medida a altura das plantas.
4
2 - ESTATÍSTICA DESCRITIVA 2.1. Definições População: conjunto universo de elementos que possuem ao menos uma característica em comum. O tamanho da população é representado por N. Exemplo 1: total de eleitores que compareceram ao último pleito. Dimensão de uma população: finita ( N< ) infinita enumerável ( N= ) não enumerável ( N= ) Censo: é a investigação exaustiva de toda a população. Exemplo 2: Censo Demográfico Brasileiro, Censo Escolar do MEC
Amostra: é um subconjunto da população, isto é, uma parte da população retirada segundo alguns critérios. O tamanho da amostra é representado por n . Exemplo 3: pesquisa pré-eleitoral do instituto IBOPE, Pesquisa Nacional por Amostragem de Domicílios (PNAD). Amostragem: é o processo de obtenção de uma amostra da população.
5
2.2. Escalas de mensuração Variáveis: são as características de interesse em uma população ou amostra. Variáveis Qualitativas: Expressam qualidade e subdividem-se em: Nominais: os níveis da variável são categorias de qualidade. Exemplo 4: tipo de variedade de batata, cor, etc. Ordinais: os níveis da variável são ordenados de acordo com a intensidade do fenômeno. Exemplo 5: atribuir graus de 1 a 4 para uma característica não mensurável como aderência de uma tinta numa superfície metálica. Z “Grau de aderência da tinta” 1 pouca ; 2 regular; 3 boa ; 4 ótima Exemplo 6: (Contra-exemplo): X “Marca da tinta”, Y “Cor da tinta” 1 branca; 2 preta; 3 prata ; 4 vermelha Marca Cor Aderência
A 1 4 B 2 4 C 4 3 D 3 1 E 2 2
média= 2,4 2,8 As médias na tabela acima foram obtidas pelo EXCEL. Observe que as variáveis Y e Z não são quantitativas, portanto não se poderia calcular média para estas. A média de 2,4 para Y não tem interpretação, pois não faz sentido “cor média”!
6
Variáveis Quantitativas: expressam uma quantidade numérica, subdividem-se em: Discretas: podem assumir valores observados somente em pontos isolados em uma escala. Exemplo 7: número de defeitos num lote de 100 peças, números de falhas diárias numa máquina, etc. Contínuas: Podem assumir qualquer valor em um conjunto não enumerável. Exemplo 8: comprimento, área, velocidade, temperatura.
2.3. Arredondamentos de números Regras: (1a ) quando o primeiro algarismo a ser descartado for 0,1,2,3 ou 4 deverá ser sumariamente abandonado (arredondamento por falta) e o último algarismo a permanecer fica inalterado. (2a) quando, porém, for 5, 6, 7, 8 ou 9, o último algarismo a permanecer será aumentado de uma unidade ( arredondamento por excesso).
Exemplo 9: 72,8 73 (arredondamento para a unidade) 72,8146 72,81 (arredondamento para o centésimo) 72,8146 72,815 (arredondamento para o milésimo) 72,465 72,47 (arredondamento para o centésimo) 183,575 183,58 (arredondamento para o centésimo) 737,638 740 (arredondamento para a dezena)
7
Exemplo 10: arredondamentos em divisões podem causar grandes diferenças (A) 894737,263157
000019,05
(B) 25000000002,0
5
(C) 500000
00001,05
diferença de 90% em relação a (A) Exemplo 11:
00000084,00003,00028,0)( A 0000009,00003,0003,0)( B diferença de 7,14% em relação a (A)
Exemplo 12: arredondamentos em potências podem causar diferenças
38180577,399982,2)(
25763921,411483,2)(
4639174,4056825,2)(
8
8
8
C
B
A
01998336,37788,2)( 8 D diferença de 7,37% em relação a (A) Exemplo 13: calculadoras podem cometer erros de truncamento Sabemos que 33890560989,71lim 22 en
nn . Vamos observar a convergência através da calculadora.
n nn21
1 5 20 50 100
1000 10000
100000 1E6 1E8 1E11 1E12
3 5,37824 6,72749
7,1066833 7,244646 7,37431 7,387578 7,388908 7,38904
7,389005595 7,38905609
1
8
Para n=1E12 11 2 nn , pois a calculadora arredondou a fração soma
n2 para zero.
Considerações: (1ª) Recomenda-se utilizar toda a precisão de sua calculadora, ou seja, utilizar o modo standard (padrão). Arredondamentos somente para resultados finais. Resultados intermediários devem ser armazenados nas memórias secundárias (variáveis). (2ª) Estrutura de memória em calculadoras cientificas comuns
MS ( memory store ) armazena diretamente um valor na memória RM (recover memory) recupera o conteúdo da memória MC (memory clear) limpa a memória , faça isto antes de qualquer nova operação M+ acumula valores na memória A tecla 2ndf aciona a segunda função correspondente a uma tecla . Por exemplo, pressionando-se a tecla ln o resultado será o logaritmo natural. Se for necessário calcular a exponencial, deve-se pressionar a tecla 2ndf e depois ln. 2.4. Resumo de conjuntos de dados Um conjunto de valores será representado por: nxxx ,....,, 21 (no caso de amostra) e Nxxx ,....,, 21 (no caso de população).
9
2.4.1. Medidas de posição (tendência central) Média: requer escala de mensuração quantitativa. Média aritmética
Na amostra: n
x
nxxxX
n
ii
n
121
Na população: N
x
Nxxx
N
ii
N
121
Observação: em uma seqüência aritmética (progressão aritmética) o termo central entre dois termos é obtido pela média aritmética. Por exemplo: 25 nan , isto é, { 7 12
17 .......}. Então, 122177
231
2
aaa .
Exemplo 14: realize a soma dos seguintes quocientes, truncando-os em duas casas decimais:
96,322,033,022,088,077,066,044,033,011,092
93
92
98
97
96
94
93
91
Observe que o truncamento em cada fração resultou em erro na resposta final É mais
eficiente realizar uma única divisão, ou seja: 49
369
232876431
. Média geométrica Na amostra: n
ng xxxm 21 , 0ix para i Na população: N
Ng xxx 21 , 0ix para i Observação: em uma seqüência geométrica (progressão geométrica) o termo central entre dois termos é obtido pela média geométrica. Por exemplo: n
na 36 , isto é, {18 54
162 ......}. Então, 541621822312 aaa
10
Média harmônica Na amostra:
n
i i
h
x
nm
1
1 , 0ix para i
Na população:
N
i i
h
x
N
1
1 , 0ix para i
Observação: em uma seqüência harmônica o termo central entre dois termos é obtido
pela média harmônica. Por exemplo: n
an1
, isto é, {1 1/2 1/3 .......}. Então,
21
312
2
a
Observações: (1ª) A média mais conhecida e utilizada é a aritmética, pois sua fórmula é mais simples, além de não ficar restrita a valores positivos. (2ª) Na expressão do cálculo da média harmônica, pode-se verificar que ela é definida como sendo o inverso da média aritmética dos inversos. (3ª) Interpretação da média aritmética: é o centro de gravidade (equilíbrio) de um conjunto, e é empregada com a finalidade de representatividade dos valores. (4ª) As três médias mantém a seguinte relação entre elas, desde que os valores sejam
positivos: hg mmX
Exemplo 15: interpretação física da média aritmética
11
ii xm é o momento de massa da i-ésima partícula
n
i im1
é a massa total; in
i i xm 1 é o momento de massa do sistema
n
i i
in
i i
m
xmX
1
1 é o centro de massa do sistema
Exemplo 16: produto interno bruto no Brasil
8213,23311
519,719073,44614,27
X
9199,151519,719073,44614,2711 gm
5663,95
519,7191
073,441
614,271
11
hm
Note que a média harmônica ameniza o efeito do crescimento exponencial da série. A diferença percentual entre média harmônica e aritmética é de 144,67%.
12
Exemplo 17: um concurso público, para um certo cargo, consiste em uma prova, dividida em quatro áreas. Cada área contém 20 questões. Para aprovação é preciso que o candidato obtenha média harmônica ponderada no mínimo igual a 13. Um candidato apresentou o seguinte desempenho:
Área Peso No. de acertos Português 3 17
Matemática 3 7 Conhecimentos Gerais 2 16
Informática 1 14 Façamos as médias aritmética, geométrica e harmônica:
11111,139
1181233
14116273173
X
21177,1214167179 1233 gm , 22935,11
141
162
73
173
9
hm
Como a média harmônica do candidato foi inferior a 13, então ele não foi aprovado no concurso. Note que se o critério de aprovação fosse pela média aritmética, então ele seria aprovado! A mediana: requer escala de medida ordinal ou quantitativa. A mediana de um conjunto ordenado de valores, denotada por Med, é definida como o valor que separa o conjunto em dois subconjuntos de mesmo tamanho.
Med =
par én se , 2
) x (x
ímpar én se , x
12n
2n
21n
sendo x a amostra ordenada em ordem crescente.
13
Exemplo 18: (a) pesos em kg de cinco pessoas: {66; 62; 60; 70; 58}
(b) alturas em cm de seis pessoas: {180; 165; 175; 182; 177; 160}
A moda A moda de um conjunto de valores, denotada por Mo, é definida como o valor mais freqüente no conjunto. Convém lembrar que a moda pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. No caso em que todas freqüências forem iguais diremos que não há moda. Exemplo 19: (a) dado o conjunto {1; 2; 2; 3; 3; 4; 4; 4; 7; 9; 15} a moda é Mo=4, pois este valor é o mais freqüente. (b) para o conjunto { 1; 1 ; 2 ; 2 ; 2 ; 3 ; 4 ; 4 ; 4} teremos duas modas: Mo )1( =2 e Mo )2( =4
14
Observações: a mediana exige ordenação das categorias e, por sua vez, é indicada nas seguintes situações: (1ª) quando se deseja obter o ponto que divide o conjunto em duas partes de mesmo tamanho. (2ª) quando há resultados extremos que afetariam a Média de maneira acentuada. Exemplo 20: peso de bovinos em kg {508 543 560 562 2500}
Med=560; 60,934
x O peso de 2500 kg é dito uma observação estranha (outlier), e por isso elevou consideravelmente o peso médio. Escalas de mensuração e medidas de tendência central Nominal: moda Ordinal: moda, mediana Quantitativa discreta e contínua: moda, mediana e média
15
2.4.2. Medidas de dispersão (variabilidade): Observação: as medidas de dispersão são para variáveis com escala quantitativa Amplitude: a medida de dispersão mais simples, porém “rústica”, é a amplitude, anotada por “h”, e definida como a diferença entre os valores extremos do conjunto, isto é: h = xmax – xmin 0
Variância e o desvio padrão absolutos As medidas mais utilizadas são a variância e o desvio padrão. Estas medidas têm como ponto de referência a média aritmética. Na amostra:
111
222
2
2
12
n
Xx
n
XxXxXxS
n
iin
é a variância.
A variância é a soma dos quadrados das distâncias em relação à
X :
16
Comparação de três amostras com mesma média aritmética:
Observação: Uma expressão alternativa é 1
1
22
2
n
XnxS
n
ii
.
A variância, por ser um quadrado, não permite comparações com a unidade que estamos trabalhando. Para se ter uma medida de variabilidade com a mesma unidade da variável utiliza-se a raiz quadrada da variância, denominado de desvio padrão:
2SS .
Na população: 21
2
2
N
xN
ii
é a variância e 2 é o desvio padrão.
17
Observações: (1ª) variância e desvio padrão são não negativos. (2ª) Em Mecânica a variância tem como interpretação o momento de inércia de uma massa, em relação a um eixo perpendicular que passe pelo centro de gravidade (que é a média) (3ª) o desvio padrão mede o grau de dispersão dos valores em torno da média, ou seja, é variabilidade média (em unidades de medida) em torno da média aritmética. Exemplo 21: número de pessoas por domicílio: {5; 6; 3; 3; 2; 3; 3; 3; 4; 4; 3; 2; 7; 4} h = xmax - xmin = 7-2=5 ; 71435,3
X
0659,213
71435,3144765 222222
S ; 4373,1S
Cada observação pode ser escrita em função da média e do desvio padrão, por exemplo: 6,14373,171435,36 kk
Exemplo 22 (o problema do truncamento de números): os valores seguintes são espessuras em mm de chapas de alumínio: { 6,34 6,38 6,40 6,38 6,36 6,36 6,38 6,20 6,42 6,28}. Obtenha média, desvio padrão e coeficiente de variação. Solução:
10n , 5,63xf , 2628,4032 fx ;
35,6
X ; 0042,02 S ; 064807,0S ; %020589,1CV Se o valor do somatório dos quadrados for arredondado para décimos, então:
18
00833333,09
35,6103,403 22
S ; 09128709,0S ; %437592,1CV , que é
diferente do resultado sem fazer arredondamento. A variância e o desvio padrão relativos A variância relativa, representada por VR, é o quociente entre a variância absoluta e o quadrado da média, isto é:
%1002
2
X
SVR , se 0
X .
O coeficiente de variação é a raiz quadrada da variância relativa, isto é:
%100
X
SCV .
Observação: o coeficiente de variação é interpretado como o grau de variabilidade relativa em torno da média.
Exemplo 23: em relação ao exemplo 21, %6963,38%1007143,34373,1
CV
19
Propriedades das medidas Seja },,,{ 21 nxxx uma amostra onde foi observada a variável X :
(i) cxy ii i , Rc cXY
e 22XY SS
(ii) ii cxy i , 0c
XcY e 222XY ScS
(iii) bcxy ii i , 0c , Rb bXcY
e 222XY ScS
(iv) X
ii S
Xxy
i 0
Y e 12 YS
2.5. Distribuições de freqüências Para se trabalhar com grandes conjuntos de dados é necessário inicialmente agrupá-los. O agrupamento é feito em tabelas, denominadas de distribuições de freqüências. Para se construir uma distribuição de freqüências fazemos distinção entre dois tipos de variáveis: a variável contínua que é o resultado de uma mensuração e a variável de contagem. Em geral, variáveis discretas são agrupadas em distribuições por ponto ou valores e variáveis contínuas em distribuições por classes ou intervalos. A separação não é rígida e depende basicamente dos dados considerados. Pode-se construir uma distribuição por classes mesmo quando a variável é discreta.
2.5.1. Distribuições de freqüências por ponto (ou valores) Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, o número de irmãos dos alunos da turma U, disciplina de Estatística. Exemplo 24: número de irmãos dos alunos da turma U - disciplina Estatística 0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1 1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0
20
Distribuição de freqüências por ponto do número de irmãos dos alunos No. de irmãos ( x ) No. de alunos ( f ) xf fx 2
0 7 0 0 1 21 21 21 2 8 16 32 3 5 15 45 4 4 16 64 5 3 15 75 6 2 12 72
Total 50 95 309 Medidas de tendência central e dispersão: no caso de uma tabela de distribuição de freqüência por ponto as fórmulas ficam:
n
fx
f
fxX
k
iii
k
ii
k
iii
1
1
1 , 1
1
22
2
n
XnfxS
k
iii
sendo if a freqüência absoluta (ou simples), que é o número de vezes que ocorre o valor
ix , e k o número de valores distintos no conjunto. Observação: as outras medidas: mediana, moda, desvio padrão e coeficiente de variação, têm as mesmas fórmulas.
Exemplo 25: em relação ao exemplo acima, 9,15095
X ; Mo=1; Med=1
6224,249
9,150309 22
S ; 6194,1S ; CV=85%.
21
2.5.2. Distribuições de freqüências por classes (ou intervalos) Ao construirmos a distribuição de freqüências por classes haverá perda de informação, mas haverá uma melhor organização na apresentação e compreensão, como ilustra o exemplo a seguir. Exemplo 26: vendas semanais (em mil reais) de gêneros alimentícios: 30 34 35 35,8 36,2 37,1 37,5 37,9 38 38,3 39 39,3 42,5 43,3 44,5 40 40,1 40,2 40,2 40,3 40,4 40,7 40,8 41 41,1 41,4 42 44,7 44,8 44,9 49,4 49 45,6 49,7 49,4 46 48 46,5 45,4 47,6 46,3 45,9 47,6 49,8 49,6 49,8 49,7 49,7 45,7 48,5 49,7 49,8 49,6 45,5 47,3 48,9 48,9 46,4 45,6 45 47 45,5 49,4 48,1 48,8 49,3 49,7 47,4 48,2 48,9 45,1 46,7 49,1 46 49,5 48,3 48,3 46,9 48,7 48,6 53,6 52,3 51,9 52 53,2 50,8 50,8 51,4 53,4 53,9 50,1 51,5 51,3 54,2 50,2 50,7 50,4 54,8 54 54 53,4 50,6 51,5 53,7 54,6 52,4 50,1 53,2 52,1 50,6 51,8 51 53,7 50,2 53,8 50,1 50,9 52 52,3 52,2 52,1 52,3 57,7 57,5 55,3 56,9 55,2 56,7 57,6 57,9 58,8 56,7 59,5 59,7 55,6 55,5 57,7 56,9 57,3 56,8 55 58 56 56,6 56,9 55,7 59,5 58,8 57,1 56,5 59,2 57,5 60,8 60,5 62,9 62,3 61,2 61,6 63,2 62,5 63,3 63,5 63,6 64,8 62,2 63,5 60,4 64,4 61 62,4 66 68 Por exemplo, com 5 classes e com amplitudes iguais a oito a tabela fica: Tabela de distribuição de freqüências com 5 classes
Vendas ix if iF Percentual
ii fx ii fx 2 30.0000 |— 38.0000 38.0000 |— 46.0000 46.0000 |— 54.0000 54.0000 |— 62.0000 62.0000 |— 70.0000
34 42 50 58 66
8 31 78 41 14
8 39 117 158 172
4.6512 % 18.0233 % 45.3488 % 23.8372 % 8.1395 %
272 1302 3900 2378 924
9248 54684 195000 137924 60984
Total -------- 172 -------- 100% 8776 457840
22
Algoritmo para a construção de uma tabela de distribuição freqüências por intervalos (1º) Determinar a amplitude dos dados: minmax xxh . (2º) Decidir sobre o número de classes k a ser utilizado. Recomenda-se um número de classes entre 5 e 15. Para que a decisão não seja totalmente arbitrária, pode-se usar a raiz quadrada do número de valores, ou seja, nk . (3º) Determinar a amplitude de cada classe. Sempre que possível manter todas as amplitudes iguais. Para tanto, deve-se dividir a amplitude dos dados “h” pelo número de
classes “k”, arredondando para mais, ou seja, khhi .
(4º) Contar o número de valores pertencentes a cada classe. As classes devem ser disjuntas (sem intersecção). Em geral, utiliza-se a notação (|--- ), para indicar um intervalo fechado à esquerda e aberto à direita. Também poderia ser utilizado o intervalo aberto à esquerda e fechado à direita (---|), aberto de ambos os lados ( --- ) ou ainda fechado de ambos os lados (|---|). Elementos de uma tabela de distribuição de freqüências por intervalos
Intervalos ix
if iF ifr iFr ii fx ii fx 2
1l |------- 1L 1x 1f 1F 1fr 1Fr 11 fx 121 fx
2l |------- 2L 2x 2f 2F 2fr 2Fr 22 fx 222 fx
kl |------- kL kx kf n kfr 1 kk fx kk fx 2 Total ---- n ---- 1 ---- ii fx ii fx 2 k é o número de classes
il é o limite inferior de classe
iL é o limite superior de classe
23
2ii
iLlx
é o ponto médio de classe
iii lLh é a amplitude de classe
if é a freqüência absoluta de classe
iF é a freqüência acumulada de classe, ou seja,
11 fF ; 212 ffF ; ......; nfffF kk 21
ifr é a frequência relativa de classe, isto é, nffr i
i
iFr é a frequência relativa acumulada de classe, ou seja,
11 frFr ; 212 frfrFr ; ......; 121 kk frfrfrFr Medidas de tendência central e dispersão No caso de uma tabela de distribuição de freqüência por intervalos as fórmulas para média e variância ficam as mesmas do caso de distribuições por ponto, exceto que onde tiver ix você deve utilizar o ponto médio de classe. As fórmulas da mediana e moda são o resultado de interpolações. Mediana: para localizar a classe mediana procuramos na coluna das freqüências
absolutas acumuladas a primeira iF tal que 2nFi .
Med =
m
m
mm f
Fn
hl12
24
ml o limite inferior da classe mediana mh a amplitude da classe mediana mf a freqüência simples da classe mediana 1mF a freqüência acumulada da classe anterior à mediana Moda pelo processo de King: O primeiro passo é localizar a classe modal, aquela com maior freqüência absoluta.
Mo =
11
1
mm
mmm ff
fhl .
ml o limite inferior da classe modal mh a amplitude da classe modal 1mf a freqüência simples da classe posterior à modal
1mf a frequência simples da classe anterior à modal Exemplo 27: com relação ao exemplo 26, para a tabela com 5 classes:
02325,511728776
X ; 82986,58
17102325,51172457840 2
2
S ; 67006,7S ,
%0325,1510002325,51
670101,7CV . Uma vez que 86
2117
n então a classe mediana é
46|-------54. Aplicando a fórmula: 82051,5078
3986846
Med . A classe modal
é 46|-------54, pois tem maior freqüência absoluta. Assim,
55555,503141
41846
Mo .
25
Medidas descritivas para os dados não agrupados:
87034,50
X ; Med= 50,5 ; Mo=49,7; 6735,522 S ; 2576,7S %2668,14CV .
N de classes
Amplitude
X Med Mo S CV
5 8 51,02325 50,8205 50,55555 7,67006 15,0325% 8 5 50,98837 50,7143 48,5 7,13569 13,99478%
13 3,10 51,91234 49,2870 50 7,18284 13,83653% Dados Não agrupados
----------- 50,87034 50,5 49,7 7,2576 14,2668%
Histograma para a distribuição de freqüências com 13 classes
26
3 - FUNDAMENTOS DA PROBABILIDADE 3.1. Objeto de estudo da Teoria da Probabilidade A Teoria da Probabilidade tem como objeto de estudo os fenômenos aleatórios. No dicionário Michaelis da língua portuguesa “aleatório” tem o sentido de eventual, fortuito, incerto. Fenômenos determinísticos: o resultado observado é completamente determinado pelas condições sob as quais o fenômeno ocorreu. Exemplo 1 (fenômeno determinístico): desconsiderando a resistência do ar, e sob a presença de gravidade, dois corpos de massa diferente atingem o solo ao mesmo instante.
Modelos Determinísticos: amF , sendo F a força resultante, m a massa do corpo e a a aceleração
2cmE , sendo E energia, c a velocidade da luz Fenômenos aleatórios: o resultado não é determinado pelas condições de realização do fenômeno. Exemplo 2: Teoria do Caos para a origem do Universo Exemplo 3: leitura da tensão, em volts, em diferentes instantes: {124 126 127 120 127}.
27
3.2. Modelos Probabilísticos Modelos probabilísticos são modelos matemáticos que descrevem fenômenos aleatórios. Experimentos aleatórios são fenômenos aleatórios executados por nós. Exemplo 4 (Exemplos de Experimentos Aleatórios): EX1: Jogue um dado e observe o nº da face de cima EX2: Jogue uma moeda 3 vezes e observe o nº de caras EX3:Jogue uma moeda 3 vezes e observe a seqüência de faces EX4: no. de peças defeituosas em um lote contendo N EX5: tempo de duração de uma lâmpada até esta queimar EX6: lance uma moeda até que ocorra a face cara pela primeira vez Espaço Amostral: é o conjunto de todos os resultados possíveis de um experimento aleatório. Notação: , . Exemplo 5 (Exemplos de espaços amostrais): com relação aos exemplos anteriores,
}6,5,4,3,2,1{1
}3,2,1,0{2
3 {KKK, CCC, KKC, KCK, CKK, CCK, CKC, KCC} C ”cara” K ”coroa”
},....,2,1,0{4 N
TtRt 0:5
6 = { C, KC, KKC, KKKC, ........}
28
Tipos de espaços amostrais Finito: 4321 ,,, Infinito enumerável: 6 Não-enumerável: 5 Evento: é um subconjunto do espaço amostral. Notação: CBA ,, ,A ,B ,C Observação: é dito evento certo e Ø evento impossível.
Tipos de eventos: Simples: formado por um único elemento do espaço amostral. Composto: é a combinação de dois ou mais elementos do espaço amostral. Exemplo 6: lance um dado e observe a face de cima. Escreva os seguintes eventos: A: “ocorre a face 6” B: “ocorre face par” C: “ocorre face superior a 6 ” D: “ocorre face menor ou igual a 6” Solução: }6,5,4,3,2,1{ ; A={6}; B={2,4,6}; C= Ø; D= 3.3. Operações com eventos Seja um espaço amostral e A,B eventos. Então, as seguintes operações com eventos são definidas:
29
(1º ) Evento união: BA : “ ocorre somente A, ou ocorre somente B, ou ocorrem ambos”
(2º ) Evento intersecção: BA : “ocorre A e B simultaneamente”
(3º) evento complementar: cA : “não ocorre A”
(4º) evento diferença: BA : “ocorre A e não B” nota: ABBA c ; BAABA e ABBAA c
30
3.4. Alguns resultados sobre a teoria dos conjuntos (1º) AAA
AAA
(2º) CABACBA
CABACBA
(3º) AA A
AA Ø ØØ A
(4º) ccc BABA ccc BABA AA cc Eventos exclusivos: BA, são mutuamente exclusivos se ØB A . Eventos não exclusivos: ØB A . Definição: Seja uma família de eventos ,...., 21 AA . Os eventos ,....},{ 21 AA são mutuamente exclusivos (disjuntos) dois a dois se e somente se ØA j iA , ji . Definição: uma união de eventos BA, tais que ØBA é dita união disjunta.
Notação:
BA
Exemplo 7: lance uma moeda 3 vezes e observe a seqüência de faces “C Cara” e “KCoroa”. Enumere os eventos: A: “ocorre pelo menos uma coroa” B: “ocorre coroa no primeiro lançamento” C: “ocorre cara no segundo lançamento”
cA , cB , CB , CB solução: cada elemento do espaço amostral é da forma: ( ______ ______ _______ ) 1º lanç 2º lanç 3º lanç Assim,
{CCC, KKK, CCK,CKC, KCC,KKC, KCK, CKK} O experimento de lançar 3 moedas também tem o mesmo espaço amostral , sendo que cada elemento é da forma : ( ________ _________ ________) 1ª moeda 2ª moeda 3ª moeda
31
A = { KKK, KKC, KCK, CKK,CCK,CKC,KCC}; B= { KKK, KCC, KKC, KCK} C= { CCC, CCK, KCC, KCK}; cA {CCC}; cB = {CCC,CCK,CKC, CKK} CB ={ KKK, KCC, KKC, KCK, CCC, CCK}; CB = { KCK, KCC}
3.5. Concepções de Probabilidade A concepção clássica de probabilidade: todos resultados possíveis do experimento
são igualmente prováveis. N
P 1)( , , #N .
Exemplo 8: lançamento de um dado honesto, observando-se a face de cima.
}6,5,4,3,2,1{ , 61)6(.....)2()1( PPP
Nota: a concepção clássica de probabilidade é válida somente para espaços amostrais finitos. Observações: (1ª) P(A) lemos como a “probabilidade do evento A”. (2ª) Uma probabilidade não tem unidade de medida. É um grau entre 0 e 1 (ou 0% e 100%).
A concepção freqüencista de probabilidade: a probabilidade de um evento é medida observando-se a freqüência relativa do mesmo em uma sucessão de realizações do experimento. A freqüência relativa é definida como:
32
nArAf nn
r)(
)()( ,
)(Arn = ”número de ocorrências do evento A em n realizações do experimento”.
A frequência relativa é um número entre zero e 1. A probabilidade do evento A será )(lim)( )( AfAP n
rn , se o limite existir, ou seja, se a seqüência }1:)({ nAf n convergir. Exemplo 9: Defina A como sendo a face resultante no lançamento da moeda foi cara. n Resultado )(Arn )()( Af n
r 1 2 3 4 . . .
C C K C
1 2 2 3
1 1 2/3 3/4
A concepção axiomática de probabilidade: construção de uma teoria matemática para as probabilidades, com base em “axiomas”.
33
Exemplo 9: axiomática de Kolmogorov
3.6. Axiomas da Teoria das Probabilidades (Kolmogorov) Uma medida é dita probabilidade se e somente se: (1) AAP ,0)( (2) 1P (3) 21 AAP ,)()( 21 APP se ,,, 21 AA estiverem contidos em e
forem disjuntos dois a dois.
3.7. Propriedades das Probabilidades As propriedades a seguir decorrem imediatamente dos axiomas: (1ª) )(1 APAP C :
cAA )(1)()()()( APAPAPAPP cc
(2ª) 0P : 011)(1)()( PPP c
(3ª) Se BA , então )()( BPAP e :)()()( APBPABP
(4ª) :1)( AP por (3ª), 1)()( PAP (5ª) para BA, eventos quaisquer, BAPBPAPBAP )()( (6ª) para CBA ,, , eventos quaisquer CBAPCBPCAPBAPCPBPAPCBAP
34
Exemplo 10: suponha que A,B,C sejam eventos tais que 41 =P(C)=P(B)=P(A) ,
BCBA e 81)( CAP . Qual a probabilidade de que ao menos um dos
eventos A,B ou C ocorram?
Solução: pela propriedade (6ª) , 85
81
413)( CBAP , pois CBA
3.8. Métodos de enumeração Princípio da multiplicação: tarefas realizadas seqüencialmente, isto é, knnn 21
Princípio da adição: tarefas realizadas de forma mutuamente exclusivas, isto é, knnn 21
Seja uma população finita constituída de N elementos. Considere uma amostra de tamanho n. Então:
35
(1º) o número de amostras com reposição, considerando a ordenação, é nN . Amostras diferem pela ordenação. (2º) o número de amostras sem reposição, considerando a ordenação é.
)!(!nN
NAnN ; n≤N
(3º) o número de amostras sem reposição, desconsiderando a ordenação é !n
AC
nNn
N .
Também vale que !)!(
!nnN
NC nN ; n≤N
Exemplo 11: seja um conjunto 321 ,, e considere uma amostra de tamanho dois. Então: N=3 e n=2. No processo com reposição sempre é considerada a ordenação, assim, as amostras possíveis são:
),( 11 ),( 21 ),( 31 ),( 12 ),( 22 ),( 32 ),( 13 ),( 23 ),( 33 ,
portanto: 231
31
31, jiP
No Processo sem reposição, considerando ordenação, teremos: ),( 21 ),( 31 ),( 12
),( 32 ),( 13 ),( 23 , e portanto:
23
161
21
31,
AP ji
No Processo sem reposição, desconsiderando ordem, teremos: ),( 21 ),( 31 ),( 32 . Note que no caso em que a ordem é desconsiderada, algumas pessoas respondem que
61
21
31, jiP , que está errado, pois a soma de todas as probabilidades não será
1. Quando a ordem não é considerada, jiP , é multiplicada por !n , que é o número de réplicas da amostra, isto é:
23
131
21
312,
CP ji
36
Isto acontece porque as réplicas, que eram do caso com ordenação, serão consideradas iguais, como mostra a figura abaixo:
Exemplo 12: considere um congresso onde compareceram 35 engenheiros, 25 matemáticos e 15 físicos. Se for formada, ao acaso, uma comissão de 10 membros, qual a probabilidade de que esta seja constituída de:
(a) 5 engenheiros, 3 matemáticos e 2 físicos? (b) Exclusivamente de engenheiros, ou de matemáticos, ou de físicos?
Solução: (a) pelo princípio da multiplicação,
094577978,0
362880066676869707172737475
21415
6232425
1203132333435
1075
215
325
535
CCCC
(b) pelo princípio da adição,
0002254,01075
1015
1075
1025
1075
1035
CC
CC
CC
37
3.9. Probabilidade condicional Definição: seja um espaço amostral e BA, eventos. Definimos a probabilidade condicional de A , dado que ocorreu B , por :
..,0
0)(,)(
)()|(
cc
BPBP
BAPBAP
Observação: A interpretação de )|( BAP é que uma vez conhecido o fato de que o evento B ocorreu, então não é mais necessário pensar em todo o espaço amostral. Na verdade, agora B passa a ser o “espaço amostral reduzido ”.
38
Exemplo 13: extrair sem reposição, considerando a ordem das cores, duas bolas de uma urna com 5 azuis e 3 brancas.
Para facilitar, faremos distinção apenas nas cores das bolinhas. Assim,
),();,();,();,( aabaabbb Defina B = “1ª bola é branca” e A = “a 2ª bola é azul”
)},();,{( abbbB ; )},();,{( aabaB c
)},();,{( aaabA ; )},();,{( babbAc
)},{( abAB ; )},{( aaAB c
5615)( 2
8
15
13
A
AAABP .
Outra maneira de obter )( ABP é através da probabilidade condicional, isto é,
5615
75
83|)( BAPBPABP .
Exemplo 14: outra maneira de resolver o Exemplo 12 (a). Note que algumas pessoas responderiam que a solução é
6614
6715
6823
7025
7131
7434
7535
, que está errada!, pois a ordem em que os
membros são formados não está fixada, ou seja, é preciso levar em conta todas as posições dos membros dentro da comissão! A resposta correta é:
094577978,06614
6715
6823
7025
7131
7434
7535
!2!3!5!10
1075
215
325
535
CCCC
39
Note que !2!3!5
!10
é dito coeficiente trinomial.
3.10. Propriedades das probabilidades condicionais (1ª) 1)|(0 BAP : (2ª) )|()()( BAPBPBAP )|()()( ABPAPBAP
))(|()|()(|)()( CBAPCBPCPCBAPCBPCBAP Exemplo 15: considere uma urna contendo 5 bolas brancas, 4 verdes e 3 pretas. Uma pessoa retira, sem reposição, 3 bolas. Qual a probabilidade: (a) ocorrer a seguinte seqüência de cores: verde, preta e branca? (b) saírem três cores diferentes? (c) ocorrer pelo menos uma branca? (d) sabendo-se que na 1ª extração saiu uma verde, qual a probabilidade de saírem mais duas verdes? Solução: se fizermos distinção entre bolas de mesma cor, então a cardinalidade do espaço amostral será 13203
12 A . Logo, será um trabalho árduo escrever todo . Fazendo distinção apenas das cores, },,,,,,{ pppvpbvbbbvbbbvbbb , # 2733 .
(a) 105
113
124
(b) Defina A o evento “ocorrem três cores diferentes”. Note que algumas pessoas
responderiam que )(AP92
276
##
A , que está errado! Este raciocínio somente valeria
se houvesse mesmo número de bolas para as três cores e, além disso, se o processo fosse
com reposição! O correto é 113
103
114
125!33
12
13
14
15
C
CCC.
40
(c) 4437
103
114
125
107
114
1253
106
117
12533
12
35
312
17
25
312
27
15
CC
CCC
CCC
ou 4437
105
116
1271
(d) 102
113
)()(|
vPvvvPvvvP
3.11. Teorema de Bayes Definição: Seja um espaço amostral. Um conjunto de eventos kBBB ,.....,, 21 forma uma partição de se e somente se: (1º ) Ø ji BB , ji
(2º) k
iiB
1
(3ª) 0)( iBP , },....,2,1{ ki
Teorema da Probabilidade Total: Seja um espaço amostral, kBBB ,.....,, 21 uma partição de e A um evento qualquer. Então:
k
i ii BAPBPAP1
)|()()(
41
Prova: kBABABAA 21 . Assim,
)|()()|()()|()(
)(
2211
21
kk
k
BAPBPBAPBPBAPBP
BAPBAPBAPAP
Teorema de Bayes: Seja espaço amostral, kBBB ,.....,, 21 uma partição e A evento qualquer. Então,
k
iii
jjj
BPBAP
BPBAPABP
1)()|(
)()|()|( , kj ,.....,2,1 .
Prova:
k
iii
jjjj
BPBAP
BPBAPAP
BAPABP
1
)()|(
)()|()(
)|(
Exemplo 16: Numa fábrica de parafusos, as máquinas A,B,C produzem 25, 35 e 40 por cento do total produzido, respectivamente. Da produção de cada máquina, 5, 4 e 2 por cento, respectivamente, são defeituosos. Escolhe-se ao acaso um parafuso e verifica-se que ele é defeituoso. Qual a probabilidade de que o parafuso seja oriundo das máquinas: (a) A ? (b) B ? (c) C ?
42
Solução: Representação das percentagens de produção das 3 máquinas
As informações de “entrada” são:
25,0)( AP , 35,0)( BP , 40,0)( CP 05,0| ADP , 04,0| BDP , 02,0| CDP
Pelo Teorema da Probabilidade Total:
0345,02,040,004,035,005,025,0)|()()|()()|()(
)()()()(
CDPCPBDPBPADPAP
DCPDBPDAPDP
Pela fórmula de Bayes:
3623,00345,0
05,025,0)(
)|()()|(
DP
ADPAPDAP
4058,00345,0
04,035,0)(
)|()()|(
DP
BDPBPDBP
43
2319,00345,0
02,040,0)(
)()()(
DPCDPCP
DCP
3.12 - Independência Probabilística Definição: dois eventos são probabilisticamente independentes se e somente se
)()()( BPAPBAP . Observação: da definição acima segue que )()|( APBAP e )()|( BPABP , ou seja, a ocorrência de um deles não altera a probabilidade de ocorrência do outro. Definição: três eventos CBA ,, são ditos mutuamente independentes se e somente se: (1º) são independentes dois a dois (2º) )()()()( CPBPAPCBAP . Observação: eventos mutuamente disjuntos não têm nenhuma relação com eventos mutuamente independentes. (a) suponha 0)( AP , 0)( BP e Ø BA Então, 0)( BAP , mas
0)()( BPAP , ou seja, são exclusivos mas não são independentes. (b) 0)( BAP e )()()( BPAPBAP , ou seja, independentes, mas não exclusivos. (c) 0)( BAP e )()()( BPAPBAP , ou seja, não exclusivos e não independentes. (d) A Ǿ e B Ω. Então, PBAP )( (Ǿ)=0 e 0)()( BPAP , ou seja, independentes e exclusivos. Exemplo 17: A finalidade deste exemplo é mostrar que extração de amostras com reposição possui a propriedade de independência probabilística, mas se o processo for sem reposição não haverá independência. Suponha uma urna contendo 7 bolas vermelhas e 5 bolas pretas. Considere o experimento aleatório de extrair 4 bolas ao acaso. Descreva o espaço amostral com as respectivas probabilidades, nos casos com e sem reposição. Na extração sem reposição considere a ordenação interna da amostra.
44
Solução: (1ª) com reposição: se fizermos distinção entre bolas de mesma cor então a cardinalidade do espaço amostral será 2073612# 4 . Logo, será um trabalho árduo escrever todo . Se não fizermos distinção entre bolas de mesma cor então
},.....,,,{ ppppvvpvvvvpvvvv , ou seja, 162# 4 .
)()()()(127
127
127
127
127)|()|()|()()(
4
vPvPvPvP
vvvvPvvvPvvPvPvvvvP
)()()()(125
127
125
127
127
127)|()|()|()()(
3
pPvPvPvP
vvvpPvvvPvvPvPvvvpP
125
127)()()()(
3
vvvpPpvvvPvpvvPvvpvP
)()()()(125
125
125
125
125)|()|()|()()(
4
pPpPpPpP
ppppPpppPppPpPppppP
Concluímos que os eventos são independentes. (2ª) sem reposição: agora neste tipo de extração a mesma bola não pode aparecer mais que uma vez.
412
47
94
105
116
127)|()|()|()()(
AA
vvvvPvvvPvvPvPvvvvP
4
127)()()()(
vPvPvPvP
Como )()()()()( vPvPvPvPvvvvP , não há independência probabilística.
412
15
37)()()()(A
AAvvvpPpvvvPvpvvPvvpvP
; 4
12
45)(
AA
ppppP
45
)()()()()()( pvpvPpvvpPvpvpPpvvpPvppvPvvppP
)()()()( pppvPppvpPpvppPvpppP
Exemplo 18 (Confiabilidade de Sistemas):
E “o sistema funciona” iA “i-ésimo componente do sistema” A probabilidade de iA funcionar é p Assuma que os componentes sejam mutuamente independentes. (a) dois componentes em série
22121)( pppAPAPAAPEP
(b) dois componentes em paralelo
2212121 2)( ppppppAAPAPAPAAPEP
47
4 - VARIÁVEIS ALEATÓRIAS DISCRETAS 4.1. Variáveis aleatórias Definição: seja um experimento aleatório e o espaço amostral associado a esse experimento. Uma função X , que associe a cada elemento um número real
)(X , é denominada de variável aleatória (v.a).
Observação: em algumas situações o resultado do espaço amostral já constitui uma característica numérica que desejamos registrar. Assim, tomamos )(X . Exemplo 1: lançamento de duas moedas. Considere a v.a. X sendo o número de faces CARA.
},,,{ KCCKKKCC C ”cara” e K ”Coroa”
Definição: uma v.a X é dita discreta quando o conjunto dos valores possíveis de X é finito ou infinito enumerável.
},.....,,{ 21 nX xxx ou ,.....},{ 21 xxX .
48
4.2. Função massa de probabilidade (fmp) Definição: a função massa de probabilidade (f.m.p) de uma v.a. discreta é:
]1,0[: Xf ; )()( iii xXPxfx Condições para ser uma f.m.p: (1ª) 1)(0 ixf , Xix (2ª) 1)(
Xix ixf ,
(3ª) 0)( ixf se Xix Exemplo 2: seja X o número de faces cara em 3 lançamentos de uma moeda tal que
43)( CP e
41)( KP .
ix 0 1 2 3
)( ixf 1/64 9/64 27/64 27/64 1
641
41
41
41)()0()0( KKKPXPf
649
643
643
643)()()(
)()()()1()1(
KKCPKCKPCKKP
KKCKCKCKKPXPf
6427
649
649
649)()()(
)()()()2()2(
CKCPKCCPCCKP
CKCKCCCCKPXPf
6427
43
43
43)()3()3( CCCPXPf
49
Representação gráfica da fmp do exemplo 2
4.3. Esperança matemática de uma v.a. discreta A esperança matemática da v.a. X é definida como: )()( ix i xfxXE
Xi
.
notações: EXXE ,),( Observações:
(1ª) A esperança matemática é a média da população, enquanto
X é a média da amostra, ou seja, uma estimativa de EX. (2ª) Interpretamos a esperança matemática como sendo o centro de gravidade (equilíbrio) de uma fmp, e é empregada com a finalidade de representatividade dos valores de X . Exemplo 3: Uma fábrica opera com 3 marcas de máquinas: A, B, C. O gerente deseja saber qual marca tem menor custo médio de manutenção.
50
Marca A Marca B Marca C
Tipo de defeito
Custo do Conserto(X)
Probab. de
Falha
Custo do Conserto(Y)
Probab. de
falha
Custo do Conserto(Z)
Probab. de
falha Mecânico 33 0,50 32 0,48 34 0,45 Elétrico 34 0,20 36 0,21 35 0,27
Hidráulico 50 0,30 47 0,31 51 0,28
3,3830,05020,03450,033 EX ; 49,37EY ; 03,39EZ A marca B tem menor custo médio, logo deve ser a preferida. Propriedades da Esperança: (1ª) ,)( kkE se k for uma constante (2ª) )()( XkEkXE , se k for uma constante (3ª) ,)()( bXaEbaXE Rba , (4ª) )()()( YEXEYXE (5ª) )()(
11
n
i in
i i XEXE 4.4. Variância e desvio padrão de uma v.a. discreta Definição: Seja X v.a discreta com f.m.p f e espaço amostral ,......},{ 21 xxX . Definimos a variância de X por )()( 2
ix i xfEXxXVarXi
.
Definição: o desvio padrão é definido como )()( XVarXDP . Notações: XX XDPXVarXV ),(,),(),( 2 .
51
Observações: (1ª) uma fórmula alternativa para a variância é 22 )()( EXxfxXVar ix i
Xi
.
(2ª) 0)( XVar . (3ª) a variância tem como unidade de medida o quadrado da unidade de medida de X . (4ª) o DP (desvio padrão) tem mesma unidade de medida que a v.a. X , e mede o grau de dispersão dos valores de X em torno de EX . (5ª) podemos também utilizar o coeficiente de variação de X , definido como
%100||
EXDPCV . O CV é interpretado como o grau de variabilidade relativa em torno
da esperança, ou seja, CV é uma medida relativa, enquanto DP é absoluta. Exemplo 4: ix 0 1 2 3 )( ixf 1/8 3/8 3/8 1/8 1
5,1)( XE , 43
23
824)(
2
XVar ,
43)( XDP e %735,57CV .
Propriedades da variância (1ª) ,0)( cVar c constante; (2ª) )()( 2 XVarccXVar ; (3ª) ),()( 2 XVarabaXVar Rba , .
52
4.5. Modelos probabilísticos discretos 4.5.1. Modelo Binomial Seja um experimento aleatório com dois resultados possíveis, isto é, },{ 21 , com pP )( 1 e qpP 1)( 2 . A variável aleatória X , tal que 1)( 1 X (ocorreu um sucesso) e 0)( 2 X (ocorreu um fracasso) é dita modelo de Bernoulli. O que é um “sucesso” ou um “fracasso” é subjetivo.
Exemplo 5: lançamento de uma moeda equilibrada ={cara, coroa}
5,01 XP e 5,00 XP .
Exemplo 6: ={ fator RH+ ; fator RH-}
Sabe-se, da Biologia, que 85,01 XP e 15,00 XP .
53
Sendo nXXX ,....,, 21 v.a’s. independentes e identicamente distribuídas segundo
uma Bernoulli de parâmetro p , então
n
i iXX1
é dita binomial de parâmetros n e p . Notação: ),(~ pnBinomialX fmp: xnxx
n qpCpnxf ),,( , nx .....,2,1,0 Esperança e Variância de uma v.a. Binomial
n
i
n
iin
i i nppXEXEEX1 11
)(
)1( pnpVarX
Exemplo 7: suponha que 40% dos moradores de um município são favoráveis à implantação de um novo sistema de coleta e reciclagem de lixo. Se 5 pessoas forem entrevistadas (independentemente), qual a probabilidade de: (a) nenhuma ser favorável (b) no máximo 2 serem favoráveis (c) no mínimo 4 serem favoráveis (d) entre 2 (incluso) e 5 (excluso) serem favoráveis Solução: vamos denotar X como o número de pessoas favoráveis ao projeto )40,0;5(~ BinomialX (a) 07776,060,040,0)0( 500
5 CXP
54
(b) 68256,060,040,060,040,060,040,0
)2()1()0()2(322
5411
5500
5
CCCXPXPXPXP
(c) 08704,060,040,060,040,0)5()4()4( 055
5144
5 CCXPXPXP
(d) 6528,060,040,060,040,060,040,0
)4()3()2()52(144
5233
5322
5
CCCXPXPXPXP
Exemplo 8: no exemplo anterior, se 50 pessoas forem entrevistadas, qual o número esperado de favoráveis? Solução: 2040,050)( XE ; 1260,040,050)( XVar , %3205,17CV
4.5.2. Modelo Uniforme Discreto
fmp: ,1)(N
xf i }.....,2,1{ Ni .
caso particular:
Nif
Nix Xi
1)(
},.....,2,1{
Notação: )(~ NUnifX Gráfico da função massa de probabilidade de uma uniforme discreta
55
Esperança e variância de uma Uniforme discreta: 2
1
NEX ; 12
)1()(2
NXVar .
Exemplo 9: X= “no. de pontos marcados na face superior de um dado”. x 1 2 3 4 5 6
)(xf 1/6 1/6 1/6 1/6 1/6 1/6 1
5,32
16)(
XE
Exemplo 10: a amostra a seguir é o resultado de 24 lançamentos de um dado equilibrado Face 1 2 3 4 5 6 Total No. ocorrências 4 4 5 4 3 4 24
416666,32482
24463544534241
X
Em n lançamentos de um dado a soma das faces divida por n é aproximadamente 3,5.
4.5.3. Modelo Hipergeométrico Nota: a denominação do modelo tem relação com a série hipergeométrica. Experimento aleatório: Seja uma população de tamanho N com r elementos possuindo uma característica em comum. O experimento consiste em extrair uma amostra, sem reposição, e observar se a unidade amostral possui a característica. Se tiver diremos que ocorreu um “sucesso”. A v.a. X ”número de sucessos na amostra” é tal que
)},min(,....,1,0{ rnX .
f.m.p: ,)(),,,( nN
xnrN
xr
CCC
xXPrnNxf
)},min(,....,1,0{ rnx .
Notação: ),,(~ rnNHX
56
Esperança e variância de uma Hipergeométrica:
npXE )( ,
1
)1()(N
nNpnpXVar , Nrp
Observação: para N e mantendo Nrp constante, a fmp de uma hipergeométrica
converge para a binomial . Logo, para uma população grande, os processos com e sem reposição ficam muito próximos. Exemplo 11: pequenos motores são guardados em caixas de 25 unidades. Um inspetor de qualidade examina cada caixa, antes da posterior remessa, testando cinco motores. Se houver no máximo dois motores defeituosos, a caixa é aceita, caso contrário todos os 25 deverão ser testados. Sabendo-se que há 4 motores defeituosos numa caixa, qual a probabilidade de que seja necessário testar todos motores dessa caixa? Solução: X “número de motores defeituosos”
}4,3,2,1,0{ X ; 25N , 5n e 4r P(examinar toda a caixa) = )3(XP
0162055,0)4()3( 525
121
44
525
221
34
CCC
CCCXPXP
Agora assuma que 250N e 40r . Então }5,4,3,2,1,0{ X : P (examinar toda a caixa) = 03027575,0)5()4()3()3( XPXPXPXP
Usando a aproximação pela binomial, com 16,025040
p :
0317587,084,016,084,016,084,016,0)3( 0555
1445
2335 CCCXP
57
4.5.4. Modelo de Poisson A distribuição de Poisson é o modelo probabilístico que descreve um experimento aleatório, cuja variável aleatória X é o número de sucessos em um intervalo de comprimento t . Exemplo 12: aplicações do modelo de Poisson: (1º) no. de chamadas telefônicas recebidas por um PBX durante um período de tempo. (2º) no. de falhas de um computador durante 1 dia. (3º) no. de veículos que chegam a um pedágio durante 1 hora. (4º) no. de falhas em 1 metro de tecido de algodão.
fmp: !
)(),(x
tetxfxt
, ,.......2,1,0x
sendo .....7182882,2e , e 0t o número médio de “sucessos” no intervalo de comprimento t . Notação: );(~ tPoisX
Esperança e variância de uma Poisson: tEX tXVar )( .
58
Gráfico da fmp de uma Poisson
Exemplo 13: Numa central telefônica chegam 300 chamadas por hora. Qual a probabilidade de que: (a) em 1 minuto não haja nenhuma chamada? (b) em 2 minutos ocorram 8 chamadas? (c) em 0,5 minutos ocorram no mínimo 2 chamadas? Solução: X ”número de chamadas em um intervalo de t minutos”
560
300 é o número esperado de chamadas em 1 minuto ( 1t )
(a) 00673,0!0
)0( 50
eeXP
(b) 1126,0!8
10!8
2)8(8
108
2 eeXP
(c) 7127,02873,015,31!15,2
!05,21
)1()0(1)1(1)2(1)2(
5,210
5,2
ee
XPXPXPXPXP
59
5 - VARIÁVEIS ALEATÓRIAS CONTÍNUAS De uma maneira geral, medidas de grandezas físicas, como coordenadas espaciais, peso, tempo, temperatura e voltagem, são descritas mais adequadamente como variáveis aleatórias contínuas. 5.1. Função densidade de probabilidade (fdp) Definição: Diz-se que X é variável aleatória contínua se existir uma função f , denominada de função densidade de probabilidade (f.d.p), tal que: (1º) 0)( xf , Rx
(2º)
1)( dxxf
(3º) para ba , b
a
dxxfbXaP )()(
Observações: (1ª) )(xf não é probabilidade.
(2ª) Uma vez que 0)()( x
x
dyyfxXP , então no caso contínuo:
)()()()( bXaPbXaPbXaPbXaP , ou seja, 0)()( bXPaXP .
(3ª) Se g é tal que 0)( xg e 1)(
Kdxxg , então a função
Kxgxf )()( é uma função densidade.
60
Exemplo 1: : um cano cilíndrico para escoamento de água tem raio 2 cm e comprimento 10 cm.
O volume de água que escoa pelo cano é dado por .1022 V A taxa de água que passa pelo cano no intervalo [0, x] , 0< x<10, é a derivada do volume, ou seja, .2)( 2 xg A função g não é densidade de probabilidade, pois
. Mas, é f.d.p. A percentagem de volume de água que passa pelo cano, no intervalo [0, x], 0< x<10, é .
5.2. Função de Distribuição Acumulada de uma v.a. contínua
]1,0[: RF
x
xXPdyyfxF )()( , onde f é f.d.p
Propriedades: (1ª) 0)(lim xFx e 1)(lim xFx (2ª) F é contínua e não-decrescente em R
(3ª) )()( xFdxdxf se F for derivável em x
0 se F não for derivável em x (4ª) )()()( aFbFbXaP ; )(1)( aFaXP .
61
Exemplo 2: seja a função a seguir
(a) Mostre que é fdp (b) Obtenha a fda (c) Usando a fda obtenha )6,0( XP , )4,0( XP e )5,02,0( XP Solução:
(a) 12 10
21
0
xxdx
(b)
:0x 00)()(
xx
dydyyfxF
:10 x 20
2
0
0
20)()( xyydydydyyfxF xxx
:1x 1020)()( 10
21
0 1
0
ydyydydydyyfxFxx
Nota: em 1x ,
2)1(lim
11lim
1)1()(
lim
01
0lim111lim
1)1()(lim
1
2
11
111
xx
xx
FxFxxx
FxF
xxx
xxx
,
logo, F não é derivável em x=1 (veja a figura abaixo).
62
(c) 36,06,0)6,0()6,0( 2 FXP , 84,04,01)4,0(1)4,0( 2 FXP 21,02,05,0)2,0()5,0()5,02,0( 22 FFXP
5.3. Esperança e variância de v.a’s contínuas
Esperança:
dxxxfEX )(
condição de existência:
dxxfxXE )(||||
Variância: 222 )()()()()( EXXEdxxfEXxXVar
, onde
dxxfxXE )()( 22
condição de existência: 2|| XE Importante: mesmas propriedades da esperança e variância são válidas para o caso contínuo. Exemplo 3: o conteúdo de cinzas (em percentagem) no carvão pode ser considerado uma variável aleatória contínua com f.d.p :
..;0
2510;4875
1)(
2
cc
xxxf
63
O conteúdo de cinzas esperado em um particular espécime de carvão é:
5,19)(4875
1)(25
10
2 dxxfxXE por cento.
Exemplo 4: seja X v.a. com densidade a seguir
Mostre que f é densidade e encontre EX e Var(X).
Solução: 132
6)( 10
310
21
0
xxdxxf
21
1216
436)( 1
0
410
31
0
xxdxxxfEX ;
206
546)()( 1
0
510
41
0
22
xxdxxfxXE ; 201)( XVar
64
5.4. Modelos probabilísticos contínuos
5.4.1. Modelo Uniforme contínuo Função densidade de probabilidade:
Notação: ],[~ baUX Função de distribuição acumulada
65
Esperança e variância
2)(2))((
)(2)(21 222 ba
ababab
abab
abxdx
abxEX b
a
b
a
12)()(
2abXarV
Exemplo 5: Os geradores de números pseudo-aleatórios, de calculadoras e computadores, têm distribuição uniforme contínua em [0,1). Por exemplo, no EXCEL o comando é : ALEATORIO( ) Por exemplo, foram gerados 18 números: 0,156829637 0,846649578 0,469263346 0,577564193 0,664633565 0,462117229 0,973857121 0,964847015 0,968308066 0,981239892 0,322957938 0,118940193 0,937166033 0,135396175 0,840436215 0,023279616 0,431708782 0,587640809 A média desses valores gerados é 0,495327. Exemplo 6: considere um relógio circular de ponteiros. O relógio pode parar, por falta de bateria, em qualquer quadrante. Defina X o ângulo formado pelo ponteiro maior quando o relógio parar. Determinar: (a) fdp (b) fda (c) probabilidade do ponteiro parar entre -90 e 0 graus Solução:
(a)
..,0
0360,360
1)(
cc
xxf (b)
0,1
0360,360
360360,0
)(
x
xxx
xF
66
5.4.2. Modelo Exponencial Este modelo possui aplicações em diversas áreas: Biologia, Engenharia, Computação. Na Teoria da Confiabilidade está associada à probabilidade de falha de componentes em um sistema.
Função densidade de probabilidade:
0,0,0
),(xe
xxf x ; 0
O parâmetro é a taxa (intensidade) de falhas. Notação: )(~ ExponX Exemplo 7: distribuições exponenciais de parâmetros 2; 1,5 e 0,6
67
Função de distribuição acumulada:
0,10,0
),(xe
xxF x
Esperança e variância da exponencial: 1
EX , 2
1)(
XVar .
Exemplo 8: o tempo de duração (em horas) de um componente eletrônico é exponencial de
parâmetro 500
1 . Qual a probabilidade de que o componente:
(a) tenha duração entre 300 e 600 horas? (b) dure mais do que a média? Solução: X denota o tempo de duração do componente em horas (a)
247617,011)300()600()600300( 2,16,0300600 eeeeFFXP
(b) A media de X é 5001
. Assim,
367879,011)500(1)500( 1500 eeFXP
68
5.4.3. A distribuição Normal (Gaussiana) A distribuição Normal é de grande importância em Probabilidade e em Inferência Estatística. A distribuição normal foi introduzida pela primeira vez por Abraham de Moivre em um artigo no ano 1733. O nome "distribuição normal" foi criado por Charles S. Peirce, Francis Galton e Wilhelm Lexis, por volta de 1875. Exemplo 9 ( Exemplos de aplicação da normal): (1º) distribuição das alturas de pessoas (2º) distribuição dos valores de depósitos bancários (3º) distribuição do quociente intelectual (QI) (4º) distribuição da produção de cereais
Função densidade: ,21exp
21),,(
2
2
xxf x ;
; ),0( Notação: ),(~ NX . Gráfico da densidade normal
Propriedades da distribuição normal: (1ª) 0)( xf . (2ª) A área sob a densidade f é igual a 1. Para mostrar isto faz-se mudança para coordenadas polares.
69
(3ª) Para três distribuições normais 321 ,, XXX de mesmo parâmetro , se 321 , então a v.a 3X é mais leptocúrtica (afinada) que 2X e por sua vez 2X é mais leptocúrtica que 1X .
(4ª) ponto de máximo: x , pontos de inflexão: x e x . (5ª)
(6ª) MoMdEX ; 2)( XVar .
70
(7ª) Se ),(~ NX então )||;(~ bbaNbXaY e )1;0(~ NXZ
.
Função de distribuição acumulada da Normal padrão Seja )1;0(~ NZ . A função de distribuição acumulada de Z é denotada por
dvvzz
2exp
21)(
2
.
Propriedades de (1ª) 0)(lim zz e 1)(lim zz (2ª) 5,0)0( (3ª) )()()( abbZaP e )(1)( bbZP (4ª) Pela simetria da densidade, )(1)( zz (5ª) Se );(~ NX é preciso padronizá-la , para poder usar a tabela da normal padrão:
71
abbZaPbXaPbXaP )(
Nota: As áreas A e B têm formas diferentes, mas tem igual valor. Tabela de : fornece )( zZP , ]79,3;79,3[z , que é área hachurada na figura abaixo. No exemplo, 8980,0)27,1( ZP .
72
Exemplo 10: Seja )1;0(~ NZ (a) 8413,0)1()1( ZP (b) 9418,0)57,1()57,1( ZP (c) 95,0025,09750,0)96,1()96,1()96,196,1( ZP (d) 0505,09495,01)64,1(1)64,1( ZP (e) 012,00102,00222,0)32,2()01,2()01,232,2( ZP (f) 0)4()4( ZP e 011)4(1)4( ZP . Mas, pelo computador
420000316712,0)4( ZP , ou seja, na tabela a área foi arredondada para zero. Exemplo 11: os depósitos efetuados por clientes de um banco têm distribuição normal com média 100,00 e desvio padrão 15,00 unidades monetárias. Um cliente é selecionado ao acaso. Qual a probabilidade de que o depósito efetuado por ele seja: (a) 100,00 u.m. ou menos ? (b) pelo menos 110,00 u.m.? (c) um valor entre 120,00 e 150,00 u.m.? (d) maior que 140,00 u.m.? Solução: denotemos por X o valor dos depósitos
(a) 5,0)0()0(00,15
00,10000,10000,15
00,10000,100
ZPXPXP
(b)
2514,00.74861)67,0(132
00,1500,10000,110
00,1500,10000,110
ZPXPXP
(c)
0,09140.9082-0.9996)33,1()33,3(33,333,100,15
00,10000,15000,15
00,10000,15
00,10000,12000,15000,120
ZP
XPXP
(d)
0038,00.99621
)67,2(167,200,15
00,10000,14000,15
00,10000,140
ZPXPXP
73
Tabela da Normal Padrão Inversa: 1 : fornece as coordenadas tais que )(1 z , ou seja:
2)( zZP (áreas unilaterais superiores)
)|(| zZP (áreas bilaterais)
Exemplo 12: Para uma normal padrão, obtenha z tal que : (a) 9750,0)( zZP (b) 95,0)( zZP (c) 01,0)( zZP (d) 95,0)( zZzP Solução: (a)
96,1z
74
Também poderá utilizar a tabela da normal inversa, com a área unilateral de 0,025, como mostra a figura abaixo:
(b) Neste caso não encontraremos a área 0,95 na tabela da normal padrão. Isto acontece porque a tabela é limitada em duas decimais para as coordenadas. O valor exato, usando o computador, é 56448536269,1z .
Você pode utilizar a media aritmética das duas coordenadas:
645,12
65,164,1
z . Também poderá utilizar a tabela inversa da normal padrão, cujo
valor da coordenada é z=1,6445.
75
(c) Neste caso, a área deseja é a cauda inferior. Pela tabela da normal inversa, obtemos z = 2,3263, e portanto - z = -2,3263.
(d) Pela tabela da normal inversa , z=1,96.
Exemplo 13: as alturas de 10000 alunos de uma escola têm distribuição normal de média 170 cm e desvio padrão 5cm. (a) qual o número esperado de alunos com altura superior a 165 cm? (b) qual o intervalo simétrico em torno da média que conterá 75% das alturas dos alunos? Solução: denotemos por X a altura dos alunos
(a) 8413,01587,01)1(115
1701655170165
ZPXPXP
O nº de esperado é 100000,8413 = 8413 alunos.
76
(b) Temos que encontrar k tal que 75,0)()()( kkkZkPkXkP Pela Tabela Inversa da Normal Padrão, para área bilateral de 0,25, obtêm-se que
15,1k . Portanto, o intervalo em torno de é
75,175;25,164515,1170;515,1170 .
77
6 - AMOSTRAGEM E ESTIMAÇÃO DE PARÂMETROS 6.1. Parâmetros e Estatísticas Definição: denomina-se amostra aleatória a uplan nXXX ,,, 21 de v.a´s com mesma distribuição de probabilidade. Exemplo 1: nXXX ,,, 21 com distribuição binomial de parâmetros m e p . Definição: um parâmetro é uma medida usada para descrever uma característica numérica da população. Exemplo 2: 85,0 é a proporção de pessoas com fator RH+ Exemplo 3: a função-produção é definida como BQKY , sendo Y o valor do produto e Q a quantidade produzida, K e B parâmetros. Definição: uma estatística (ou estimador) é uma característica numérica da amostra, isto é, uma estatística T é uma função de nXXXfT ,,, 21 .
Exemplo 4: n
XP
n
ii
1 , onde iX 1, se for RH+
= 0, se for RH- Nota: uma vez que T é função de v’as, então também será aleatória. Definição: uma estimativa é um valor particular assumido pelo estimador
),....,( 21 nxxxft
Exemplo 5: numa amostra de 30 pessoas, 25 tem RH+. Assim, 83,03025
p .
Observação: por convenção representamos a amostra observada (e as estimativas) por letras minúsculas.
78
Notações usuais:
Medidas Parâmetro Estimador Estimativa Média
nXf
Xk
i ii
1 n
xfx
k
i ii
1
Variância
2
1
2
1
2
2
n
XnXfS
k
iii
1
2
1
2
2
n
xnxfs
k
iii
Desvio padrão S
s
Amplitude
H h
Proporção
P p
Correlação R r
6.2. Propriedades dos Estimadores: (1ª) Um estimador é dito não tendencioso ou não enviesado, se )(TE , onde é um parâmetro populacional Exemplo 6: “a média de todas médias amostrais possíveis é igual à média populacional”,
ou seja,
)(XE .
Exemplo 7: 22 SE , mas 22 VE , onde 2
1
2
2
Xn
XfV
k
iii
.
(2ª) Uma seqüência 1nnT de estimadores de é dita consistente se:
)(lim nn TE e 0)(lim nn TVar
Exemplo 8: como
)(XE e 0lim2
nn , então
X é consistente.
(3ª) Se T e H são dois estimadores não tendenciosos de e )()( HVarTVar então dizemos que T é mais eficiente que H.
79
Exemplificação de quatro estimadores onde foram feitas 18 observações
6.3. Estimação por ponto e por intervalo Estimação por ponto: é a estimativa resultante da amostra. Estimação por intervalo: a estimação por ponto não permite julgar a magnitude do erro que estamos cometendo. Daí surge a idéia de construir os intervalos de confiança, que são fundamentados na distribuição amostral do estimador. ..CIP
é dito grau de confiança, que é a probabilidade do parâmetro pertencer ao intervalo
1 é a probabilidade de não pertencer ao intervalo
80
Construção de intervalos de confiança: o teorema a seguir é o alicerce dos Intervalos de Confiança. Teorema (Teorema Central do Limite): Para uma amostra aleatória ),....,( 1 nXX e um estimador ),....,( 1 nn XXfT de máxima verossimilhança do parâmetro , tal que
)( nTE , tem-se:
)1,0()()( N
TVarTETZ
n
n
nnn
6.4. Intervalos de confiança
6.4.1. IC para a média populacional quando o desvio padrão é conhecido Pelo Teorema Central do Limite,
11n
zXn
zXPzXVar
XEXzP tabtabtabtab ,
onde tabz é tal que )(12 tabz .
81
Assim, o intervalo de confiança para , de grau %100)1( , é dado por
XIC , onde n
ztab é dito erro de estimação (ou erro amostral).
Observação: note que o erro de estimação é a semi-amplitude do I.C. Exemplo 9: suponha que se esteja estudando a altura de pessoas numa certa população.
Sabe-se que =15. A amostra de 100 indivíduos resultou em
x =170 . Construa intervalos de confiança para a média populacional com: (a) 1 =0,90 (b) 1 =0,95 (c) 1 =0,99 solução:
(a) 46,172;54,16710015645,1170;
10015645,1170
(b) 94,172;06,1671001596,1170;
1001596,1170
(c) 85,173;14,16610015575,2170;
10015575,2170
82
Interpretação do Intervalo de Confiança: espera-se que %100)1( dos intervalos originados de amostras de mesmo tamanho contenham o parâmetro .
Observações: (1ª) Não se utiliza grau de confiança igual a 100%, pois neste caso o intervalo fica a própria reta real! De fato, para que 1 tabtab zZzP , então é preciso que
tabz . (2ª) Um grau de confiança igual a 0% resulta em um intervalo degenerado (que é a própria estimativa por ponto!). De fato, para que 0 tabtab zZzP , então é preciso que
0tabz . (3ª) Não existe um valor ideal para o grau de confiança. Nunca se deve utilizar os extremos 0% e 100%. Os valores mais usuais são 0,99; 0,95 e 0,90, mas não há uma justificativa formal para usá-los, são apenas valores de referência mais encontrados em artigos e livros. (4ª) O desvio padrão influencia diretamente na amplitude do I.C., ou seja, se for grande, então o I.C. será amplo. O grau de confiança também é responsável pela amplitude do I.C. Mantendo fixado, se n aumentar então a amplitude do I.C. irá diminuir, ou seja, ficará mais preciso.
83
6.4.2. IC para a média populacional quando o desvio padrão é desconhecido A distribuição t-student: Foi introduzida por William Gosset, que utilizou o pseudônimo “um estudante”. Essa distribuição aparece quando substituímos o desvio padrão pelo respectivo estimador S . A t-student é similar à normal padrão, isto é, e simétrica em torno do zero e tem a forma de um sino, sendo mais baixa (achatada) que a normal. Além disso, a t-student converge à normal padrão. Notação: )(~ vtX , onde 0v é o parâmetro da distribuição. Comparação entre a normal padrão e a t-student
84
Em inferência estatística esse parâmetro assume valores inteiros positivos e tem a denominação de “graus de liberdade”. O conceito de graus de liberdade (GL) é o número de valores que poderemos atribuir de maneira arbitrária. Por exemplo, suponha que temos três parcelas, cujos valores devem ser não negativos e somarem 14: 4 + 7 + = 14 Então, teremos a “liberdade” de atribuir apenas dois valores, pois o último ficará “amarrado” (determinado). A tabela da t-student é tal que se você entrar com GL=n-1 e a área, você obterá a coordenada. Para GL maior que 120, utiliza-se a normal padrão.
85
Modelo de Tabela t-student
nStXIC tab , onde tabt é tal que )|(| tabtTP , )1(~ ntT
Exemplo 10: de 1500 placas de memória fabricadas retirou-se uma amostra de 30 unidades, observando-se o tempo até a primeira falha. Obteve-se as seguintes estatísticas:
800
x h e 100s h. Construa um IC de 99% para a média da população.
Solução: IC = 31,850;68,74930
1007564,2800;30
1007564,2800
Observação: o desvio padrão amostral S influencia diretamente na amplitude do I.C. Se a variabilidade na amostra for alta, o I.C. será mais amplo. Aumentando-se a amostra, o I.C. deverá ficar mais preciso (com menor amplitude).
86
6.4.3. IC para a variância populacional 2 A distribuição Qui-Quadrado: a distribuição origina-se da soma de quadrados de distribuições normais. A densidade dessa distribuição é assimétrica à direita. O nome “QUI” vem da letra grega . Algumas distribuições Qui-Quadrado
Notação: )(~ vQuadradoQuiX , onde 0v é o parâmetro da distribuição. Assim como na t-student, em inferência estatística esse parâmetro assume valores inteiros positivos, e denomina-se “graus de liberdade”. A tabela da Qui-Quadrado é tal que se você entrar com GL e a área, você irá obter a coordenada.
87
Modelo de Tabela Qui-Quadrado
O intervalo de confiança para a variância é:
inf
2
sup
2 )1(,)1(q
Snq
SnIC , onde
1)( supinf qXqP ; )1(~ nQuadradoQuiX
O intervalo de confiança para o desvio padrão é:
inf
2
sup
2 )1(,)1(q
Snq
SnIC
Exemplo 11: O setor de qualidade de uma indústria de parafusos deseja estimar a variação dos comprimentos de parafusos produzidos. Obtenha intervalo de confiança de grau 95% para . A amostra foi a seguinte: 12,2 12,4 12,1 12,0 12,7 12,4 14,0 13,7 13,9 14,1 13,9 13,7 13,5 12,2 12,5 13,6.
Solução: 05625,13
x 634624,02 s 796633,0s
23295,1;58848,02621,6634624,015;
4884,27634624,015
IC
88
6.4.4. IC para a proporção populacional
n
PPzPIC tab)1(
, onde P é a proporção amostral e tabz é tal que
)(12 tabz .
Exemplo 12: suponha a seguinte amostra sobre a intenção de voto em um candidato: {1; 0; 1; 1; 1; 1; 0; 0; 1; 1; 0; 0; 0; 0; 0; 1; 0; 0; 1; 0} 1 “a favor”; 0 “contra” Construa um IC de 98% para a proporção.
Solução: 45,0209
p
IC = 7086,0;1913,020
55,045,0325,245,0;20
55,045,0325,245,0
6.5. Dimensionamento de amostras Estimação da média
Vimos que para a média populacional,
XXCI ,.. , onde
nz tab
é o erro de estimação absoluto. Isolando n nesta última equação obtemos
o tamanho da amostra:
população infinita: 2
22
tabzn , onde tabz é tal que )(12 tabz .
população finita: nN
Nnm
.
89
Observações: (1ª) se for desconhecido então utiliza-se algum valor já utilizado em uma pesquisa semelhante que já foi realizada, ou realiza-se uma pesquisa incial (amostra piloto) para obter uma estimativa. (2ª) O tamanho da amostra n e o erro de estimação tem relação inversa, como mostra a figura:
Exemplo 13: deseja-se estimar a renda dos moradores do bairro da Gávea , no Rio de Janeiro, sabendo-se que o desvio padrão da renda é de 300,00. Exige-se um erro absoluto máximo de 20,00 e um grau de confiança de 95%. Qual deve ser o tamanho da amostra?
Solução: 86536,86420
30096,12
22
n
Supondo N=5000, 73796,73636,864500036,8645000
m
90
Estimação da proporção
r é o erro de estimação relativo
população infinita: 22 )1(
rtabzn
, onde tabz é tal que )(12 tabz .
população finita: nN
Nnm
.
Observações: (1ª) o erro de estimação para a proporção está em termos relativos, visto que uma proporção é uma medida relativa (sem unidade de medida).
(2ª) Se for desconhecida, pode-se utilizar alguma estimativa de uma pesquisa anterior. Também pode-se assumir o maior valor possível 25,0)1( . Desta forma,
2
2 25,0
r
tabzn
.
Exemplo 14: Uma amostra preliminar de 50 famílias foi selecionada de N=4000 famílias. Constatou-se que na amostra 30 famílias possuíam renda superior a 1000,00. Qual deve ser o tamanho da amostra, com grau de confiança de 99% e erro de estimação máximo de 5%? Solução:
6,05030
p ; 575,2tabz
63754,63605,0
4,06,0575,22
2
n ; 55015,54954,636400054,6364000
m
Se usarmos 25,05,05,0)1( , 66306,66305,0
25,0575,22
2
n e 569m
91
7 – TESTES DE HIPÓTESES 7.1. Definições Hipótese conceitual: é a hipótese formulada utilizando termos específicos na área em estudo. Hipótese operacional: é a formulação matemática da hipótese conceitual Exemplo 1: o biodiesel é menos poluente que o diesel convencional Como trabalhar matematicamente com essa hipótese? Iremos comparar as médias de emissões de partículas de óxido de enxofre por cm 3 . Um grupo de veículos vai rodar com biodiesel e outro com o convencional. Vamos denotar por B a média de emissão de partículas por cm 3 usando biodiesel, e por C usando o diesel comum. Hipóteses : B = C e B < C Hipóteses estatísticas Em inferência estatística uma hipótese é uma suposição formulada a respeito dos parâmetros de uma distribuição de probabilidade de uma ou mais populações. Esta hipótese será testada com base em resultados amostrais, sendo aceita ou rejeitada. Ela somente será rejeitada se o resultado da amostra for improvável de ocorrer sob a suposição da hipótese ser verdadeira. Denominaremos por 0H (hipótese nula) a hipótese a ser testada, e por 1H (hipótese alternativa) a negação de 0H . Através de um teste aceitaremos ou rejeitaremos 0H . A nossa decisão terá uma probabilidade de erro. Essa probabilidade de erro é controlada (escolhida pelo pesquisador). Um pesquisador nunca poderá escrever num artigo ou relatório frases do tipo: “o teste de hipótese mostrou que....”, mas deverá apresentar qual a probabilidade de erro que ele admitiu no teste. O quadro abaixo apresenta o que pode acontecer em um teste de hipóteses:
92
Exemplo 2: suponha um julgamento num tribunal
As probabilidades desses erros são chamadas e respectivamente, ou seja: = P(erro tipo I) = P(rejeitar 0H | 0H é verdadeira) P(aceitar 0H | 0H é verdadeira), que é o grau de confiança = P(erro tipo II) = P(aceitar 0H | 0H é falsa) = P(rejeitar 0H | 0H é falsa) Nível de significância de um teste: é o valor de no teste, ou seja, é a probabilidade de rejeitar 0H , dado que é verdadeira. Os valores mais utilizados para são: 0,01; 0,05 e 0,10. Observações: (1ª) No enfoque de Fisher, a preocupação é com os testes de significância, dando exclusiva atenção ao erro tipo I. Neste curso seguiremos o enfoque de Fisher. (2ª) Fisher, um dos precursores da Teoria Estatística, usou o valor de 5% para facilitar o ensino da Teoria, e por isso ficou como um valor “consagrado”.
7.2. Etapas de um teste de hipóteses (1ª) Formular as hipóteses estatísticas: a hipótese nula a respeito de um parâmetro deve conter a igualdade e alternativa pode ser bilateral ou unilateral.
0H : 0 1H : 0 (bilateral) 0 (unilateral à esquerda) 0 (unilateral à direita).
93
(2ª) Fixar o nível de significância do teste. (3ª) Calcular a estatística do teste. (4ª) Tomada de decisão: rejeitar 0H se a estatística do teste estiver na região crítica (região onde a hipótese nula é rejeitada), caso contrário não se rejeita 0H . A região crítica dependerá de e do tipo de hipótese alternativa. Observações:
7.3. Testes de hipóteses
7.3.1.Teste de hipóteses para a média de uma população (a) conhecido
00 : H
estatística do teste: nX
zc
0
1H bilateral ( 01 : H ): rejeita 0H se || cz > tabz , tal que )(12 tabz .
1H unilateral à direita ( 01 : H ): rejeita 0H se cz > tabz , tal que )(1 tabz .
1H unilateral à esquerda ( 01 : H ): rejeita 0H se cz < tabz , tal que )(1 tabz .
94
Observações: (1ª) se for grande, a estatística cz não será sensível o bastante para detectar diferença
significante entre
X e 0 . (2ª) aumentando a amostra, o teste ficará mais sensível para detectar diferenças significativas. (3ª) O teste unilateral é mais rigoroso que o bilateral. Na figura abaixo, o valor tabelado do teste unilateral é menor que no bilateral. Se )()( b
tabcu
tab zzz , então o teste unilateral irá rejeitar a hipótese nula, mas o bilateral não.
95
(4ª) Para ∝ fixado, tabz também ficará fixado. Variando os valores de 0 , pode-se “manipular” cz de maneira que leve à aceitação ou rejeição de 0H .
Fixando 0 , cz também ficará fixado. Variando ∝ poderemos “manipular” tabz de maneira que leve à aceitação ou rejeição de 0H .
A manipulação de ∝ ou 0 é uma clara evidência de que o pesquisador está sendo tendencioso, protegendo seus próprios interesses!
96
Exemplo 3: uma linha de produção fabrica parafusos cujo diâmetro tem desvio padrão
22716,1 . Tomou-se uma amostra de tamanho 20, cujas estatísticas foram 735,3
x e 8756,3s . Com 05,0 , teste 0H : 5 contra
(a) 1H : 5 (b) 1H : 5 (c) Em relação ao item (b), apresente um que levaria à aceitação de 0H . Solução:
61,42022716,1
5735,3
cz
(a) 96,1tabz . Como tabc zz || , rejeitamos 0H . (b) 645,1 tabz . Como tabc zz , rejeitamos 0H . (c) Temos que encontrar um - tabz tal que tabc zz . Note que 65,4 tabz leva-nos à aceitação! Mas, 000001659,0)( tabzZP , que é um absurdo! Exemplo 4: Na tabela constam as medidas mensais dos comprimentos de parafusos (em mm) de uma linha de produção.
97
Mês
X1 X2 X3 X4 X5 Média
1 0,65 0,7 0,65 0,65 0,85 0,7 2 0,75 0,85 0,75 0,7 0,65 0,74 3 0,75 0,72 0,8 0,7 0,75 0,744 4 0,6 0,7 0,7 0,75 0,65 0,68 5 0,7 0,75 0,65 0,8 0,8 0,74 6 0,6 0,75 0,75 0,85 0,7 0,73 7 0,75 0,8 0,65 0,75 0,7 0,73 8 0,6 0,7 0,8 0,75 0,75 0,72 9 0,65 0,8 0,85 0,74 0,75 0,758 10 0,6 0,7 0,6 0,8 0,65 0,67 11 0,8 0,75 0,7 0,76 0,7 0,742 12 0,85 0,75 0,79 0,65 0,7 0,748 13 0,7 0,7 0,75 0,75 0,7 0,72 14 0,65 0,7 0,85 0,75 0,6 0,71 15 0,74 0,75 0,74 0,75 0,79 0,754 16 0,75 0,9 0,92 0,8 0,65 0,804 17 0,69 0,9 0,8 0,93 0,88 0,84 18 0,78 0,88 1,02 0,98 1,03 0,938 19 1 1 1,02 0,98 1,04 1,008 20 0,99 1,01 1,02 0,99 1,04 1,01 21 1,03 1,05 1,06 0,99 1,03 1,032 22 1,06 1,07 1,09 1,1 1,1 1,084 23 1,08 1,08 1,1 1,12 1,14 1,104 24 1,1 1,12 1,15 1,13 1,14 1,128 25 1,12 1,14 1,16 1,18 1,2 1,16
O departamento de controle de qualidade deseja informações acerca da uniformidade dos comprimentos dos parafusos. Segundo as normas da empresa, o processo de produção estará sob controle se o comprimento médio dos parafusos tiver 0,7 mm. Sabe-se, do manual das máquinas que produzem as peças, que a média e o desvio padrão dos comprimentos são 0,70 e 0,07 mm, respectivamente. Gráfico de controle é uma ferramenta amplamente utilizada em controle de qualidade. Consiste em construir uma “banda de confiabilidade” em torno da média. Para cada nova amostra, se constrói um intervalo de confiança para a média populacional. Traduzindo para testes de hipóteses: 0H : 70,0 contra 1H : 70,0 , onde o nível de significância adotado geralmente é 0,05. No gráfico, aparecerão os limites inferiores e superiores do intervalo de confiança. Se a média amostral estiver dentro do intervalo então não haverá evidências para rejeitar 0H , que é a hipótese de que o processo de produção está sob controle.
98
iX ; i=1,2,3,4,5 são as cinco medidas observadas para cada mês Os limites dos intervalos de confiança são:
64,0507,096,170,0 e 76,0
507,096,170,0
Como se pode observar pelo gráfico, a partir do 16º mês as médias amostrais começam a “cair” fora da “banda” de segurança (confiança) evidenciando claros indícios de que o processo está fora da especificação. (b) desconhecido
00 : H
Estatística do teste: nS
Xtc
0
1H bilateral: rejeita 0H se || ct > tabt , )|(| tabtTP , )1(~ ntT
1H unilateral à direita: rejeita 0H se ct > tabt , )( tabtTP
1H unilateral à esquerda: rejeita 0H se ct < - tabt , )( tabtTP
99
Exemplo 5: em relação ao Exemplo 3, vamos supor que era desconhecido. Use
05,0 .
Solução: 4597,1208756,3
5735,3
ct
(a) 093,2tabt . Como tabc tt || , não rejeitamos 0H . (b) 7291,1tabt . Como tabc tt , não rejeitamos 0H .
Nota: como %76,103%100735,3
8756,3CV é elevado, o teste não foi sensível o
bastante para detectar diferença significativa!
100
7.3.2.Teste de hipóteses para a proporção de uma população
00 : H
Estatística do teste: nPzc
)1( 00
0
, sendo P a proporção amostral.
1H bilateral( 0 ): rejeita 0H se || cz > tabz , tal que )(12 tabz
1H unilateral à direita( 0 ): rejeita 0H se cz > tabz , tal que )(1 tabz .
1H unilateral à esquerda( 0 ): rejeita 0H se cz < tabz , tal que )(1 tabz .
Exemplo 6: uma estação de TV afirma que 60% dos televisores estavam ligados no seu programa especial de sábado. Uma rede concorrente deseja contestar essa afirmação, e decide entrevistar 200 domicílios. Desses 200, 104 deram respostas afirmativas. Teste a hipóteses 6,0:0 H e 6,0:1 H , com : (a) 01,0 (b) 05,0 .
Solução: 31,2
20024,0
6,052,0
cz
(a) 325,2 tabz , então não rejeitamos 0H para 1% de significância . (b) 645,1 tabz , logo rejeitamos 0H para 5% .
101
7.3.3. Teste de hipóteses para a igualdade de médias de duas populações (a) desvios padrões populacionais conhecidos
YXH :0
Estatística do teste:
mn
YXzYX
c 22 , n é o tamanho da amostra para X e m para Y
1H bilateral( YX ): rejeita 0H se || cz > tabz , tal que )(12 tabz
1H unilateral à direita( YX ): rejeita 0H se cz > tabz , tal que )(1 tabz .
1H unilateral à esquerda( YX ): rejeita 0H se cz < - tabz , tal que )(1 tabz . Exemplo 7: deseja-se verificar se duas máquinas de empacotar café são homogêneas com relação ao peso neto. Sabe-se, pelo manual das máquinas, que o desvio padrão de ambas é
20 YX gramas. Foram obtidas amostras de 60 unidades para cada máquina. Teste se a média da máquina X é significativamente maior que a de Y, utilizando
10,0 . Estatísticas X Y
Média 500,01 g 497 g Amostra 60 60
Solução: YXH :0 contra YXH :1
8243,0
6020
6020
00,49701,50022
cz ; 2816,1tabz
Como tabc zz então não rejeita-se 0H .
102
(b) desvios padrões populacionais desconhecidos
YXH :0
Estatística do teste:
mnS
YXtc 11,
2)1()1( 22
mn
SmSnS YX
1H bilateral: rejeita 0H se || ct > tabt , )|(| tabtTP , )2(~ mntT
1H unilateral à direita: rejeita 0H se ct > tabt , )( tabtTP
1H unilateral à esquerda: rejeita 0H se ct < - tabt , )( tabtTP Exemplo 8: duas técnicas de vendas são aplicadas por duas equipes de vendedores: a técnica A por 12 vendedores e a B por 15. No final de um mês obtiveram-se os seguintes resultados: Estatísticas A B
Média 68 76 Variância 50 50,8 Amostra 12 15
Teste se a média do grupo B é maior que a do A, usando 05,0 . Solução: ABH :0 contra ABH :1 .
1026,725
50118,5014
s ; 908,2
121
1511026,7
6876
ct ; 7081,1tabt
Como tabc tt rejeitamos 0H .
103
7.3.4.Teste de hipóteses para a igualdade de proporções de populações
YXH :0
Estatística do teste: )
)1()1(m
PPn
PPPPz
YYXX
YXc
, YX PP , são as proporções amostrais
1H bilateral( YX ): rejeita 0H se || cz > tabz , tal que )(12 tabz .
1H unilateral à direita( YX ): rejeita 0H se cz > tabz , tal que )(1 tabz .
1H unilateral à esquerda ( YX ): rejeita 0H se cz < - tabz , tal que )(1 tabz . Exemplo 9: a matriz de uma empresa de embalagens quer comparar a proporção de itens que são rejeitados pelo setor de qualidade em duas de suas filiais. As amostras resultaram no seguinte: 200n ; 05,0Xp e 210m ; 052,0Yp . (a) Teste YXH :0 contra YXH :0 , com 05,0 . (b) Em (a), qual levaria à rejeição de 0H Solução:
092,0
210)052,01(052,0
200)05,01(05,0
052,005,0
cz
(a) Para teste unilateral à esquerda, com 05,0 , aceita-se 0H , pois 645,1 tabz .
(b) Mas, qual valor de levaria à rejeição de 0H ? Temos que encontrar um tabz tal que
tabc zz . Note que 09,0 tabz leva-nos à rejeição. Mas, 4641,04641,0)09,0( ZP , que é um absurdo!
104
7.4 – Significância amostral
Quando realizamos testes de hipóteses partimos de um valor fixado para , permitindo tomar uma decisão entre 0H e 1H . Quando utilizamos o computador, o programa não irá utilizar um pré-fixado, ou seja, o programa deixa a critério do usuário fixar o nível de significância. O computador calcula o valor-p ( ou significância amostral) . De posse do valor-p comparamos com utilizando a seguinte regra de decisão: se valor-p < então rejeitamos 0H . Valores pequenos de p significam que a probabilidade de rejeitar 0H , supondo que seja verdadeira, é pequena. O conceito de “pequeno” é incumbência do usuário, que decide qual utilizar. Contudo, há três interpretações freqüentemente utilizadas em trabalhos de pesquisa:
Significativa, quando p for menor que 0,05
Muito significativa, quando p for menor que 0,01;
Altamente significativa, quando p for menor que 0,001;
105
Exemplo 10: teste a hipótese de que o diâmetro médio de parafusos seja de 57 mm. Diâmetro 56,5 56,6 56,7 56,8 56,9 57 57,1 57,2 57,3 Total Freqüência 1 2 2 4 10 5 4 2 1 31 Solução: 57:0 H contra 57:1 H
9161,56
x 18275,0s ;
555,2ct ; 0157,0p . Como 05,0p então é significativo.
106
8 – CORRELAÇÃO E REGRESSÃO LINEAR
8.1. O coeficiente de correlação linear de Pearson O diagrama de dispersão nos fornece uma idéia do tipo de relacionamento entre duas variáveis quantitativas X e Y. Uma forma de quantificar a relação entre duas variáveis quantitativas é através do coeficiente de correlação linear de Pearson. Exemplo 1: Carga aplicada em uma mola, em kg (X): 1 2 3 4 5 6 7 8 9 10 Alongamento da mola, em cm (Y): 0,5 1,0 2,0 2,5 4,0 5,0 5,3 6,2 6,8 7,2
Definição: o coeficiente de correlação linear de Pearson para duas variáveis é definido como:
2
22
2 YnYXnX
YXnYXR
i ii i
i ii
107
Exemplo 2: para o exemplo anterior, Planilha do Excel
992,0
05,41011,2175,510385
05,45,5104,28822
r .
O Excel também tem o comando que calcula diretamente a correlação linear: Correl( ) Resultados: (1º) 11 R (2º) se Y e X tiverem uma relação linear perfeita diretamente proporcional ( bXaY ) então 1R
108
(3º) se Y e X tiverem uma relação linear perfeita inversamente proporcional ( bXaY ) então 1R
(4º) se Y e X forem independentes então 0R . Contudo, a recíproca não vale, 0R não implica Y e X independentes. Na figura, há uma relação perfeita 2XY , contudo,
0R .
(5º)
|| R Interpretação da correlação 0 a 0,40 Fraca
0,40 a 0,70 Regular 0,70 a 0,80 Boa 0,80 a 0,99 Ótima
1 Perfeita
109
Teste de hipóteses para o coeficiente de correlação
0H : 0 contra 1H : 0
Estatística do teste : 21
2
RnRtc
Regra de decisão: rejeita-se 0H se tabc tt , onde )|(| tabtTP , )2(~ ntT .
Exemplo 3: para o exemplo anterior, 2263,22)992,0(1
210992,02
ct e 8107748,1 p ,
que é altamente significante. 8.2. O modelo linear simples O modelo linear simples é definido como iii XY 10 , i=1,.....,n., onde:
10 , são os parâmetros do modelo que deverão ser estimados; X é dita variável preditora; Y é dita variável resposta (dependente). é ditto erro aleatório
110
O método que usaremos para estimar os parâmetros do modelo é o dos Mínimos Quadrados. Neste método, minimiza-se a soma dos quadrados das distâncias id (ver figura). Os estimadores de 0 e 1 são, respectivamente:
2
1
2
11
XnX
YXnYXb
n
ii
i
n
ii
,
XbYb 10 .
Observação: da relação 2
1
2
2
1
2
1
XnX
YnYRb
n
ii
n
ii
segue que 1b e R têm o mesmo
sinal. Exemplo 4: para o exemplo anterior,
795758,0
5,51038505,45,5104,288
21
b ; 326667,05,5795758,005,40 b
O modelo ajustado ficou XY 795758,0326667,0^
. Para x=7,5 kg, o valor estimado para y será 5,6415 cm. Pelo EXECEL os comandos são: inclinação() e intercepção().
8.3. Modelos não lineares Modelo Exponencial: }exp{ xY , Rx Modelo Logaritmico: )ln(xY , 0x
Modelo Hiperbólico:
xxY ,
x
Modelo Logístico: }exp{1
}exp{
xxY , Rx