apostila de estatística para engenharia
DESCRIPTION
Apostila de Estatística Para Engenharia1TRANSCRIPT
-
APOSTILA
DE
ESTATSTICA
Aluno: ______________________________________
-
A arte de descobrir novos horizontes Cristiane Sander *
Se todos ns temos perguntas/problemas e buscamos alternativas para os mesmos e, se a pesquisa nos leva a desenvolver o conhecimento, criar alternativas para problemas e a descobrir novos horizontes, ento todos podemos ser pesquisadores.
Geralmente, quando ouvimos falar em pesquisa, nos reportamos a laboratrios cheios de aparelhos sofisticados, tubos de ensaio, produtos qumicos etc, ou ento a nmeros, dados, porcentagem, ou ainda, a pessoas importantes, cientistas, doutores, professores e outros. No entanto, a pesquisa no tem endereo certo, quer dizer, no s em laboratrios que ela se encontra. A pesquisa est prxima de ns, ela faz parte do nosso dia-a-dia. Para pesquisar necessrio, em primeiro lugar, ter um problema ou uma pergunta a resolver. Ou seja, quando nos dispomos conscientemente a resolver um problema, estamos dando incio a uma pesquisa. Passos para a pesquisa Para realizar uma pesquisa no h uma receita pronta para seguir. H, no entanto, alguns elementos importantes a observar, dos quais destacamos: Problema: Na vida, no dia-a-dia, nos deparamos com vrios problemas, somos desafiados sempre a tomar decises e definir rumos. Por exemplo, se estamos desempregados, vamos fazer o levantamento de quais so as qualificaes, capacidades, habilidades que possumos e onde podemos ir buscar trabalho dentro dessas condies. Mas buscamos tambm saber por que estamos desempregados, se este um problema que apenas ns estamos enfrentando ou se mais pessoas esto nesta situao. A partir disto, levantamos vrias hipteses, respostas, alternativas para resolver nosso problema. Temos que ter presente que problema na pesquisa no se refere a uma coisa negativa e sim a algo que nos ajuda a construir e encontrar sadas. A forma de levantar um problema, de fazer a pergunta, define de certa maneira a perspectiva que daremos pesquisa. Por isso importante saber fazer as perguntas, ver quem faz as perguntas e para quem e por que estas perguntas/problemas so considerados importantes. Ou seja, quais so os objetivos que pretendemos atingir com a pesquisa. Hipteses: So as vrias possibilidades de soluo que levantamos para responder o problema, ou seja, so respostas antecipadas que imaginamos a partir do conhecimento que j possumos acerca do objeto a ser investigado. No entanto precisamos comprovar ou refutar nossas hipteses para ter um resultado da pesquisa, pois
no podemos ficar no achismo, em opinies, precisamos ter bases concretas, provas para realizar nossas pesquisas. Para tanto, precisamos buscar dados, o que implica em ver onde podemos busc-los, o que precisamos para comprovar nossas hipteses e qual ser o mtodo que vamos usar. Podemos buscar dados, respostas para nossas pesquisas em vrios lugares: em livros, revistas, jornais(dados bibliogrficos); em arquivos; em fotografias, objetos, ou junto s pessoas, atravs de entrevistas, questionrios etc. Ou seja, s vezes as respostas podem estar onde menos esperamos. Podemos, por exemplo, chegar ao trmino da pesquisa e concluir que as hipteses que levantamos no incio da pesquisa no eram verdadeiras. Isso no quer dizer que a pesquisa no tenha sido vlida, ao contrrio, ela pode nos mostrar justamente por onde no devemos andar, ou ainda, nos mostrar caminhos que antes no havamos pensado em seguir. Por que importante pesquisar? Quando realizamos qualquer pesquisa, precisamos sempre ter presente por que vamos faz-la, em que ela vai contribuir para melhorar a vida das pessoas na sociedade. A pesquisa, antes de tudo, gera conhecimento, pois leva-nos a refletir, pensar, ler, escrever e descobrir novos horizontes. importante que tornemos pblicos os resultados aos quais chegamos, pois se guardamos o conhecimento adquirido para ns, ele no ter importncia nenhuma para a sociedade. A pesquisa nos possibilita tambm a olhar de forma crtica a realidade, na medida em que ela nos instiga busca do novo, para a formulao de novas perguntas e para a produo prpria e criativa do conhecimento. Poderamos iniciar a pesquisa nas escolas e tambm fora dela, para torn-la mais presente em nossa vida. No entanto, a proposta da pesquisa quebra com a lgica pedaggica de muitas escolas, que se preocupam somente em dar respostas aos alunos. Pois, a pesquisa preocupa-se em fazer perguntas e levar os prprios alunos a buscar solues, instigando sua criatividade que leva a questionar aquilo que muitos no querem que seja questionado. * Cristiane Sander, licenciada em histria-UNIJU, mestranda em Servio Social-PUCRS. Abril/2000
-
3
Introduo
PROBABILIDADE
A histria da teoria das probabilidades teve incio com os jogos de cartas, dados e de roleta. Esse o motivo da grande existncia de exemplos de jogos de azar no estudo da probabilidade. A teoria da probabilidade permite que se calcule a chance de ocorrncia de um nmero em um experimento aleatrio. A estatstica surgiu muito antes da probabilidade e tratava principalmente da coleta, organizao e apresentao de dados por meio de tabelas e cartas. Com o advento da probabilidade, foi constatado que a estatstica poderia ser utilizada para extrair concluses vlidas e tomar decises razoveis com base na anlise de dados, como em teoria da amostragem e previses.
Experimento Aleatrio
aquele experimento que quando repetido em iguais condies, podem fornecer resultados diferentes, ou seja, so resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve clculo de experimento aleatrio Exemplos : - Retirar uma carta de um baralho com 52 cartas e observar seu naipe, sua cor ou seu nmero / letra. - Jogar uma moeda 50 vezes e observar o nmero de caras ou coroas obtidas - Retirar com ou sem reposio, bolas de uma caixa que contenha determinadas quantidades de bolas pretas e brancas - Arremessar um dado e observar o nmero da face de cima.
Espao Amostral
o conjunto de todos os resultados possveis de um experimento aleatrio. A letra que representa o espao amostral, S. Exemplo: Lanando uma moeda e um dado, simultaneamente, sendo S o espao amostral, constitudo pelos 12 elementos: S = {K1, K2, K3, K4, K5, K6, R1, R2, R3, R4, R5, R6}
1. Escreva explicitamente os seguintes eventos: A = {caras e um nmero par aparece},
B = {um nmero primo aparece}, C = {coroas e um nmero mpar aparecem}.
2. Idem, o evento em que: a) A ou B ocorrem; b) B e C ocorrem; c) Somente B ocorre.
3. Quais dos eventos A, B e C so mutuamente exclusivos
Resoluo:
-
4
1. Para obter A, escolhemos os elementos de S constitudos de um K e um nmero par: A={K2, K4, K6}; Para obter B, escolhemos os pontos de S constitudos de nmeros primos: B={K2,K3,K5,R2,R3,R5} Para obter C, escolhemos os pontos de S constitudos de um R e um nmero mpar: C={R1,R3,R5}.
2. (a) A ou B = AUB = {K2,K4,K6,K3,K5,R2,R3,R5} (b) B e C = B C = {R3,R5} (c) Escolhemos os elementos de B que no esto em A ou C; B Ac Cc = {K3,K5,R2}
3. A e C so mutuamente exclusivos, porque A C =
Conceito de probabilidade
Se num fenmeno aleatrio as possibilidades so igualmente provveis, ento a probabilidade de ocorrer um evento A :
Por, exemplo, no lanamento de um dado, um nmero par pode ocorrer de 3 maneiras diferentes dentre 6 igualmente provveis, portanto, P = 3/6= 1/2 = 50% Dizemos que um espao amostral S (finito) equiprovvel quando seus eventos elementares tm probabilidades iguais de ocorrncia. Num espao amostral equiprovvel S (finito), a probabilidade de ocorrncia de um evento A sempre:
Propriedades Importantes:
1. Se A e A so eventos complementares, ento:
P( A ) + P( A' ) = 1
2. A probabilidade de um evento sempre um nmero entre (probabilidade de evento impossvel) e 1 (probabilidade do evento certo).
-
5
Probabilidade Condicional
Antes da realizao de um experimento, necessrio que j tenha alguma informao sobre o evento que se deseja observar. Nesse caso, o espao amostral se modifica e o evento tem a sua probabilidade de ocorrncia alterada. Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se ocorrer um sorteio de 2 bolas, uma de cada vez e sem reposio, qual ser a probabilidade de a primeira ser vermelha e a segunda ser azul?
Resoluo:
Seja o espao amostral S=30 bolas, bolinhas e considerarmos os seguintes eventos: A: vermelha na primeira retirada e P(A) = 10/30 B: azul na segunda retirada e P(B) = 20/29 Assim: P(A e B) = P(A).(B/A) = 10/30.20/29 = 20/87
Eventos independentes
Dizemos que E1 e E2 e ...En-1, En so eventos independentes quando a probabilidade de ocorrer um deles no depende do fato de os outros terem ou no terem ocorrido. Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se sortearmos 2 bolas, 1 de cada vez e respondo a sorteada na urna, qual ser a probabilidade de a primeira ser vermelha e a segunda ser azul? Resoluo: Como os eventos so independentes, a probabilidade de sair vermelha na primeira retirada e azul na segunda retirada igual ao produto das probabilidades de cada condio, ou seja, P(A e B) = P(A).P(B). Ora, a probabilidade de sair vermelha na primeira retirada 10/30 e a de sair azul na segunda retirada 20/30. Da, usando a regra do produto, temos: 10/30.20/30=2/9. Observe que na segunda retirada foram consideradas todas as bolas, pois houve reposio. Assim, P(B/A) =P(B), porque o fato de sair bola vermelha na primeira retirada no influenciou a segunda retirada, j que ela foi reposta na urna.
Probabilidade de ocorrer a unio de eventos
Exemplo: Se dois dados, azul e branco, forem lanados, qual a probabilidade de sair 5 no azul e 3 no branco? Considerando os eventos: A: Tirar 5 no dado azul e P(A) = 1/6 B: Tirar 3 no dado branco e P(B) = 1/6 Sendo S o espao amostral de todos os possveis resultados, temos: n(S) = 6.6 = 36 possibilidades. Da, temos:P(A ou B) = 1/6 + 1/6 1/36 = 11/36
Exemplo: Se retirarmos aleatoriamente uma carta de baralho com 52 cartas, qual a probabilidade de ser um 8 ou um Rei? Sendo S o espao amostral de todos os resultados possveis, temos: n(S) = 52 cartas. Considere os eventos: A: sair 8 e P(A) = 4/52
-
6
B: sair um rei e P(B) = 4/52 Assim, P(A ou B) = 4/52 + 4/52 0 = 8/52 = 2/13. Note que P(A e B) = 0, pois uma carta no pode ser 8 e rei ao mesmo tempo. Quando isso ocorre dizemos que os eventos A e B so mutuamente exclusivos.
Porque a estatstica importante? Os mtodos estatsticos so usados hoje em quase todos os campos de investigao cientfica, j que eles nos capacitam a responder a um vasto nmero de questes, tais como: 1) Como os cientistas avaliam a validade de novas teorias?
2) Como os pesquisadores mdicos testam a eficincia de novas drogas?
3) Como os demgrafos prevem o tamanho da populao do mundo em qualquer tempo futuro?
4) Como pode um economista verificar se a mudana atual no ndice de Preos ao Consumidor
a continuao de uma tendncia secular, ou simplesmente um desvio aleatrio?
5) Como possvel para algum predizer o resultado de uma eleio entrevistando apenas
algumas centenas de eleitores?
Estes so poucos exemplos nos quais a aplicao da estatstica necessria. Por isso, a estatstica tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em
contato com dados quantitativos ou tiram concluses a partir destes.
Definio de Estatstica
Estatstica uma parte da Matemtica Aplicada que fornece mtodos para a coleta,
organizao, descrio, anlise e interpretao de dados. Ela dividida em:
Estatstica Descritiva: parte da Estatstica que apenas coleta, descreve, organiza e
apresenta os dados. Nela no so tiradas concluses.
Estatstica Indutiva ou Inferncia: analisa os dados e obtm-se as concluses.
Estatstica Descritiva
Fases do Mtodo Estatstico
Coleta de Dados
Aps a definio do problema a ser estudado e o estabelecimento do planejamento da
pesquisa (forma pela qual os dados sero coletados; cronograma das atividades, custos
envolvidos; exame das informaes disponveis; delineamento da amostra etc.), o passo seguinte
a coleta de dados, que consiste na busca ou compilao dos dados das variveis, componentes
do fenmeno a ser estudado.
A coleta de dados pode ser direta ou indireta.
Coleta de
dados
Crtica dos
dados
Apresentao
dos dados
Tabelas
Grficos
Anlises
-
7
- coleta direta: quando os dados so obtidos na fonte originria. Os valores assim
compilados so chamados de dados primrios, como, por exemplo, nascimentos,
casamentos e bitos, registrados no Cartrio de Registro Civil; opinies obtidas em
pesquisas de opinio pblica; ou ainda, quando os dados so coletados pelo prprio
pesquisador.
A coleta direta pode ser classificada relativamente ao fator tempo em:
contnua quando feita continuamente, como por exemplo, nascimentos e bitos,
freqncia dos alunos s aulas;
peridica quando feita em intervalos constantes de tempo, como os censos (de
10 em 10 anos);
ocasional quando feita sem poca preestabelecida.
- coleta indireta: quando os dados obtidos provm da coleta direta. Os valores assim
compilados so denominados de dados secundrios, como, por exemplo, o clculo do
tempo de vida mdia, obtido pela pesquisa, nas tabelas demogrficas publicadas pela
Fundao Instituto Brasileiro de Geografia e Estatstica, se constitui em uma coleta
indireta.
Crtica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis
falhas e imperfeies, eliminando os erros capazes de provocar futuros enganos de apresentao
e anlise.
Apresentao dos Dados
Aps a crtica, os dados devem ser apresentados sob forma adequada (tabelas ou
grficos), para o melhor entendimento do fenmeno que est sendo estudado.
Caractersticas Importantes dos Dados 1- A natureza ou forma de distribuio dos dados como forma de sino, uniforme ou assimtrica. 2- Um valor representativo como uma mdia 3- Uma medida de disperso ou variao. Podemos conhecer alguma coisa da natureza ou forma da distribuio organizando os dados e construindo grficos. Estatstica Descritiva: Tabelas, Sries Estatsticas e Grficos Estatsticos
Tabelas
Tabela um quadro que resume um conjunto de observaes.
Ela composta de:
- ttulo: conjunto de informaes, as mais completas possveis, respondendo s perguntas: O que?
(referente ao fato), Quando? (relativo ao lugar), Onde? (correspondente poca);
- corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;
- cabealho: parte superior da tabela que especifica o contedo das colunas;
-
8
- rodap: reservado pare as observaes pertinentes, bem como a identificao da fonte dos dados .
Sries Estatsticas
toda tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo
da poca, do local ou da espcie.
Conforme o critrio de agrupamento as sries classificam-se em:
a) Srie Cronolgica, Temporal, Evolutiva ou Histrica: a srie estatstica em que os
dados so observados segundo a poca de ocorrncia. Exemplo:
Vendas da Companhia Alfa - 1990-1994
Ano Vendas (em R$ 1.000,00)
1990 2.181
1991 3.948
1992 5.642
1993 7.550
1994 10.009
Fonte: Departamento de Marketing da Companhia Alfa.
b) Srie Geogrfica ou de Localizao: a srie estatstica em que os dados so
observados segundo a localidade de ocorrncia. Exemplo:
INAMPS - Empresas fiscalizadas em 1998
Regies Empresas fiscalizadas Norte 7.495
Nordeste 107.783
Sudeste 281.207
Sul 53.661
Centro-Oeste 15.776
Fonte: Mensrio Estatstico do IBGE
c) Srie Especfica: a srie estatstica em que os dados so agrupados segundo a
modalidade de ocorrncia. Exemplo:
Matriculas no Ensino de Terceiro Grau
Brasil1995 (ciclo bsico)
reas de ensino Matrculas
Cincias Biolgicas 62.109
Cincias Exatas e Tecnologia 95.949
Cincias Agrrias 32.419
Cincias Humanas 178.842
Letras 39.883
Artes 37.464
-
9
Duas ou mais reas 46.323
Fonte: Servio de Estatstica do Ministrio da Educao e Cultura.
d) Distribuio de Freqncias. a srie estatstica em que os dados so agrupados com suas
respectivas freqncias. Ser vista com mais detalhes a seguir. Exemplo:
Nmero de Acidentes por Dia na Rodovia X em Janeiro de 2003
Nmero de acidentes por dia Nmero de dias
0 10
1 7
2 4
3 5
4 3
5 2
Fonte: DNER.
Grficos Estatsticos A representao grfica das sries estatsticas tem por finalidade dar uma idia, a mais
imediata possvel, dos resultados obtidos, permitindo chegar-se a concluses sobre a evoluo do
fenmeno ou sobre como se relacionam os valores da srie. No h apenas uma maneira de
representar graficamente uma srie estatstica. A escolha do grfico mais apropriado ficar a
critrio do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados
quando da elaborao de um grfico.
Os principais tipos de grficos.
a) Grfico em Colunas
Populao
Grfico em Colunas
Ano
Pop
ula
o d
o B
rasi
l (m
ilhe
s)
0
10
20
30
40
50
60
70
80
90
100
1940 1950 1960 1970
Populao Brasileira
1940 1970
Ano Populao
1940 41 236 315
1950 51 944 397
1960 70 119 071
1970 93 139 037
Fonte: Anurio Estatstico
- 1974 -
-
10
b) Grfico em Barras: semelhante ao grfico em colunas, porm os retngulos so dispostos
horizontalmente. Eis a configurao do mesmo grfico anterior:
Esses dois tipos de grficos so geralmente utilizados para comparar diferentes variveis ou
diferentes valores da mesma varivel.
b) Grficos em Setores: a representao grfica de uma srie estatstica, em um crculo,
por meio de setores. utilizado principalmente quando se pretende comparar cada valor
da srie com o total. Para constru-lo, divide-se o crculo em setores, cujas reas sero
proporcionais aos valores da srie. Essa diviso poder ser obtida pela soluo da regra
de trs.
Total _____ 360 o
Parte _____ x o
Populao
Grfico em Barras
Populao do Brasil (milhes)
Ano
1940
1950
1960
1970
0 10 20 30 40 50 60 70 80 90 100
Grfico em Setores
RECEITA DO MUNICPIO X DE 1996 a 1998 (milhes)
(1996), 90,0
(1998), 150,0
(1997), 120,0
-
11
c) Grfico em Curvas ou Linear: utilizado para representar o crescimento ou o
decrescimento da varivel. Exemplo:
Dicas para a Apresentao dos Dados
Grfico Linear
Anos
VE
ND
AS
0
100
200
300
400
500
1991 1992 1993 1994 1995 1996 1997
Dados
Dados Qualitativos
Dados Quantitativos
Mtodos Tabulares
Mtodos Grficos
Mtodos Tabulares
Mtodos Grficos
Distribuies de freqncias
Grficos de barras e pizza
Distribuies de freqncias
Histograma
Vendas da Companhia
Beta
1991 a 1997
Ano Vendas
R$ 1.000,00)
1991 230
1992 260
1993 380
1994 300
1995 350
1996 400
1997 4500
Fonte: Departamento de Marketing
Companhia Beta
-
12
Tabela de Dados Relaciona TODOS os dados levantados na pesquisa, independentemente de ordem. Tabela de Dados Ordenados (Rol) Relaciona TODOS os dados levantados na pesquisa, ordenados de alguma forma. Tabela de Freqncia Relaciona classes e freqncia do nmero de valores que se enquadram em cada categoria. Amplitude de Amostra ( Amplitude Total) (Range) Diferena entre o maior e o menor valores encontrados na Tabela de dados. Amplitude de Classe Diferena entre os limites superior e inferior de cada classe.
Freqncia Absoluta
o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos pertencentes a uma classe. Freqncia Relativa
totalfreqncia
classe de freqnciaou
totalfreqncia
absoluta
freqnciarelativafreqncia =
As freqncias relativas tambm podem ser apresentadas como porcentagens. Quando calculada corretamente e, a menos dos erros de arredondamento, a soma das freqncias relativas deve ser igual a 1 (ou 100%).
Freqncia Acumulada A freqncia acumulada de uma classe a soma das freqncias daquela classe e de todas as classes que a antecedem.
Freqncia Absoluta Acumulada
a soma da freqncia absoluta do elemento ou da classe com a freqncia absoluta dos
elementos anteriores ou das classes anteriores.
Freqncia Relativa
A freqncia relativa o valor da freqncia absoluta dividido pelo nmero total de
observaes: n
ffr i= .
Freqncia Acumulada Relativa ou Freqncia Relativa Acumulada
A freqncia acumulada relativa o valor da freqncia acumulada dividido pelo nmero total
de observaes: n
ffar ac= .
Anlise dos Resultados
-
13
Realizadas as fases anteriores, faz-se uma anlise dos resultados obtidos, atravs dos mtodos da
Estatstica Indutiva ou Inferncia, e tiram-se as concluses e previses.
Tipos de Variveis
Varivel o conjunto de resultados possveis de um fenmeno. Por exemplo:
- Para o fenmeno sexo so dois os resultados possveis: sexo masculino e sexo feminino;
- Para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs
dos nmeros naturais: 0, 1, 2, 3, ... n;
- Para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um
nmero infinito de valores numricos dentro de um determinado intervalo.
As variveis, desta forma, podem ser:
Variveis quantitativas - referem-se a quantidades e podem ser medidas em uma escala
numrica. Exemplos: idade de pessoas, preo de produtos, peso de recm nascidos. Elas
subdividem-se em dois grupos:
- Variveis quantitativas discretas: so aquelas que assumem apenas determinados
valores tais como 0,1,2,3,4,5,6 dando saltos de descontinuidade entre seus valores.
Normalmente referem-se a contagens. Por exemplo: nmero de ovos produzidos por uma
granja, nmero de pessoas por famlia, quantidade de doentes por hospital.
- Variveis quantitativas contnuas: so aquelas cujos valores assumem uma faixa
contnua e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o
peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o preo de um
produto agrcola, a produo de leite de uma fazenda.
Variveis Qualitativas - refere-se a dados no numricos. Exemplos dessas variveis so o sexo
das pessoas, a cor, o grau de instruo. Elas subdividem-se tambm em dois grupos:
- Variveis qualitativas ordinais: so aquelas que definem um ordenamento ou uma
hierarquia. Exemplos so o grau de instruo, a classificao de um estudante no curso de
estatstica, as posies das 100 empresas mais lucrativas, etc.
- Variveis qualitativas nominais: por sua vez no definem qualquer ordenamento ou
hierarquia. So exemplos destas a cor, o sexo, o local de nascimento, etc.
Populao
o conjunto de elementos a serem observados. Exemplo: alunos de uma escola.
Amostra
uma pequena parte selecionada de uma populao que se pretende estudar. Fazemos uma
amostragem quando:
-
14
- o nmero de elementos da populao muito grande;
- queremos economizar tempo e dinheiro.
Distribuio de Freqncias e Histograma para Dados sem Intervalo de Classe
Utilizamos esse tipo de distribuio quando o nmero de elementos distintos da amostra for
pequeno.
Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25,
25, 26, 26, 26, 28, 30. Construa uma distribuio com todas as freqncias.
X fi fac fr far fr % far %
21 3 3 3/17 3/17
22 2
23 2
24 1
25 4
26 3
28 1
30 1
17 |||||||||||||||||||||| ||||||||||||||||||||||| |||||||||||||||||||||
Histograma
Histograma uma representao grfica de uma tabela de distribuio de freqncias.
Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas) colocamos os valores da
varivel em estudo e no eixo vertical (ordenadas) colocamos os valores das freqncias. O
histograma tanto pode ser representado para as freqncias absolutas como para as freqncias
relativas. No caso do exemplo anterior, o histograma seria:
-
15
Histograma
0
1
2
3
4
5
21 22 23 24 25 26 28 30 Mais
valores
Fre
q
nci
a A
bso
luta
Ogiva
Ogiva uma representao grfica de uma tabela de distribuio de freqncias acumuladas.
No caso exemplo anterior, a ogiva seria:
Ogiva
0
2
4
6
8
10
12
14
16
18
21 22 23 24 25 26 28 30
Valores de x
Fre
qu
enci
as A
cum
ula
das
-
16
Distribuio de Freqncia e Histograma para Dados com Intervalo de Classe
Quando o nmero de elementos distintos da amostra for grande, os dados devem ser
tabulados em intervalos de classes. Para a determinao dessas classes no existe uma regra pr-
estabelecida, sendo necessrio um pouco de tentativa e erro para a soluo mais adequada.
Suponhamos que as safras agrcolas de um determinado produto, em uma determinada regio
sejam dadas pela tabela a seguir:
Ano Safra (1000 t) Ano Safra (1000 t)
1 280 10 365 2 305 11 280 3 320 12 375 4 330 13 380 5 310 14 400 6 340 15 371 7 310 16 390 8 340 17 430 9 369 18 370
Lembrando os passos que devem ser seguidos para a tabulao de freqncias de dados.
- Sempre comear por ordenar os dados. Obter o Rol(Tabela de dados ordenados) antes de
comear a construir as Tabela de Freqncias
- Definir o nmero de classes. O nmero de classes no deve ser muito baixo nem muito alto.
Um nmero de classes pequeno gera amplitudes de classes grandes o que pode causar distores
na visualizao do histograma. Um nmero de classes grande gera amplitude de classes muito
reduzidas. Foram definidas regras prticas para a determinao do nmero de classes, sendo que
este deve variar entre 5 e 20 (5 para um nmero muito reduzido de observaes e 20 para um
nmero muito elevado). Se n representa o nmero de observaes (na amostra ou na populao,
conforme for o caso) o nmero aproximado de classes pode ser calculado por Nmero de
Classes(k), k = n , arredondando os resultados. No caso do exemplo anterior temos n = 18 e
k= 18 4 24= , e podemos adotar um nmero de 5 classes, que ser razovel. Lembrar que o
valor adotado para k deve ser SEMPRE INTEIRO
- Calcular a amplitude das classes(h). A amplitude ser obtida conhecendo-se o nmero de
classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados o resultado da subtrao
valor mximo - valor mnimo da srie de dados. A amplitude de classe ser:k
TA =h
O valor do resultado tambm poder ser arredondado para um nmero inteiro mais adequado.
No nosso exemplo temos: 305
280-430 =h =
-
17
Preparar a tabela de seleo com os limites de cada classe. Na tabela abaixo apresentamos
para os dados do nosso exemplo os limites inferior(Linf) e superior (Lsup) de cada uma das 5 classes
de freqncia.
Classe Limite inferior Limite Superior
1 280 310
2 310 340
3 340 370
4 370 400
5 400 430
Observa-se na tabela acima que o limite superior de cada classe coincide com o limite inferior
da classe seguinte. Prevendo-se que pode ocorrer que o valor de uma observao seja
exatamente igual ao valor do limite de classe deve-se estabelecer um critrio de incluso. Para
evitar esse tipo de dificuldade normalmente se estabelece que o limite superior de cada classe
aberto (e consequentemente, o limite inferior de cada classe fechado), ou seja, cada intervalo
de classe no inclui o valor de seu limite superior, com exceo da ltima classe.
Tabular os dados por classe de freqncia. A partir da listagem de dados seleciona-se para
cada um deles qual a sua classe de freqncia e acumula-se o total de freqncia de cada
classe. De acordo com nosso exemplo, teremos:
Classe fi fac fr far fr % far % 280 |--- 310 3
310 |--- 340 4
340 |--- 370 4
370 |--- 400 5
400 |---| 430 2
Total 18
-
18
Histograma
0
1
2
3
4
5
6
280 - 310 310 - 340 340 - 370 370 - 400 400 - 430classes
Fre
q
nci
a
Polgono de Freqncia
0
1
2
3
4
5
6
280 - 310 310 - 340 340 - 370 370 - 400 400 - 430
classes
Fre
q
nci
a
Estatstica Descritiva: Medidas de Tendncia Central (ou de Posio) As medidas de tendncia central so usadas para indicar um valor que tende a representar
melhor um conjunto de dados. Geralmente localizam-se em torno do meio ou do centro de uma
distribuio, onde a maior parte dos dados tende a se concentrar. As principais medidas de
tendncia central so: mdia, mediana e moda.
Mdia Aritmtica ( X ), ou simplesmente Mdia A mdia definida como a soma das observaes dividida pelo nmero de observaes.
Se tivermos, por exemplo, n valores, temos: n
x
Xi
=
Exemplo: Calcule a mdia da varivel x: 3, 5, 8, 12, 7, 12, 15, 18, 20, 20.
-
19
...............10
.................
10
...................................853==
+++=X
Mdia para Dados Agrupados sem Intervalos de Classe ( X )
A mdia para dados agrupados sem intervalo de classe obtida por:
=i
ii
f
fxX
onde fi a freqncia absoluta
Exemplo: Determinar a mdia da distribuio:
xi fi xifi
2 1
5 4
6 3
8 2
fi = 10 xifi =
Ento: ..................10
...................X ===
i
ii
f
fx
Mdia para Dados Agrupados com Intervalos de Classe ( X ) Para o clculo da mdia para dados agrupados com intervalos de classe, necessrio
calcular o ponto mdio de cada classe. A mdia obtida por:
=i
im
f
fPX
onde: Pm o ponto mdio de cada classe.
O ponto mdio de cada classe definido por:
2supinf
m
LLP
+=
Exemplo: Calcular a mdia da distribuio:
classes fi Pm Pmfi
2 |------ 5 1
5 |------ 8 10
8 |------ 11 6
11 |------ 14 1
14 |------17 2
fi = 20 Pmfi = ........
-
20
Ento: ...........................
................X ===
i
im
f
fP
Mdia Geomtrica (G)
A mdia geomtrica de uma amostra definida como a raiz ensima do produto dos n
valores amostrais.
G = n ( )( )...( )x x xn1 2
Por exemplo, a mdia geomtrica de 5, 9 e 13 :
........... = .......).......)(.(.......)(=G ....
Mdia Harmnica (H)
A mdia harmnica o inverso da mdia aritmtica dos inversos dos valores observados.
Simbolicamente, para uma amostra, temos:
Hx x x
n
x
n
n
x
n=+ + +
= =
11 1 1
1
1
11 2
... ( / )
( / )
Exemplo: A mdia harmnica dos trs valores 2, 5 e 10 :
..................
..........
........................
.........
.......
.......
......
.......
......
................
==++
=
++
=H
Mdia Quadrtica (Q) E a raiz quadrada da mdia dos quadrados dos valores observados
n
x
Q
n
i
i== 1
2
Exemplo: a mdia quadrtica dos trs valores 2 , 5 e 10 :
.....................
........
.......
.....................
......
................. 222===
++=
++=Q
Mdia Ponderada
Tomemos um conjunto de n dados... nxxxx ..,,.........,, 321
-
21
Se, para cada dado ix associarmos respectivamente um peso ip , a mdia ponderada ser dada
por :
=
==n
i
i
n
i
ii
p
px
P
1
1
.
Exemplo : A mdia ponderada dos valores 5, 7, 9, 11sabendo-se que tm, respectivamente,
pesos 2, 3, 3 e 4 : ................................
................
4332
411393725==
+++
+++=
xxxxP
Mediana (Md) A mediana um valor real que separa o rol em duas partes deixando sua esquerda o mesmo
nmero de elementos que a sua direita. Portanto, a mediana um valor que ocupa a posio
central em uma srie. Ela denotada por: Md.
Inicialmente devemos ordenar os elementos, em seguida determinamos o nmero n de elementos.
Se n mpar: a mediana o termo central, aquele que divide o rol em duas partes iguais.
Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.
Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.
A mediana ser o nmero 12, pois ele divide o conjunto em duas partes iguais. Portanto, Md = 12.
Se n par: a mediana ser a mdia aritmtica dos dois termos centrais.
Exemplo: Determinar a mediana da srie: x: 7, 21, 13, 15, 10, 8, 9, 13.
Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.
A mediana ser: Md = 5,112
1310=
+
Moda (Mo)
o valor de maior freqncia em um conjunto de dados. Ela denotada por Mo.
Exemplos: Determinar a moda dos conjuntos de dados:
a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.
O elemento de maior freqncia 5. Portanto, Mo = 5. uma seqncia unimodal, pois s
temos uma moda.
b) X: 6, 10, 5, 6, 10, 2.
Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior freqncia.
Portanto, Mo = 6 e Mo = 10. Por isso chamada de bimodal.
Quando no houver elementos que se destaque pela maior freqncia, dizemos que a
srie amodal.
Exemplo: x: 3, 3, 3, 4, 4, 4.
-
22
No h moda, pois os elementos tm a mesma freqncia.
Utilizao das Medidas de Tendncia Central
Na maioria das situaes, no necessitamos calcular as trs medidas de tendncia central.
Normalmente precisamos de apenas uma das medidas para caracterizar o centro da srie.
A medida ideal em cada caso aquela que melhor representa a maioria dos dados da srie.
Quando houver forte concentrao de dados na rea central da srie, devemos optar pela Mdia.
Quando houver forte concentrao de dados no incio e no final da srie, devemos optar pela
Mediana.
A Moda deve ser a opo como medida de tendncia central apenas em sries que apresentam
um elemento tpico, isto , um valor cuja freqncia muito superior freqncia dos outros
elementos da srie.
Estatstica Descritiva: Medidas de Disperso
As medidas de disperso so medidas que mostram o grau de disperso ou de concentrao em
torno da mdia. As principais medidas de disperso so: varincia, desvio padro e coeficiente de
variao.
Varincia e Desvio Padro para Dados Agrupados sem Intervalos de Classe
A varincia uma mdia aritmtica calculada a partir dos quadrados dos desvios obtidos
entre os elementos da srie e a sua mdia.
O desvio padro a raiz quadrada positiva da varincia.
populao. a para ,
amostra; a para ,
2
2
=
= SS
O desvio-padro de um conjunto de valores amostrais uma medida de variao dos valores em relao mdia.
Frmulas : desvio-padro populacional ( )
=
=
n
i
i
n
xx
1
2
desvio-padro amostral ( )
=
=
n
i
i
n
xxs
1
2
1
Notao s = desvio-padro de um conjunto de dados amostrais = desvio-padro de um conjunto de dados populacionais s = varincia de um conjunto de dados amostrais
2 = varincia de um conjunto de dados populacionais
-
23
OBS : Em artigos de revistas e relatrios profissionais costuma-se indicar o desvio-padro por SD(Standard Deviation) e a varincia por Var.
Maneira de se calcular o desvio-padro
Eemplo : Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao.
xi fi xifi (xi - )2 fi(xi - )
2
2 3
3 5
4 8
5 4
20
Primeiro, calculamos a mdia: ...................
.........===
i
ii
f
fx
Como estamos trabalhando com uma populao a varincia dada por:
........................
..............)(2
2 ==
=
N
xf ii
O desvio padro ser: ............................... ==
Varincia e Desvio Padro para Dados Agrupados com Intervalos de Classe
A varincia para dados agrupados com intervalos de classe dada por:
populao. a para , )(
amostra; a para , 1
)(
22
22
N
Pf
n
XPfS
mi
mi
=
=
O desvio padro dado por:
populao. a para , amostra; a para , 22 == SS
Exemplo: Calcule a varincia e o desvio padro da srie abaixo, representativa de uma populao:
-
24
classes fi Pm Pmfi 2)( mP 2)( mi Pf
2 |------ 5 1 3,5
5 |------ 8 10
8 |------ 11 6
11 |------ 14 2
14 | ------ | 17 1
20
Primeiramente calculamos o ponto mdio de cada classe e em seguida a mdia:
...............
...........===
i
im
f
fP
Como estamos trabalhando com uma populao a varincia dada por:
.................
..............)(2
2 ==
=
N
Pf mi
O desvio padro ser:
......................... ==
Coeficiente de Variao (CV)
uma medida relativa de disperso, til para a comparao em termos relativos do grau
de concentrao em torno da mdia.
100
=mdia
padrodesvioCV
Se: CV 15% Baixa disperso Homognea, estvel, regular.
15% < CV< 30% Mdia disperso.
CV > 30% Alta disperso Heterognea.
Exemplo: Determine o coeficiente de variao para o exemplo anterior:
-
25
.%..........100......
............==CV
Quartis, Decis e Percentis(ou Centis)
Assim como a mediana divide os dados em duas partes iguais, os trs quartis,
denotados por 321Q e ,QQ
, dividem as observaes ordenadas(dispostas em ordem crescente) em quatro partes iguais.
Grosso modo, 1Q separa os 25% inferiores dos 75% superiores dos valores ordenados ; 2Q a
mediana e 3Q
separa os 75% inferiores dos 25% superiores dos dados. Mais precisamente, ao
menos 25% dos dados sero no mximo iguais a 1Q e, ao menos 75% dos dados sero no mnimo
iguais a 1Q . Da mesma forma, 75% dos dados sero no mximo iguais a 3Q
, enquanto ao menos 25%
sero, no mnimo, iguais a 3Q
.
Analogamente h nove decis, denotados por 9321,.......,,, DDDD
, que dividem os dados em 10 grupos com cerca de 10% deles em cada grupo. H, finalmente, 99 percentis(ou centis), que dividem os dados em 100 grupos com cerca de 1% em cada grupo. Os quartis, decis e percentis(centis) so exemplos de fractis, que dividem os dados em partes aproximadamente iguais. Exemplo : Um estudante que se submeteu ao vestibular para ingresso em uma faculdade informado que est no 92 percentil. Isso no significa, entretanto, que ele tenha obtido 92% no exame; indica apenas que, qualquer que tenha sido a nota obtida, ela foi superior a 92%(e inferior a 8%) das notas de toda a turma. O 92 percentil , portanto, uma excelente classificao em relao aos outros que fizeram o exame.
O processo de determinao do percentil kP , correspondente a um determinado valor x
bastante simples, como pode ser visto na expresso seguinte :
100 valoresde totalnmero
x a inferiores valoresde nmerok valor xdo percentil do ndice ==
nk
n
Lxk .
100Lou
100
==
Onde L = nmero de valores inferiores a x ( O endereo do percentil na tabela) k = ndice do percentil kP
n = nmero total de valores ( nmero de elementos da tabela) Fluxograma para determinao do k-simo percentil
-
26
Exemplo : Determine o 40 percentil ( 40P
) dos valores da tabela de dados ordenados abaixo :
TABELA DE DADOS ORDENADOS (Rol)
01 200 201 204 204 206 206 208 02 208 209 215 217 218 220 223 03 225 228 230 234 236 241 242 04 242 248 250 251 251 252 252 05 254 256 256 256 257 257 258 06 259 259 260 261 262 262 262 07 262 262 263 263 263 263 263 08 263 264 265 265 265 266 267 09 267 268 268 268 268 268 268 10 268 268 268 269 269 269 269 11 270 270 270 270 270 270 270
Ordenar os dados, do menor para o maior.
Calcular L = (k/100).n , n = nmero de valores k = percentil desejado
L um nmero inteiro?
O valor do k-simo percentil est a meio caminho entre o L-simo valor e o prximo valor mais alto no conjunto
original de dados. Obtm-se kP ,
somando-se o L-simo valor ao prximo valor mais alto e dividindo-se o resultado por 2.
Sim
Modificar L, arredondando seu valor para o maior inteiro mais prximo
O valor de kP o L-simo valor a
contar do mais baixo
No
Incio
-
27
12 270 271 271 272 272 272 272 13 272 273 273 273 273 273 273 14 274 274 274 274 275 275 275 15 275 276 276 276 276 276 277 16 277 277 277 277 277 277 277 17 278 278 278 278 278 278 278 18 279 279 279 280 280 280 281 19 281 281 281 281 282 282 282 20 282 282 282 282 283 283 283 21 283 283 284 284 284 284 285 22 285 285 286 286 286 286 287 23 287 288 289 289 289 289 289 24 290 290 290 291 291 292 292 25 292 293 293 294 295 295 297
Soluo : Acompanhando o fluxograma, calculamos : 70175
100
40
100=
=
= n
kL
Sendo 70 um nmero inteiro , segundo o fluxograma, 40P
est a meio caminho entre o 70 e o 71 valores. E como esses valores so, respectivamente, 269 e 270, conclumos que o 40 percentil (269 + 270) / 2 = 269,5. Exemplo 2 : Determine o 71 Percentil.
Soluo : 25,124175100
71
100=
=
= n
kL (valor no inteiro).
Neste caso, simplesmente se arredonda para o nmero inteiro superior mais prximo, ou seja, L = 125. E, assim, o nmero que est no espao 125 o 280 e, portanto, 28071 =P Treino : Determine todos os Quartis Determine todos os Decis pares Descubra qual o Percentil dos dados : 208, 252, 278, 287 e 294
Escores z
Quase todos ns estamos familiarizados com a sigla QI(coeficiente de inteligncia) e reconhecemos que um QI de 102 bastante comum enquanto um QI de 170 raro. Esse QI de 102 bastante comum porque est prximo da mdia de 100, mas o QI de 170 raro porque est bem acima de 100. Esta circunstncia pode sugerir uma diferena entre os valores tpicos e os valores raros, com base em sua
diferena em relao mdia ( )xx . Mas o tamanho dessa diferena depende da escala que estamos utilizando. Com os valores de QI, uma diferena de 2 pontos insignificante mas, para mdias de notas de uma faculdade, uma diferena de 2 pontos, entre 2,00 e 4,00, altamente significativa. Seria muito melhor se dispusssemos de um padro que no levasse em conta a escala utilizada. Com
o valor, ou escore padronizado, dividimos a diferena ( ) ( )-xou xx pelo desvio-padro para chegarmos a esse resultado. DEFINIO : O escore padronizado, ou escore z , o nmero de desvios-padro pelo qual um valor x dista da mdia (para mais ou para menos) . Obtm-se como se segue : Amostra Populao
-
28
s
xxz
=
=
xz
NOTA : Arredondar z para duas casas decimais
Exemplo : As alturas da populao de homens adultos tm mdia 75,1= m, desvio-padro 07,0= m e distribuio em forma de sino. Um jogador de basquete com 1,98 m pode ser
considerado excepcionalmente alto, comparado com a populao geral de homens adultos ? Determine o escore z para a altura de 1,98 m. Soluo : Como estamos lidando com parmetros populacionais, o escore z se calcula como segue :
29,307,0
75,198,1=
=
=
xz .
Podemos interpretar este resultado dizendo que a altura do jogador de basquete est 3,29 desvios- padro acima da mdia. A importncia dos escores z na estatstica reside no fato de que eles permitem distinguir entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estejam entre 2,00 e 2,00 e incomuns os valores com escore z inferior a 2,00 ou superior a 2,00 . Assim, a altura do jogador de basquete do exerccio anterior corresponde a um escore z de 3,29, que consideramos incomum por ser superior a 2,00. Em comparao com a populao geral, o jogador pode ser considerado, excepcionalmente alto. Fig 01 - Interpretao do escore z
Testes de Hipteses e Significncia
Decises Estatsticas
Quando somos levados a tomar decises com base em informaes sobre amostras elas so chamadas de decises estatsticas. Hipteses Estatsticas e Hipteses Nulas. Na tentativa de se chegar a decises, conveniente fazer suposies ou conjeturas sobre as populaes envolvidas. Estas suposies, que podem ser verdadeiras ou no, so chamadas de hipteses estatsticas e, em geral, so afirmaes sobre as distribuies de probabilidade das populaes. Por exemplo : a) Se queremos decidir se uma moeda viciada, formulamos a hiptese de que a moeda honesta, ou seja, p=0,5 onde p a probabilidade de dar cara no lanamento da moeda. b) Se queremos decidir se um procedimento melhor do que outro, formulamos a hiptese de que no h diferena entre os procedimentos( i.e., quaisquer diferenas observadas so meramente devido a flutuaes na amostragem de uma mesma populao). Tais hipteses, muitas vezes chamadas de hipteses nulas ou simplesmente hipteses, so
Valores Incomuns Valores usuais
Valores Incomuns
-3 -2 -1 0 1 2 3
-
29
denotadas 0H .
Quaisquer outras hipteses que difiram de uma dada hiptese nula so chamadas de hipteses alternativas e so denotadas por 1H . Por exemplo : Se a hiptese nula p = 0,5, hipteses alternativas podem ser
5,0 , 5,0 , 7,0 >= ppp .
Testes de Hipteses e Significncia
Se, sob a suposio de uma hiptese particular ser verdadeira, concluirmos que os resultados observados em uma amostra aleatria diferem muito daqueles esperados, diramos que as diferenas observadas so significantes e estaramos inclinados a rejeitar a hiptese. Por exemplo : Se 20 lanamentos de uma moeda do 16 caras, estaramos inclinados a rejeitar a hiptese de que a moeda honesta, apesar de admitirmos que podemos estar equivocados. Os procedimentos que nos capacitam a decidir se aceitamos ou rejeitamos uma hiptese ou a determinar se a amostra observada difere significativamente dos resultados esperados so chamados de testes de hipteses, testes de significncia ou regras de deciso.
Erros do Tipo I e Do Tipo II
Se rejeitamos uma hiptese quando ela de fato verdadeira, dizemos que foi cometido um erro do Tipo I . Se aceitamos uma hiptese quando ela deveria ser rejeitada, dizemos que foi cometido um erro do Tipo II . Em ambos os casos ocorreu uma deciso errada ou um erro no julgamento. Para que um Teste de hipteses (ou uma regra de deciso) seja bom, precisa ser construdo de modo a minimizar erros de deciso. Este no um problema simples pois, em geral, para um dado tamanho de amostra, a tentativa de diminuir um tipo de erro acompanhada por um aumento no outro tipo de erro. Na prtica, um tipo de erro pode ser mais srio do que o outro e ento deveria ser assumido um compromisso em favor de uma limitao no erro mais srio. A nica maneira de reduzir ambos os tipos de erros, aumentar o tamanho da amostra, o que nem sempre possvel.
Nvel de Significncia
Ao testar uma dada hiptese, a probabilidade mxima com a qual queremos arriscar cometer erro do Tipo I chamada de nvel de significncia do teste. Esta probabilidade em geral especificada antes de qualquer amostra ser extrada para que os resultados obtidos no venham a influenciar nossa deciso. Na prtica so usuais nveis de significncia de 0,05 ou 0,01 , apesar de outros valores tambm serem usados. Se, por exemplo, um nvel de significncia de 0,05 (ou 5%) for escolhido na construo de um teste de hipteses, ento h em torno de 5 chances em 100, da hiptese ser rejeitada quando ela deveria ter sido aceita, isto , sempre que a hiptese nula for verdadeira, estaremos em torno de 95% confiantes de que tomamos a deciso correta. Em tais ocasies dizemos que a hiptese foi rejeitada ao nvel de significncia de 0,05, o que significa que podemos estar errados com probabilidade de 5%.
-
30
Testes envolvendo a Distribuio Normal Para ilustrar as idias recm apresentadas, suponhamos que sob uma dada hiptese, a distribuio amostral de uma estatstica S uma distribuio normal com mdia s e desvio-
padro s . Alm disso, suponhamos que decidimos rejeitar a hiptese de S se for muito pequena
ou muito grande. A distribuio da varivel padronizada ( )
s
sSZ
= a distribuio normal
padro (mdia 0, varincia 1) mostrada na figura abaixo e valores extremos de Z nos levariam rejeio da hiptese. z = - 1,96 z = 1,96 Como est indicado na figura, podemos estar 95% confiantes de que, se a hiptese for verdadeira, o escore z de uma estatstica amostral verdadeira S estar entre 1,96 e 1,96 (pois a rea sob a curva normal entre estes valores 0,95). Entretanto, se ao escolher uma nica amostra aleatoriamente encontramos o escore z desta estatstica fora do intervalo de 1,96 a 1,96, concluiramos que tal evento aconteceria somente com probabilidade de 0,05(rea sombreada total na figura) se a hiptese fosse verdadeira. Diramos ento que este escore z difere significativamente do que seria esperado sob a hiptese e estaramos inclinados a rejeitar a hiptese. A rea 0,05 da regio sombreada total o nvel de significncia do teste. Este nvel representa a probabilidade de estarmos errados em rejeitar a hiptese, isto , a probabilidade de cometer o erro do Tipo I. Portanto dizemos que uma hiptese rejeitada ao nvel de significncia de 0,05 ou que o escore z de uma dada estatstica amostral significante ao nvel de significncia de 0,05. O conjunto de escores z fora do intervalo de 1,96 a 1,96 constitui o que chamado de regio crtica ou regio de rejeio da hiptese ou regio de significncia. O conjunto dos escores z dentro do intervalo de 1,96 a 1,96 pode ser chamado de regio de aceitao da hiptese ou regio de no-significncia. Com base nestas observaes podemos formular as seguintes regras de deciso : a) Rejeito a hiptese ao nvel de significncia de 0,05 se o escore z da estatstica S
estiver fora do intervalo de 1,96 a 1,96 (isto , z > 1,96 ou z < -1,96 ). Isto equivale dizer que a estatstica amostral observada significante ao nvel de 0,05.
b) Aceito a hiptese( ou, se desejado, no tomo qualquer deciso) em caso contrrio.
IMPORTANTE : Deve-se destacar que outros nveis de significncia poderiam ter sido usados. Por exemplo : se um nvel de 0,01 fosse usado, substituiramos 1,96 por 2,58 em todos os lugares acima. Vide as Tabelas abaixo. Clculo do Desvio-Padro A mdia pode ser encontrada fazendo-se np=
0,025 0,95
Regio crtica Regio
crtica 0,025
-
31
O desvio-padro pode ser encontrado aplicando-se a frmula qpn ..= onde : n = quantidade de dados utilizados na pesquisa p = probabilidade de sucesso do evento analisado q = probabilidade de fracasso do evento analisado Observe-se que, SEMPRE, p + q = 1 Exemplos : Moedas.... p = 0,5 = q = 0,5 = Dados ..... p = 1/6 q = 5/6 Tabelas de valores crticos de Escore Z Nvel de Confiana
99,73 % 99 % 98 % 96 % 95,45 % 95 % 90 % 80 % 68,27 % 50 %
Valores
crticos cz 3,00 2,58 2,33 2,05 2,00 1,96 1,645 1,28 1,00 0,6745
Nvel de significncia
0,10 0,05 0,01 0,005 0,002
Valores crticos de z para testes unilaterais
-1,28 ou
1,28
-1,645 ou
1,645
-2,33 ou
2,33
-2,58 ou
2,58
-2,88 ou
2,88 Valores crticos de z para testes bilaterais
-1,645 e
1,645
-1,96 e
1,96
-2,58 e
2,58
-2,81 e
2,81
-3,08 e
3,08
Teste do Qui Quadrado Este teste objetiva verificar se a freqncia absoluta observada de uma varivel
significativamente diferente da distribuio de freqncia absoluta esperada. Aplica-se o teste do
qui quadrado para uma amostra quando se quer estudar a dependncia entre duas variveis
atravs de uma tabela de dupla entrada, tambm conhecida como tabela de contingncia.
Para que se possa executar o teste do qui quadrado h de se observar algumas condies como :
a) Exclusivamente para variveis nominais e ordinais b) Somente para observaes independentes
c) No se aplica se 20% das observaes forem inferiores a 5.(Amostras muito
pequenas)
d) No pode haver freqncias inferiores a 1
-
32
e) Nos dois ltimos casos, caso haja incidncia, aconselha-se agrupar os dados segundo algum critrio especfico.
Passo-a-Passo para a Execuo do Teste Qui Quadrado Passo 01 : Determinar a hiptese nula 0H que dever ser a negativa da existncia de diferenas
entre a distribuio de freqncia observada e a esperada. Passo 02 : Estabelecer o nvel de significncia ( ) Passo 03 : Determinar a regio de rejeio da hiptese nula 0H atravs da determinao dos
graus de liberdade ( ) sendo 1= k onde k o nmero de classes(categorias). A determinao feita atravs da tabela de contingncia onde se localiza o valor do qui quadrado
tabelado ( )2tx .
Passo 04 : Determinar o valor do qui quadrado calculado ( )2cx atravs da frmula : ( )
=i
ii
ce
eox
22
Passo 05 : Comparar os valores do qui quadrado tabelado ( )2tx e do qui quadrado calculado ( )2cx . Sendo o valor do segundo maior do que o primeiro, isto , ( )2cx > ( )2tx , rejeita-se a hiptese nula 0H em favor da hiptese alternativa 1H .
Exemplo : Um vendedor trabalhou comercializando um produto em cinco bairros residenciais de uma mesma cidade, num mesmo perodo do ano. O gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as diferenas eram significativas entre os bairros trabalhados. A partir deste estudo o gerente pretendia elaborar uma estratgia comercial especfica para cada bairro ou manter uma mesma estratgia para todos.
Bairro 1 2 3 4 5 Total Valores
Observados
9
11
25
20
15
80
Valores Esperados
16
16
16
16
16
80
Soluo :
Passo 01 : A hiptese nula 0H ser : No h diferenas significativas entre os 5 bairros
estudados e, assim, uma hiptese alternativa 1H poder ser As diferenas observadas entre os bairros mais discrepantes ( 3 e 4) so significativamente diferentes para melhor em relao aos demais bairros
-
33
Passo 02 : Nvel de significncia escolhido %505,0 ==
Passo 03 : Sendo k = 5 ( nmero de bairros estudados, classes, categorias), teremos
4151 === k e a tabela de contingncia nos oferece ( )2tx =9,488 9,49
Passo 04 :
( ) ( ) ( ) ( ) ( ) ( )[ ]
( ) ( ) ( )...........
........
.........
........
.........................
..........
.........................
...........
..................................................
22222
222222
==++++
=++++
=
=++++
=cx
Passo 05 : Observa-se que, de fato, ( )2cx > ( )2tx pois 10,75 > 9,49 e, assim, rejeita-se 0H em
favor de 1H . Desta forma a concluso final a de que h diferena significativa, ao nvel de 5%
de significncia para os bairros 3 e 4 e o gerente dever mesmo elaborar uma estratgia comercial
para cada bairro.
Teste do Qui Quadrado para Independncia (Duas Amostras) A utilizao do presente teste em pesquisa visa verificar se as distribuies de duas ou mais amostras no relacionadas diferem significativamente em relao determinada varivel. CONDIES PARA A EXECUO DO TESTE
a)Exclusivamente para variveis nominais e ordinais; b)Preferencialmente para amostras grandes, n
-
34
sendo = (L 1) (C 1), onde L = nmeros de linhas da tabela e C = ao nmero de colunas.. Encontrar portanto, o valor do qui-quadrado tabelado; Passo 04 : Para encontrar o valor esperado (E), utilizar a frmula a seguir:
( )( )
sobservae das Total
i coluna i linha da daSomaSomaE =
Passo 05 : Sendo o qui quadrado calculado, maior do que o tabelado, rejeita-se H0 em favor de H1. H dependncia ou as variveis no esto associadas. Exemplo: Um pesquisador deseja identificar se h dependncia no consumo de seus chocolates e as cidades de sua regio. Cidades do Vale do Taquari Sabor do chocolate Lajeado Santa Cruz Estrela Taquari Chocolate com caju 60 30 20 40 150 Chocolate com amendoim 45 35 20 10 110 Chocolate com flocos 55 25 47 13 140 Chocolate com passas 70 35 25 20 150 230 125 112 83 550 Passo 01 : H0: A preferncia pelos sabores independe da cidade H1: A preferncia pelos sabores depende da cidade. Passo 02 : = 0,05 = 5% Passo 03 : = (4 1) (4 1) = 9, onde qui quadrado tabelado igual a 16,919.(Vide Tabela A-4) Passo 04 : Calculo dos valores esperados (E)
Cidades do Vale do Taquari
Sabor do chocolate Lajeado Santa Cruz Estrela Taquari Chocolate com caju 62,7 Chocolate com amendoim 46,0 Chocolate com flocos 58,5 Chocolate com passas 62,7 Passo 05 : -qui quadrado para a linha Chocolate com caju
( ) ( ) ( ) ( )
....................
............
.........
............
.........
............
.........
............ 22222 =
+
+
+
=X
- qui quadrado para a linha Chocolate com amendoim
( ) ( ) ( ) ( )
...................
............
.........
............
........
...........
........
........... 22222 =
+
+
+
=X
-
35
- qui quadrado para a linha Chocolate com flocos
( ) ( ) ( ) ( )
.................
............
.........
...........
.........
............
.........
............ 22222 =
+
+
+
=X
-qui quadrado para a linha Chocolate com passas
( ) ( ) ( ) ( )
....................
............
.........
............
.........
............
.........
............ 22222 =
+
+
+
=X
-qui quadrado total calculado = ............. + ............. + ............. + ............. = ................ Conclui-se que o qui quadrado calculado (..............) maior do que o tabelado (.............) e, assim, rejeita-se H0 em favor de H1. CONCLUSO : Portanto ............... diferena significativa, ao nvel de 0,05 ou (5%), entre as cidades.
Correlao
Existe uma correlao entre duas variveis quando uma delas est, de alguma forma, relacionada com a outra. O coeficiente de correlao linear r mede o grau de relacionamento linear entre os valores emparelhados x e y em uma amostra. O coeficiente de correlao linear chamado s vezes de coeficiente momento-produto de Pearson.
TABELA PARA CLCULO DE r
x y x.y X Y - - - - - - - - - - - - - - -
x y yx. 2x 2y
Frmula para clculo de r ( )( )
[ ( ) ( ) ] [ ( ) ( ) ]2222 yn
=
yxxn
yxxynr
-
36
Deveremos arredondar o coeficiente de correlao linear r para trs casas decimais, a fim de que seu valor possa ser comparado com os valores crticos da Tabela de Valores Crticos do Coeficiente de Correlao r de Pearson, encontrada na maioria dos livros de Estatstica.
Interpretao do Coeficiente de Correlao Linear
Se o valor de r est prximo de 0, conclumos que no h correlao linear significativa entre x e y, mas se r est prximo de 1 ou +1, conclumos pela existncia de correlao linear significativa entre x e y . Como a interpretao da expresso prximo de 0, ou 1, ou +1 vaga, adota-se o critrio de deciso seguinte, bastante especfico : Se o mdulo do valor calculado de r excede o valor na Tabela A-6,
conclumos que h correlao linear significativa. Em caso contrrio, no h evidncia suficiente para apoiar a existncia de uma correlao linear significativa.
Regresso Linear
A expresso xbby 10 += chamada de : Equao da Regresso ou, Reta de Regresso ou, Regra de melhor ajuste ou, Reta de mnimos quadrados Onde x = varivel independente ou varivel preditora y = varivel dependente ou varivel resposta 0b = intercepto y
1b = coeficiente angular OBS : 1)- Os valores 10 e bb so estatsticas amostrais usadas para estimar os parmetros
populacionais 10 e . 2)- A Equao da Regresso s poder ser usada para relaes lineares 3)- A Equao da regresso s poder ser usada para variveis aleatrias de distribuio normal(em forma de sino) Objetivo O objetivo utilizar dados amostrais emparelhados para estimar a equao de regresso. Dispondo apenas de dados amostrais, no poderemos achar os valores exatos dos parmetros populacionais 10 e mas, com os dados amostrais, podemos estim-los com 1 0 beb , que se obtm com as frmulas : Regras de Arredondamento :
1) - De modo geral, para arredondar, utilize um decimal a mais do que os que aparecem nos dados originais. 2) - Arredondar apenas a resposta final e no os valores intermedirios. Exemplos : 1)- A mdia de (2), (3) e (5) 3,33333333............. , que pode ser
-
37
( )( ) ( )( )( ) ( )22
2
0
=
xxn
xyxxyb
( ) ( )( )( ) ( )221
=
xxn
yxxynb
TABELA DE DISTRIBUIO QUI QUADRADO (x) rea direita do valor crtico
Graus de
liberdade
0,995
0,99
0,975
0,95
0,90
0,10
0,05
0,025
0,01
0,005
1 ---- ---- 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879 2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597 3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838 4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860 5 0,412 0,554 0,831 1,145 1,610 9,236 11,071 12,833 15,086 16,750 6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548 7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,578 8 1,344 1,646 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955 9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188 11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757 12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,299 13 3,565 4,107 5,009 5,892 7,042 19,812 22,362 24,736 27,688 29,819 14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319 15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801 16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267 17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718 18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156 19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582 20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997 21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401 22 8,643 9,542 10,982 12,338 14,042 30,813 33,924 36,781 40,289 42,796 23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181 24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,559 25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928 26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290 27 11,808 12,879 14,573 16,151 18,114 36,741 40,113 43,194 46,963 49,645 28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,993
-
38
29 13,121 14,257 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,336 30 13,787 14,954 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672 40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766 50 27,991 29,707 32,357 34,764 37,689 63,167 67,505 71,420 76,154 79,490 60 35,534 37,485 40,482 43,188 46,459 74,397 79,082 83,298 88,379 91,952 70 43,275 45,442 48,758 51,739 55,329 85,527 90,531 95,023 100,425 104,215 80 51,172 53,540 57,153 60,391 64,278 96,578 101,879 106,629 112,329 116,321 90 59,196 61,754 65,647 69,126 73,291 107,565 113,145 118,136 124,116 128,299 100 67,328 70,065 74,222 77,929 82,358 118,498 124,342 129,561 135,807 140,169
De Donald B. Owen, Hanbook of Statistical Tables, @ 1962 Addison-Wesley Publishing Co. , Reading, MA
TABELA Valores Crticos do Coeficiente de
Correlao r de Pearson n 05,0= 01,0= 4 0,950 0,999 5 0,878 0,959 6 0,811 0,917 7 0,754 0,875 8 0,707 0,834 9 0,666 0,798
10 0,632 0,765 11 0,602 0,735 12 0,576 0,708 13 0,553 0,684 14 0,532 0,661 15 0,514 0,641 16 0,497 0,623 17 0,482 0,606 18 0,468 0,590 19 0,456 0,575 20 0,444 0,561 25 0,396 0,505 30 0,361 0,463 35 0,335 0,430 40 0,312 0,402 45 0,294 0,378 50 0,279 0,361 60 0,254 0,330 70 0,236 0,305 80 0,220 0,286
-
39
90 0,207 0,269 100 0,196 0,256
NOTA : Para testar Ho : p = 0 contra H1 : 0p , rejeite Ho se o valor absoluto de r for maior do que o valor crtico da tabela (a) Correlao positiva entre x e y (b) (c) (d) Correlao negativa entre x e y (e)
* ** * * * * ** * ** ** *** * ** * * * * * **** * * * * * ** ****** * * * * **
*** *** *** **** *** **** *** *** **** *** **** ** *
y
x
y
x
* * * * * * * * * * * *
Correlao positiva
perfeita entre x e y
Forte Correlao
positiva entre x e
* ** * * * * * * * * * ** ** ** * * ** *** * * * ** *** * * ** * ** * * **
* *** ** *** ** ** *** ** *** * ***
Forte Correlao negativa entre x e y
* * * * * * * * * * *
(f) Correlao negativa perfeita entre x e y
y
x
-
40
(g) No h correlao entre x e y
Exerccios sobre Sries e Grficos
1. Montar uma srie cronolgica para representar os valores das exportaes de acar, fornecidas pelo Instituto do Acar e do lcool nos anos de 1965 a 1971 em milhares de dlares: 60193 80114 812826 106879 112064 126740 149548.
2. Idealizar uma srie geogrfica para representar o seguinte fato: populao da regio Norte
do Brasil em 1970, sabendo-se que em Rondnia, Acre, Amazonas, Roraima, Par e Amap temos, respectivamente, 116620 218006 960934 41638 2197072 e 116480 habitantes, segundo dados da Fundao IBGE.
3. Fazer uma tabela estatstica para representar o movimento religioso de certo municpio no
perodo 1975-1977, que apresentou os seguintes dados: em 1975 houve 56738 habitantes batizados (dos quais 26914 do sexo feminino), 15884 casamentos e 13678 extremas-unes. Em 1976, houve 33915 batizados do sexo masculino e 29568 do sexo feminino; os casamentos foram em nmero de 17032 e as extremas-unes, 14328. Em 1977, em um total de 71232 batizados, 34127 eram do sexo masculino; as extremas-unes foram 16107 e os casamentos 16774.
4. A tabela a seguir mostra as reas, em milhes de km, dos oceanos. Representar
graficamente os dados, usando: a) um grfico de colunas ; b) um grfico de setores.
Oceano Antrtico rtico Atlntico ndico Pacfico
* * * * * *
* * * * * * * * * * * *
* *** *** *** *** * * * ** ** ** * *
(h) Correlao no linear entre x e y
* ** * * * * *
y
x
(i) Grfico da Equao de Regresso entre x e y
-
41
rea (milhes km)
36,8 23,2 199,4 137,9 342,7
Exerccio de Estatstica Completar as Tabelas de Distribuio de Freqncias abaixo.
iX aF aFa rF aFr
21 3 22 2 23 2 24 1 25 4 26 3 28 1 30 1 31 3 32 1 33 3 34 3 35 2 36 1
||||||||||||||||||||||||||| ||||||||||||||||||||||||||||
Classe aF aFa rF aFr
45 |--- 55 15 55 |--- 65 20 65 |--- 75 35
-
42
75 |--- 85 20 85 |--- 95 10
||||||||||||||||||||||| |||||||||||||||||||||||
EXERCCIO DE ESTATSTICA - Mdias
Um levantamento feito nas idades dos atletas participantes de um determinado torneio de futebol produziu a tabela abaixo. 21 22 21 20 23 23 23 19 30 25 23 25 23 34 32 23 24 26 23 21 32 35 21 21 20 21 24 25 23 24 26 27 28 23 25 24 42 28 28 29 22 17 21 21 21 21 22 22 24 23 28 29 29 30 23 21 26 26 27 28 29 32 31 29 18 17 30 31 24 24 40 19 20 21 23 26 23 22 28 19 23 32 22 23 22 21 20 26 27 29 22 21 22 18 22 33 21 18 31 30 19 23 24 25 26 21 21 19 23 34 23 24 19 18 30 30 18 19 27 21 21 21 22 21 28 25 21 22 21 23 25 18 28 20 23 20 23 23 23 27 19 20 17 25 26 40 29 19 24 20 23 22 21 24 16 21 27 27 28 24 30 20 25 21 24 22 20 28 21 20 34 23 30 25 30 23 28 27 25 22 17 29 20 22 23 21 27 26 29 24 26 24 25 25 34 28 Pede-se : Calcular a mdia de idade dos jogadores utilizando-se uma Tabela de Freqncias com intervalo de Classes em uma das seguintes situaes :
1) Descartando a menor idade encontrada 2) Descartando a maior idade encontrada 3) Descartando a maior e a menor idade encontradas 4) Considerando todas as idades encontradas
-
43
Utilizar K = K / Situao 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
EXERCCIOS SOBRE VARINCIA E DESVIO PADRO
1 A tabela abaixo representa os dados coletados de uma amostra.
20 26 26 22 26 29 27 26 21 29 23 27 30 28 28 23 25 28 21 28 29 20 27 29 25 29 20 23 25 20 29 20 27 28 22 26 28 23 20 23 27 24 25 26 25 25 20 25 28 25 29 25 27 30 29 27 28 26 28 30
1- a Qual a Amplitude desta amostra? 1- b Qual o valor da Mediana? 1- c Qual a sua Moda? 1- d Calcule a Mdia da terceira coluna. 1- e Calcule a Mdia Geomtrica da quarta coluna 1- f Calcule a Mdia Harmnica da sexta coluna 1- g Calcule a Mdia Quadrtica da ltima coluna 1- h Qual a Varincia da amostra? 1 - i Qual o Desvio Padro da amostra? 1- j Qual o Coeficiente de Variao da amostra?
2 A tabela abaixo representa o Rol de uma Populao.
200 201 204 204 206 206 208 208 208 208 208 209 215 217 218 220 223 224 225 225 225 228 230 234 236 241 242 242 242 242 242 248 250 251 251 252 252 253 254 254 254 256 256 256 257 257 258 259 259 259 259 259 260 261 262 262 262 262 262 262 262 262 263 263 263 263 263 263 263 263 263 264 265 265 265 266 267 267 267 267 267 268 268 268 268 268 268 268 268 268 268 268 268 269 269 269 269 269 269 269 269 270 270 270 270 270 270 270 270 270 270 271 271 272 272 272 272 272 272 272
-
44
272 273 273 273 273 273 273 273 274 274 274 274 274 274 275 275 275 275 275 275 275 276 276 276 276 276 277 277 277 277 277 277 277 277 277 277 277 277 278 278 278 278 278 278 278 278 278 279 279 279 279 279 279 280 280 280 281 281 281 282 282 283 283 284 284 284 285 285 286 286 286 286 287 287 288 288 288 289 289 290
2 a Transforme este Rol numa Tabela com dados agrupados com Intervalos de classe 2 b Calcule a Varincia desta Populao 2 c Calcule o Desvio-Padro desta Populao 2 d Calcule o Coeficiente de Variao (CV ) desta pesquisa.
Exerccios sobre FRACTIS
200 201 204 204 206 206 208 208 208 208 208 208 209 215 217 218 220 223 224 225 225 225 225 228 230 234 236 241 242 242 242 242 242 242 248 250 251 251 252 252 253 254 254 254 254 256 256 256 257 257 258 259 259 259 259 259 259 260 261 262 262 262 262 262 262 262 262 262 263 263 263 263 263 263 263 263 263 263 264 265 265 265 266 267 267 267 267 267 267 268 268 268 268 268 268 268 268 268 268 268 268 268 269 269 269 269 269 269 269 269 269 270 270 270 270 270 270 270 270 270 270 270 271 271 272 272 272 272 272 272 272 272 272 273 273 273 273 273 273 273 274 274 274 274 274 274 274 275 275 275 275 275 275 275 275 276 276 276 276 276 277 277 277 277 277 277 277 277 277 277 277 277 277 278 278 278 278 278 278 278 278 278 278 279 279 279 279 279 279 279 280 280 280 280 280 281 281 281 281 281 281 281 282 282 282 282 282 282 282 282 282 282 282 283 283 283 283 283 283 283 283 283 284 284 284 284 285 285 285 285 285 285 285 286 286 286 286 287 287 287 287 287 287 288 289 289 289 289 289 289 290 290 290 290 290 290 291 291 292 292 292 292 292 292 292 293 293 294 295 295 297 297 297 300 300
Com base na Tabela de Dados Ordenados(Rol) Acima, pede-se:
-
45
a) Os Percentis 774837 P , P , P
b) Os Quartis 321 Q , Q , Q
c) Os Decis 753 D , D , D d) Determine o Percentil correspondente a 252 , 279 , 287
e) Qual a diferena entre 202 P e D ?
f) Qual o Percentil correspondente a 321 Q e Q , Q ? g) Qual a Amplitude da Amostra ? h) Como faria para escolher o nmero de classes ? i) Adotado um nmero de classes, qual seria a amplitude de classe ?
Exerccios de Estatstica Mdias
01 Determine as mdias aritmtica, geomtrica, harmnica e quadrtica das seguintes sries :
a) 3, 4, 1, 3, 6, 5, 6 b) 7, 8, 8, 10, 12 c) 3,2; 4; 0,75; 5; 2,13; 4,75 d) 70, 75, 76, 80, 82, 83, 90
02 A mdia mnima para aprovao em determinada disciplina 5,0. Se um estudante obtm as notas 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questo, pergunta-se se ele foi ou no aprovado. 03 Calcule para cada uma das distribuies abaixo, sua respectiva mdia. a) ix | 3 4 7 8 12 b) ix | 10 11 12 13
if | 2 5 8 4 3 if | 5 8 10 6
c) ix | acf d) ix | if e) ix | if
2 | 3 7 | 1/16 85 | 5 3 | 9 8 | 5/18 87 | 1 4 | 19 9 | 1/3 88 | 10 5 | 25 10 | 2/9 89 | 3 6 | 28 11 | 5/48 90 | 5
-
46
04 Dadas as estaturas, em cm, de 140 alunos, conseguiu-se a distribuio abaixo. Calcular a mdia. Estat.| 145|---150 | 150|---155 | 155|---160 | 160|---165 | 165|---170 | 170|---175 | 175|---180 | 180|---185 N | 2 | 10 | 27 | 38 | 27 | 21 | 8 | 7 05 Turmas que possuem determinada disciplina em comum apresentam, nessa disciplina: Turma A (40 alunos) - mdia 6,5 Turma B (35 alunos) - mdia 6,0 Turma C (35 alunos) - mdia 4,0 Turma D (20 alunos) - mdia 7,5 Determine a mdia geral.
Exerccios sobre ESCORE Z 01 Os carros dos estudantes de uma faculdade tm idade mdia de 7,93 anos, com desvio-padro de 3,68 anos. Determine o escore z para os seguintes carros : a) Um GM Corsa 1994 b) Um FIAT Plio 2003 c) Um FORD Focus 0 Km 02 Uma pesquisa realizada no Japo detectou que o nmero de horas que os estudantes universitrios passam estudando fora da escola, cada semana, tm mdia de 8,03 h e desvio-padro 4,97 h. Determine o escore z para um aluno que estuda 20 horas por semana. 03 Uma mulher alegou ter dado luz uma criana, 305 dias aps a visita de seu marido, que estava servindo na Marinha em misso no exterior. Os tempos de durao da gravidez, acusam uma mdia de 269 dias, com desvio-padro de 15,5 dias. Determine o escore z correspondente aos 305 dias e comente: a) Esse prazo pode ser considerado fora do comum ? b)Que se pode concluir ? 04 Certa mquina automtica aceita moedas de 50 centavos que no fujam ao padro comum. Ache o escore z para uma moeda de 50 centavos que pesa 7,37 g. Sabe-se que os pesos das moedas de 50 centavos tm mdia de 7,60 g com desvio-padro de 0,009 g e pergunta-se : a) Qual o escore z desta moeda b) Esta moeda ser aceita pela mquina ? 05 Para os homens com idade entre 18 e 24 anos, os nveis de colesterol ( em mg / ml ) tm mdia de 178,1 e desvio-padro de 40,7.
-
47
a) Determine o escore z para um homem de 22 anos de idade, que tem um ndice de colesterol de 274,9 mg / ml.
b) Esse nvel pode ser considerado muito elevado ? 06 ) Trs candidatos a um emprego fazem testes equivalentes de desempenho em pensamento crtico e voc o encarregado de decidir qual deles contratar. A. da Silva acertou 38 questes em um teste onde a mdia era de 29 e o desvio-padro, 6. B. dos Santos acertou 399 questes no teste de mdia 313 e desvio-padro, 56 C. Oliveira teve nota 4,11 em teste de mdia 2,76 e desvio-padro 0,91. a) Qual deles seria o seu escolhido ? b) Por que ? 07) Em exame de estatstica a mdia foi de 78 e o desvio-padro foi 10. a) Determine os escores z de dois alunos cujas notas foram 93 e 62, respectivamente. b) Determine as notas de dois alunos cujos escores z foram -0,6 e 1,2, respectivamente 08) Encontre a mdia e o desvio-padro em um exame onde as notas 70 e 88 correspondem a escores z de -0,6 e 1,4, respectivamente.
Exerccios de fixao sobre TESTES DE HIPTESE E SIGNIFICNCIA
01 ) Para testar uma hiptese de que uma moeda honesta, a seguinte regra de deciso tomada:
(1) Aceito a hiptese se o nmero de caras em uma nica amostra de 100 lanamentos est entre 40 e 60 inclusive
(2) Rejeito a hiptese caso contrrio. a)- Encontre a probabilidade de rejeitar a hiptese quando ela, de fato, correta b)- Interprete graficamente a regra de deciso e o resultado da pergunta anterior c)- Que concluses voc tiraria se a amostra de 100 fornecesse 53 caras ? d)- E se fornecesse 60 caras ? e)- Voc poderia estar errado em suas concluses da pergunta c) ? 02) Crie uma regra de deciso para testar a hiptese de que uma moeda honesta se uma amostra de 64 lanamentos da moeda obtida e se um nvel de (a) 0,05, (b) 0,01 usado. 03) Em um experimento sobre percepo extra sensorial (PES), uma pessoa em uma sala questionada sobre a cor(vermelha ou azul) de uma carta escolhida de um baralho de 50 cartas embaralhadas por um indivduo em outra sala. A pessoa desconhece quantas cartas vermelhas ou azuis tm no baralho. Se a pessoa identifica 32 cartas corretamente, determine se os resultados so significantes ao nvel de (a) 0,05 de significncia (b) 0,01 de significncia. 04) Em 200 lanamentos de uma moeda, 115 caras e 85 coroas foram observadas. Teste a hiptese de que a moeda honesta usando um nvel de significncia de: (a) 0,05 (b) 0,01 05) A tabela abaixo mostra as freqncias observadas e esperadas no lanamento de um dado 120 vezes.
(a) Teste a hiptese de que o dado honesto, usando um nvel de significncia de 0,05.
Face 1 2 3 4 5 6 Freqncia Observada
25
17
15
23
24
16
Freqncia Esperada
20
20
20
20
20
20
-
48
06) Considere dois grupos, A e B, cada um consistindo de 100 pessoas portadoras de uma doena. Um soro dado ao Grupo A, mas no ao Grupo B(o qual chamado grupo de controle); caso contrrio, os dois grupos so tratados identicamente. constatado que nos Grupos A e B, 75 e 65 pessoas, respectivamente, se recuperaram da doena. Teste a hiptese de que o soro ajudou a curar a doena usando um nvel de significncia de: (a) 0,01 (b) 0,05 (c) 0,10.
07) Em 60 lanamentos de uma moeda, 37 caras e 23 coroas foram observadas. Teste a hiptese da moeda ser honesta usando um nvel de significncia de : (a) 0,05 (b) 0,01. 08) Em um longo perodo de tempo as notas atribudas por um grupo de instrutores em determinado curso tm sido em mdia, 12% As, 18% Bs, 40% Cs, 18% Ds e 12% Es. Um novo instrutor atribuiu 22 As, 34 Bs, 66 Cs, 16 Ds e 12 Es durante dois semestres. Determine, ao nvel de significncia de 0,05, se o novo instrutor est seguindo o padro de notas dos outros instrutores. 09) O nmero de livros emprestados por uma biblioteca pblica durante uma certa semana dado pela tabela abaixo. Teste a hiptese de que o nmero de livros emprestados no depende do dia da semana, usando um nvel de significncia de (a) 0,05 (b) 0,01.
Segunda Tera Quarta Quinta Sexta N de livros emprestados
135