modulo 5 - estatistica.pdf

120
 Copyright © 2007, ESAB – Escola Superior Ab erta do Brasil 1  MÓDULO DE: ESTATÍSTICA AUTORIA: FREDERICO GOMES CARVALHAES Copyrig ht © 200 8, E SAB – Escola Superior Ab erta do Brasil

Upload: iago-taine

Post on 01-Jun-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 1/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil1

 

MÓDULO DE:

ESTATÍSTICA

AUTORIA:

FREDERICO GOMES CARVALHAES

Copyright © 2008, ESAB – Escola Superior Aberta do Brasi l

Page 2: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 2/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil2

Módulo de: Estatística

Autoria: Frederico Gomes Carvalhaes

Primeira edição: 2009

CITAÇÃO DE MARCAS NOTÓRIAS

Várias marcas registradas são citadas no conteúdo deste módulo. Mais do que simplesmente listar esses nomes

e informar quem possui seus direitos de exploração ou ainda imprimir logotipos, o autor declara estar utilizando

tais nomes apenas para fins editoriais acadêmicos.

Declara ainda, que sua utilização tem como objetivo, exclusivamente na aplicação didática, beneficiando e

divulgando a marca do detentor, sem a intenção de infringir as regras básicas de autenticidade de sua utilização

e direitos autorais.

E por fim, declara estar utilizando parte de alguns circuitos eletrônicos, os quais foram analisados em pesquisas

de laboratório e de literaturas já editadas, que se encontram expostas ao comércio livre editorial.

Todos os direitos desta edição reservados à

ESAB – ESCOLA SUPERIOR ABERTA DO BRASIL LTDA

http://www.esab.edu.brAv. Santa Leopoldina, nº 840/07

Bairro Itaparica – Vila Velha, ES

CEP: 29102-040

Copyright © 2008, ESAB – Escola Superior Aberta do Brasil

Page 3: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 3/120

Page 4: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 4/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil4

Ementa

Histórico, conceitos, profissão e aplicações; Métodos Estatísticos; Variáveis Estatísticas;População e Amostra; Amostragem; Séries e Gráficos Estatísticos; Distribuição deFrequência; Medidas de Posição e Variabilidade; Assimetria e Curtose; Probabilidades;Distribuições de Probabilidade; Correlação e Regressão Linear.

Sobre o Autor

Frederico Gomes Carvalhaes é mineiro, natural de Belo Horizonte, residente em Vitória,

Espírito Santo. É graduado em Engenharia Elétrica e Matemática, pós-graduado em Gestão

de Negócios e Tecnologia da Informação e Mestre em Ciências Contábeis (Área

Administração Estratégica / Finanças). É aluno de Doutorado na COPPE/UFRJ, no Programa

de Planejamento Energético (Área Modelos Matemáticos aplicados à Energia). Possui vasta

experiência no Setor Elétrico, tendo trabalhado em empresas como CEMIG, ESCELSA e

ECOCEL. É consultor em energia, atuando na gestão da energia elétrica para grandes

indústrias, buscando otimizar seu uso e reduzir custos para as empresas. É tutor de

Educação à Distância, Professor Universitário e Coordenador de Curso de Pós-Graduação,

responsável por ministrar disciplinas como Matemática Aplicada, Matemática Financeira,

Estatística, Cálculo Atuarial, Métodos Quantitativos e Gestão de Energia Elétrica. Também

atua desenvolvendo projetos educacionais e ministrando palestras e cursos relacionados às

Ciências Exatas e Energia.

Page 5: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 5/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil5

SUMÁRIO

UNIDADE 1 ........................................................................................................... 8 

Histórico da Estatística ....................................................................................... 8 

UNIDADE 2 ......................................................................................................... 11 

Métodos Estatísticos ........................................................................................ 11 

UNIDADE 3 ......................................................................................................... 14 

Fases do Método Estatístico ............................................................................ 14 

UNIDADE 4 ......................................................................................................... 17 

Variáveis Estatísticas ....................................................................................... 17 

UNIDADE 5 ......................................................................................................... 20 

Amostragem ..................................................................................................... 20 

UNIDADE 6 ......................................................................................................... 25 

Principais técnicas da Amostragem ................................................................. 25 

UNIDADE 7 ......................................................................................................... 29 

Séries Estatísticas ............................................................................................ 29 

UNIDADE 8 ......................................................................................................... 32 

Gráficos Estatísticos ........................................................................................ 32 

UNIDADE 9 ......................................................................................................... 39 

Distribuição de Frequência .............................................................................. 39 

UNIDADE 10 ....................................................................................................... 43 

Elementos de uma Distribuição de Frequência ............................................... 43 

UNIDADE 11 ....................................................................................................... 47 

Cálculo do número de classes (k) e intervalo de classes (hi) ......................... 47  

UNIDADE 12 ....................................................................................................... 49 

Medidas de Posição ......................................................................................... 49 

UNIDADE 13 ....................................................................................................... 55 

Page 6: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 6/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil6

Medidas Separatrizes ...................................................................................... 55 

UNIDADE 14 ....................................................................................................... 57 

Medidas Separatrizes ...................................................................................... 57 

UNIDADE 15 ....................................................................................................... 60 

Medidas Separatrizes ...................................................................................... 60 

UNIDADE 16 ....................................................................................................... 61 

Medidas de Dispersão ou Variabilidade .......................................................... 61 

UNIDADE 17 ....................................................................................................... 64 

Medidas de Dispersão ou Variabilidade .......................................................... 64 

UNIDADE 18 ....................................................................................................... 66 

O coeficiente de variação (CV) ........................................................................ 66 

UNIDADE 19 ....................................................................................................... 67 

Escore padronizado (zi) ................................................................................... 67 

UNIDADE 20 ....................................................................................................... 69 

Medidas de Assimetria ..................................................................................... 69 

UNIDADE 21 ....................................................................................................... 74 

Medidas de Curtose ......................................................................................... 74 

UNIDADE 22 ....................................................................................................... 78 

Noções de Probabilidades ............................................................................... 78 

UNIDADE 23 ....................................................................................................... 81 

Probabilidade ................................................................................................... 81 

UNIDADE 24 ....................................................................................................... 84 

Exercícios resolvidos envolvendo o cálculo de Probabilidades ...................... 84 

UNIDADE 25 ....................................................................................................... 93 

Distribuições de Probabilidade ........................................................................ 93 

UNIDADE 26 ....................................................................................................... 98 

Distribuição Binomial ........................................................................................ 98 

UNIDADE 27 ..................................................................................................... 100 

Page 7: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 7/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil7

Distribuição Normal ........................................................................................ 100 

UNIDADE 28 ..................................................................................................... 106 

Correlação ...................................................................................................... 106 

UNIDADE 29 ..................................................................................................... 109 

Correlação Linear ........................................................................................... 109 

UNIDADE 30 ..................................................................................................... 114 

Regressão Linear ........................................................................................... 114 

GLOSSÁRIO ..................................................................................................... 119 

BIBLIOGRAFIA ................................................................................................ 120 

Page 8: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 8/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil8

UNIDADE 1 

Objetivo: Apresentar e discutir o Histórico da Estatística e sua origem

Histórico da Estatística

Embora a palavra “Estatística” ainda não existisse, há indícios de que desde 3000 A.C. já se

faziam censos na Babilônia, China e Egito.

Desde a Antiguidade, vários povos já registravam o número de habitantes, de nascimentos,

de óbitos, faziam estimativas das riquezas individuais e sociais, distribuíam equitativamente

terras ao povo, cobravam impostos e realizavam inquéritos quantitativos por processos que,

hoje, chamaríamos de “estatísticas”.

A palavra “censo” deriva do latim “censere”, que significa taxar.

A palavra “estatística” deriva do latim “status”, que significa estado.

Assim, a Estatística servia como ferramenta administrativa nas mãos do Estado. Na Idade

Média colhiam-se informações, geralmente com a finalidade tributária ou bélica.

Já a partir do século XVI começaram a surgir os primeiros controles sistemáticos de fatos

sociais, como nascimentos, batizados, casamentos e funerais, dando origem às primeiras

tábuas e tabelas e aos primeiros números relativos.

Foi no século XVIII que os estudos de tais fatos foram adquirindo forma verdadeiramente

científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de

Estatística, determinando o seu objetivo e suas relações com as ciências.

No início do século XIX, os estudos estatísticos ganharam a contribuição de grandes

matemáticos. Nos trabalhos de dois deles, o francês Simon Laplace e o alemão Carl

Page 9: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 9/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil9

Friedrich Gauss (1777-1855), surge a ideia de “Distribuição Normal de Frequência”. Essa

ideia levou a uma teoria muito útil para fazer previsões.

A teoria da distribuição normal foi usada pelo astrônomo e matemático belga Adolphe

Quételet (1796-1874), no estudo estatístico de diversas características das populações

humanas: altura, peso, natalidade, mortalidade, renda mensal, etc.

Ronald Aylmer Fisher (1890-1962), geneticista e estatístico britânico, concentrou seus

estudos na genética das populações, campo em que obteve importantes resultados, sendo

considerado um dos grandes criadores do neodarwinismo. Na Estatística trabalhou com

ajustes de curvas de frequências, com coeficientes de correlação, os chamados coeficientes

de Fisher, na análise de variância e nas técnicas de estimação de um parâmetro.

Influenciado pelos trabalhos de Karl Pearson, outro importante geneticista e estatístico

britânico, Fisher utilizou os resultados que obteve na Estatística como ferramentas para

aplicação nos seus estudos de genética, sendo hoje considerado um dos maiores nomes na

Teoria de Estatística e na Estatística aplicada à Biologia.

Assim, as tabelas tornaram-se mais completas, surgiram às representações gráficas e o

cálculo das probabilidades, quando a Estatística deixou de ser simples catalogação de dados

numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo

(população), partindo da observação de partes desse todo (amostras).

Atualmente o público leigo (leitor de jornais e revistas) se posiciona em dois extremos

divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em

sua infalibilidade ou afirma que elas nada provam. Os que assim pensam ignoram os

objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, seja teórica ou

prática, ou a conhecem muito superficialmente.

A Estatística em diversas áreas vem avançando muito rapidamente e, com seus processos e

técnicas, tem contribuído para a organização dos negócios e para a evolução do mundo

moderno.

Page 10: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 10/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil10

 A profissão do Estatíst ico

O Estatístico promove o levantamento de pesquisas estatísticas em suas aplicações técnicas

e científicas, investigando, elaborando e testando métodos matemáticos e sistema de

amostragem, bem como coletando, analisando e interpretando os dados relacionados com

os fenômenos estatísticos, e ainda estudando e renovando a metodologia estatística a fim de

estabelecer a sua evolução e desenvolvimento.

As especializações da profissão vinculam-se aos campos profissionais que exigem ou

permitem o exercício do estatístico. Elas resultam da prática profissional e decorrem quase

sempre da demanda decorrente no mercado de trabalho. São elas:

  Demografia

  Bioestatística

  Estatístico Matemático

  Estatístico de Estatística Aplicada

Principais cargos procurados:

  Estatístico

  Estatístico Matemático

  Estatístico de Estatística Aplicada

Page 11: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 11/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil11

UNIDADE 2 

Objetivo: Apresentar e discutir os principais Métodos Estatísticos existentes.

Métodos Estatísticos

O método c ientífico

Muitos dos conhecimentos que temos foram obtidos na Antiguidade por acaso e, outros, pornecessidades práticas, sem aplicação de um método.

Atualmente, quase todo acréscimo de conhecimento resulta da observação e do estudo.

Embora muito desse conhecimento possa ter sido observado inicialmente por acaso, a

verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais

conhecimentos.

Podemos então dizer que:

Método é um conjunto de meios dispostos convenientemente para se chegar a um fim

que se deseja.

Dos métodos científicos, destacaremos o método experimental e o estatístico.

O método experimental

O método experimental consiste em manter constantes todas as causas (fatores), menos

uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso

existam.

É o método preferido no estudo da Física, da Química etc.

Page 12: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 12/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil12

O Método Estatístico

Muitas vezes temos necessidade de descobrir fatos em um campo em que o método

experimental não se aplica (nas ciências sociais), já que os vários fatores que afetam o

fenômeno em estudo não podem permanecer constantes enquanto fazemos variar a causa

que, naquele momento, nos interessa.

Como exemplo, podemos citar a determinação das causas que definem o preço de uma

mercadoria. Para aplicarmos o método experimental, teríamos de fazer variar a quantidade

da mercadoria e verificar se tal fato iria influenciar seu preço.

Porém, seria necessário que não houvesse alteração nos outros fatores.

Assim, deveria existir, no momento da pesquisa, uma uniformidade dos salários, o gosto dos

consumidores deveria permanecer constante, seria necessária a fixação do nível geral dos

preços das outras necessidades, etc. Mas isso tudo é impossível.

Nesses casos, lançamos mão de outro método, embora mais difícil e menos preciso,

denominado método estatístico.

O método estatístico, diante da impossibilidade de manter as causas constantes,

admite todas essas causas presentes variando-as, registrando essas variações e

procurando determinar, no resultado final, que influências cabem a cada uma delas.

 A Estat ística

Exprimindo por meio de números as observações que se fazem de elementos com, pelomenos, uma característica comum (por exemplo: os alunos do sexo masculino de uma

comunidade), obtemos os chamados dados referentes a esses elementos.

Page 13: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 13/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil13

Podemos dizer, então, que:

 A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta,

organização, descrição, análise e interpretação de dados, para a utilização dos

mesmos na tomada de decisões.

A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva,

enquanto a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou

Inferencial.

Em geral, as pessoas, quando se referem ao termo estatística, o fazem no sentido da

organização e descrição dos dados (estatística do Ministério da Educação, estatística dos

acidentes de tráfego, etc.), desconhecendo que o aspecto essencial da Estatística é o de

proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados

obtidos inicialmente.

Assim, a análise e a interpretação dos dados estatísticos tornam possível o diagnóstico de

uma empresa (por exemplo, de uma escola), o conhecimento de seus problemas (condições

de funcionamento, produtividade), a formulação de soluções apropriadas e um planejamentoobjetivo de ação.

Page 14: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 14/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil14

UNIDADE 3 

Objetivo: Apresentar e discutir as Fases do Método Estatístico.

Fases do Método Estatístico

São verificadas no método estatístico as seguintes fases:

1. Coleta de dados

Após cuidadoso planejamento e a devida determinação das características mensuráveis do

fenômeno que se quer pesquisar, damos início à coleta dos dados numéricos necessários à

sua descrição.

A coleta pode ser direta ou indireta.

A coleta é direta quando feita sobre elementos informativos de registro obrigatório

(nascimentos, casamentos e óbitos, importação e exportação de mercadorias, etc) ou, ainda,quando os dados são coletados pelo próprio pesquisador através de inquéritos e

questionários, como é o caso das notas de verificação e de exames, do censo demográfico,

etc.

A coleta direta dos dados pode ser classificada relativamente ao fator tempo em:

  Contínua (registro) → Quando feita continuamente, tal como a de nascimentos e

óbitos, frequência de alunos às aulas, etc.

  Periódica → Quando feita em intervalos constantes de tempo, como os censos (de 10

em 10 anos), avaliações mensais dos alunos, etc.

  Ocasional → Quando feita extemporaneamente, a fim de atender a uma conjuntura ou

a uma emergência, como no caso de epidemias, acidentes naturais, etc.

Page 15: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 15/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil15

 

A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do

conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo,

podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos

por uma coleta direta.

2. Crítica dos dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas

e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam

influenciar sensivelmente nos resultados.

A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou

má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os

elementos originais dos dados da coleta.

3. Apuração dos dados

É a operacionalização algébrica e o processamento dos dados obtidos e a disposição

mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.

4. Apresentação dos dados

Independentemente da finalidade da pesquisa, os dados devem ser apresentados sob forma

adequada através de tabelas ou gráficos, tornando mais fácil a análise daquilo que está

sendo objeto de tratamento estatístico para posterior obtenção de medidas típicas.

Page 16: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 16/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil16

5. Análise dos resultados

O objetivo da Estatística é tirar conclusões sobre o todo (população), a partir de informações

fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores

(Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da

Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos

desses resultados conclusões e previsões.

Page 17: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 17/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil17

UNIDADE 4 

Objetivo: Apresentar e discutir as Variáveis Estatísticas, População e Amostra.

Variáveis Estatísticas

Variável é o conjunto de resultados possíveis de um fenômeno.

Pode ser classificada em:

Qualitativa => quando seus valores são expressos por atributos. Exemplo:

  Sexo (masculino ou feminino)

  Cor da pele (branca, preta, amarela, vermelha, parda, etc.)

Quantitativa => quando seus valores são expressos em números. Exemplo:

  Salário

  Idade

Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limitesrecebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes

a um conjunto enumerável recebe o nome de variável discreta ou descontínua.

Page 18: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 18/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil18

Exemplos:

  Variável contínua =>Peso dos alunos de uma sala de aula

  Variável discreta => Nº de alunos de uma sala de aula

Outros exemplos:

  Cor dos olhos variável qualitativa

  Índice de liquidez nas indústrias brasileiras variável quantitativa contínua

  Produção de café no Brasil variável quantitativa contínua

  Número de defeitos em aparelhos de TV variável quantitativa discreta

  Comprimento dos pregos de uma caixa variável quantitativa contínua

  O ponto obtido em cada jogada de um dado variável quantitativa discreta

População e Amostra

Ao conjunto finito ou infinito de elementos que possuem PELO MENOS UMA característica

comum denominamos população estatística ou universo estatístico.

Assim, os jogadores de futebol, por exemplo, constituem uma população, pois apresentam

pelo menos uma característica comum: são aqueles que jogam futebol.

Entretanto, na maioria das vezes, por impossibilidade ou inviabilidade econômica ou

temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma

parte da população. A essa parte proveniente da população em estudo denominamos

amostra.

Page 19: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 19/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil19

Assim, amostra é qualquer conjunto finito e não vazio de uma população, ou seja, uma

subcoleção.

Verificamos, então, que a Estatística Indutiva tem por objetivo tirar conclusões sobre as

populações, baseada em resultados verificados nas amostras retiradas destas populações.

Entretanto, para que as inferências estejam corretas, é necessário garantir que a amostra

seja representativa da população, isto é, a amostra deve possuir as mesmas características

básicas da população, no que diz respeito ao fenômeno que será pesquisado. Dessa forma,

é necessário que a amostra a ser usada seja obtida por processos adequados.

Page 20: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 20/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil20

UNIDADE 5 

Objetivo: Apresentar e discutir Amostragem e as principais técnicas existentes.

 Amostragem

É a técnica utilizada para recolher amostras, que garante, tanto quanto possível, o acaso na

escolha.

Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o

que garante à amostra o caráter de representatividade. Isto é muito importante pois as

conclusões relativas à população vão estar baseadas nos resultados obtidos nas amostras

dessa população.

Principais técnicas da Amost ragem

1. Amostra casual ou aleatór ia simples

Este tipo de amostragem é equivalente a um sorteio de loterias.

É realizada numerando-se a população de 1 a n e sorteando-se por meio de um dispositivo

aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos

pertencentes à amostra.

Exemplo:

Obter uma amostra representativa de 10% da população para a pesquisa de salários dos 90

funcionários de uma empresa.

Page 21: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 21/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil21

 

Procedimentos:

1. Numera-se os funcionários da empresa de 01 a 90;

2. Escreve-se os números, de 01 a 90, em pedaços iguais de um mesmo papel,

colocando-os dentro de uma caixa. Agita-se sempre a caixa para misturar bem os

pedaços de papel e retira-se, um a um, nove números que formarão a amostra, neste

caso, 10% da população.

Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muitotrabalhoso. A fim de facilitá-lo, foi elaborada uma tabela - TABELA DE NÚMEROS

ALEATÓRIOS, construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso

nas linhas e colunas.

Page 22: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 22/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil22

 

Para obtermos os elementos da amostra usando a tabela, escolhemos ao acaso um

algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou

6 3 1 2 4 4 4 2 7 0 9 2 6 1 0 6 6 3 9 4 4 3 5 0 1 8 8 7 8 2 4 9 4 6 0 1 8 7 4 3 3 5 6 2 6 2 0 4 3 1 9 3 6 0

1 1 1 9 7 1 3 8 9 8 7 5 6 6 8 3 2 3 8 4 1 0 2 3 4 6 4 3 4 1 9 9 8 4 0 1 2 4 5 8 1 5 7 7 1 4 2 5 6 8 1 8 3 5

8 4 1 9 1 8 5 3 8 2 4 0 7 9 7 6 2 9 0 4 9 5 4 9 9 8 5 7 8 1 0 5 8 1 0 4 7 0 8 7 6 6 9 6 7 5 5 0 1 5 9 6 3 9

3 5 9 9 6 9 1 8 9 9 4 2 2 0 8 7 9 1 6 3 1 1 6 1 4 2 3 6 5 1 6 5 9 9 2 9 8 5 7 2 2 3 5 3 9 3 0 4 4 8 9 9 2 2

0 9 2 2 5 4 0 0 3 2 1 5 1 6 4 8 0 3 9 4 4 9 7 8 9 5 3 6 7 0 0 0 4 0 9 6 5 5 1 8 7 2 0 3 6 1 8 6 9 9 2 1 2 9

6 2 1 8 5 4 6 6 0 6 6 8 9 5 6 6 0 9 1 4 9 7 6 1 0 4 2 1 3 5 3 4 6 8 5 5 5 8 7 4 8 5 9 6 2 3 4 5 9 4 8 2 9 2

9 1 1 2 4 4 4 1 6 6 1 5 9 1 5 9 2 9 4 0 3 1 8 1 7 7 8 3 4 3 7 8 2 8 7 4 0 1 0 5 8 7 4 1 0 2 1 2 2 7 2 3 2 4

2 0 6 5 2 2 3 8 7 2 1 6 9 4 8 4 1 0 5 0 8 5 1 0 8 4 7 5 0 4 0 5 4 3 8 5 7 7 0 1 1 5 5 4 6 4 2 5 0 1 3 2 4 3

5 9 0 2 4 8 4 2 0 3 2 8 2 4 0 3 0 7 9 3 6 8 7 2 5 9 6 2 4 4 0 5 6 6 2 4 3 2 8 5 7 9 8 0 7 0 1 4 3 4 3 4 9 2

1 8 1 1 7 3 4 7 4 4 2 2 8 6 2 7 1 6 1 9 9 9 3 8 9 8 7 8 8 9 1 6 7 1 9 0 1 3 5 5 0 0 0 0 6 9 3 6 2 2 8 2 4 7

8 4 1 5 0 9 6 0 5 0 9 5 6 7 1 5 3 4 2 2 6 8 4 2 9 7 5 8 7 6 6 5 6 4 8 9 6 4 0 7 7 1 3 0 7 3 4 0 3 2 1 5 9 4

5 8 7 1 3 4 5 8 2 2 2 7 2 9 6 5 0 0 2 2 9 3 7 8 3 3 4 8 7 3 7 1 7 8 1 5 7 0 0 4 8 8 6 1 8 1 8 1 8 3 7 2 6 77 8 2 4 7 9 9 7 5 3 1 0 1 4 8 1 9 9 6 5 8 2 6 8 4 6 0 5 8 6 5 5 9 0 7 9 5 3 2 0 2 7 7 1 1 2 4 0 6 8 7 7 3 2

8 7 0 4 6 8 8 2 8 6 5 3 5 2 6 9 6 9 3 6 2 9 2 5 5 0 5 8 7 3 8 0 1 3 0 7 2 7 6 6 4 1 6 8 1 1 4 8 3 4 2 6 3 0

8 8 2 4 9 8 2 5 4 1 8 3 2 7 1 9 2 6 6 2 6 3 6 4 4 9 0 4 6 9 5 9 2 0 2 3 7 9 1 2 1 1 9 1 8 3 2 5 0 8 3 8 0 3

1 9 8 6 2 0 0 2 6 9 0 8 1 2 6 7 4 8 5 1 7 8 8 9 8 6 1 3 1 2 4 4 0 2 0 6 3 4 1 7 6 7 8 8 8 9 3 6 6 0 9 8 0 7

8 0 0 7 8 4 5 9 2 1 7 0 5 6 3 0 0 2 9 7 2 3 4 6 8 6 8 8 1 8 1 0 7 1 5 5 6 6 1 2 3 0 3 8 6 2 1 8 8 8 2 6 9 8

5 5 9 8 5 3 5 5 5 0 6 3 6 0 1 4 1 3 2 6 9 3 4 3 0 7 3 2 6 7 6 0 4 3 7 0 5 4 7 0 7 6 2 7 8 1 5 4 3 4 2 3 4 1

0 3 7 1 1 4 2 4 1 3 2 7 8 3 6 4 2 4 6 2 5 6 2 3 4 0 2 9 6 0 6 8 4 9 1 0 3 9 5 9 5 1 3 5 7 3 5 6 1 2 7 5 0 2

1 9 2 5 1 7 7 2 9 7 4 1 8 0 9 9 4 7 0 9 3 4 3 7 1 3 8 3 8 4 7 3 7 9 4 6 9 6 5 6 1 7 9 7 2 1 9 7 7 4 3 9 3 3

9 5 6 3 7 3 3 3 1 7 4 9 5 8 4 8 6 4 2 8 6 3 4 7 6 4 2 4 5 6 9 0 8 7 5 8 1 9 7 5 5 7 7 7 9 0 8 9 4 2 0 3 9 5

3 6 0 6 0 7 2 6 1 5 2 0 3 9 1 2 8 4 6 7 4 3 8 0 2 1 1 9 9 6 1 3 3 2 5 1 9 4 9 1 0 6 1 1 7 9 2 7 1 6 4 8 3 6

7 7 0 6 5 5 8 6 0 3 6 4 7 9 0 3 1 0 1 3 8 8 3 2 2 1 1 9 2 6 3 5 5 2 9 5 0 1 0 2 5 3 7 0 3 4 0 9 5 4 2 3 2 4

9 7 9 5 1 5 2 9 6 7 7 7 0 6 3 7 7 2 3 0 0 5 1 7 5 8 0 9 8 1 6 4 6 2 6 9 8 1 7 8 3 0 3 4 6 2 9 0 9 3 5 7 6 4

2 3 5 0 4 0 0 0 1 2 8 1 7 3 5 7 0 9 8 3 8 2 6 0 9 7 4 6 3 2 2 1 0 2 5 5 4 7 4 8 2 1 1 3 7 5 2 4 1 4 1 4 2 0

2 6 3 7 2 3 0 3 1 2 5 6 7 0 7 6 0 7 7 8 1 1 5 7 4 4 9 1 2 7 7 8 0 9 7 3 8 7 6 6 6 6 4 1 0 2 6 9 1 4 2 5 4 3

5 2 2 1 2 6 5 0 5 0 4 3 2 2 9 0 5 2 4 2 8 0 0 4 9 1 9 9 9 7 9 6 4 7 8 2 7 6 5 3 4 6 7 8 4 9 1 7 6 6 0 6 0 5

0 9 6 6 2 1 7 9 5 9 9 9 6 6 2 1 6 8 5 3 9 4 0 0 0 5 0 8 9 0 9 2 5 3 1 3 6 2 5 8 4 7 9 0 2 4 4 5 3 4 3 8 4 34 9 7 9 9 4 7 9 0 7 8 5 9 8 9 7 9 8 5 5 2 4 6 5 7 6 3 3 1 9 0 8 6 2 3 2 7 2 4 5 4 1 5 0 9 7 2 2 3 5 6 8 8 6

5 1 1 5 9 6 0 5 9 0 4 2 4 9 9 0 5 4 4 2 0 6 0 0 1 1 8 6 9 9 0 9 0 5 2 7 5 1 8 0 1 5 0 7 9 5 9 0 6 2 6 5 6 3

6 7 5 5 9 8 1 2 3 1 6 8 2 1 6 2 1 5 0 5 9 8 5 3 3 6 6 5 3 6 5 2 9 0 4 1 8 3 9 3 1 0 6 1 8 7 5 6 5 1 3 4 0 5

5 5 0 0 9 8 2 6 7 4 1 2 8 7 4 4 4 0 2 9 4 3 3 4 7 8 9 5 9 6 4 8 4 1 2 8 6 8 3 9 3 1 4 3 8 5 2 6 3 3 3 5 8 4

4 2 0 6 2 4 8 0 5 8 4 5 5 0 4 0 0 5 3 3 0 2 2 4 8 1 5 7 2 3 4 6 4 6 4 0 7 8 3 7 9 5 0 4 7 4 2 4 8 0 6 9 2 5

8 2 5 6 9 4 7 8 0 5 6 1 6 0 7 3 0 5 9 3 9 1 3 7 4 3 9 7 5 8 5 9 6 0 3 3 2 0 8 1 8 7 2 9 1 6 5 9 3 4 3 5 9 9

9 3 1 1 8 8 0 2 0 9 8 6 5 6 3 8 9 1 3 4 9 1 8 7 5 2 9 4 5 9 9 5 4 3 5 3 0 2 4 0 3 6 5 8 8 0 1 7 5 7 5 7 1 2

0 4 6 6 1 2 3 4 4 6 0 2 9 8 6 3 5 1 1 3 7 2 5 2 7 1 5 9 5 3 4 2 8 6 1 9 7 3 0 8 9 1 8 7 4 9 6 2 5 2 9 2 4 2

1 9 0 2 7 7 5 9 2 3 4 0 8 1 0 6 4 7 0 7 5 8 7 8 8 1 6 4 8 0 9 6 0 8 5 1 4 4 6 6 4 3 0 3 1 0 9 6 0 0 5 6 3 9

5 9 0 5 6 4 6 9 9 4 2 5 8 8 5 1 8 7 6 8 5 3 5 3 1 3 0 2 1 6 8 8 1 5 3 0 2 1 7 4 8 3 1 2 8 0 6 2 7 3 9 2 5 2

9 6 5 7 6 9 3 2 5 6 1 8 1 6 6 5 0 3 7 9 0 8 4 0 5 8 9 3 7 8 7 2 4 9 3 7 7 3 6 6 8 4 6 1 5 0 7 4 3 8 0 3 2 4

7 6 7 3 0 6 3 9 9 8 7 9 6 6 3 9 8 4 5 3 7 5 8 0 1 0 2 1 6 6 5 4 9 5 5 2 8 8 7 1 0 4 6 3 7 5 7 7 4 4 2 7 8 2

6 3 7 5 0 1 6 5 9 9 9 1 8 4 2 4 8 3 2 6 8 2 2 8 1 6 1 3 8 3 5 8 5 9 0 9 6 3 3 4 0 0 8 7 6 7 7 4 2 4 8 8 6 8

0 5 1 3 2 6 4 2 8 7 5 6 5 9 5 8 1 0 3 7 9 4 9 3 8 0 7 1 3 3 8 8 2 2 1 5 0 6 6 6 9 7 8 3 8 6 5 4 7 4 0 1 4 1

0 5 6 2 0 3 8 3 7 4 9 5 7 2 3 5 0 5 0 2 5 8 2 4 1 4 6 1 0 1 0 5 3 7 5 7 3 7 8 7 5 1 0 4 6 5 9 2 4 1 7 7 6 5

5 4 9 8 8 6 3 0 7 4 1 7 0 2 9 6 3 9 4 6 4 3 5 2 0 8 8 5 3 4 9 5 5 3 9 3 6 4 8 9 2 2 0 8 1 8 8 4 7 4 6 5 9 2

1 8 8 0 5 9 4 3 5 7 1 0 9 6 7 9 8 5 1 1 9 6 1 3 2 1 9 0 9 0 0 6 9 2 9 2 1 6 4 4 7 0 3 9 1 9 0 6 7 1 0 6 5 9

4 6 4 1 6 3 4 7 7 4 6 0 6 1 7 5 7 4 2 3 3 6 3 7 1 5 2 0 9 0 7 2 3 1 9 6 8 6 5 1 5 5 3 4 9 5 4 6 0 5 8 0 2 1

6 2 2 3 8 4 6 3 0 6 7 7 7 1 9 5 1 6 0 3 7 9 5 1 0 4 4 6 2 0 8 2 7 0 6 4 7 0 2 2 4 6 4 0 3 3 6 5 3 2 2 9 9 2

6 2 6 8 2 3 7 5 7 9 3 0 5 3 2 2 2 3 7 0 2 5 2 9 8 5 5 4 6 3 9 5 1 3 9 2 2 8 9 0 8 3 9 7 5 1 5 6 2 9 4 2 2 1

4 2 0 4 7 9 3 4 5 0 1 9 9 7 6 8 4 6 5 0 1 1 3 0 7 5 8 5 7 1 7 3 4 1 4 6 8 9 7 9 2 8 7 0 3 1 1 4 4 2 0 3 5 7

5 1 3 2 3 5 3 9 9 8 4 4 4 3 7 5 8 9 2 6 2 0 6 3 9 7 0 8 3 5 0 3 8 7 2 3 2 1 2 9 1 0 5 9 7 5 5 0 5 2 8 9 7 7

6 6 5 3 3 6 0 3 0 4 3 2 1 4 8 2 8 1 5 1 6 9 5 2 6 6 4 1 6 6 7 4 3 2 5 3 7 2 2 4 5 9 4 1 1 8 6 9 8 4 4 6 3 8

6 8 8 0 8 7 3 6 8 6 7 4 0 2 8 6 0 8 3 3 4 4 9 5 6 9 1 0 4 2 0 5 3 2 2 7 9 2 1 8 7 2 0 8 4 3 5 0 5 5 7 4 1 7

6 4 6 7 5 9 2 4 4 5 4 5 0 7 4 1 9 8 2 4 5 8 1 6 8 9 6 9 9 5 4 0 0 6 3 5 1 6 9 3 0 1 5 5 1 1 2 4 8 7 6 5 9 8

TABELA DE NÚMEROS ALEATÓRIOS

Page 23: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 23/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil23

mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os

elementos da amostra.

A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa),

verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou

descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita

antes de iniciado o processo.

O primeiro passo é definir o critério da leitura da tabela. Assim, consideremos, por exemplo,

a 6ª linha, tomando os números de dois algarismos (tantos algarismos quantos formam o

maior número da população), da esquerda para direita e de cima para baixo, e assim

sucessivamente. Obtivemos então:

62 18 54 66 06 68 95 66 09 14 97 61

Evidentemente, os numerais 95 e 97 serão desprezados, pois não constam da população,

como também será abandonado um numeral que já tenha aparecido, no caso o 66. Tem-se,

então:

62 18 54 66 06 68 95 66 09 14 97 61

Ou, reescrevendo:

62 18 54 66 06 68 09 14 61

Organizando os dados em uma ordem crescente, temos:

06 09 14 18 54 61 62 66 68

Estas foram as pessoas escolhidas para o critério adotado. Com base na listagem dos

funcionários, deve- se buscar posteriormente as informações salariais de cada um. Anota-se,

Page 24: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 24/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil24

assim, os salários das pessoas correspondentes aos números sorteados, obtendo-se uma

amostra de 10% dos salários dos 90 funcionários da empresa.

Observe que não houve direcionamento na escolha (aleatoriedade) e todos os 90

funcionários tiveram a mesma chance de serem escolhidos, garantindo assim, a

representatividade da amostra.

Page 25: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 25/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil25

UNIDADE 6 

Objetivo: Apresentar e discutir as principais técnicas de Amostragem.

Principais técnicas da Amostragem

2. Amostragem proporcional estratificada

Muitas vezes a população se divide em subpopulações - estratos.

Como é provável que a variável em estudo apresente, de estrato em estrato, um

comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo,

convém que o sorteio dos elementos da amostra leve em consideração tais estratos.

É exatamente isso que fazemos quando empregamos a amostragem proporcional

estratificada, que, além de considerar a existência dos estratos, obtém os elementos da

amostra proporcional ao número de elementos dos mesmos.

Exemplo:

Supondo que no exemplo anterior, dos 90 funcionários, 54 sejam do sexo masculino e 36

sejam do sexo feminino, vamos obter a amostra proporcional estratificada de 10% da

população. São, portanto, dois estratos: sexo masculino e sexo feminino.

Page 26: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 26/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil26

Logo, teremos:

Sexo População 10% Amostra

Masculino 54 4,5100

5410

  5

Feminino 36 6,3100

3610

 4

TOTAL 90 0,9100

9010

 9

Numera-se os funcionários da empresa de 01 a 90, sendo que de 01 v a 54 corresponderão

ao sexo masculino e de 55 a 90 ao sexo feminino. Como critério, estabeleceremos na

Tabela de Números Aleatórios a 3ª e 4ª colunas, de cima para baixo e da esquerda para a

direita, e assim sucessivamente.

Obtivemos então:

12 19 19 99 22 18 12 65 02 11 15 71 24 04

24 86 07 98 71 25 63

Da mesma forma, deveremos desprezar todos os numerais que não constam da população,

bem como aqueles que já tiverem sido selecionados. Também devemos parar a seleção para

um estrato quando já tiver sido preenchida sua quantidade de elementos necessários. Dessa

forma:

12 19 19 99 22 18 12 65 02 11 15 71 24 04

24 86 07 98 71 25 63

Page 27: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 27/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil27

Ou, separando por estratos:

12 19 22 18 02 => Para o sexo masculino

65 71 86 63 => Para o sexo feminino

Organizando os dados em uma ordem crescente, teremos:

02 12 18 19 22 => Para o sexo masculino

63 65 71 86 => Para o sexo feminino

Estas foram as pessoas escolhidas para o critério adotado em cada estrato. Com base na

listagem dos funcionários, deve-se buscar posteriormente as informações salariais de cada

um. Anota-se, assim, os salários das pessoas correspondentes aos números sorteados em

cada estrato, obtendo-se uma amostra proporcional estratificada de 10% dos salários dos 90

funcionários da empresa, separados por sexo. Também pode ser verificada a aleatoriedade

na determinação da amostra, o que garante sua representatividade.

3. Amost ragem Sistemática

É uma seleção feita por algum critério preestabelecido, como, por exemplo, intervalos de

tempo para coleta, peças de uma linha de montagem, etc.

Quando os elementos da população já se acham ordenados, não há necessidade de

construir o sistema de referência.

Page 28: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 28/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil28

Exemplos:

Prontuários médicos de um hospital

Prédios de uma rua

Linhas de produção

Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um

sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos sistemática.

Assim, no caso de uma linha de produção, podemos, por exemplo, a cada dez itens

produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso,estaríamos fixando o tamanho da amostra em 10% da população.

Exemplo:

Suponha-se uma avenida contendo 900 prédios, dos quais desejamos obter uma amostra

formada por cinquenta prédios. Podemos, neste caso, usar o seguinte procedimento: como

1850

900

, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o

primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente

considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado

direito da rua, o 4º prédio, o 22º, o 40º, etc. , até voltarmos ao início da avenida, pelo lado

esquerdo.

Page 29: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 29/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil29

UNIDADE 7 

Objetivo: Apresentar e discutir as principais Séries Estatísticas.

Séries Estatísticas

Denominamos série estatística toda tabela que apresenta a distribuição de um conjunto de

dados estatísticos em função da época, do local ou da espécie.

Numa série estatística, observamos a existência de três elementos ou fatores: o tempo, o

espaço e a espécie. Conforme varie um dos elementos da série, podemos classificá-la em

Histórica, Geográfica, Específica ou Mista.

1. Séries Temporais, Históricas, Cronológicas ou Marchas

São aquelas onde os dados são observados conforme época de ocorrência. Descrevem os

valores da variável em determinado local, discriminados segundo intervalo de tempo variável.

Exemplo:

 Ano Vendas (RS)2001 22.600,002002 39.870,002003 51.240,002004 63.850,00

2005 90.730,002006 100.540,002007 123.190,002008 139.820,00

Vendas da Companhia "Vale Tudo"2001 - 2008

Page 30: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 30/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil30

2. Séries Geográficas, Espaciais, Territoriais ou de Localização

São aquelas onde os dados são observados conforme a localidade de ocorrência.Descrevem os valores da variável em determinado instante, discriminados segundo regiões.

Exemplo:

3. Séries Específ icas ou Categóricas

São aquelas onde os dados são observados em determinado tempo e local, discriminados

conforme especificações ou categorias.

Exemplo:

Região QuantidadeNorte 542.863

Nordeste 947.321

Sudeste 1.589.647

Sul 754.294

Centro-Oeste 349.612

Vacinação contra doença "X"Brasil - 2006

Setor Industr ial Quantidade produzida (ton) Aço 789

Papel 247

 Açúcar 6.587

Café 5.421

Chocolate 23.144Trigo 1.239

Soja 1.024

Carne 456

Granito 872

Produção média de cada operário por setor País " Z" - 2007

Page 31: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 31/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil31

4. Séries Mistas ou Conjugadas

São aquelas onde os dados provenientes de duas ou mais séries são colocados em uma

única série.

Exemplo:

Região 2005 2006 2007Norte 11.300.493 12.989.073 15.463.182

Nordeste 20.800.020 23.908.069 28.461.987

Sudeste 38.413.867 44.153.870 52.564.131

Sul 26.074.207 29.970.352 35.678.991

Centro-Oeste 17.808.678 20.469.745 24.368.744

 Aparelhos celulares em serviço no país " ÔMEGA"2005 - 2007

Page 32: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 32/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil32

UNIDADE 8 

Objetivo: Apresentar e discutir os principais tipos de Gráficos Estatísticos.

Gráficos Estatísticos

É um conjunto de figuras geométricas representativas dos fenômenos. O gráfico estatístico é

uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir uma

impressão mais rápida e viva do fenômeno em estudo.

A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais

para ser realmente útil:

  Simplicidade => o gráfico não deve conter detalhes de importância secundária, assim

como de traços desnecessários que possam levar o leitor a uma análise demorada ou

errônea.

  Clareza => o gráfico deve possibilitar uma correta interpretação dos valores

representativos do fenômeno em estudo.

  Veracidade => o gráfico deve expressar a verdade sobre o fenômeno em estudo.

DIAGRAMAS são representações gráficas de séries estatísticas por intermédio de linhas e

superfícies. Dentre os principais diagramas, destacam-se:

Page 33: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 33/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil33

 

1. Gráfico em linha ou em curva

É a representação gráfica de uma série estatística por meio de uma linha poligonal e constituiuma aplicação do processo de representação das funções num sistema de coordenadas

cartesianas. É a melhor representação para uma série temporal, onde se deve observar a

ordem cronológica das informações. É usada para mostrar a variação entre os valores de

uma série.

Exemplo:

Vendas (R$) da Companhia "Sucesso S/A"

100.000

110.000

120.000

130.000

140.000

150.000

160.000

170.000

180.000

190.000

200.000

2001 2002 2003 2004 2005 2006 2007 2008

Page 34: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 34/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil34

2. Gráfico em colunas ou em barras

É a representação gráfica de uma série estatística por meio de retângulos, dispostos

verticalmente (em colunas) ou horizontalmente (em barras).

Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos

respectivos dados.

Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais

aos respectivos dados.

Dessa forma, asseguramos a proporcionalidade entre as áreas dos retângulos e os dados

estatísticos.

Exemplos:

a. Gráfico em Colunas

Produção de Soja do País " Omega"

020.00040.00060.00080.000

100.000120.000140.000160.000180.000200.000

1990 1991 1992 1993 1994 1995 1996 1997

   M   i   l    T  o  n  e   l  a   d  a  s

Page 35: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 35/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil35

b. Gráfico em Barras

Observações:

1. Sempre que as informações escritas das legendas forem extensas, devemos dar

preferência ao gráfico em barras (séries geográficas ou específicas). Porém, mesmo

assim for escolhido o gráfico em colunas, as informações das legendas devem ser

dispostas de baixo para cima, jamais o contrário.

2. A ordem a ser observada é a cronológica, se a série for histórica, e a decrescente, se

for geográfica ou categórica.

Exportações Brasileiras - Ano XX

0 500 1.000 1.500 2.000 2.500

Goiás

Santa Catarina

Pernambuco

Paraná

Espírito Santo

Ceará

Bahia

Rio de Janeiro

Minas Gerais

São Paulo

US$ milhões

Page 36: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 36/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil36

3. Para uma melhor apresentação e visualização de informações, a distância entre as

colunas (ou barras) não deverá ser menor que a metade nem maior que dois terços da

largura (ou da altura) dos retângulos.

3. Gráfico em colunas ou em barras múltip las

É geralmente empregado quando queremos representar, simultaneamente, dois ou mais

fenômenos estudados com o propósito de comparação.

Exemplo:

Balança Comercial do País "Ômega"

0

10.000

20.000

30.000

40.000

2000 2001 2002 2003 2004

   U   S   $  m   i   l   h   õ  e  s

Exportações Importações

Page 37: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 37/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil37

4. Gráfico em setores ou circular (pizza)

É a representação gráfica de uma série estatística por meio de superfícies setoriais. É usado

para comparar os valores de uma série com a soma total.

O gráfico é construído com base em um círculo dividido em partes, onde cada ângulo central

é proporcional à frequência de cada variável.

Obtemos cada setor por meio de uma regra de três simples e direta, lembrando que o total

da série corresponde à 360º.

Exemplo:

Região QuantidadeNorte 542.863

Nordeste 947.321

Sudeste 1.589.647

Sul 754.294

Centro-Oeste 349.612

TOTAL 4.183.737

Vacinação contra doença "X"Brasi l - 2006

Page 38: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 38/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil38

 

Observações:

1. Para uma melhor apresentação e interpretação dos dados, o gráfico em setores sódeve ser empregado quando há, no máximo, sete dados.

2. Se a série já apresenta os dados percentuais, obtemos os respectivos valores em

graus multiplicando o valor do percentual por 3,6.

Vacinação contra doença "X" - Brasil - 2006

13%

23%

38%

18%

8%

Norte

Nordeste

Sudeste

Sul

Centro-Oeste

Page 39: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 39/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil39

UNIDADE 9 

Objetivo: Apresentar e discutir os conceitos relacionados à Distribuição de Frequência.

Distribuição de Frequência

Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos, que

compõem uma amostra dos alunos de uma Faculdade brasileira, resultando a seguinte

tabela de valores, dados em centímetros (cm):

166 160 161 150 162 160 165 167 164 160

162 161 168 163 156 173 160 155 164 168

155 152 163 160 155 155 169 151 170 164

154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, cujos elementos não foram numericamente organizados,denominamos tabela primitiva.

Partindo dos dados acima, é difícil averiguar em torno de que valor tende a se concentrar as

estaturas, qual a menor e qual é a maior estatura ou, ainda, quantos alunos se acham abaixo

ou acima de uma dada estatura.

Dessa forma, conhecidos os valores de uma variável, é difícil formarmos uma ideia exata do

comportamento do grupo como um todo, a partir dos dados não ordenados.

A maneira mais simples de se organizar os dados é através de certa ordenação (crescente

ou decrescente). A tabela obtida após a ordenação dos dados recebe o nome de rol.

Page 40: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 40/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil40

Assim, obtemos o seguinte rol para os dados apresentados:

150 154 155 157 160 161 162 164 166 169

151 155 156 158 160 161 162 164 167 170

152 155 156 158 160 161 163 164 168 172

153 155 156 160 160 161 163 165 168 173

Agora podemos obter com relativa facilidade qual é a menor estatura (150 cm) e qual é a

maior (173 cm). Podemos também determinar qual foi a amplitude de variação (173 - 150 =

23 cm) e, ainda, a ordem que um valor em particular da variável ocupa no conjunto.

Observamos também que há uma concentração das estaturas em algum valor entre 160 cm

e 165 cm e, mais ainda, existem poucos valores abaixo de 155 cm e acima de 170 cm.

Com base nas informações anteriores, podemos organizar o que chamamos de “Quadro de

Distribuição de Frequências”.

Definindo arbitrariamente, por exemplo, 6 classes, com intervalos de 4 cm, teremos:

ESTATURAS DE 40 ALUNOS

O símbolo “ ⌐ “ é um intervalo fechado à esquerda e aberto à direita. Por exemplo, na classe

2, em 154 ⌐ 158 , teremos todas as frequências de 154 (inclusive) até 158 (exclusive).

i Estaturas (cm) Freqüências (f i)

1 150 ⌐ 154   4

2 154 ⌐ 158   9

3 158 ⌐ 162   11

4 162 ⌐ 166   8

5 166 ⌐ 170   5

6 170 ⌐ 174   3

Σ f i = 40

Page 41: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 41/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil41

Assim, ao invés de dizermos que a estatura de 1 aluno é 154 cm; de 4 alunos é de 155 cm;

de 3 alunos é de 156 cm; e de 1 aluno é de 157 cm, diremos que 9 alunos têm estaturas

entre 154, inclusive, e 158 cm, exclusive. Estaremos desse modo, agrupando os valores da

variável em intervalos, chamados em Estatística de classes.

Ao agruparmos os valores da variável em classes, ganhamos em simplicidade, mas

perdemos em pormenores. Nos dados originais (chamados de dados desagrupados),

podemos verificar que 4 alunos têm 161 cm de altura e que não existe nenhum aluno com

171 cm de altura. Entretanto, no quadro acima (dados agrupados) não podemos ver se

algum aluno tem a estatura de 159 cm. No entanto, sabemos, com segurança, que 11 alunos

têm a estatura compreendida entre 158 e 162 cm.

O que se pretende com a construção deste quadro é realçar o que há de essencial nos

dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição.

Recorde que a Estatística tem por finalidade específica analisar o conjunto de valores,

desinteressando-se por casos isolados.

A partir do quadro anterior, podemos elaborar um quadro mais completo, pelo qual será

possível extrair um maior volume de informações sobre a variável em estudo. Este quadro é

conhecido na Estatística como “Quadro de Distribuição de Frequências”, conforme abaixo:

QUADRO DE DISTRIBUIÇÃO DE FREQUÊNCIAS

i Classes (cm) x i f i fr i (%) Fi Fr i (%)

1 150 ⌐ 154   152   4   10,00   4   10,00

2 154 ⌐ 158   156   9   22,50   13   32,50

3 158 ⌐ 162   160   11   27,50   24   60,00

4 162 ⌐ 166   164   8   20,00   32   80,00

5 166 ⌐ 170   168   5   12,50   37   92,506 170 ⌐ 174   172   3   7,50   40   100,00

40 100TOTAL

Page 42: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 42/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil42

Com este quadro, podemos observar, por exemplo, que existem 27,5% dos alunos com

estaturas entre 158 e 162 cm. Verificamos também que existem 80% dos alunos com

estaturas até 166 cm e que existem 33 alunos com estaturas entre 154 e 170 cm. Cada um

dos “elementos” deste quadro será detalhado a seguir.

Relação Estatística x Profissão

Como vimos, a Estatística possui grande importância para nossa formação. Dessa forma,

relacione a Estatística com sua profissão, destacando os principais pontos onde sua

aplicação é (ou poderia ser) relevante. 

Page 43: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 43/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil43

UNIDADE 10 

Objetivo: Apresentar e discutir os principais Elementos de uma Distribuição de Frequência.

Elementos de uma Distribuição de Frequência

1. Classes (i)

Classes de frequência ou simplesmente classes são intervalos de variação da variável.

São representadas simbolicamente por i, sendo i = 1, 2, 3, ... , k, onde k é o número total declasses da distribuição.

2. Limi tes de Classe

Denominamos limites de classe os extremos de cada classe.

O menor número é o limite inferior da classe (  i

) e o maior número, o limite superior daclasse (Li).

3. Ampl itude de um intervalo de classe (hi)

Amplitude de um intervalo de classe ou, simplesmente, intervalo de classe é a medida do

intervalo que define a classe.

É obtida pela diferença entre os limites superior e inferior dessa classe e indicada por hi.

Assim:

hi = Li - i  

Page 44: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 44/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil44

 

4. Amplitude total da distr ibuição (AT)

É a diferença entre o limite superior da última classe (limite superior máximo) e o limiteinferior da primeira classe (limite inferior mínimo):

AT = Lmáx -   mín 

5. Amplitude Amostral (AA)

É a diferença entre o valor máximo e o valor mínimo da amostra.

AA = xmáx - xmín

6. Ponto médio de uma classe (xi)

Como o próprio nome indica, é o ponto que divide o intervalo de classe em duas partes

iguais. Para obtermos o ponto médio de uma determinada classe, calculamos a soma doslimites da classe e dividimos por 2, ou seja:

2

Lx   iii

 

 

O ponto médio de uma classe é o valor que a representa.

7. Frequência simples ou absoluta (fi)

Frequência simples ou frequência absoluta ou, simplesmente, frequência de uma classe ou

de um valor individual é o número de observações correspondentes a essa classe ou a esse

valor.

Page 45: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 45/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil45

Obviamente, a soma de todas as frequências é igual ao número total de observações n.

8. Frequência relativa (fri)

É o valor da razão entre a frequência simples e a frequência total.

9. Frequência acumulada (Fi)

É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma

dada classe.

10. Frequência acumulada relativa (Fri)

Frequência acumulada relativa de uma classe é a frequência acumulada da classe, dividida

pela frequência total da distribuição.

nf k 

1i i 

 

n

if 

if 

if 

ifr   

 

Fi = f 1 + f 2 + f 3 + ... + f k  

niF

if iFiFr   

 

Page 46: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 46/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil46

 

Antes de dar continuidade aos seus estudos é fundamental que você acesse sua

SALA DE AULA e faça a Atividade 1 no “link” ATIVIDADES.

Page 47: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 47/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil47

UNIDADE 11 

Objetivo: Apresentar e calcular o Número de Classes e Intervalo de Classes de umaDistribuição.

Cálculo do número de classes (k) e intervalo de classes (hi)

É a primeira preocupação na construção de uma distribuição de frequências. No exemplo

anterior, foi o valor de k foi arbitrariamente usado como sendo 6 e hi como 4 cm. Entretanto,vamos agora aprender a calcular estes valores, o que não necessariamente será o mesmo

valor arbitrado anteriormente.

Para determinação do nº de classes de uma distribuição podemos utilizar a Regra de

Sturges, que nos dá o nº de classes em função do número de valores da variável:

Em que k é o número de classes e n é o número total de dados.

Quando o resultado não for exato, iremos sempre arredondá-lo para mais,

independentemente do valor decimal encontrado.

Uma vez encontrado o número de classes da distribuição, devemos determinar a amplitude

do intervalo de classes (hi). Obtemos o valor de hi dividindo o valor da amplitude amostral

(AA) pelo valor de k.

2

n1k 

log

log  

Page 48: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 48/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil48

Assim, temos:

Também iremos manter o critério de arredondamento para mais para facilitar nossos

cálculos, na medida do possível.

Para o exemplo das estaturas dos alunos, temos:

n = 40 alunos

7321928093,51

301029996,0

602059991,1

2log

40log1k  

 

Observe que foi feito um arredondamento matemático para mais, independente do valor

decimal encontrado.

Para o cálculo de hi, temos:

AA = 173 - 150 = 23 cm

4285714286,3723

kAA

hi    

Observe que também foi feito um arredondamento matemático para mais, independente do

valor decimal encontrado.

Assim, teríamos para o exemplo anterior os valores calculados de k = 7 classes e hi = 4 cm.

Conforme foi dito, inicialmente não existia a preocupação em se calcular k, que havia sido

arbitrariamente definido como 6.

Sempre que for solicitada a aplicação da Fórmula de Sturges, deverão ser considerados k e

hi calculados.

AAih    

Page 49: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 49/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil49

UNIDADE 12 

Objetivo: Apresentar e discutir as principais Medidas de Posição.

Medidas de Posição

O estudo que fizemos sobre as distribuições de frequências, até agora, permite-nos

descrever, de modo geral, os grupos dos valores que uma variável pode assumir. Dessa

forma, podemos localizar a maior concentração de valores de uma dada distribuição, isto é,

se ela se localiza no início, no meio ou no final, ou ainda, se há uma distribuição por igual.

Porém, para ressaltar as tendências características de cada distribuição, isoladamente, ou

em confronto com outras, necessitamos introduzir conceitos que se expressem através de

números, que nos permitam traduzir essas tendências.

As medidas de posição são dados que nos orientam quanto à posição da distribuição em

relação ao eixo horizontal (eixo das abscissas).

Dentre as medidas de posição mais importantes estão as medidas de tendência central, que

recebem tal nome pelo fato dos dados observados tenderem, em geral, a ser agrupar em

torno dos valores centrais.

Destacamos:

  Média Aritmética;

  Mediana;

  Moda.

Page 50: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 50/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil50

As outras medidas de posição são as separatrizes, que englobam:

  A própria mediana;

  Os quartis;

  Os decis;

  Os percentis.

1. Média Aritmética ( x  )

É o quociente da divisão da soma dos valores da variável pela quantidade de variáveis.

Para dados não agrupados, temos:

nx

x i

 

Para dados agrupados, temos:

i

ii

f f x

Sendo:

 

x  => média aritmética

  xi => cada valor da variável, de ordem i

  n => número de valores

  fi => frequência simples, de ordem i

Page 51: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 51/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil51

 

A média é utilizada quando desejamos obter a medida de posição que possui maior

estabilidade

2. Moda (Mo)

É o valor que ocorre com maior frequência em uma série de valores.

Por exemplo, o salário modal de uma empresa é o salário mais comum, isto é, o salário

recebido pelo maior número de empregados desta empresa.

Nos dados não agrupados, podemos encontrar séries que não possuam valor modal (série

amodal). Em contra-partida, podem haver dois ou mais valores de concentração de uma

variável. Nestes casos, a série é chamada de bimodal, trimodal, tetramodal, etc .

Para dados agrupados, a moda é o ponto médio da classe modal, ou seja, da classe de

maior frequência.

A moda é utilizada quando:

  Desejamos obter uma medida rápida e aproximada de posição;

  A medida de posição deve ser o valor mais típico da distribuição.

3. A mediana ( Md )

É definida como o número que se encontra no centro de uma série de números, estando

estes dispostos segundo uma ordem.

É o valor situado de tal forma no conjunto de dados que o separa em dois subconjuntos de

mesmo número de elementos.

Page 52: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 52/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil52

Para dados não agrupados, se a série tiver número ímpar de elementos, a mediana é,

obviamente, o valor central da série, disposta em uma determinada sequência.

Se a série tiver um número par de elementos, a mediana será, por definição, qualquer dos

números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o

ponto médio dos valores centrais.

3.1 Mediana para dados agrupados

O problema consiste em determinar o ponto do intervalo em que está compreendida a

mediana.

Para tanto, temos inicialmente que determinar a classe na qual se acha à mediana - classe

mediana. Tal classe será, evidentemente, àquela correspondente à frequência acumulada

imediatamente superior a 2

f i

.

Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os

valores se distribuam uniformemente em todo o intervalo de classe.

Interpolação => Inserção de uma determinada quantidade de valores entre dois números

dados.

Page 53: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 53/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil53

 

Veja o exemplo:

ESTATURAS DE 40 ALUNOS DE UMA FACULDADE

i Classes (cm) x i f i fr i (%) Fi Fr i (%)

1 150 ⌐ 154 152 4 10,00 4 10,002 154 ⌐ 158 156 9 22,50 13 32,503 158 ⌐ 162 160 11 27,50 24 60,004 162 ⌐ 166 164 8 20,00 32 80,005 166 ⌐ 170 168 5 12,50 37 92,506 170 ⌐ 174 172 3 7,50 40 100,00

40 100TOTAL 

Classe mediana

Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos

determinar o valor que ocupa o 20 lugar, a partir do início da série, vemos que este deve

estar localizado na terceira classe (i = 3), supondo que as frequências destas classes

estejam uniformemente distribuídas.

Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar, a

partir do limite inferior, a distância:

54,21128

7114

1320114

 

A mediana será dada por: Md = 158 + 2,54 = 160,54 cm

Na prática, executamos os seguintes passos:

Page 54: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 54/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil54

1. Determinamos as frequências acumuladas;

2. Calculamos2

if 

;

3. Marcamos a classe correspondente à frequência acumulada imediatamente superior à

2if 

 (classe mediana) e, em seguida, empregamos a fórmula:

Na qual:

 *

 é o limite inferior da classe mediana;

  F(ant) é a frequência acumulada da classe anterior à classe mediana;

  f* é a frequência simples da classe mediana;

  h* é a amplitude do intervalo da classe mediana.

Empregamos a mediana quando:

1. Desejamos obter o ponto que divide a distribuição em partes iguais;

2. Há valores extremos que afetam a média de uma maneira acentuada;

3. A variável em estudo é salário.

*f 

*h)ant(F2

if 

*Md

   

Page 55: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 55/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil55

UNIDADE 13 

Objetivo: Apresentar e discutir as Medidas Separatrizes – Quartis.

Medidas Separatrizes

Como vimos, a mediana caracteriza uma série de valores devido à sua posição central. No

entanto, ela apresenta outra característica, tão importante quanto à primeira: ela separa a

série em dois grupos que apresentam o mesmo número de valores.

Assim, além das medidas de posição que estudamos, há outras que, consideradas

individualmente, não são medidas de tendência central, mas estão ligadas à mediana

relativamente à sua segunda característica, já que se baseiam em sua posição na série.

Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana,

conhecidas pelo nome genérico de medidas separatrizes.

1. Os quart is

Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há,

portanto, três quartis:

O primeiro quartil (Q1)

Valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e

as três quartas partes restantes (75%) são maiores.

Page 56: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 56/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil56

O segundo quartil (Q2)

Evidentemente, coincide com a mediana (Q2 = Md ).

O terceiro quartil (Q3)

Valor situado de tal modo na série que as três quartas partes (75%) dos dados são menores

que ele e uma quarta parte (25%) é maior.

Quando os dados estão agrupados, para determinar os quartis usamos a mesma técnica do

cálculo da mediana, bastando substituir, na fórmula da mediana, 2

if 

 por:

sendo k o número de ordem do quartil.

Assim, temos:

*f 

*h)ant(F4

if k

*kQ

   

4if k 

Page 57: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 57/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil57

UNIDADE 14 

Objetivo: Apresentar e discutir as Medidas Separatrizes – Decis.

Medidas Separatrizes

2. Os decis

Denominamos decis os valores de uma série que a dividem em dez partes iguais. Há,portanto, dez decis:

O primeiro decil (D1)

Valor situado de tal modo na série que 10% dos dados é menor que ele e 90% restantes são

maiores.

O segundo decil (D2)

Valor situado de tal modo na série que 20% dos dados é menor que ele e 80% restantes são

maiores.

O terceiro decil (D3)

Valor situado de tal modo na série que 30% dos dados é menor que ele e 70% restantes são

maiores.

Page 58: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 58/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil58

O quarto decil (D4)

Valor situado de tal modo na série que 40% dos dados é menor que ele e 60% restantes são

maiores.

O quinto decil (D5)

Valor situado de tal modo na série que 50% dos dados é menor que ele e 50% restantes são

maiores. Evidentemente, coincide com a mediana (D5 = Q2 = Md ).

O sexto decil (D6)

Valor situado de tal modo na série que 60% dos dados é menor que ele e 40% restantes são

maiores.

O sétimo decil (D7)

Valor situado de tal modo na série que 70% dos dados é menor que ele e 30% restantes sãomaiores.

O oitavo decil (D8)

Valor situado de tal modo na série que 80% dos dados é menor que ele e 20% restantes são

maiores.

Page 59: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 59/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil59

O nono decil (D9)

Valor situado de tal modo na série que 90% dos dados é menor que ele e 10% restantes são

maiores.

O décimo decil (D10)

Valor situado de tal modo na série que 100% dos dados é menor que ele e 0% restantes são

maiores (ou seja, nenhum é maior).

O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém a fórmula 2if 

 

será substituída por:

Sendo k o número de ordem do decil.

Assim, temos:

*f 

*h)ant(F10

if k

*kD

   

10if k 

Page 60: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 60/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil60

UNIDADE 15 

Objetivo: Apresentar e discutir as Medidas Separatrizes – Percentis.

Medidas Separatrizes

3. Os percentis

Denominamos percentis os noventa e nove valores que separam uma série em 100 partes

iguais.

O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula

2if 

 será substituída por:

sendo k o número de ordem do percentil.

Assim, temos:

*f 

*h)ant(F100

if k*

kP

   

100if k 

Page 61: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 61/120

Page 62: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 62/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil62

Calculando a média aritmética de cada um desses conjuntos, obtemos:

705

350nx

x i

;

705

350ny

y i

;

705

350nz

z i

;

Vemos, então, que os três conjuntos apresentam a mesma média aritmética: 70.

Entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que

todos os valores são iguais à média.

O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação

entre cada um de seus valores e a média representativa.

Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de

uma variável em torno de um valor de tendência central tomado como ponto de comparação,

podemos dizer que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto

Y apresenta uma dispersão ou variabilidade menor que o conjunto Z.

Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor

dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística

recorre às medidas de dispersão ou de variabilidade.

Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficientede variação.

Page 63: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 63/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil63

 Ampl itude Total

Para dados não agrupados

É a diferença entre o maior e o menor valor observado.

Para dados agrupados

É a diferença entre o limite superior da última classe e o limite inferior da primeira classe.

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da

série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a

idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou

variabilidade.

Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um

dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a

compreensão popular é mais importante que a exatidão e a estabilidade.

 AT = x(máx) – x(mín) 

 AT = L(superior) – (inferior) 

Page 64: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 64/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil64

UNIDADE 17 

Objetivo: Apresentar e discutir as Medidas de Dispersão ou Variabilidade – Variância eDesvio Padrão.

Medidas de Dispersão ou Variabilidade

Variância e Desvio Padrão

Como vimos, a amplitude total é instável, por se deixar influenciar pelos valores extremos,

que são, na sua maioria, devidos ao acaso.

A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em

consideração a totalidade dos valores da variável em estudo, o que faz delas índices de

variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados.

A variância baseia-se nos desvios em torno da média aritmética, porém determinando a

média aritmética dos quadrados dos desvios. Assim, representando a variância por s 2,temos:

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um nº em unidade

quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é uminconveniente.

n

xxf 

xxs

2i

i

2i2    

   

Page 65: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 65/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil65

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,

denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:

Assim, teremos que:

Desvio padrão:

n

xxs

2i  

  (Para população)

Quando nosso interesse não se restringe à descrição dos dados, mas, partindo da amostra,

visamos tirar inferências válidas para a respectiva população, convém efetuar uma

modificação, que consiste em utilizarmos o divisor n - 1 no lugar de n.

Assim, teremos:

Desvio padrão:

1n

xx

s

2i

 

  (Para amostra)

Desvio padrão para dados agrupados

Analogamente ao caso da média, o desvio padrão de um conjunto de dados agrupados é

dado por:

Desvio padrão na amostra:

2ss   

1n

x.nf .xs

2i

2i

   

Page 66: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 66/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil66

UNIDADE 18 

Objetivo: Apresentar e discutir o Coeficiente de Variação.

O coefic iente de variação (CV)

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas

unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 300;

no entanto, se a média for igual a 30, o mesmo não pode ser dito.

Além disso, o fato de o desvio padrão ser expresso na mesma unidade de medida dos dados

limita o seu emprego quando desejamos comparar duas ou mais séries de valores,

relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes.

Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou

variabilidade dos dados em termos relativos a seu valor médio. Toma-se então uma medida

relativa da variabilidade, comparando o desvio padrão com a média. Esta medida é ocoeficiente de variação (CV).

Já vimos que o desvio padrão tem a mesma unidade de medida que os dados, de modo queo coeficiente de variação é adimensional.

A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de

diferentes conjuntos de dados.

100xs

CV    

Page 67: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 67/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil67

UNIDADE 19 

Objetivo: Apresentar e discutir o Escore Padronizado.

Escore padronizado (zi)

No contexto de um único conjunto de dados, o desvio padrão pode ser interpretado

intuitivamente como unidade natural de dispersão de dados. Esta interpretação é utilizada na

construção de “escores padronizados”, de larga aplicação em medidas educacionais.

Por exemplo, em uma escala de 0 a 10, a nota 6 em uma prova em que a nota máxima foi

6 é muito mais do que a mesma nota 6 em uma prova em que a nota máxima foi 9. Uma

forma de captar essa diferença é considerar a nota do aluno como a sua posição relativa no

grupo, medida por:

, onde zi é o que se chama “escore padronizado”

Dessa forma, estamos comparando a nota do aluno com a média do grupo, ou seja, estamos

considerando o afastamento da nota em relação à média, tomando esta como origem. Ao

dividirmos aquela diferença pelo desvio padrão s, estamos tomando o desvio padrão como

unidade ou padrão de medida. Daí o nome desvio padrão.

s

xxz i

i

 

Page 68: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 68/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil68

  Aplicação das Ferramentas no dia a dia

De acordo com o que você aprendeu, como poderíamos aplicar as ferramentas e métodos

estatísticos em seu dia a dia ? Quais rotinas ou processos poderiam ser melhorados? Como? 

Page 69: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 69/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil69

UNIDADE 20 

Objetivo: Apresentar, discutir e calcular as Medidas de Assimetria.

Medidas de Assimetria

Você já ouviu falar dessas medidas ? Sabe como calculá-las? Vamos estão estudá-las nesta

unidade.

Chamamos de assimetria o grau de desvio ou afastamento da simetria de uma distribuição

(média e moda).

As medidas podem ser simétricas ou assimétricas. Elas são simétricas quando os valores da

Média e Moda se coincidem. Quando a média é menor que a moda, a medida é assimétrica

à esquerda ou negativa. Quando a média é maior que a moda, a medida é assimétrica à

direita ou positiva. Naturalmente, quanto mais próxima de zero for a medida de assimetria,

mais simétrica será a distribuição.

Os conceitos de assimetria de uma curva de frequência estão ilustrados nos gráficos abaixo:

Page 70: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 70/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil70

 

Baseando-se nas relações entre a Média e a Moda, podemos determinar o tipo de

assimetria.

Se tivermos:

  x – Mo = 0 => assimetria nula ou distribuição simétrica

  x – Mo < 0 => assimetria negativa ou à esquerda

  x – Mo > 0 => assimetria positiva ou à direita

onde:

x   = Média

Mo = Moda

Page 71: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 71/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil71

 

Exemplos:

1. Suponhamos os seguintes valores: x  = 18 e Mo = 18.

Temos nesse caso uma distribuição simétrica, pois x – Mo = 18 – 18 = 0

2. Suponhamos os seguintes valores: x  = 14,3 e Mo = 17.

Temos nesse caso uma distribuição assimétrica negativa, pois x – Mo = 14,3 – 17 = –

2,7

3. Suponhamos os seguintes valores: x  = 15,1 e Mo = 12.

Temos nesse caso uma distribuição assimétrica positiva, pois x – Mo = 15,1 – 12 =

3,1

Coeficiente de Assimetria de Pearson

Nessa medida de coeficiente, podemos verificar se a assimetria é moderada, fraca ou forte,por meio da fórmula:

s

Mdx3As

 

 , em que:

As = Coeficiente de Assimetria de Pearson

x   = Média

Md = Mediana

s = Desvio-padrão

Page 72: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 72/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil72

Após calcular os valores da média, mediana e desvio-padrão, basta aplicar na fórmula

anterior para se obter o Coeficiente de Assimetria de Pearson.

A assimetria é considerada moderada se o módulo do resultado encontrado estiver entre

0,15 e 1, ou seja, se 0,15 < |As| < 1. Se 0 < |As| ≤ 0,15 , temos uma assimetria fraca e,

caso |As| ≥ 1, então a assimetria é considerada forte.

Assim, temos:

As = 0 ⇒  temos uma simetria

0 < |As| ≤ 0,15  ⇒  temos uma assimetria fraca

0,15 < |As| < 1 ⇒  temos uma assimetria moderada

|As| ≥ 1  ⇒  temos uma assimetria forte

Exemplos:

1. Considere os valores: x  = 10, Md = 10 e s = 4,8. Calcule o coeficiente de assimetria.

s

Mdx3As

 

 

0

8,403

8,410103

As  

 

Como As = 0, temos neste caso uma simetria.

Page 73: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 73/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil73

2. Considere os valores: x   = 14,5 , Md = 15,2 e s = 4,2. Calcule o coeficiente de

assimetria.

s Mdx3As    

5,0

2,41,2

2,47,03

2,42,155,143

As  

 

Como As = – 0,5 e 0,15 < |As| < 1, temos neste caso uma assimetria negativa moderada.

3. Considere os valores: x   = 11,6 , Md = 10,62 e s = 2,1. Calcule o coeficiente de

assimetria.

s

Mdx3As

 

 

4,1

1,294,2

1,298,03

1,262,106,113

As  

 

Como As = 1,4 e |As| ≥ 1, temos neste caso uma assimetria positiva forte. 

Antes de dar continuidade aos seus estudos é fundamental que você acesse suaSALA DE AULA e faça a Atividade 2 no “link” ATIVIDADES.

Page 74: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 74/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil74

UNIDADE 21Objetivo: Apresentar, discutir e calcular as Medidas de Curtose.

Medidas de Curtose

Você já ouviu falar dessas medidas ? Sabe como calculá-las ? Vamos estão estudá-las nesta

unidade.

Chamamos de Curtose o grau de achatamento de uma distribuição em relação a uma

distribuição padrão, denominada Curva Normal, que é uma curva correspondente a uma

distribuição teórica de probabilidade.

Quando a distribuição apresentar uma curva de frequência mais aberta que a normal (ou

mais achatada em sua parte superior), ela receberá o nome de Platicúrtica.

Se a distribuição em estudo apresentar uma curva de frequência mais fechada que a normal

(ou mais aguda em sua parte superior), ela receberá o nome de Leptocúrtica.

A curva normal, que é a nossa base referencial, recebe o nome de Mesocúrtica.

Curva Normal ou Curva de Gauss 

Page 75: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 75/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil75

Os tipos de curvas de frequência em termos de curtose estão mostrados abaixo:

Coeficiente de Curtose

Uma fórmula para medir a curtose é mediante o cálculo do Coeficiente Percentílico de

Curtose, conforme abaixo:

1090

13

PP2

QQC

 

onde:

C = Coeficiente Percentílico de Curtose ou Coeficiente de Curtose

Q1 = 1º Quartil da Distribuição

Q3 = 3º Quartil da Distribuição

P10 = 10º Percentil da Distribuição

P90 = 90º Percentil da Distribuição

Page 76: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 76/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil76

Para o caso especial da Curva Normal, temos que C = 0,263.

Assim:

Se C = 0,263 => Curva Mesocúrtica

Se C < 0,263 => Curva Leptocúrtica

Se C > 0,263 => Curva Platicúrtica

Exemplos:

1. Sabendo que uma distribuição apresenta as seguintes medidas:

Q1 = 21,84 cm ; Q3 = 45,32 cm

P10 = 18,69 cm ; P90 = 53,24 cm

Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.

Solução:

1090

13

PP2

QQC

 

3398,0

10,6948,23

55,34248,23

69,1824,53284,2132,45

C  

 

Como 0,3398 > 0,263 , temos uma distribuição Platicúrtica em relação à normal.

Page 77: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 77/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil77

2. Uma distribuição salarial de uma empresa apresentou os seguintes valores:

Q1 = R$ 925,36 ; Q3 = R$ 2.043,75

P10 = R$ 658,31 ; P90 = R$ 2.983,87

Calcule o coeficiente de curtose e classifique a distribuição em relação à curva normal.

Solução:

1090

13

PP2

QQC

 

2405,0

12,651.439,118.1

56,325.2239,118.1

31,65887,983.2236,92575,043.2

C  

 

Como 0,2405 < 0,263 , temos uma distribuição Leptocúrtica em relação à normal.

Page 78: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 78/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil78

UNIDADE 22 

Objetivo: Apresentar e discutir os principais elementos relacionados às Probabilidades.

Noções de Probabilidades

É conveniente dispormos de uma medida que exprima a incerteza presente em afirmações

tais como: “É possível que chova amanhã”, ou “Não há chance de vitória”, em termos de uma

escala numérica que varie do impossível ao certo. Esta medida é a probabilidade.

O conceito de probabilidade é fundamental para o estudo de situações onde os resultados

são variáveis, mesmo quando mantidas inalteradas as condições de sua realização.

Experimento Aleatório

Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “éprovável que o meu time ganhe a partida de hoje” pode resultar:

  que, apesar do favoritismo, ele perca;

  que, como pensamos, ele ganhe;

  que empate.

Como vimos, o resultado final depende do acaso. Fenômenos como esses são chamados

fenômenos aleatórios ou experimentos aleatórios.

Experimentos ou fenômenos aleatórios são aqueles que, mesmo repetidos várias vezes sob

condições semelhantes, apresentam resultados imprevisíveis.

Page 79: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 79/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil79

É o processo de coleta de dados relativos a um fenômeno que acusa variabilidade em seus

resultados.

Espaço Amostral

É o conjunto de todos os resultados possíveis de um experimento. Vamos representá-lo por

S. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou ocorrer

coroa. Logo, temos:

S = {CARA , COROA}

Já ao lançarmos um dado, há seis resultados possíveis. Assim, temos:

S = {1, 2, 3, 4, 5, 6}

Ao conjunto desses resultados possíveis damos o nome de espaço amostral ou conjunto

universo, representado por S.

Do mesmo modo, como em dois lançamentos sucessivos de uma moeda podemos obter

cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou coroa no primeiro e

cara no segundo, ou coroa nos dois lançamentos, o espaço amostral é:

S = {(Ca, Ca) , (Ca, Co) , (Co, Ca) , (Co, Co)}

Cada um dos elementos de S que corresponde a um resultado recebe o nome de ponto

amostral. Assim:

2  S  2 é um ponto amostral de S

Page 80: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 80/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil80

Eventos

Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento

aleatório, representado por E.

Assim, qualquer que seja E, se E  S (E está contido em S), então E é um evento de S.

Se E = S, E é chamado evento certo.

Se E  S e E é um conjunto unitário, E é chamado evento elementar.

Se E = , E é chamado evento impossível.

Exemplo:

No lançamento de um dado, onde S = {1, 2, 3, 4, 5, 6}, temos:

  A = {2, 4, 6}  S; logo, A é um evento de S.

  B = {1, 2, 3, 4, 5, 6}  S; logo, B é um evento certo de S (B = S).

  C = {4}  S; logo, C é um evento elementar de S.

  D =   S; logo, D é um evento impossível de S.

Um evento é sempre definido por uma sentença. Assim, os eventos acima podem ser

definidos pelas sentenças:

  “Obter um número par na face superior.”

  “Obter um número menor ou igual a 6 na face superior.”

  “Obter o número 4 na face superior.”

  “Obter um número maior que 6 na face superior.”

Page 81: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 81/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil81

UNIDADE 23 

Objetivo: Apresentar e calcular as Probabilidades.

Probabilidade

Dado um experimento aleatório, sendo S o seu espaço amostral, vamos admitir que todos os

elementos de S tenham a mesma chance de acontecer, ou seja, que S é um conjunto

equiprovável.

Chamamos de probabilidade de um evento A (A  S) o número real P(A), tal que:

Onde:

  n(A) é o número de elementos de A ou número de vezes que A ocorreu;

  n(S) é o número de elementos de S ou número total de repetições do experimento;

Assim, pelos exemplos anteriores podemos concluir que, sendo n(S) = n:

  A probabilidade do evento certo é igual a 1 =>

)(

)()(

Sn

AnAP    

P(S) = 1

Page 82: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 82/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil82

  A probabilidade do evento impossível é igual a zero =>

  A probabilidade de um evento E qualquer (E  S) é um número real P(E), tal que:

  A probabilidade de um evento elementar E qualquer é, lembrando que n(E) = 1:

Eventos Complementares

Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra

(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento

existe sempre a relação:

Eventos Independentes

Dizemos que dois eventos são independentes quando a realização ou a não realização de

um dos eventos não afeta a probabilidade da realização do outro e vice-versa.

Por exemplo, quando lançamos dois dados, o resultado obtido em um deles independe do

resultado obtido no outro.

0 P(E) 1

n1

)E(P    

pqqp     11

P( 

) = 0

Page 83: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 83/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil83

Se dois eventos são independentes, a probabilidade de que eles se realizem

simultaneamente é igual ao produto das probabilidades de realização dos dois eventos.

Assim, sendo p1 a probabilidade de realização do primeiro evento e p2 a probabilidade de

realização do segundo evento, a probabilidade de que tais eventos se realizem

simultaneamente é dada por:

Eventos Mutuamente Exclusivos

Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de umexclui a realização do(s) outro(s).

Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são

mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza.

Se dois eventos são mutuamente exclusivos, a probabilidade de que um ou outro se realize é

igual à soma das probabilidades de que cada um deles se realize:

21  ppp    

21   ppp    

Page 84: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 84/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil84

UNIDADE 24 

Objetivo: Exercícios resolvidos envolvendo o cálculo de Probabilidades.

Exercícios Resolvidos Envolvendo o Cálculo de Probabilidades

1. Qual a probabilidade de sair o valete de espadas quando retiramos uma carta de um

baralho de 52 cartas ?

Solução :

Evento A = {sair valete de espadas em um baralho de 52 cartas}

P(A) = Probabilidade de ocorrer o Evento A

n(A) = Quantidade de valetes de espadas existentes no baralho de 52 cartas

n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do

baralho.

Logo, temos:

%92,10192308,0521

)S(n)A(n

)A(P    

Resposta: A probabilidade de sair o valete de espadas quando retiramos uma carta de

um baralho de 52 cartas é de aproximadamente 1,92%.

2. Qual a probabilidade de sair uma dama quando retiramos uma carta de um baralho de 52

cartas ?

Solução :

Evento A = {sair dama em um baralho de 52 cartas}

P(A) = Probabilidade de ocorrer o Evento A

n(A) = Quantidade de damas existentes no baralho de 52 cartas

Page 85: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 85/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil85

n(S) = Quantidade de elementos do Espaço Amostral S, ou seja, número de cartas do

baralho.

Logo, temos:

%69,70769231,0524

)S(n)A(n)A(P    

Resposta: A probabilidade de sair uma dama quando retiramos uma carta de um

baralho de 52 cartas é de aproximadamente 7,69%.

3. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 7.

Solução :

O evento “obter soma igual a 7” é formado pelos elementos (1, 6) , (6, 1) , (2, 5) , (5, 2) ,

(3, 4) , (4, 3). Como o número de elementos do Espaço Amostral S é 36 (pois existem ao

todo 6 x 6 = 36 possíveis combinações no lançamento de dois dados), temos que:

≈366

=)S(n)A(n

=)A(P 16,67% 

4. Em um lote de 18 peças, 5 são defeituosas. Sendo retirada uma peça, calcule:

a) A probabilidade de essa peça ser defeituosa;

b) A probabilidade de essa peça não ser defeituosa;

Solução :

a) Evento A = {sair peça defeituosa}

Page 86: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 86/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil86

P(A) = Probabilidade de ocorrer o Evento A

n(A) = Quantidade de peças defeituosas existentes no lote.

n(S) = Quantidade de total de peças do lote.

Logo, temos:

%78,27≈277777778,0=185

=)S(n)A(n

=)A(P

b) Evento B = {sair peça não defeituosa}

P(B) = Probabilidade de ocorrer o Evento B

n(B) = Quantidade de peças não defeituosas existentes no lote.

n(S) = Quantidade de total de peças do lote.

Logo, temos:

%22,72≈722222222,0=1813

=)S(n)B(n

=)B(P

Como os eventos A e B são eventos complementares, também poderíamos fazer

neste problema:

P(A) + P(B) = 1

P(B) = 1 – P(A) = 1 – 0,277777778 = 0,722222222 ≈ 72,22% 

Resposta: A probabilidade de se retirar uma peça defeituosa é de aproximadamente

27,78% e de se retirar uma não defeituosa é de aproximadamente 72,28%. 

5. Uma urna A  contém: 5 bolas brancas, 3 pretas, 3 verdes; uma urna B  contém: 4 bolas

brancas, 2 pretas, 2 verdes; uma urna C  contém: 3 bolas brancas, 2 pretas, 4 verdes.

Uma bola é retirada de cada urna. Qual a probabilidade de as três bolas retiradas da

primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde ?

Solução :

p1 = { sair bola branca na primeira urna }

p2 = { sair bola preta na segunda urna }

Page 87: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 87/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil87

p3 = { sair bola verde na terceira urna }

Como são três acontecimentos simultâneos e independentes  (uma urna não afeta

outra), temos que:

pTotal = p1 x p2 x p3 

995

=79240

=94

×82

×115

=pTotal  5,05% 

6. De dois baralhos retiram-se, simultaneamente, uma carta do primeiro baralho e uma

carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser uma dama e a

do segundo ser o 6 de copas ?

Solução :

p1 = { sair dama }

p2 = { sair 6 de copas }

Como são dois acontecimentos simultâneos e independentes  (um baralho não afeta

outro), temos que:

pTotal = p1 x p2 

6761

=2704

4=

521

×524

=pTotal  0,15% 

7. De um baralho retiram-se, ao acaso, duas cartas sem reposição. Qual a probabilidade

de a primeira carta ser o rei de espada e a segunda ser o valete de ouros ?

Solução :

p1 = { sair rei de espada }

p2 = { sair valete de ouros }

Page 88: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 88/120

Page 89: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 89/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil89

p2 = { sair dama } =524

  =131

 

p3 = { sair valete } =

52

4  =

13

Como os três eventos são mutuamente exclusivos  (ou   sai rei, ou   sai dama ou   sai

valete – uma opção exclui a outra), temos que:

pTotal = p1 + p2 + p3 

=13

1

+13

1

+13

1

=pTotal 13

3

 23,08%

Também poderíamos resolver este problema da seguinte forma:

Como em um baralho temos 12 figuras (4 reis, 4 damas e 4 valetes), teríamos que:

13

3=

52

12=pTotal  23,08%

10. Qual a probabilidade de sair uma carta de paus ou de copas quando retiramos uma carta

de um baralho ?

Solução :

p1 = { sair paus } =5213

  =41

 

p2 = { sair copas } = 5213

  = 41

 

Como os dois eventos são mutuamente exclusivos  (ou   sai paus ou   sai copas – uma

opção exclui a outra), temos que:

Page 90: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 90/120

Page 91: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 91/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil91

Como estes quatro eventos são mutuamente exclusivos (ou  sai soma 9, ou  soma 10,

ou  soma 11 ou  soma 12 – uma opção exclui a outra), temos que:

pTotal = p1 + p2 + p3 + p4 

185

=3610

=361

+362

+363

+364

=pTotal  27,78 %

12. São dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma carta do primeiro

baralho e uma carta do segundo. Qual a probabilidade de tirarmos um 4 e um 7, não

necessariamente nesta ordem ?

Solução :

p1 = { sair quatro } =524

  =131

 

p2 = { sair sete } =524

  =131

 

Vamos calcular a probabilidade de termos um quatro no primeiro baralho e um sete no

segundo baralho. Como são dois acontecimentos simultâneos e independentes  (um

baralho não afeta outro), temos que:

p3 = p1 x p2  → 169

1=

131

×131

=p3  

A probabilidade de tirarmos um sete  no primeiro baralho e um quatro  no segundo

baralho é a mesma, ou seja:

p4 = p1 x p2  → 169

1=

131

×131

=p4  

Como estes dois eventos são mutuamente exclusivos (ou  sai a sequência 4 – 7  , ou  

sai a sequência 7 – 4 , pois uma opção exclui a outra), temos que:

Page 92: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 92/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil92

 

pTotal = p3 + p4 

1692=

1691+

1691=pTotal  1,18 %

Page 93: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 93/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil93

UNIDADE 25 

Objetivo: Apresentar e discutir as principais Distribuições de Probabilidades.

Distribuições de Probabilidade

Serão apresentados dois modelos teóricos de Distribuição de Probabilidade, aos quais um

experimento aleatório estudado possa ser adaptado, o que permitirá a solução de grande

número de problemas práticos.

1. Variável Aleatória

Suponhamos um espaço amostral S e que a cada ponto amostral seja atribuído um número.

Fica, então, definida uma função chamada VARIÁVEL ALEATÓRIA, indicada por uma letra

maiúscula, sendo seus valores indicados por letras minúsculas.

Assim, se o espaço amostral relativo ao “lançamento simultâneo de duas moedas” é S =

{(Ca,Ca) , (Ca,Co) , (Co,Ca) , (Co,Co)} e se X representa “o número de caras” que

aparecem, a cada ponto amostral podemos associar um número para X, de acordo com a

tabela abaixo:

Ponto Amost ral X

(Ca,Ca) 2

(Ca,Co) 1

(Co,Ca) 1

(Co,Co) 0

Page 94: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 94/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil94

2. Distribuição de Probabilidade

Consideremos a distribuição de frequências relativa ao número de acidentes diários em um

estacionamento:

Número de Acidentes Frequências

0 22

1 5

2 2

3 1

TOTAL  30  

Em um dia qualquer, a probabilidade de:

  Não ocorrer acidente é:73,0

3022p  

 

  Ocorrer um acidente é:17,0

305

p    

  Ocorrerem dois acidentes é:07,0

302

p    

  Ocorrem três acidentes é:03,0

301

p    

Page 95: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 95/120

Page 96: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 96/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil96

Logo, para o caso do lançamento de duas moedas, teremos:

Ponto Amostral X P(X)

(Ca,Ca) 241

21x

21

 

(Ca,Co) 141

21

x21

 

(Co,Ca) 14

1

2

1x

2

1

 

(Co,Co) 041

21

x21

 

Assim, poderemos escrever:

Número de Caras (X) P(X)

241

 

142

 

041

 

  1 

Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca

entre os valores da variável aleatória X e os valores da variável P. Esta correspondência

Page 97: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 97/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil97

define uma função; os valores xi ( i = 1, 2, 3, ... , n) formam o domínio da função e os valores

pi ( i = 1, 2, 3, ... , n) formam o seu conjunto imagem.

Esta função, assim definida, é denominada função de probabilidade e é representada por:

A função P (X = xi) determina a distribuição de probabilidade da variável aleatória X.

Assim, ao lançarmos um dado, a variável aleatória X, definida por “pontos de um dado”, pode

tomar os valores 1, 2, 3, 4, 5 e 6.

Como a cada um destes valores está associada uma e uma só probabilidade de realização e

  1)x(P i ·, fica definida uma função de probabilidade, da qual resulta a seguinte

distribuição de probabilidade:

X P(X)

161

 

261

 

361

 

461

 

5 61

 

661

 

  1 

f(x) = P (X = x i) 

Page 98: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 98/120

Page 99: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 99/120

Page 100: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 100/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil100

UNIDADE 27 

Objetivo: Apresentar e discutir a Distribuição Normal.

Distribuição Normal

Curva Normal

Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é aDISTRIBUIÇÃO NORMAL.

Muitas variáveis analisadas em pesquisas socioeconômicas correspondem à distribuição

normal ou dela se aproximam.

O aspecto gráfico de uma distribuição normal é o da figura abaixo:

Curva Normal ou Curva de Gauss

Page 101: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 101/120

Page 102: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 102/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil102

Vamos determinar a probabilidade de um parafuso ter diâmetro com valor entre 2 e 2,05 cm.

Essa probabilidade é indicada por: P(2 < X < 2,05) , correspondente à área hachurada na

figura abaixo:

Se X é uma variável aleatória com distribuição normal de média x  e desvio padrão s, então avariável z tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e

desvio padrão 1, onde z é o escore padronizado, calculado da seguinte forma:

As probabilidades associadas à distribuição normal padronizada são encontradas em

tabelas, não havendo necessidade de serem calculadas.

Observe a curva e tabela a seguir:

Área subentendida pela Curva Normal reduzida de 0 a Z:

sxx

z i   

sxxz i   

Page 103: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 103/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil103

 

Page 104: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 104/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil104

A probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z é:

Temos, então, que se X é uma variável aleatória com distribuição normal de média x   e

desvio padrão s, podemos escrever:

P ( x < X < x ) = P ( 0 < Z < z ), com sxx

z i  .

Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, devemos calcular o valor

de z que corresponde a x = 2,05 (x = 2  z = 0, pois x = 2). Temos, então:

Onde:

P(2 < X < 2,05) = P(0 < X < 1,25)

Olhando na tabela o valor de z = 1,25, temos:

Na primeira coluna encontramos o valor de 1,2. Em seguida, encontramos, na primeira linha,

o valor 5, que corresponde ao último algarismo do número 1,25. Na interseção da linha e

coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever:

P(0 < Z < z) 

P(0 < Z < 1,25) = 0,3944

25,104,005,0

04,0205,2

sxx

z i

Page 105: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 105/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil105

Assim, a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro

entre a média x = 2 e o valor x = 2,05 é 0,3944.

Escrevemos, então:

P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%

Page 106: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 106/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil106

UNIDADE 28 

Objetivo: Apresentar e discutir os conceitos principais relacionados à Correlação.

Correlação

Nosso estudo anterior se preocupava em descrever a distribuição de valores de uma única

variável. Entretanto, quando consideramos observações de duas ou mais variáveis, surge um

novo problema: as relações que podem existir entre as variáveis estudadas.

Quando consideramos variáveis como peso e altura de um grupo de pessoas, uso do cigarro

e a incidência de câncer, vocabulário e compreensão da leitura, dominância e submissão,

procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e

qual o grau dessa relação. Para isso, é necessário o conhecimento de novas medidas.

Sendo esta relação de natureza quantitativa, o instrumento adequado para descobrir e medir

essa relação denomina-se CORRELAÇÃO.

Uma vez caracterizada esta relação, procuraremos descrevê-la através de uma função

matemática. A REGRESSÃO é o instrumento adequado para determinar os parâmetros

dessa função.

Relação Funcional x Relação Estatística

Já sabemos que o perímetro e o lado de um quadrado estão relacionados. A relação que os

liga é perfeitamente definida e pode ser expressa por meio de uma sentença matemática:

4  

Page 107: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 107/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil107

Onde  é o perímetro e   é o lado do quadrado.

Ao atribuirmos um valor qualquer a  , é possível determinar exatamente o valor de .

Consideremos, agora, a relação que existe entre o peso e a estatura de um grupo de

pessoas. É evidente que essa relação não é do mesmo tipo da anterior; ela é bem menos

precisa. Pode acontecer que a estaturas diferentes correspondam pesos iguais ou que a

estaturas iguais correspondam pesos diferentes. Porém, em média, quanto maior a estatura,

maior o peso.

As relações do tipo perímetro-lado são conhecidas como relações funcionais e as do tipo

peso-estatura, como relações estatísticas.

Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe

correlação entre elas.

Diagrama de Dispersão

Consideremos uma amostra aleatória formada por 10 dos 98 alunos de uma determinada

Faculdade A e pelas notas por eles obtidas nas disciplinas de Matemática e Estatística.

Vejamos os valores obtidos:

Matemática (xi) Estatísti ca (yi)

01 5,0 6,008 8,0 9,024 7,0 8,038 10,0 10,0

44 6,0 5,058 7,0 7,059 9,0 8,072 3,0 4,080 8,0 6,092 2,0 2,0

NOTASNº doaluno

Page 108: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 108/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil108

Representando os pares ordenados (xi , yi) em um sistema coordenado cartesiano ortogonal,

obtemos uma nuvem de pontos que denominamos Diagrama de Dispersão. Este diagrama

nos fornece uma ideia grosseira, porém útil, da correlação existente entre as variáveis:

Page 109: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 109/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil109

UNIDADE 29 

Objetivo: Apresentar e discutir Correlação Linear, calculando o Coeficiente de Correlação.

Correlação Linear

Os pontos obtidos anteriormente, vistos em conjunto, formam uma elipse em diagonal.

Podemos imaginar que, quanto mais fina for à elipse, mais ela se aproximará de uma reta.

Dizemos, então, que a correlação de forma elíptica tem como “imagem” uma reta, sendo, por

isso, denominada correlação linear.

É possível verificar que a cada correlação está associada como “imagem” uma relação

funcional. Por este motivo, as relações funcionais são chamadas relações perfeitas.

Page 110: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 110/120

Page 111: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 111/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil111

Coeficiente de Correlação Linear

O instrumento empregado para medir a correlação linear é o coeficiente de correlação. Esse

coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o

sentido dessa correlação (positivo ou negativo).

Faremos o uso do Coeficiente de Correlação de Pearson ( r ) , que é dado por:

Onde n é o número de observações.

Os valores limites de r são -1 e +1.

  Se r = +1 , há uma correlação perfeita e positiva entre as variáveis;

  Se r = -1 , há uma correlação perfeita e negativa entre as variáveis;

  Se r = 0 , ou não há correlação entre as variáveis, ou a relação que porventura possa

existir não é linear;

Para que uma relação possa ser descrita por meio do Coeficiente de Correlação de Pearson

é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de

verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse

apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de

correlação curvilínea.

Para podermos tirar conclusões significativas sobre o comportamento simultâneo das

variáveis analisadas, é necessário que:

0,6 ≤ | r | ≤ 1 

  2i

2i

2i

2i

iiii

yynxxn

yxyxnr 

Page 112: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 112/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil112

  Se 0,3 ≤ | r | < 0,6 , há uma correlação relativamente fraca entre as variáveis.

  Se 0 < | r | < 0,3 , a correlação é muito fraca e praticamente nada podemos concluir

sobre a relação entre as variáveis em estudo.

Vejamos o exemplo anterior:

Para o cálculo do coeficiente de coeficiente de correlação linear r, devemos calcular colunas

auxiliares xi.yi ,

2

ix   e

2

iy  . Posteriormente devemos calcular o somatório de cada coluna.

Assim, teremos:

Matemática (x i) Es tat ís tica (yi)

01 5,0 6,008 8,0 9,024 7,0 8,0

38 10,0 10,044 6,0 5,058 7,0 7,059 9,0 8,072 3,0 4,080 8,0 6,092 2,0 2,0

NOTASNº doaluno

Matemática (x i) Estat ís tica (yi) x i . y i x2i y2

i

5,0 6,0 30,0 25,0 36,0

8,0 9,0 72,0 64,0 81,0

7,0 8,0 56,0 49,0 64,0

10,0 10,0 100,0 100,0 100,0

6,0 5,0 30,0 36,0 25,0

7,0 7,0 49,0 49,0 49,0

9,0 8,0 72,0 81,0 64,03,0 4,0 12,0 9,0 16,0

8,0 6,0 48,0 64,0 36,0

2,0 2,0 4,0 4,0 4,0

Σ 65 65 473 481 475

Page 113: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 113/120

Page 114: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 114/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil114

UNIDADE 30 

Objetivo: Apresentar, discutir e calcular Regressão Linear e Equação da Reta.

Regressão Linear

 Ajus tamento da Reta

Sempre que desejamos estudar determinada variável em função de outra, fazemos umaanálise de regressão.

Ela tem por objetivo descrever, através de um modelo matemático, a relação entre duas

variáveis, partindo de n observações das mesmas.

A variável sobre a qual desejamos fazer uma estimativa recebe o nome de variável

dependente e a outra recebe o nome de variável independente.

Assim, supondo X a variável independente e Y a variável dependente, vamos determinar oajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função

definida por:

Onde a e b são os parâmetros da equação e:

2i

2i

iiii

xxn

yxyxna   xayb    

 Y = a.X + b

Page 115: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 115/120

Page 116: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 116/120

Page 117: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 117/120

 

Copyright © 2007, ESAB – Escola Superior Aberta do Brasil117

Interpolação e Extrapolação

Observando os dados do exercício anterior, podemos facilmente verificar que não temos a

nota 4,0 entre as notas de Matemática.

Entretanto, obtida a equação estimada da reta, podemos estimar a nota correspondente em

Estatística, fazendo X = 4,0 na equação estimada Ŷ. 

Eis uma das grandes aplicações da Regressão Linear !!

Assim, temos que:

Ŷ = 0,8632 X + 0,8889 

Ŷ = 0,8632 . 4,0 + 0,8889

Ŷ = 4,34 

Isso significa dizer que, com base nas notas apresentadas do grupo, por meio da equação da

reta de Regressão Linear, podemos estimar a nota de Estatística. Uma pessoa que por

ventura tirasse 4,0 em Matemática, dentro daquele grupo, essa nota estimada seria 4,34.

Como a nota 4,0 pertence ao intervalo de notas de Matemática do grupo (que vai de 2,0 a

10,0), dizemos que foi feita uma Interpolação.

E qual seria a nota estimada de Estatística de uma pessoa que tirasse 1,0 em Matemática?

De forma análoga, podemos também fazer uma estimativa para a nota de Estatística,

fazendo X = 1,0 na equação estimada Ŷ. 

Assim, temos que:

Ŷ = 0,8632 X + 0,8889 

Ŷ = 0,8632 . 1,0 + 0,8889 

Ŷ = 1,75 

Page 118: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 118/120

Page 119: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 119/120

Page 120: Modulo 5 - Estatistica.pdf

8/9/2019 Modulo 5 - Estatistica.pdf

http://slidepdf.com/reader/full/modulo-5-estatisticapdf 120/120

 

BIBLIOGRAFIA BUSSAB, Wilton O, MORETTIN, Pedro A. Estatística Básica. 5a ed. São Paulo: Saraiva,

2003.

BUSSAB, Wilton O, MORETTIN, Pedro A. Métodos quantitativos: Estatística Básica.

Editora Atual, 1987.

CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 2002..

HOFFMAN, Rodolfo. Estatística para Economistas. São Paulo: Livraria Pioneira Editora,1980.

LEVIN, J. Estatística Aplicada a Ciências Humanas. São Paulo: Harbra, 1987.

LEVINE, David M., STEPHAN, David, KREHBIEL, Timothy C., BERENSON, Mark L.

Estatística - Teoria e Aplicações usando o Microsoft Excel em Português . Rio de

Janeiro: LTC, 2005.

MEYER, Paul L. Probabilidade: aplicações à Estatística. Tradução do Prof. Ruy C. B.Lourenço Filho. Rio de Janeiro: LTC, 1978.