aula3 cap 02

22
Estatística e Probabilidade Prof. Dr . Alysson Steimache r Prof. Dr . Alysson Steimache r Aula 3 – Cap 02 Estatística Descritiva

Upload: alysson-steimacher

Post on 08-Jul-2015

513 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Aula 3 – Cap 02

Estatística Descritiva

Page 2: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

estudaremos medidas de tendência central, medidas de variação

e medidas de posição.

Nesta aula...

Page 3: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Medidas de tendência central

Uma medida de tendência central é um valor que representa uma entrada típica, ou central, de um conjunto de dados.

Os três tipos de medidas de tendência central mais usadas são:

• Média • Mediana • Moda

Page 4: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

MédiaA média de um conjunto de dados éa soma de toda as entradas de dados dividida pelo números de entradas.

Em uma população:

Em uma amostra:

Dica de estudo

Média de uma amostra

Média de uma população

μ

Número de entradas em uma amostra

n

Número de entradas em uma população

N

Variável que representa uma entrada de dados

x

Indica uma soma de valores

Σ

DescriçãoSímbolo

x

Page 5: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

A Mediana de um conjunto de dados é o dado que fica no meio quando as entradas são colocadas em ordem crescente ou decrescente.

Mediana

Moda

A Moda de um conjunto de dados é o dado que ocorre com maior freqüência.

Se nenhuma entrada é repetida, o conjunto de dados não possui moda.

Se duas entradas ocorrem com freqüência elevada → dados são bimodais

Page 6: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

0 2 2 2 3 4 4 6 40

2 4 2 0 40 2 4 3 6Calcule a média, a mediana e a moda.

Média:

Mediana: Ordene os dados.

O valor que fica no meio é 3, logo a mediana é 3.

Moda: A moda é 2, pois esse é o valor que ocorre mais vezes.

Um instrutor registra a média de faltas de seus alunos emdeterminado semestre. Em uma amostra aleatória, os dados são:

Exemplo...

Page 7: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Exemplo...Em um debate político pediu-se que uma amostra dos membros do público citasse o partido a qual eles pertenciam. As respostas estão na Tabela abaixo:

21PMDB9Outros

56PSDB34PT

frequênciaPartido Político Qual é a moda das respostas?

A moda é a única medida de tendência central que pode ser utilizada para descrever dados no nível nominal de medida.

Page 8: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Uma média ponderada é a média de um conjunto de dados cujas entradas tem pesos variáveis. Uma média ponderada é dada por:

∑∑=

wwx

x).(

Onde w é o peso de cada entrada

Média Ponderada

Page 9: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson SteimacherΣw=1

0,05

0,10,2

0,150,5

Pesos, w

Σ(xw)=8,86

10,0

9,88,2

9,68,6

notas,x

0,98Laboratório de computação

1,64Exame final

0,5Trabalho extra-classe

1,44Exame no meio do semestre

4,3Média dos testes

xwFonte

Exemplo...Você está fazendo uma disciplina na qual sua nota final é composta por:

Assim, sua média ponderada para a disciplina é de 88,6

Page 10: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

A média de uma distribuição de freqüências de uma amostra éaproximada por:

nfx

x ∑= ).(

Onde x e f são os pontos médios e freqüências, respectivamente.

∑= fn

Média de uma distribuição de freqüência

Page 11: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Aspecto das distribuições de freqüência As distribuições de frequência podem ser:

Simétricas: Quando pudermos traçar uma linha vertical pelo ponto médio do gráfico e as duas metades forem iguais.

As distribuições de freqüência podem ser:

Simétricas: Quando todas as entradas, ou classes na distribuição tiverem freqüências iguais

Uniforme:

Page 12: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Média > Mediana Média < Mediana

Se a ‘cauda’ do gráfico se prolongar mais para a direita, a distribuição échamada de assimétrica à direita.

Assimétricas à direita:

Se a ‘cauda’ do gráfico se prolongar mais para a esquerda, a distribuição échamada de assimétrica à esquerda.

Assimétricas à esquerda:

Page 13: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Medidas de variação

• Desvio, • Variância e• Desvio padrão

Page 14: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

O desvio de uma entrada x em um conjunto de dados de uma população ou amostra é a diferença entre a entrada e a média (μ ou ) do conjunto de dados

Desvio populacional

Em uma população, o desvio de cada valor x é:

Em uma amostra, o desvio de cada valor x é:

x

Como a soma dos desvios de todas as entradas é igual a zero, não faz sentido determinar a média dos desvios.

Desta maneira, você pode elevar ao quadrado cada desvio e obter a média...

Page 15: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Variância populacional

( )N

x∑ −=

22 μ

σ

É a média da soma dos quadrados dos desvios de um conjunto de dados de uma população com N entradas, ou seja

Desvio Padrão populacional

( )N

x∑ −==

22 μ

σσ

É a raiz quadrada da variância populacional:

Page 16: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Variância amostralA média dos quadrados dos desvios padrão é chamada de variância amostral. Para um conjunto de dados de uma amostra com n entradas é:

Desvio Padrão amostral

Uma desvantagem da variância consiste no fato de suas unidades normalmente não terem sentido (como dólares ao quadrado, por exemplo). Assim, pode-se retornar a unidade original dos dados tomando sua raiz quadrada.

( )1

22

−= ∑

nxx

s

( )1

22

−== ∑

nxx

ss

É a raiz quadrada da variância amostral:

Page 17: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Resumindo...Para obter a variância e o desvio padrão

1. Obtenha a média do conjunto de dados

2. Obtenha o desvio de cada entrada

3. Eleve ao quadrado cada desvio

4. Some os resultados para obter a soma dos quadrados

5. Divida por (n – 1) para obter a variância

6. Determine a raiz quadrada da variância para obter o desvio padrão

( )1

22

−= ∑

nxx

s

( )1

22

−== ∑

nxx

ss

( )2x x−∑

xxx −=

( )2x x−

xx

n= ∑

Page 18: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Existe ainda...

Desvio Padrão para dados agrupados

Grandes conjuntos de dados são normalmente mais bem representados por uma distribuição de freqüência.

A fórmula para o desvio padrão da amostra de uma distribuição de freqüência é

( )1

2

−= ∑

nfxx

s

na qual n=Σf é o número de entradas no conjunto de dados.

Page 19: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Definição:

Os três quartis Q1, Q2 e Q3 dividem aproximadamente um conjunto ordenado de dados em quatro partes.

• 1/4 dos dados ficam dentro ou abaixo do primeiro quartil

• metade dos dados ficam dentro ou abaixo do segundo quartil (éigual a mediana do conjunto de dados)

• ¾ dos dados ficam dentro ou abaixo de terceiro quartil

Medidas de PosiçãoSão utilizadas para identificar a posição de uma entrada dentro de um conjunto de dados. Quartis, por exemplo, são números que dividem em partes iguais um conjunto de dados ordenados.

Page 20: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

A pontuação nos testes de 15 empregados envolvidos em um curso de treinamento estão dispostos abaixo. Obtenha Q1, Q2 e Q3.

13 9 18 15 14 21 7 10 11 20 5 18 37 16 17

5 7 9 10 11 13 14 15 16 17 18 18 20 21 37

Q1Q2 Q3

Metade inferior Metade superior

Exemplo:

Q2 = Mediana Q1 = Mediana dos dadosabaixo de Q2

Q3 = Mediana dos dadosacima de Q2

Page 21: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Amplitude interquartil (AIQ)A amplitude interquartil (AIQ) de um conjunto de dados é a diferença entre o primeiro e o terceiro quartis.

A AIQ é uma medida da variação que fornece uma idéia de quanto os 50% médios dos dados variam.

A AIQ também serve para identificar dados estranhos (discrepantes).

Qualquer valor acima de 1,5 AIQ à esquerda de Q1 ou a direita de Q3 é estranho.

No exemplo anterior, 37 é um dado estranho as pontuações.

Amplitude interquartil (AIQ)= Q3 – Q1

(AIQ)= Q3 – Q1 = 18-10 = 8 (as pontuações no teste na metade do conjunto de dados varia em 8 pontos)

Page 22: Aula3 cap 02

Estatística e Probabilidade

Prof. Dr. Alysson Steimacher

Prof. Dr. Alysson Steimacher

Outras medidas de posição...

• Decis → Divide o conjunto de dados em dez partes iguais (D1, D2, D3.......D9)

• Percis → Divide o conjunto de dados em cem partes iguais (P1, P2, P3.......P99)