apostila estatistica - autor ceadufop

173
Jorge Luiz Brescia Murta Tays Torres Ribeiro das Chagas ESTATÍSTICA APLICADA À ADMINISTRAÇÃO Ouro Preto/MG, 2008

Upload: lucasgrs

Post on 16-Feb-2015

71 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Apostila Estatistica - Autor CEADUFOP

Jorge Luiz Brescia MurtaTays Torres Ribeiro das Chagas

ESTATÍSTICA APLICADA ÀADMINISTRAÇÃO

Ouro Preto/MG, 2008

Page 2: Apostila Estatistica - Autor CEADUFOP

PRESIDENTE DA REPÚBLICALuiz Inácio Lula da Silva

MINISTRO DA EDUCAÇÃOFernando Haddad

REITOR DA UFOPJoão Luiz Martins

VICE-REITOR DA UFOPAntenor Rodrigues Barbosa Junior

DIRETOR DO CEADJaime Antônio Scheffler Sardi

VICE-DIRETORA DO CEADMarger da Conceição Ventura Viana

COORDENAÇÃO DA UAB/UFOPTânia Rossi Garbin

Gláucia Maria dos Santos Jorge

COORDENAÇÃO DO CURSO DEADMINISTRAÇÃO A DISTÂNCIAJaime Antônio Scheffler Sardi

COORDENAÇÃO ADMINISTRATIVA DO CEADIracilene Carvalho Ferreira

REVISORASElinor de Oliveira Carvalho Maria Teresa Guimarães

CAPA E LAYOUTDanilo França do Nascimento

DIAGRAMAÇÃOAlexandre Pereira de Vasconcellos

Copyright © 2008. Todos os direitos desta edição pertencem ao Centro de Educação Aberta e a Distância da Universidade Federal de Ouro Preto (CEAD/UFOP). Reprodução permitida desde que citada a fonte.

M984e Murta, Jorge Luiz Brescia. Estatística aplicada à administração. / Jorge Luiz Bres-cia Murta, Tays Torres Ribeiro das Chagas. - Ouro Preto : UFOP, 2008. 173 p.: il., grafs., tabs.

1. Administração – Métodos estatísticos. 2. Estatística. I. Título. II. Universidade Federal de Ouro Preto. CDU: 519.2:658

Catalogação: Sisbin/UFOP

Page 3: Apostila Estatistica - Autor CEADUFOP

SUMÁRIO

Capítulo 1 - Introdução. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17Capítulo 2 - Conceitos Básicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

1 - Populações, Amostragem e Amostra. . . . . . . . . . . . . . . . . 232 - Amostragem Aleatória. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 - Experimento Aleatório. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 - Atributo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 - Variável. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 - Recenseamento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 - Censo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248 - O Método Estatístico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

A) Estudo do fenômeno ⇒ Planejamento. . . . . . . . . . . . . . . . . . . . 24B) Coleta de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24C) Sumarização do fenômeno. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24D) Descrição numérica do fenômeno. . . . . . . . . . . . . . . . . . . . . . . . 25E) Análise e previsão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Capítulo 3 - Variáveis Aleatórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 - Variável Aleatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292 - Variável Aleatória Discreta. . . . . . . . . . . . . . . . . . . . . . . . . . 293 - Variável Aleatória Contínua. . . . . . . . . . . . . . . . . . . . . . . . . 294 - Variáveis Aleatórias Independentes. . . . . . . . . . . . . . . . . . . 29

Capítulo 4 - Normas de Apresentação Tabular. . . . . . . . . . . . . . . . . . . . 311 - Objetivo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

Page 4: Apostila Estatistica - Autor CEADUFOP

2 - Conceitos Básicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 - Organizando as Informações. . . . . . . . . . . . . . . . . . . . . . . . 334 - Modelo de Tabela. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

5 - SÉRIES / TABELAS ESTATÍSTICAS. . . . . . . . . . . . . . . . . . . . . . . . . . . 345.1 - Tipos de Séries Estatísticas. . . . . . . . . . . . . . . . . . . . . . . . . . . 34A) Série Temporal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34B) Série Geográfica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35C) Série Específica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35D) Distribuição de Freqüência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35E) Séries Compostas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 365.2 - Elementos essenciais de uma Série. . . . . . . . . . . . . . . . . . . . . 365.3 - Elementos Complementares de uma Série. . . . . . . . . . . . . . . 365.4 - Construção de Séries. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Capítulo 5 - Gráficos Tradicionais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 - Tipos de Gráficos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.1 - Gráfico de Linhas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.2 - Gráficos de Barras/Colunas. . . . . . . . . . . . . . . . . . . . . . . . 471.3 - Estereograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491.4 - Gráfico de Setores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Capítulo 6 - Distribuição de Freqüências. . . . . . . . . . . . . . . . . . . . . . . . . 531 - Dados Brutos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552 - Rol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 - Amplitude Total. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554 - Número de Classes (STURGES). . . . . . . . . . . . . . . . . . . . . . . . . . 565 - Intervalo de Classes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

Page 5: Apostila Estatistica - Autor CEADUFOP

6 - Notas sobre a Distribuição de Freqüência. . . . . . . . . . . . . . . . . 577 - Elementos de uma Distribuição de Freqüência. . . . . . . . . . . . . 59

7.1 - Classe/Grupo/Nível. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.2 - Limites de Classe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.3 - Intervalo de Classe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597.4 - Amplitude Total da Distribuição. . . . . . . . . . . . . . . . . . . . 597.5 - Ponto Médio de uma Classe. . . . . . . . . . . . . . . . . . . . . . . 597.6 - Distribuição de Freqüência Relativa. . . . . . . . . . . . . . . . . 607.7 - Distribuição de Freqüência Acumulada. . . . . . . . . . . . . . 60

8 - Representação Gráfica de uma Distribuição de Freqüência. . . 628.1 - Histograma de Freqüência. . . . . . . . . . . . . . . . . . . . . . . . . . . . 628.2 - Polígono de Freqüência. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 628.3 - Ogivas de Galton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Capítulo 7 - Medidas de Posição. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 671 - Medidas de Tendência Central. . . . . . . . . . . . . . . . . . . . . . . 691.1 - Média Aritmética. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 691.1.1 - Média Aritmética números não tabulados. . . . . . . . . . . 691.1.2 - Média Aritmética Ponderada. . . . . . . . . . . . . . . . . . . . . . 701.1.3 - Média Aritmética números tabulados. . . . . . . . . . . . . . 711.1.3.1 - Processo do Ponto Médio. . . . . . . . . . . . . . . . . . . . . . 711.1.3.2 - Processo simplificado. . . . . . . . . . . . . . . . . . . . . . . . . 721.1.4 - Propriedades da Média Aritmética. . . . . . . . . . . . . . . . . 731.1.5 - Vantagens da Média Aritmética. . . . . . . . . . . . . . . . . . . 771.1.6 - Desvantagens da Média Aritmética. . . . . . . . . . . . . . . . 781.2 - Média Típica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Page 6: Apostila Estatistica - Autor CEADUFOP

1.3 - Média Atípica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 781.4 - Média Geométrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 791.4.1 - Dados isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 791.4.2 - Dados agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 791.5 - Média Harmônica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 801.5.1 - Dados isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 801.5.2 - Dados Agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 811.6 - Mediana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821.6.1 - Números Isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821.6.2 - Números Tabulados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 831.7 - Moda, Modo ou Norma. . . . . . . . . . . . . . . . . . . . . . . . . . . . 851.7.1 - Números Isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 851.7.2 - Números Tabulados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

2 - Medidas Separatrizes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872.1 - Mediana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872.2 - Quartis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 872.3 - Decil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 882.4 - Percentil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

Capítulo 8 - Medidas de Dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 931- Amplitude Total. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

1.1 - Dados Isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 951.2 - Dados Agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

2 - Desvio Médio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 962.1 - Dados Isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 962.2 - Dados Agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

Page 7: Apostila Estatistica - Autor CEADUFOP

2.3 - Características do Desvio Médio. . . . . . . . . . . . . . . . . . 973 - Variação Total. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 984 - Variância. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

4.1 - Dados Isolados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 994.2 - Dados Agrupados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

5 - Desvio Padrão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1015.1 - Cálculo do desvio Padrão pelo Processo abreviado. . 1025.2 - Propriedades do Desvio Padrão / Variância. . . . . . . . . 104

6 - Coeficiente de Variação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107Capítulo 9 - Medidas de Assimetria / Curtose. . . . . . . . . . . . . . . . . . . . 109

1 - Coeficiente de Assimetria. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1112 - Distribuição Simétrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1113 - Distribuições Assimétricas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1124 - Assimetria Positiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1125 - Assimetria negativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1136 - Medidas de Curtose. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

6.1 - Classificação da Curva. . . . . . . . . . . . . . . . . . . . . . . . . . 1146.2 - Visão Conceitual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1146.3 - Classificação da Curtose pelo Grau Percentílico. . . . . 115

Capítulo 10 - Regressão x Correlação. . . . . . . . . . . . . . . . . . . . . . . . . . 1171 - Introdução. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1192 - Aplicações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1193 - Regressão Linear Simples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

3.1 - Método dos Mínimos Quadrados. . . . . . . . . . . . . . . . . . 1213.2 - Equacionamento de um Fenômeno. . . . . . . . . . . . . . . . 122

Page 8: Apostila Estatistica - Autor CEADUFOP

4 - Variação Total. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1245 - Notas Sobre A Regressão Linear Simples. . . . . . . . . . . . . . . . 128

5.1 - Variação Residual. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1295.2 - Fundamentos do Erro Residual. . . . . . . . . . . . . . . . . . . 1305.3 - Variação Explicada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1305.4 - Propriedades do Coeficiente Angular. . . . . . . . . . . . . . 1325.5 - Propriedades do Coeficiente Linear. . . . . . . . . . . . . . . . 132

6 - Diagrama de Dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1336.1 - Correlação Linear Simples. . . . . . . . . . . . . . . . . . . . . . . 1336.2 - Visual Gráfico da Correlação. . . . . . . . . . . . . . . . . . . . . 1346.3 - Observações sobre os gráficos da correlação. . . . . . . 135

7 - Conceituar Correlação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1367.1 - Primeiro Conceito da Correlação. . . . . . . . . . . . . . . . . . 1367.2 - Segundo Conceito da Correlação. . . . . . . . . . . . . . . . . . 1377.3 - Propriedades da Correlação. . . . . . . . . . . . . . . . . . . . . . 1377.4 - Determinação Linear. . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

Capítulo 11 - Números Índices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1411 - Introdução. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1432 - Índices Simples. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

2.1 - Índice Relativo a Preço – IRP. . . . . . . . . . . . . . . . . . . . . 1432.2 - Índice Relativo a Quantidade - IRQ. . . . . . . . . . . . . . . . . 1432.3 - Índice relativo a Valor - IRV. . . . . . . . . . . . . . . . . . . . . . . 1442.4 - Fórmula Geral - Índices Relativos. . . . . . . . . . . . . . . . . . 144

3 - Evolução de um Fenômeno. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1483.1 - Evolução de um Fenômeno Partindo-se de Dados Originais. 148

Page 9: Apostila Estatistica - Autor CEADUFOP

3.2 - Utilizando-se das Variações de Cada Época. . . . . . . . . 1503.3 - Utilizando-se da Variação média de uma Época. . . . . . 1513.4 - Evolução Acumulada e Cálculo da Evolução Média. . . 151

4 - Deflator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1524.1 - Evolução Real. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

5 - Índices Compostos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1555.1 - Índices Não Ponderados. . . . . . . . . . . . . . . . . . . . . . . . . 1555.1.1 - Índice Aritmético Simples. . . . . . . . . . . . . . . . . . . . . . . 155

A) Índice Aritmético Simples Relativo a Preços. . . . . . . . . . . . . . 155B) Índice Aritmético Simples Relativo a Quantidades. . . . . . . . . 156

5.1.2 - Índice Médio Geométrico Simples. . . . . . . . . . . . . . . . 156A) Índice Médio Geométrico Simples Relativo a Preço. . . . . . . . . 156B) Índice Aritmético Simples Relativo a Quantidades. . . . . . . . . 157

5.2 - Índices Ponderados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1595.2.1 - Índices de Laspeyres. . . . . . . . . . . . . . . . . . . . . . . . . . . 159

A) Índices de Laspeyres Relativo a Preços. . . . . . . . . . . . . . . . . . 159B) Índices de Laspeyres Relativo a Quantidades. . . . . . . . . . . . . 160

5.2.2 - Índices de Paasche. . . . . . . . . . . . . . . . . . . . . . . . . . . . 161A) Índices de Paasche Relativo a Preços. . . . . . . . . . . . . . . . . . . . 161B) Índices de Paasche Relativo a Quantidades. . . . . . . . . . . . . . . 1626 - Propriedades dos Índeces. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

6.1 - Identidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1646.2 - Reversão do Tempo/Reversibilidade. . . . . . . . . . . . . . . 1656.3 - Reversão dos Fatores/Decomposição dos Fatores/Decomposição das Causas. . . . . . . . . . . . . . . . . . . . . . . . . . .

165

Page 10: Apostila Estatistica - Autor CEADUFOP

6.4 - Circular. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656.5 - Homogeneidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656.6 - Proporcionalidade. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1656.7 - Erros e Restrições nos Números - Índices. . . . . . . . . . 166

7 - Mudanças de Base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

Page 11: Apostila Estatistica - Autor CEADUFOP

APRESENTAÇÃOCaro aluno,

A Estatística tornou-se uma ferramenta indispensável no apoio a uma tomada de decisão, à resolução de problemas e ao planejamento de produtos e processos, por lidar com a coleta, a apresentação, a análise e o uso de bancos de dados referentes às atividades econômicas.

Exemplo: Uma atividade econômica que está desenvolvendo outros tipos de produtos para atender a uma demanda insaciável do mercado extremamente competitivo. As informações ajudam, pois, a determinar iniciativas para novos produtos. Imagine que uma pessoa tenha a função de avaliar o mercado. Qual é o papel da Estatística no âmbito da atividade comercial?

É preciso analisar a carteira de produtos e serviços, examinar tendências e prever o comportamento do mercado. A Estatística pode ser utilizada para comparar desempenhos atuais, antecipar ciclos de vida de produtos e planejar iniciativas .

É preciso identificar a sensibilidade para novos produtos e desenvolvê-los com base em informações de consumidores. A Estatística pode estimar a atividade futura do produto com base em vendas atuais.

É preciso avaliar a satisfação dos consumidores e o desempenho dos produtos. A Estatística pode ser utilizada para identificar problemas de aceitação de produtos e determinar níveis de satisfação ou insatisfação dos consumidores.

É preciso avaliar o desempenho financeiro dos produtos com base no desempenho histórico e no retorno do investimento. A Estatística pode ser útil para estimar a receita das atividades econômicas, tanto do setor privado quanto do setor público, pois sempre é necessário analisar dados quantitativos à luz dos objetivos para tomar decisões.

Este fascículo foi produzido com o objetivo de auxiliá-lo nas atividades referentes à Estatística Aplicada à Administração. Sendo assim, tem a seguinte estrutura:

Primeiro Capítulo: apresentação e aplicações da Estatística.

Segundo Capítulo: conceitos básicos da Estatística.

Page 12: Apostila Estatistica - Autor CEADUFOP

Terceiro Capítulo: conceitos e aplicações das variáveis aleatórias.

Quarto Capítulo: inicío da abordagem das normas de apresentação tabular e séries/tabelas estatísticas. Quinto Capítulo: apresentação dos gráficos tradicionais.

Sexto Capítulo: conceito de distribuição de freqüências.

Sétimo Capítulo: medidas de posição.

Oitavo Capítulo: prosseguimento da abordagem das medidas de disperção.

Nono Capítulo: continuação da abordagem sobre as medidas de assimetria.

Décimo Capítulo: regressão e correlação.

Décimo Primeiro Capítulo: números índices.

Em vista dos objetivos propostos neste fascículo, desejamos que você possa usá-lo com sucesso na realização de suas atividades profissionais.

NOTA: As informações e os dados apresentados nas tabelas e gráficos, bem como os respectivos exemplos, são fictícios.

Page 13: Apostila Estatistica - Autor CEADUFOP

Lista de TabelasTabela 1 - Registro do Movimento Turístico, Finaisde Semana, na Registro do Movimento Turístico, Finais de Semana, na Cidade de Ouro Preto, por Mês, 1.º Semestre de 2007. . . . . .

34Tabela 2 - Vendas do Grupo Alfa, em milhões de reais, 20/02/2007. . . . . . . . . . . . . . . . . . . . . . 35Tabela 3 - Impostos Estaduais - Empresas fiscalizadas em 2007. . . . . . . . . . . . . . . . . . . . . . . . 35Tabela 4 - Formandos do Ensino Superior, no Estado de Minas Gerais, 2005. . . . . . . . . . . . . . 35Tabela 5 - Pessoas Premidas pela Loteria Sorte Grande 1.º Semestre de 2006, no Estado da Bahia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

37Tabela 6 - Produção da Cooperativa Agrícola Boa Safra, 2006, em Mil Toneladas - Minas Gerais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

38Tabela 7 - Faturamento por Filial, nos Meses de Fevereiro e Março de 2007 Empresa KKPP, em R$ 1.000,00. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

39Tabela 8 - Vendas por Filial e Produto da Empresa PPRR/BH, em Mil Toneladas, Março / 2007. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

40Tabela 9 - Número de Hóspedes, Quantidade de Diárias Recebidas, Faturamento Hotel PPTT, por Mês, no Período Janeiro a Junho / 2007 Ouro Preto, Valores em Reais. . . . . . . . . . . . . . . .

41Tabela 10 - Produção Milho no Estado E, Período 2000/2006. . . . . . . . . . . . . . . . . . . . . . . . . . . 46Tabela 11 - Produção de Arroz e Trigo, Estado X , 1994/2000, Tonelada. . . . . . . . . . . . . . . . . . 47Tabela 12 - Produção de Aço por Empresa, em 2006, Minas Gerais, em Mil Toneladas. . . . . . . 50Tabela 13 - VendasdasEmpresasA,B, CeD,emMilReais,MinasVendas das Empresas A, C e D, em Mil Reais, Minas Gerais, 2000. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51Tabela 14 - Salários da Construção Civil Pesada, Fevereiro, 2006, Belo Horizonte, em Real. . . 58Tabela 15 - Salários Funcionários, em Real, Empresa TTYYG, Março/2007, Ouro Preto /MG. . 61Tabela 16 - Vendas por Filial, Empresa XXTT , Julho/2007, Belo Horizonte, em Milhões de Reais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71Tabela 17 - Vendas das 60 Filiais da Empresa KLPT, Maio/2007, em Milhões de Reais. . . . . . . 72Tabela 18 - Duração Amostra de Lâmpadas, em Horas, Fabricante HH Agosto 2007 – Ouro Preto / MG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80Tabela 19 - Exportações, Empresa MMGG, 1.º Trimestre / 2007. BH / MG. . . . . . . . . . . . . . . . . 84Tabela 20 - Vendas, Milhões de reais, Empresa HHFF, 1.º Trimestre / 2007, Porto Alegre / RS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86Tabela 21 - Vendas Diárias Realizadas pela Empresa PPXX 1.O Trimestre / 2007, BH, em Mil Reais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

Page 14: Apostila Estatistica - Autor CEADUFOP

Tabela 22 - Exportações Realizadas pela Empresa KKI, Março / 2.001, em Mil Dólares. . . . . . . 96Tabela 23 - Exportações da Empresa HPP, Julho / 2.007, em Mil Reais. . . . . . . . . . . . . . . . . . . 97Tabela 24 - Faturamento da Empresa BBHHZ, Agosto/2007, Belo Horizonte, Milhões de Reais. . 103Tabela 25 - Gastos e Faturamento de Quatro Fabricas em Janeiro de 2007. . . . . . . . . . . . . . . . . 122Tabela 26 - Preços e Quantidades Faturadas KKLP 2005/2007. . . . . . . . . . . . . . . . . . . . . . . . . . . 158Tabela 27 - Vendas dos produtos A, B, C e D em junho e julho de 2007. . . . . . . . . . . . . . . . . . . 163Tabela 28 - Produção de Carne Bovina - Empresa KKPL, 2000/2007 - MIL. TON. . . . . . . . . . . . . 167

Figura

Figura 1 - Gráficos de Correlação. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

Page 15: Apostila Estatistica - Autor CEADUFOP

Gráfico 1 - Produção de Milho, Estado E, 2000/2006, Tonelada. . . . . . . . . . . . . . . . . . . . . . . . . 46Gráfico 2 - Produção de Arroz e Trigo, Estado X, 1994/2000, em Produção de Arroz e Trigo, Estado X, em Toneladas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47Gráfico 3 - Vendas das Filiaisda Empresa KKI, Agosto 2000, Minas Vendas das Filiais da Empresa KKI, Agosto 2000, Minas Gerais, em Milhões de Reais. . . . . . . . . . . . . . . . . . . . . . . . 48Gráfico 4 - Vendas das Filiais da Empresa GTK, Agosto 2000, Minas Vendas das Filiais da Empresa GTK, Agosto 2000, Minas Gerais, em Milhões de Reais. . . . . . . . . . . . . . . . . . . . . . . . 48Gráfico 5 - Produção Arroz, Feijão, Trigo e Soja Estado X 2006/2007 Mil Produção Arroz, Trigo e Soja Estado X 2006/2007 Mil Toneladas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Gráfico 6 - Produção de Aço por Empresa, em 2006, Minas Gerais, em mil toneladas. . . . . . . . 50Gráfico 7 - Vendas das Empresas A, B, C e D, em Mil Reais, Minas Vendas das Empresas A, C e D, em Mil Reais, Minas Gerais, 2000. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51Gráfico 8 - Salários dos Funcionários, em Real, Empresa TTYYG, Março / 2006 , Ouro Preto/MG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63Gráfico 9 - Salários dos Funcionários, em Real, Empresa Souza, Março / 2001, Belo Horizonte/MG. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64Gráfico 10 - Salários dos Funcionários da Empresa TTYYG, em Real, Ouro Preto/MG, Março/ 2007. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65Gráfico 11 - Curva Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107Gráfico 12 - Assimetria Positiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113Gráfico 13 - Assimetria Negativa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114Gráfico 14 - Gráfico de Dispersão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

Lista de Gráficos

Page 16: Apostila Estatistica - Autor CEADUFOP
Page 17: Apostila Estatistica - Autor CEADUFOP

Capítulo 1

Introdução

Page 18: Apostila Estatistica - Autor CEADUFOP
Page 19: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

IntroduçãoPágina 19

Estatística é o estudo da coleta e do processamento de dados para facilitar a tomada de decisões. Constitui uma parte da Matemática Aplicada e tem, pois, por objetivo obter conclusões sobre um conjunto de dados. Pode-se dividir o processo do uso da Estatística em três fases:

A - Coleta de dados ou amostragem: É obtida com a elaboração de uma pesquisa. A amostra é um subconjunto, isto é, uma parte da totalidade abrangida pela população. E a população consiste na totalidade das observações coletadas. Portanto a amostra é um conjunto de observações selecionadas a respeito de uma população.

B - Análise Descritiva: Preocupa-se com a organização e a descrição dos dados, sem fazer generalizações ou tirar conclusões para o conjunto de que foram retirados.

C - Análise Inferencial: Trata da análise e interpretação dos dados. Consegue, assim, prever o comportamento da população com base nos resultados da amostra, isto é, como o desempenho se altera à proporção que as variáveis-chave são modificadas.

Page 20: Apostila Estatistica - Autor CEADUFOP
Page 21: Apostila Estatistica - Autor CEADUFOP

Capítulo 2

Conceitos Básicos

Page 22: Apostila Estatistica - Autor CEADUFOP
Page 23: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Conceitos BásicosPágina 23

1 - População, Amostragem e Amostra

População é o conjunto universo dos dados sobre os quais se deseja tirar conclusões.Amostra é um subconjunto da população.Amostragem é uma ferramenta que permite analisar um subconjunto da população e dar informações sobre os fatos relativos a ele, com a intenção de inferir o comportamento da população.

Portanto se justifica trabalhar com amostras pelos motivos apresentados.• Custo: Despesas com a operacionalização estatística da população são geralmente maiores que com a averiguação de uma amostra.• Velocidade: Pesquisas realizadas em amostras são mais rápidas em virtude de conter menor número de unidades.• Praticabilidade: A dimensão da população pode tornar as pesquisas impraticáveis.Mas existe a desvantagem de trabalhar com pequenos conjuntos porque uma mostra pode conduzir a não se ter certeza da validade das estimativas, análises e conclusões.

2 - Amostragem AleatóriaVisa a selecionar os integrantes de uma amostra de tal forma que todos os elementos de uma população tenham a mesma probabilidade de ser incluídos na amostra.

3 - Experimento AleatórioÉ aquele cujos resultados não são sempre os mesmos, apesar de se repetirem, várias vezes, em condições semelhantes. É aquele que apresenta resultados imprevisíveis. O lançamento de moedas e dados bem como os sorteios e extrações lotéricas são fenômenos aleatórios.

O experimento apresenta vários resultados não sendo possível afirmar qual a determinação antes que ele tenha sido realizado. Antes do lançamento de um dado, por exemplo, não se pode dizer o resultado, mas se podem enumerar os resultados possíveis. A possibilidade de repetição contínua, mantidas as condições iniciais, é uma característica importante de experimentos aleatórios.

4 - AtributoÉ “tudo aquilo que se diz ou é próprio de um ser, podendo ser qualitativo ou quantitativo.” Uma variável é um atributo.

Page 24: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Conceitos BásicosPágina 24

Qualitativo: É um atributo não-mensurável. Exemplo: cor, beleza, sexo, nacionalidade.Quantitativo: É um atributo mensurável. Exemplo: peso, altura, salário, tempo.

5 - VariávelÉ o conjunto de todos os resultados possíveis de um atributo/fenômeno. A variável pode ser qualitativa ou quantitativa.

6 - RecenseamentoÉ o levantamento estatístico com o objetivo de promover o conhecimento da totalidade da população, “tanto em relação às suas características individuais, como em relação às suas atividades e produção, e se refere sempre a uma ocasião determinada.”

7 - CensoÉ o resultado do recenseamento. É o resultado das variáveis investigadas, relativas aos elementos que compõem uma população claramente definida.

8 - O Método EstatísticoReúne as técnicas básicas de observação dos fenômenos coletivos bem como a quantificação e a qualificação de suas características. Determina como coletar dados numéricos, sintetizá-los e exprimi-los de maneira simples, porém clara, assim também como descrever e interpretar os acontecimentos, fazendo previsões e conclusões. Compreende:

A - Estudo do fenômeno ⇒ PlanejamentoÉ a fase do diagnóstico, da identificação das variáveis componentes da pesquisa. O que fazer? Quais as características do fenômeno que interessam à pesquisa?

B - Coleta de dadosÉ a fase operacional da pesquisa. É a busca das informações necessárias à pesquisa. É o levantamento das informações necessárias à pesquisa.

C - Sumarização do fenômenoÉ a organização das informações coletadas e da apresentação do fenômeno em estudo, por tabelas e gráficos.É a apresentação sintética e expositora do problema levantado, com suas variáveis, pontos críticos, tendências e flutuações.

Page 25: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Conceitos BásicosPágina 25

As tabelas organizam as informações coletadas e apresentam, de maneira sintética, o fato estudado e os gráficos dão uma visão do problema e de suas tendências.

D - Descrição numérica do fenômenoÉ a realização de cálculos que dão o suporte necessário para a interpretação dos dados, análise, conclusões e previsões.

E - Análise e previsãoVisa a definir o perfil do problema estudado, suas variações e tendências futuras.

A análise descritiva e numérica indica os pontos críticos e as flutuações do fato observado, as conclusões parciais e finais do problema bem como as previsões, tendências e perspectivas. Portanto são fatores fundamentais que dão o suporte necessário para uma tomada de decisão.

Page 26: Apostila Estatistica - Autor CEADUFOP
Page 27: Apostila Estatistica - Autor CEADUFOP

Capítulo 3

Variáveis Aleatórias

Page 28: Apostila Estatistica - Autor CEADUFOP
Page 29: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Variáveis AleatóriasPágina 29

1 - Variável aleatória é um conjunto de todos os resultados possíveis de um fenômeno aleatório. Portanto pode assumir uma gama de valores. Classifica-se em discreta e contínua.

2 - Variável Aleatória DiscretaÉ aquela que é obtida mediante alguma forma de contagem. Normalmente seu valor é expresso com número inteiro não-negativo.

Exemplos: A produção diária de uma fábrica de carros é teoricamente um número inteiro. O número de funcionários de uma empresa só pode ser inteiro. O mesmo acontece com o número de filhos de um casal e com o resultado de um sorteio. Portanto a variável discreta assume determinado valor dentro de um intervalo e tem um número finito de valores.

3 - Variável Aleatória ContínuaÉ aquela que assume qualquer valor numa escala (peso, altura, velocidade, tempo, etc) e resulta freqüentemente de uma medição, sendo usada, pois, em alguma forma de medida. E geralmente o valor é aproximado.

Considera-se que a variável aleatória contínua pode tomar qualquer valor real em um dado intervalo, sendo caracterizada por uma função de densidade tal que a área sob a curva respectiva entre dois números representa a probabilidade de estar entre eles a variável aleatória.

4 - Variáveis Aleatórias IndependentesSão aquelas que não se afetam mutuamente, ou para as quais o conhecimento do valor de uma não dá qualquer informação sobre o valor da outra.

Exemplo 1Se numa sala houver homens e mulheres, a retirada de um homem não afeta o conjunto das mulheres. Logo as variáveis homens e mulheres são independentes.

Exemplo 2Numa caixa há 7 bolas brancas e 4 pretas. Retirar duas bolas, com reposição, não altera o espaço amostral ou conjunto. Logo retirar uma bola e em seguida uma outra, mas com reposição, define eventos independentes.

Page 30: Apostila Estatistica - Autor CEADUFOP
Page 31: Apostila Estatistica - Autor CEADUFOP

Capítulo 4

Normas de Apresentação Tabular

Page 32: Apostila Estatistica - Autor CEADUFOP
Page 33: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 33

1 - ObjetivoAs normas de apresentação tabular fornecem elementos que asseguram a padronização e a racionalização da apresentação de dados numéricos em tabelas. Fixam conceitos e procedimentos aplicáveis à elaboração de tabelas de dados numéricos, de modo a garantir a clareza das informações.

2 - Conceitos BásicosA tabela é uma forma não-discursiva de apresentar informações das quais o dado numérico se destaca como informação central.

Em uma tabela se destacam estas partes: • Topo - É o espaço superior, destinado ao número e ao título.• Centro - É o espaço central, destinado à moldura dos dados numéricos e aos termos necessários à compreensão.No centro identificam-se 4 espaços menores: do cabeçalho, da coluna, da linha e da célula.• Rodapé - É o espaço inferior, destinado à fonte, à nota geral e à nota específica.

3 - Organização das InformaçõesNa quase totalidade, o conjunto de valores coletados é extenso e desorganizado. Portanto o exame requer atenção. Organizando os valores em tabelas compactas, consegue-se apresentar e descrever a variável com mais eficiência. A organização dos valores em séries ou tabelas permite, portanto, a utilização da representação gráfica, normalmente uma forma mais útil e adequada de apresentar a variável analisada.

Page 34: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 34

4 - Modelo de TabelaNa tabela apresentada a seguir, registra-se o número de turistas que visitaram a cidade de Ouro Preto, nos finais de semana, em cada mês, no período de janeiro a junho de 2007.

Tabela 1 - Registro do Movimento Turístico, Finais de Semana, naRegistro do Movimento Turístico, Finais de Semana, na Cidade de Ouro Preto , por Mês, 1.º Semestre de 2007.

Mês N.º de Turistas Participação %Janeiro 260.000 21,45%

Fevereiro 290.000 23,93%Março 212.000 17,49%Abril 180.000 14,85%Maio

Junho150.000120.000

12,38% 9,90%

TOTAL 1.212.000 100,00%Fonte: Secretaria de Turismo

5 - Séries / Tabelas EstatísticasAs séries e as tabelas estatísticas são classificadas em função de 3 caracteristicas:• Época: variável temporal, histórica ou cronológica a que se refere o fenômeno.• Local: variável espacial ou geográfica em que o fenômeno ocorreu ou ocorre.• Fenômeno: variável espécie do fato ou fato específico que descreve o fenômeno.5.1 - Tipos de Séries EstatísticasA) Série TemporalTambém chamada de cronológica, histórica, evolutiva ou em marcha, é identificada pela variável cronológica e pelos fatores fixos geográfico e específico.

Page 35: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 35

Tabela 2 - Vendas do Grupo Alfa, em milhões de reais, 20/02/2007Ano Vendas2002 2,182003 2,452004 2,592005 1,822006 2,132007 2,96

Fonte: Departamento de Vendas

B) Série GeográficaTambém chamada de territorial, espacial ou de localização, apresenta como elemento variável o espaço, a localização, e como fatores fixos o tempo e a espécie.

Tabela 3 - Impostos Estaduais - Empresas fiscalizadas em 2007Região Empresas fiscalizadasNorte 6.700

Nordeste 9.872Sudeste 13.139

Centro-Oeste 14.255Sul 22.007

Fonte: Secretaria Estadual da Fazenda

C) Série EspecíficaTambém chamada de categórica ou especificativa, apresenta como variável a espécie do fenômeno, permanecendo fixos os fatores temporal e geográfico.

Tabela 4 - Formandos do Ensino Superior, no Estado de Minas Gerais, 2005

Área FormandosBiológicas 15.758

Exatas 44.573Humanas 88.652

Fonte: Ministério da Educação - MEC

D) Distribuição de FreqüênciaÉ o arranjo tabular de um conjunto numérico em grupos, classes, intervalos

Page 36: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 36

ou níveis com o número de observações de cada classe.Na distribuição de freqüência, os fatores temporal, específico e geográfico permanecem fixos, constantes.

E) Série CompostaÉ usada quando o fenômeno apresenta mais de uma variável. A série composta pode apresentar combinação 2 a 2 ou 3 a 3, resultando uma série de dupla entrada (temporal / específica; geográfica / específica; temporal / geográfica; temporal / temporal; geográfica / geográfica) ou de tripla entrada (geográfica / específica / temporal; temporal / temporal / específica, etc.).

5.2 - Elementos Essenciais de uma Série• Título - É a indicação que precede a tabela e contém a designação do fato observado, o local e a época em que foi registrado. Responde às três perguntas: O quê? Onde? Quando?• Cabeçalho - Especifica o conteúdo de cada coluna. É o título de cada coluna.• Corpo / moldura - Contém informações sobre o fato observado. É o conjunto de linhas e colunas.• Coluna Indicadora - É a primeira coluna de uma série. Nela se registram as categorias da variável em estudo, exprimindo o conteúdo das linhas.• Dado Numérico - É a quantificação de um fato observado.

5.3 - Elementos Complementares de uma Série• Fonte - Indica o responsável pela elaboração ou fornecimento dos dados, sendo registrada logo abaixo da tabela, à esquerda, isto é, no rodapé da tabela.• Nota Geral - Reúne informações de natureza geral. Destina-se a conceituar ou esclarecer o conteúdo das tabelas, ou a indicar a metodologia adotada no levantamento ou na elaboração dos dados.• Nota Específica - Reúne informações de natureza específica sobre determinada parte da tabela, destinadas a conceituar ou esclarecer os dados.• Chamada - É um símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota.

5.4 - Construção de Séries• Na coluna indicadora colocam-se as categorias da variável. Caso a variável tenha duas divisões, a de maior categoria é registrada na coluna indicadora, de preferência, e a outra no cabeçalho.• A linha básica, logo abaixo do título, deve ser dupla ou em negrito.

Page 37: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 37

• A fonte é registrada logo abaixo da tabela, à esquerda.• As tabelas são abertas lateralmente.• A última linha da tabela deve ser dupla ou em negrito.

Exemplo 3Na tabela 5, a seguir, está registrado o número de pessoas que foram premiadas pela loteria KKPP, por mês, no 1.º Semestre de 2006, no Estado da Bahia.

Tabela 5 - Pessoas Premidas pela Loteria Sorte Grande 1.º Semestre de 2006, no Estado da Bahia

Mês Pessoas PremiadasJaneiro

FevereiroMarçoAbrilMaio

Junho

4050647690

120Total 420

Fonte: Receita Federal

Pessoas premiadas, por mês, como registra a tabela, definem uma série histórica. Portanto a série é histórica ou temporal quando a variável for o tempo.A espécie do fenômeno (pessoas premiadas) é fixa. O local onde ocorreu o fenômeno é fixo: Estado da Bahia. Logo a série é temporal ou histórica.Se houvesse uma série retratando os ganhadores e apostadores, ela seria escífica, além de ser temporal. Por outro lado, se os ganhadores estivessem em Ouro Preto e em Mariana, a série seria também geográfica.Observa-se que a classificação desta série está ligada às variáveis espécie, tempo e espaço

Page 38: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 38

Exemplo 4Apresenta-se, a seguir, na Tabela 6, a produção de soja, arroz, açúcar, feijão e trigo da Cooperativa Agrícola Boa Safra, em 2006, em mil toneladas, e a participação de cada produto.

Tabela 6 - Produção da Cooperativa Agrícola Boa Safra , 2006, em Mil Toneladas - Minas Gerais

Produto Produção Participação %SojaArroz

AçúcarFeijãoTrigo

6090

120160210

9,09%13,64%18,18%27.27%31,82%

Total 660 100%Fonte: Secretaria Estadual de Agricultura

A produção agrícola da Cooperativa Boa Safra, em 2006, por produto, define uma série específica ou categórica. Isso porque a variável é a espécie do fenômeno, permanecendo fixos o espaço e o tempo. O espaço/local é a Cooperativa Agrícola Boa Safra, em Minas Gerais, e o tempo, também fixo, é 2006.

Na coluna 3 apresenta-se a participação percentual de cada produto na produção anual da Cooperativa e verifica-se que a produção de trigo corresponde a 31,82% do total. A produção de açúcar foi o dobro do produção de soja. A produção de feijão, além de ser o dobro da produção de arroz, foi 50% maior do que a produção de açúcar. Dessa produção, 59,09% corresponderam a feijão e trigo. A produção de soja e a de arroz participaram com 22,73% da produção.

Page 39: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 39

Exemplo 5Apresenta-se, a seguir, na Tabela 7, o faturamento, por filial, da empresa KKPP, nos meses de fevereiro e março de 2007.

Tabela 7 - Faturamento por Filial, nos Meses de Fevereiro e Março de 2007 Empresa KKPP, em R$ 1.000,00

Filial VendasFevereiro Março Total

CataguasesLagoa Santa

UbáBarbacenaUberlândia

SantosDumond

40506080

100120

5070

100100120130

90120160180220250

TOTAL 450 570 1020Fonte: Departamento de Vendas

O faturamento da empresa KKPP por filial, nos meses de fevereiro e março de 2007, segundo a tabela apresentada, define uma série geográfica e temporal. A localização das filiais dá idéia de espaço e a variação do tempo, fevereiro e março, de evolução. A espécie do fenômeno vendas da empresa é fixa.Pela tabela, percebe-se que 41,12% das vendas, no bimestre, ocorreram em fevereiro e 55,88% em março ( 570/1020 )100 = 55,81 %.A filial de Cataguases alcançou o menor índice de participação no faturamento da empresa, no bimestre, registrando apenas 8,82%. A filial de Santos Dumond participou com 24,51% desse faturamento. As filiais de Uberlândia e Barbacena participaram, no bimestre em estudo, com 39,22% desse faturamento.

Page 40: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 40

Exemplo 6A Tabela 8, a seguir, mostra as vendas da empresa PPRR, por produto e por filial, em março de 2007, em Belo Horizonte.

Tabela 8 - Vendas por Filial e Produto da Empresa PPRR/BH, em Mil Toneladas, Março / 2007

Produto FIilial da Empresa TOTAL01 02 03

ABCDE

4050

100120190

50606070

100

6070304060

150180190230350

TOTAL 500 340 260 110Fonte: Departamento de Vendas

As vendas da empresa PPRR, por produto, definem a espécie do fenômeno e, por filial, a localização dos fatos. O tempo (março de 2007) permanece fixo. Logo a série é específica e geográfica.No mês citado, a filial 01 participou com 45,46% das vendas da empresa PPRR, enquanto as filiais 02 e 03 participaram, respectivamente, com 30,91% e 23,64% do faturamento.O produto E foi o que teve o maior faturamento, com 31,82% do total.O produto A teve o menor faturamento na filial 01. O produto B apresentou boas vendas na filial 03, em comparação com as vendas nas outras filiais.Os produtos D e E participaram com 52,73% das vendas da empresa, mas os produtos A e B apenas com 30% do faturamento.

Page 41: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Normas de Apresentação Tabular

Página 41

Exemplo 7Na Tabela 9, a seguir, está registrado o número de hóspedes e a quantidade de diárias recebidas por mês, no período de janeiro a junho de 2007, Hotel PPTT , Ouro Preto.

Tabela 9 - Número de Hóspedes, Quantidade de Diárias Recebidas, Faturamento Hotel PPTT, por Mês, no Período Janeiro a Junho / 2007 Ouro Preto, Valores em Reais

Mês N.º Hóspedes

Qtde. Diárias

Valor Diária Faturamento

Janeiro 3.000 30.000 80,00 2.400.000,00Fevereiro 3.400 36.000 100,00 3.600.000,00

Março 1.900 29.000 80,00 2.320.000,00Abril 1.600 26.000 70,00 1.820.000,00Maio 1.400 24.000 70,00 1.680.000,00

Junho 1.200 20.000 70,00 1.400.000,00TOTAL 12.500 165.000 13.220.000,00

Fonte: Departamento de Vendas

A Tabela 9 define uma série temporal e específica. São apresentadas variáveis específicas: número de hóspedes, quantidade de diárias, valor da diária e faturamento do Hotel. É uma série temporal e específica.Pode-se observar que o primeiro trimestre participa com 62,94% do faturamento semestral e o segundo trimestre com 37,06%.O mês de fevereiro tem a maior participação no faturamento trimestral, 43,27% . No segundo trimestre o mês de abril é o dominante, ficando o mês de junho com a menor parcela do faturamento do segundo trimestre e também do primeiro semestre.

Page 42: Apostila Estatistica - Autor CEADUFOP
Page 43: Apostila Estatistica - Autor CEADUFOP

Capítulo 5

Gráficos Tradicionais

Page 44: Apostila Estatistica - Autor CEADUFOP
Page 45: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 45

O gráfico é uma forma de apresentação dos dados coletados com o objetivo de ter visão rápida do fenômeno em estudo. É a forma mais simples de comunicação dos fenômenos estatísticos. Deve ser confeccionado de maneira simples e clara, de tal forma que o observador entenda o que o gráfico busca evidenciar. Portanto deve atrair a atenção do observador, apresentar com rapidez e com simplicidade a mensagem, ser inteligível e inspirar confiança.

Para a construção de um gráfico, recomenda-se proporcionalidade no sistema de coordenadas, de tal forma que o eixo dos Y seja aproximadamente de 2/3 a 3/4 do eixo dos X. O título é o mesmo da série que o gráfico representa.

1 - Tipos de Gráfico 1.1 - Gráfico de LinhaVisa a relacionar, no plano cartesiano, a variável tempo no eixo das abcissas e as observações relativas às categorias no eixo das ordenadas, criando-se um conjunto de pares ordenados (x, y) que são registrados no plano interligados por uma linha contínua.O gráfico de linha fornece uma visão da tendência do comportamento de um fenômeno, em cada época de um período considerado.

Se a variável temporal tiver mais de uma subcategoria, haverá uma linha para representar o fenômeno relativo àquela subcategoria, tornando necessária a criação da legenda, para identificação das linhas. A legenda deve ser colocada na parte inferior, à direita do gráfico.

Page 46: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 46

Exemplo 8A produção de milho, no período 2000/2006, no Estado E.

Tabela 10 - Produção Milho no Estado E, Período 2000/2006

Período Tonelada2000 102001 152002 82003 122004 202005 152006 25

Fonte: Secretaria da Agricultura

Registra-se, no eixo dos x, a variável tempo e, no eixo dos y, os valores da variável. As variáveis tempo e valor são marcadas no plano por sete pares ordenados, cujos pontos estão registrados no gráfico a seguir.

Gráfico 1 - Produção de Milho, Estado E, 2000/2006, Tonelada

Fonte: Secretaria da AgriculturaExemplo 9Na Tabela 11, a seguir, está representada uma série temporal e específica. Registra-se, no eixo dos x, o tempo e, no eixo dos y, o maior valor entre as variáveis arroz e trigo. Traça-se uma linha para simbolizar a tendência do arroz e outra para a do trigo. Há necessidade de legenda.

Page 47: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 47

Tabela 11 - Produção de Arroz e Trigo, Estado X , 1994/2000, Tonelada

Período ProduçãoArroz Trigo

1994 10 151995 20 101996 5 121997 15 201998 20 251999 28 322000 23 20

Fonte: Secretaria da Agricultura

Gráfico 2 - Produção de Arroz e Trigo, Estado X, 1994/2000, emProdução de Arroz e Trigo, Estado X, 1994/2000, em Toneladas

Fonte: Secretaria da Agricultura

1.2 - Gráfico de Barras/ColunasDeve ser construído com bases fixadas no eixo dos x e barras fixadas no eixo dos y. Como regra básica, considera-se o espaço entre as barras/colunas igual à metade ou a dois terços das larguras.

O gráfico de colunas é um conjunto de retângulos dispostos verticalmente,

Page 48: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 48

com intervalos regulares não-nulos, tendo como base o eixo dos X e a altura de cada coluna é proporcional aos valores da variável, sendo registrada no eixo dos Y. Observa-se que o gráfico de colunas é um conjunto de colunas verticais separadas por intervalos regulares. Pode-se utilizar o aplicativo Excel para construir o gráfico de linhas e o de barras/colunas.

Gráfico 3 - Vendas das Filiais da Empresa KKI, Agosto 2000, MinasVendas das Filiais da Empresa KKI, Agosto 2000, Minas Gerais, em Milhões de Reais

O gráfico de barras é um conjunto de retângulos dispostos horizontalmente, com intervalos regulares e não-nulos, tendo o eixo dos Y como base e o comprimento de cada barra proporcional aos valores de cada categoria do fenômeno. Todas as colunas/barras devem ter a mesma largura.

Gráfico 4 - Vendas das Filiais da Empresa GTK, Agosto 2000, MinasVendas das Filiais da Empresa GTK, Agosto 2000, Minas Gerais, em Milhões de Reais

Page 49: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 49

No caso de um fenômeno ser dividido em categorias e subcategorias, há tantas colunas/barras quantas forem as subcategorias, justapostas ou sobrepostas, formando grupos que representam as categorias da variável. Este tipo de gráfico é empregado quando se deseja representar, simultaneamente, dois ou mais fenômenos, com o objetivo de comparação.

Gráfico 5 - Produção Arroz, Feijão, Trigo e Soja Estado X 2006/2007 MilProdução Arroz, Feijão, Trigo e Soja Estado X 2006/2007 Mil Toneladas

Analisando o gráfico construído, percebe-se o aumento da produção de arroz, feijão, trigo e soja, em 2007, em relação a 2006 . Por outro lado, a produção de feijão superou a dos outros três alimentos, nos dois períodos estudados.

1.3 EstereogramaÉ a representação gráfica dos fenômenos por figuras de volume.

Exemplo 10A produção de aço das empresas A, B, C e D, em 1999, em Minas Gerais, por exemplo, pode ser representada por uma figura de volume construída com base nas informações dos gráficos de colunas.

Page 50: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 50

Tabela 12 - Produção de Aço por Empresa, em 2006, Minas Gerais, em Mil Toneladas

Empresa ProduçãoA 10B 15C 20D 25

TOTAL 70Fonte: Ministério de Minas e Energia

Gráfico 6 - Produção deProdução de Aço por Empresa, em 2006, Minas Gerais, em mil toneladas

Fonte: Ministério de Minas e Energia

1.4 - Gráfico de SetoresMostra a proporção de partes em um todo representado por um círculo. Para isso, os 360 graus do círculo são divididos pelas categorias de variáveis, proporcionalmente às freqüências observadas. Mas o uso é restrito ao caso de variáveis divididas em poucas categorias.

Cada categoria corresponde a uma divisão de setor do círculo e, por uma regra de três, calculam-se os graus correspondentes a cada categoria.

Page 51: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Gráfico TradicionalPágina 51

Exemplo 11Tabela 13 - Vendas das Empresas A, B, C e D, em Mil Reais, MinasVendas das Empresas A, B, C e D, em Mil Reais, Minas Gerais, 2000

Empresa VendasA 40B 120C 200D 360

Total 720Fonte: Receita Estadual

Gráfico 7 - Vendas das Empresas A, B, C e D, em Mil Reais, MinasVendas das Empresas A, B, C e D, em Mil Reais, Minas Gerais, 2000

• O gráfico de setores fornece a proporção das partes. Assim, verifica-se a preponderância da cidade D, nas vendas. A divisão proporcional das partes é feita da seguinte forma: o total das vendas corresponde a 360 graus, como as vendas da cidade A estão para x.

• Nesta regra de três, encontra-se o valor de x, em graus. Com auxilio de um transferidor, marcam-se 20 graus para a cidade A. E assim por diante, repetindo o cálculo para todas as cidades. No interior do círculo marcam-se as categorias da variável. No caso, os nomes das cidades, com os respectivos valores.

Page 52: Apostila Estatistica - Autor CEADUFOP
Page 53: Apostila Estatistica - Autor CEADUFOP

Capítulo 6

Distribuição de Freqüências

Page 54: Apostila Estatistica - Autor CEADUFOP
Page 55: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 55

Pode-se definir a distribuição de freqüências como um arranjo tabular de um conjunto numérico apresentado em grupos, classes, intervalos ou níveis com as informações de cada grupo.Para a construção de uma distribuição de freqüência, devem-se apresentar alguns conceitos.

1 - Dados BrutosDados BrutosÉ um conjunto desorganizado de números. É um amontoado de observações. É um conjunto não-trabalhado. Feita a coleta, os dados originais ainda não se encontram prontos para análise, por não estarem numericamente organizados. 2 - RolRolÉ o arranjo dos dados brutos em uma ordem de grandeza crescente ou decrescente. É um conjunto de números trabalhados, organizados ou lapidados. ExemploEm uma coleta de informações sobre os salários da empresa KKPPT, em julho de 2007, foram observados os salários de 10 pessoas, em reais: R$600, R$800, R$1.000, R$1.500, R$1.100, R$1.400, R$1.200, R$900, R$1.100 e R$700. Mas os valores foram apresentados conforme a coleta das informações, portanto desorganizados em função de ordem crescente ou decrescente de grandeza. Colocando-se o conjunto em ordem crescente ou decrescente de valores, tem-se este rol: R$600, R$700, R$800, R$900, R$1.000, R$1.100, R$1.100, R$1.200, R$1.400 e R$1.500.

3 - Amplitude TotalAmplitude TotalÉ a diferença entre os valores extremos de um conjunto definido em uma ordem de grandeza. A diferença entre o maior e o menor valor de um conjunto define a amplitude total ou o comprimento do conjunto numérico.

ExemplosA - Sejam os valores 600, 700, 800, 900, 1.000, 1.100, 1.200, 1400 e 1500.A amplitude total é: AT = Vmáx - Vmín ⇒ AT = 1500 - 600 = 900Sendo Vmáx = Valor Máximo (maior valor) e Vmín = Valor Mínimo (menor valor).

B - Sejam os valores 6, 12, 17, 20, 24, 14 e 10. A amplitude total deste conjunto é:AT = 24 - 6 = 18. A amplitude total representa o comprimento do conjunto.

Page 56: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 56

4 - Número de Classes (Fórmula da SNúmero de Classes (Fórmula da Sturges)

Adota-se o seguinte modelo: K = 1 + 3,3.log nK = número de classes.n = número total de observações (o tamanho da população ou amostra)Pode-se usar a Fórmula de Sturges com o logaritmo neperiano. Assim, a fórmula se reduz a:K = 1 + 3,3 ln n / ln 10.

O número de classes ou grupos de um conjunto numérico não pode, em nenhuma hipótese, ser menor que 5 e nem deve ser maior que 12. Mesmo conhecendo esse ou outros critérios de determinação do número de classes, o analista deve ter em mente que a escolha depende mais da natureza dos dados e da unidade de medida em que forem expressos do que de regras, muitas vezes arbitrárias e pouco flexíveis.

Exemplo 12Na empresa KKPT há 100 empregados. Quantas classes salariais podem ser construídas segundo Sturges?K = 1+ 3,3 log 100 = 1 + 3,3 x 2 = 7,6 = 8K = 1+ 3,3 ln 100 / Ln 10 = 1 + 3,3 x 2 = 7,6 = 8

5 - Intervalo de ClassesIntervalo de ClassesDeve ser regular, isto é, igual em todas as classes, o que facilita os cálculos posteriores. O intervalo de cada classe ou a razão da progressão aritmética será: h = AT / k.

Exemplo 13Numa amostra de 100 empregados da empresa KKPT, em julho de 2007, o menor salário foi R$ 800,00 e o maior foi R$ 2.400,00. Calcular a amplitude total, o número de classes e o valor do intervalo de classes.

A amplitude total dos salários desta população é: AT = 2.400,00 - 800,00 = 1.600,00.O número de classes ou níveis salariais desta empresa é: K = 1 + 3,3 log n.Então:

Page 57: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 57

Trabalha-se com 8 classes/níveis salariais. O intervalo de cada grupo, classe ou nível salarial é h = AT / k = 1.600 / 8 = 200.Os 8 níveis salariais da empresa são construídos com uma progressão aritmética cujo primeiro termo é 800 e cuja razão é 200. Logo a progressão aritmética é: 800, 1.000, 1.200, 1.400, 1.600, 1.800, 2.000, 2.200, 2.400.O primeiro nível salarial da empresa é de 800 a 1.000; o segundo nível de 1.000 a 1.200; o terceiro nível de 1.200 a 1.400. E assim sucessivamente. O último nível é de 2.200 a 2.400.

Exemplo 14Analisando o tempo de serviço dos 100 funcionários da empresa KKPT, o menor tempo de serviço é de 16 meses e o maior é de 64 meses. Calcular a amplitude total, o número de classes e o valor do intervalo de classes para a construção de uma distribuição de freqüências.Amplitude total é AT = 64 - 16 = 48 meses.O número ideal de classes é K = 1 + 3,3 log n ⇒ K = 1 + 3,3 log 100.K = 1 + 3,3 (2) ⇒ K = 1 + 6,6 = 7,6 = 8Vai-se trabalhar, em princípio, com 8 classes / grupos e o valor do intervalo de classe é:h = AT/ k ⇒ h = 48 / 8 = 6.Pode-se construir uma distribuição de freqüências com uma progressão aritmética cujo primeiro termo é 16 e cuja razão é 6. As classes são de 16 a 22, de 22 a 28, de 28 a 34, de 34 a 40, de 40 a 46, de 46 a 52, de 52 a 58, de 58 a 64 meses.O intervalo de 16 a 22 representa a primeira classe do conjunto e o intervalo de 58 a 64 representa a última classe.

6 - NotasNotas Após a coleta de dados, é preciso sumarizar ou sintetizar o fenômeno com a finalidade de obter as características quantitativas para descrever numericamente o fenômeno. Sumarizar um conjunto de observações significa criar grupos, classes ou níveis, com intervalos geralmente regulares que contêm todas as observações relativas ao fenômeno estudado. A distribuição de freqüência pode ser definida como um arranjo tabular de um conjunto em grupos, classes ou níveis com as suas respectivas freqüências, que representam o número de observações referentes a cada classe. A distribuição de freqüência é uma série em que os dados numéricos relativos a um fenômeno estão reunidos em intervalos de valores. Na distribuição de freqüências, os dados estatísticos estão dispostos

Page 58: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 58

ordenadamente em linhas e colunas, facilitando a leitura no sentido horizontal e vertical. Nas distribuições de freqüências, são fixos a época, o local e a espécie do fenômeno; os dados são agrupados de acordo com a intensidade ou variação quantitativa do fenômeno. Na tabela de freqüência procura-se fazer que sejam correspondentes os valores observados da variável em estudo e as respectivas freqüências. As tabelas de freqüências podem representar tanto valores individuais como valores agrupados em classes.

Exemplo 15Os salários de uma amostra de 100 empregados da construção civil, em fevereiro de 2006, em real, em Belo Horizonte, MG, estão representados a seguir.

Tabela 14 - Salários da Construção Civil Pesada, Fevereiro, 2006, BeloSalários da Construção Civil Pesada, Fevereiro, 2006, Belo Horizonte, em Real

N.º da Classe Salário Funcionários1.ª 200 | 250 42.ª 250 | 300 103.ª 300 | 350 184.ª 350 | 400 255.ª 400 | 450 206.ª 450 | 500 137.ª 500 | 550 78.ª 550 | 600 3

TOTAL 100Fonte: Departamento de Recursos Humanos

Essa amostra dos salários do pessoal da construção civil abrange pedreiros, pintores, serventes, bombeiros e carpinteiros, num total de 100 amostras coletadas, em fevereiro de 2006. Foram determinados 8 grupos, cujos salários variam de R$ 200,00 a R$ 600,00 ou de R$ 200,00 a R$ 599,99.O primeiro nível ou a primeira classe ou intervalo de salários é formado por 4 empregados cujos salários variam de R$ 200,00 a R$ 249,99.O oitavo nível salarial abrange os empregados cujos salários variam de R$ 550,00 a R$ 599,99. Verifica-se que 25 funcionários da amostra têm salário de R$ 350,00 a R$ 399,99.

Page 59: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 59

Na Tabela 14, o símbolo | indica que o intervalo está fechado à esquerda e aberto à direita. Logo o primeiro nível é definido, matematicamente, como [200, 250). E assim por diante.

Existem outros símbolos para representar um intervalo de classe. As classes podem ter os seguintes símbolos:200 | 250. Intervalo aberto à esquerda e fechado à direita, logo 200 não pertence à primeira classe, contudo 250 pertence ao primeiro nível.200 250. Intervalo de classe com extremos excluídos, logo os valores 200 e 250 não pertencem ao primeiro nível/classe.200 || 250. Intervalo de classe com extremos incluídos, logo os valores 200 e 250 pertencem ao primeiro nível/classe.

7 - Elementos de uma Distribuição de Freqüência7.1 - Classe/Grupo/NívelClasse/Grupo/NívelAs classes, grupos, intervalos ou níveis de uma distribuição de freqüência são os intervalos de variação de uma variável.7.2 - Limites de ClasseLimites de ClasseOs valores extremos de uma classe são denominados de limites de classe. Há os limites inferior e superior da classe, simbolizados respectivamente, (Li) e (Ls).7.3 - Intervalo de ClasseIntervalo de ClasseA amplitude do intervalo de classe ou intervalo de uma classe é a diferença entre os dois limites da classe. Denomina-se também razão de uma classe.7.4 - Amplitude Total da DistribuiçãoAmplitude Total da DistribuiçãoÉ a diferença entre os valores extremos de uma distribuição de freqüência, isto é, a diferença entre o maior limite superior e o menor limite inferior.

At = Valor máximo – Valor mínimo

7.5 - Ponto Médio de uma ClassePonto Médio de uma ClasseÉ o principal representante de uma classe, podendo ser definido como o ponto intermediário de uma classe. É obtido pela soma dos limites inferior e superior da classe, dividindo-se o resultado por dois.

Exemplo 16O ponto médio da primeira classe, ou seja, o salário médio dos integrantes do primeiro nível salarial é igual a ( 200 + 250 ) / 2 = 225.Esse valor representa o salário médio dos funcionários do primeiro nível amostral. O ponto médio de cada classe é representado por xi.

Page 60: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 60

Xi =( Limite superior + Limite inferior) / 2

7.6 - Distribuição de Freqüência RelativaFreqüência relativa de uma classe é a freqüência simples dessa classe dividida pelo somatório de todas as freqüências simples.

Exemplo 17A freqüência relativa da quarta classe da Tabela 15 é (25 / 100) = 0,25. Pode-se dizer que 25% dos funcionários da amostra têm salários que variam de R$ 350,00 a R$ 400,00.A soma das freqüências relativas de todas as classes é igual a 1 ou 100%. A freqüência relativa de cada classe está expressa sob o título fr.e é definida por:

7.7 - Distribuição de Freqüência AcumuladaDistribuição de Freqüência AcumuladaFreqüência acumulada de uma classe é o somatório das freqüências anteriores ou posteriores, incluída a freqüência da respectiva classe.Para caracterizar a freqüência acumulada, usam-se as expressões abaixo de ou acima de, isto é, a freqüência acumulada pode ser crescente ou decrescente.Para obter a distribuição de freqüência acumulada crescente (fac), repete-se a freqüência simples da primeira classe e somam-se sucessivamente as demais freqüências, obtendo assim as freqüências acumuladas de cada classe. Exprime-se a freqüência acumulada crescente pelo limite superior de uma classe.A distribuição de freqüência acumulada decrescente (fad) é obtida repetindo-se a freqüência simples da última classe e , a seguir , somar, sucessivamente, as demais freqüências, obtendo assim as freqüências acumuladas de cada classe. A freqüência acumulada acima de é expressa pelos limites inferiores da respectiva classe.Em uma distribuição de frequência acumulada, encontra-se o número que representa o tamanho da população, na primeira ou na última classe. Em uma distribuição de freqüência acumulada relativa, encontra-se o número 1 ou 100%, na primeira ou na última classe.

A inclusão, ou não, de um valor em um intervalo depende da simbologia

Page 61: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 61

usada. Usando-se o símbolo |, está incluído o limite inferior e excluido o limite superior. Usando-se o símbolo |, está excluído o limite inferior e incluído o limite superior.

Exemplo 18A Tabela 15, a seguir, mostra os salários dos funcionários da empresa TTYYG, em março de 2007, em Ouro Preto, com valores em real.

Tabela 15 - SaláriosFuncionários,emReal,Empresa TTYYG,Março/2007,Salários Funcionários, em Real, Empresa TTYYG, Março/2007, Ouro Preto /MG

SALÁRIOS fi Xi fr% fac fad

400 | 600 3 500 6 3 50600 | 800 5 700 10 8 47

800 | 1000 8 900 16 16 421000 | 1200 12 1100 24 28 341200 | 1400 10 1300 20 38 221400 | 1600 6 1500 12 44 121600 | 1800 4 1700 8 48 61800 | 2000 6 1900 4 50 2

TOTAL 50 100Fonte: Departamento Recursos Humanos

Pela analise dos resultados da empresa em março de 2007 e registrados na tabela apresentada, pode-se afirmar:• Dez funcionários recebem salário que vai de R$ 1.200,00 a R$ 1.399,99.Dez funcionários recebem salário que vai de R$ 1.200,00 a R$ 1.399,99.• O salário médio dos integrantes do quarto nível salarial é de R$ 1.100,00.O salário médio dos integrantes do quarto nível salarial é de R$ 1.100,00.• 12% dos funcionários recebem salário que vai de R$ 1.400,00 a12% dos funcionários recebem salário que vai de R$ 1.400,00 a R$ 1.600,00.• 24% dos funcionários recebem o salário médio de R$1.100,00.24% dos funcionários recebem o salário médio de R$1.100,00.• Trinta e oito funcionários recebem salário abaixo de R$ 1.400,00.Trinta e oito funcionários recebem salário abaixo de R$ 1.400,00.• Trinta e quatro funcionários recebem salário do mesmo valor e superior aTrinta e quatro funcionários recebem salário do mesmo valor e superior a R$ 1.000,00.• A empresa gasta emA empresa gasta em média 5 x 700 = 3.500,00 para quitar a folha de pagamento dos integrantes do segundo nível salarial.• Quatro funcionários recebem o salário médio de R$ 1.700,00.Quatro funcionários recebem o salário médio de R$ 1.700,00.• Doze funcionários recebem salário que vai de R$ 1.400,00 a R$ 1.999,99.Doze funcionários recebem salário que vai de R$ 1.400,00 a R$ 1.999,99.• 44% dos funcionários recebem salário que vai de R$ 1.000,00 a R$44% dos funcionários recebem salário que vai de R$ 1.000,00 a R$ 1.399,99.

Page 62: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 62

• 18% dos funcionários recebem salário que vai de R$ 1.500,00 a R$18% dos funcionários recebem salário que vai de R$ 1.500,00 a R$ 1.999,99.• 22 funcionários recebem salário que vai de R$ 1.200,00 a R$ 1.999,99.22 funcionários recebem salário que vai de R$ 1.200,00 a R$ 1.999,99.• 16% dos funcionários recebem salário que varia de R$ 400,00 a R$ 799,9916% dos funcionários recebem salário que varia de R$ 400,00 a R$ 799,99 e a mesma participação é verificada na terceira classe salarial.

8 - Representação GráficaUma distribuição de freqüência pode ser representada por histograma, polígono de freqüência ou ogivas de Galton.Uma distribuição de freqüências que envolve uma variável discreta ou contínua é considerada, automaticamente, contínua. Portanto não importa se, na prática, for discreta. O mesmo acontece na análise de um gráfico que representa uma distribuição de freqüências.8.1 - Histograma de FreqüênciaÉ um conjunto de colunas sucessivas, justapostas, isto é, com intervalos nulos entre si, cujas bases são registradas no eixo das abcissas, pelos limites inferiores de cada classe. A altura e a largura de cada coluna são proporcionais à freqüência e amplitude de cada classe.O histograma é um gráfico de colunas, mas nem todo gráfico de colunas define um histograma. Isso porque, no histograma, se registra, no eixo dos x, o limite inferior de cada classe e, no gráfico de colunas, se registram as categorias da variável.8.2 - Polígono de FreqüênciaÉ um gráfico de linha em que se associa cada ponto médio à sua respectiva freqüência. O ponto médio é registrado no eixo das abcissas e a freqüência simples/relativa no eixo das ordenadas.O polígono de freqüência é um gráfico de linha mas nem todo gráfico de linha define um polígono de freqüência.

Exemplo 19A distribuição salarial da empresa TTYYG é feita por um histograma de freqüência simples, apresentado a seguir.

Page 63: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 63

Gráfico 8 - Salários dos Funcionários, em Real, Empresa TTYYG, Março / 2006 , Ouro Preto/MG

Fonte: Departamento de Recursos Humanos

Pode-se construir o polígono de freqüência simples, isto é, o gráfico de linha, partindo-se do histograma. Basta marcar o ponto médio de cada classe no topo de cada coluna, associando-o a sua respectiva freqüência. Após registrar, no plano cartesiano, todos os pontos (pares ordenados), traçam-se segmentos de reta, ligando-os.Para melhor visualização de área, costuma-se fechar, nos pontos relativos aos pontos médios das classe, a linha poligonal com o eixo das abcissas imediatamente anterior à primeira e superior à última classe.

Page 64: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 64

Gráfico 9 - Salários dos Funcionários, em Real, Empresa Souza, Março / 2001, Belo Horizonte/MG

Para uma visão relativa ou percentual, registra-se a freqüência relativa no lugar das freqüências simples . Registram-se as duas freqüências para se ter uma visão simples e relativa dos fatos.

8.3 - Ogivas de GaltonEste conjunto de linhas é denominado de Ogivas de Galton.

Registram-se, no eixo dos X, os limites inferiores da distribuição e, no eixo dos Y, as respectivas freqüências acumuladas simples ou relativas.No eixo dos Y, registram-se as freqüências acumuladas e, no eixo dos X, registram-se os limites inferiores da distribuição. Observando-se os valores da empresa TTYY, a maior freqüência acumulada é o valor que representa o tamanho da população.

Page 65: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à AdministraçãoDistribuição de Freqüências

Página 65

Exemplo 20Gráfico 10 - Salários dos Funcionários da Empresa TTYYG, em Real, Ouro Preto/MG, Março/ 2007

Fonte: Departamento de Recursos Humanos

A primeira linha parte do ponto ( 400, 0 ) e define o gráfico da freqüência acumulada crescente; a segunda linha parte do ponto ( 0, 50 ) e define o gráfico da freqüência acumulada decrescente. O ponto de interseção das curvas que compõem as ogivas dá o valor de uma medida denominada mediana.

Quando se traça uma reta paralela ao eixo dos X, partindo-se do ponto de interseção das curvas que compõem as ogivas, o intercepto dessa reta com o eixo dos Y dá o valor que representa 50 % da população.

Page 66: Apostila Estatistica - Autor CEADUFOP
Page 67: Apostila Estatistica - Autor CEADUFOP

Capítulo 7

Medidas de Posição

Page 68: Apostila Estatistica - Autor CEADUFOP
Page 69: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 69

Vista a apresentação dos dados em tabelas e gráficos e as distribuições de freqüência, são apresentados os cálculos de medidas que possibilitam representar, de forma resumida, um conjunto de dados relativos à observação de determinado fenômeno. São as medidas de posição, que orientam quanto à posição distribuição no eixo dos X. Compreendem as medidas de tendência central e as medidas separatrizes.

1 - Medidas de Tendência CentralFornecem ao pesquisador informações representativas do núcleo das observações de um fenômeno relativo a qualquer campo da atividade humana. São representadas por média aritmética, média geométrica, média harmônica, mediana e moda.1.1 - Média AritméticaÉ o ponto de equilíbrio de um conjunto numérico. É o ponto de sustentação de um conjunto. É o valor de maior representatividade de um conjunto numérico. Pode ser calculada para números não-tabulados, média aritmética ponderada e números tabulados.1.1.1 - Média Aritmética de Números Não-TabuladosÉ o quociente da soma desses números com a sua quantidade. É representada por , que se lê x barra.Sejam os valores x1 , x2 , x3 .... xn. Define-se a média aritmética desse conjunto como a razão existente entre a soma dos valores e a sua quantidade.

onde xi representa os valores do conjunto e n a quantidade de números (o tamanho da amostra)Em um conjunto, a média multiplicada pelo número de valores é igual à soma dos valores.

Exemplo 21A variável aleatória X assume os valores 5, 7, 8, 10 e 15 e a variável aleatória Y assume os valores 4, 7, 11, 15, 20 e 21. Determine a média aritmética de cada variável.Valores da variável X : 5, 7, 8, 10 e 15. Então a sua média aritmética é:

Page 70: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 70

Valores da variável Y: 4, 7, 11, 15, 20 e 21. Então a sua média aritmética é:

1.1.2 - Média Aritmética PonderadaConsiderando-se que os valores x1, x2, .. xn ocorrem com as freqüências f1, f2, .. fn vezes, respectivamente, a média aritmética ponderada é:

onde f1 + f2 + f3 + .. + fn = n. O tamanho da amostra ou o somatório das freqüências é n. Exemplo 22Se os valores 5, 8, 6 e 2 ocorrerem com as freqüências 3, 2, 4 e 1, respectivamente, então a média aritmética será:

Exemplo 23Uma pesquisa feita sobre o mercado imobiliário de Ouro Preto obteve os seguintes resultados: 8 apartamentos de R$70.000,00 cada; 15 apartamentos de R$ 90.000,00 cada e 7 apartamentos de R$100.000,00 cada. Qual é o preço médio de apartamento?

Resposta: R$87.000,00

Page 71: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 71

1.1.3 - Média Aritmética de Números Tabulados 1.1.3.1 - Processo do Ponto MédioProcesso do Ponto MédioConsiderando-se que o ponto médio é o principal representante da classe, ele deve ser a base do cálculo da média aritmética.Considerando-se que os pontos médios x1, x2, x3...xn ocorrem com as freqüências f1, f2, f3...fn, respectivamente, define-se a média aritmética como a razão existente entre o somatório do produto de cada ponto médio pela respectiva freqüência e o somatório das freqüências. A média é definida assim:

onde n é o tamanho da amostra.

Observa-se que fi, no caso, tanto representa a freqüência simples quanto a relativa. Usando-se a relativa, não se dividide o resultado por n.

Exemplo 24A Tabela 16, apresentada a seguir, define a distribuição das vendas das diversas filiais da empresa XXTT, em julho/2007, em Belo Horizonte, em milhões de reais.

Tabela 16 - Vendas por Filial, Empresa XXTT , Julho/2007, Belo Horizonte, em Milhões de Reais

Vendas fi xi fi xi

6 14 3 10 3015 23 7 19 13324 32 9 28 25233 41 5 37 18542 50 4 46 184TOTAL 28 784

Fonte: Departamento de Vendas

Exemplo 25Cálculo do faturamento médio de uma filial da empresa XXTT, em julho/2007.Para calcular a média aritmética, deve-se determinar:

Page 72: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 72

• Ponto médio de cada classe x Ponto médio de cada classe xi .

• Produto de cada ponto médio pela respectiva freqüência simples ou Produto de cada ponto médio pela respectiva freqüência simples ou relativa.• Somatório de f Somatório de fi xi dividido pelo total das freqüências.

O faturamento médio dessa filial, em julho/2007, foi de R$28.000.000,00.1.1.3.2 - Processo SimplificadoProcesso SimplificadoConsiste em definir a classe que deve ser a origem arbitrária da distribuição. Essa classe deve ter um desvio nulo e os demais desvios são definidos em unidades de classe. Dessa forma, a média, pelo processo simplificado, é definida por:

onde X0 = média suposta definida pelo ponto médio da classe escolhida para ser a origem arbitrária;µi = desvios em unidades de classe;h = intervalo de classes.

Exemplo 26A Tabela 17, apresentada a seguir, mostra as vendas das 60 filiais da empresa KLPT, em maio de 2007.

Tabela 17 - Vendas das 60 Filiais da Empresa KLPT, Maio/2007, em Milhões de Reais

Vendas fi µi fi xi

40 60 4 -3 -1260 80 7 -2 -14

80 100 12 -1 -12100 120 15 0 0120 140 10 1 10140 160 8 2 16160 180 4 3 12

Total 60 0Fonte: Departamento de Vendas

Page 73: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 73

Escolhe-se a classe do centro para ser a origem, mas poderia ter sido outra classe. A classe-origem tem desvio nulo, em unidade de classe.O desvio é definido pela razão existente entre a diferença de cada ponto médio e o ponto médio escolhido aleatoriamente, que, no exemplo, é110, e o intervalo de classe.O primeiro desvio, em unidade de classe, é ( 50 – 110 ) / 20 = -3A variável µ, representando os desvios, desenvolve-se de unidade a unidade. São os desvios em unidades de classe.A escolha da origem é arbitrária e a média suposta é o ponto médio da classe escolhido para ser a origem. São estes os valores:

X0 = 110 n = 60 ∑ fi µi = 0 h = 20

Conclui-se que uma filial da empresa vendeu, em média, 110 milhões de reais.

Observa-se que o somatório do produto de cada freqüência pelo respectivo desvio foi nulo. logo a média da distribuição é igual ao ponto médio da classe- origem. Se o somatório fosse positivo, a média seria maior do que o ponto médio da classe-origem. Se fosse negativo, seria menor do que o ponto médio da classe-origem.

1.1.4 - Propriedades da Média Aritmética Primeira PropriedadeA soma algébrica dos desvios de um conjunto de números, em relação à média aritmética, é zero.O desvio de um número, com base na média aritmética, é a diferença existente entre esse número e a média aritmética.Considera-se que:

Para calcular o desvio de cada número, necessita-se da média aritmética do conjunto.

Page 74: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 74

Exemplo 27Sejam os valores 6, 4, 8, 5 e 7. Calcular a média aritmética do conjunto.

Os desvios, em relação à média aritmetica, são:

Então os desvios são:d1 = 6 - 6 = 0 d2 = 4 - 6 = - 2 d3 = 8 - 6 = 2 d4 = 5 - 6 = - 1 d5 = 7 - 6 = 1.

O somatório dos desvios é nulo: 0 + (- 2) + 2 + ( - 1) + 1 = 0

Segunda PropriedadeA média de uma série de valores constantes é a própria constante.Sejam os valores 8, 8, 8 e 8. Então a média aritmética do conjunto é igual a 8.

Terceira PropriedadeSe P1 números têm média M1 , P2 têm média M2 .... Pk números têm média Mk. Então a média aritmética da variável é:

Pela fórmula, percebe-se que a média total do conjunto é:

Quarta PropriedadeSomando-se uma constante a cada valor de um conjunto, a média aritmética fica somada com o valor da constante.

Exemplo 28Uma variável aleatória assume os valores 4, 8, 12 e 16. A média aritmética da variável aleatória é:

Somando-se 5 unidades a cada valor da variável, obtém-se 9, 13, 17 e 21.

Page 75: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 75

A média aritmética do novo conjunto é:

Logo se pode concluir que, somando-se a cada valor de um conjunto uma constante, a média aritmética ficará aumentada dessa constante. Não se pode esquecer que a subtração é um caso especial da adição.

Exemplo 29A empresa KKYY dará, no próximo mês, a cada um de seus quarenta funcionários, um abono de R$ 50,00. Neste mês, o salário médio do funcionário da empresa é de R$700,00. No próximo mês, o salário médio do funcionário passará para R$700,00 + R$50,00 = R$750,00. O gasto médio da empresa com salários, portanto, será de R$750,00 x 40 = R$30.000,00. Como cada funcionário vai receber um abono de R$50,00. Portanto a média ficará somada de R$50,00.

Quinta PropriedadeMultiplicando-se cada valor de um conjunto numérico ou de uma variável aleatória por uma constante (c≠0), a média do conjunto ou da variável aleatória ficará multiplicada pela respectiva constante. Observa-se que a divisão é um caso da multiplicação.

Exemplo 30O salário médio dos funcionários da empresa YYTR, neste mês, é de R$ 900,00. Para o próximo mês, a empresa dará um reajuste salarial de 10% a cada um Então o salário médio da empresa ficará somado com 10% do seu valor, isto é, o salário médio ficará multiplicado por 1,10. Observa-se que acrescentar 10% a um valor é o mesmo que multiplicá-lo por 1,10. Esse valor significa a soma da taxa unitária mais 1. Então o novo salário médio será de R$ 900,00 x 1,10 = R$ 990,00.Para aplicação da propriedade é fundamental saber que um valor futuro é igual ao valor presente multiplicado pelo índice unitário elevado a n. Então:

VF = VP ( 1 + i )n

Observa-se que n representa o tempo decorrido e i representa a taxa unitária: 10% têm como taxa unitária 10/100 = 0,10, que, somada à unidade, dará o índice unitário. Então o problema é resolvido por: Valor Futuro = 900( 1 + 0,10 ) ⇒ VF = 900 x 1,10 = 990,00

Page 76: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 76

Exemplo 31As vendas da empresa PPTT, neste mês, foram de 600 mil reais. Para o próximo mês, as perspectivas indicam que as vendas devem ter redução de 10%. Qual será a tendência das vendas da empresa para o próximo mês?A redução de 10% é igual ao fator 0,9. A redução de 20% é igual ao fator 0,8 e o aumento de 20% é igual ao fator 1,2.VF = VP ( 1 + i ) ⇒ VF = 600 (-0,10 + 1)1 ⇒ VF = 600 x 0,9 = 540

Sexta PropriedadeA média aritmética de uma série de valores é igual a uma média suposta (representada por um valor qualquer) aumentada da média aritmética dos desvios em relação à média suposta.

Exemplo 32Sejam estes os valores de uma variável aleatória: 8, 14, 22, 36, 56 e 80. A média do conjunto é:

Sabe-se que o conjunto tem média 36. Para calculá-la novamente, escolhe-se um valor qualquer para o início dos cálculos. Aleatoriamente se escolhe um valor, denominado de média suposta. Escolhe-se o valor 14 para ser a média suposta. Então os desvios serão calculados tendo o número 14 representando a média, sendo:

D1 = 8 - 14 = -6

D4 = 36 - 14 = 22

D2 = 14 - 14 = 0

D5 = 56 - 14 = 42

D3 = 22 - 14 = 8

D6 = 80 - 14 = 66

Sabe-se que: ∑ Di = 132. A média verdadeira do conjunto é:

Page 77: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 77

Sétima Propriedade

A média aritmética de uma soma ou de uma diferença de duas variáveis aleatórias é igual à soma ou à diferença das médias das duas variáveis.

Se e , então:

Para aplicar esta propriedade é fundamental que as variáveis tenham o mesmo tamanho e que a soma/diferença seja respectiva. Exemplo 33A variável x é formada pelos valores 3 e 5, logo a média da variável é igual a:

A variável y é formada pelos valores 7 e 9, logo a média da variável é igual a:

Somando-se as variáveis aleatórias x e y, respectivamente, tem-se:

K = 3 + 7 = 10 e 5 + 9 = 14

Então a variável K é formada pelos valores 10 e 14. A média da variável K é igual a:K = ( 10 + 14 ) / 2 = 12. Então:

1.1.5 - Vantagens da Média Aritmética• É obtida com cálculos relativamente simples.É obtida com cálculos relativamente simples.• É a mais conhecida das médias.É a mais conhecida das médias.• Tem cálculo simples e de fácil compreensão.Tem cálculo simples e de fácil compreensão.

Page 78: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 78

1.1.6 - Desvantagens da Média AritméticaPara a obtenção da é necessário ter todos os valores do grupo.

É excessivamente afetada por valores extremos - ou muito grandes ou muito pequenos em relação ao conjunto de dados.

1.2 - Média TípicaÉaquela em que os valores da série estão concentrados em torno da média.

Exemplo 34Não existem valores discrepantes no conjunto 18, 20, 20 e 22.Não existem valores que podem conduzir a uma falsa análise. Logo o valor 20 representa, com muita perfeição, o conjunto dos números 18, 20, 20 e 22.

O valor 20 representa, com muita fidelidade, o conjunto, tendo-se em vista a forte concentração dos diversos valores em torno desta média. Sendo assim, é considerado média típica do conjunto.

1.3 - Média AtípicaÉ aquela em que os valores da série não estão concentrados em torno da média. A média atípica representa mal a série de valores.

Exemplo 35Observa-se que, no conjunto 2, 4, 5, 6 e 100, o valor 100 é discrepante dos demais valores, logo tal valor conduz a uma falsa análise do conjunto. Para melhor visualização, calcula-se a média.

O número 23,4 não representa adequadamente os valores deste conjunto. Portanto pode-se dizer que ele é uma média atípica.

Page 79: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 79

1.4 - Média Geométrica1.4.1 - Dados IsoladosA média geométrica de um conjunto de n números x1, x2......xn é a raiz de ordem n do produto desses números:

Exemplo 36Determinar a média geométrica dos números 3, 8, 14.

Na prática, o cálculo da média geométrica é facilitada por logaritmos. Assim para dados isolados, tem-se:

onde f representa as freqüências dos valores e xi os valores do conjunto.1.4.2 - Dados AgrupadosPara calcular a média geométrica de uma distribuição de freqüências:1. Determina-se o ponto médio de cada classe.2. Determina-se o logaritmo decimal ou neperiano de cada ponto médio.3. Efetua-se o produto de cada fi pelo respectivo valor do logaritmo de xi, isto é, fi Log xi.4. Realiza-se a operação:

Page 80: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 80

Exemplo 37Determinar a média geométrica da distribuição apresentada:

Tabela 18 - Duração Amostra de Lâmpadas, em Horas, Fabricante HHDuração Amostra de Lâmpadas, em Horas, Fabricante HH Agosto 2007 - Ouro Preto / MGOuro Preto / MG

Duração fi xi Log xi fi log xi

400 | 600 12 16 1, 2041 14, 4492400 | 600 84 18 1, 2553 105, 4452400 | 600 265 20 1, 3010 344, 7650400 | 600 281 22 1, 3424 377, 2144400 | 600 260 24 1, 3802 358, 8520400 | 600 83 26 1, 4150 117, 4450400 | 600 15 28 1, 4472 21, 7080

TOTAL 1.000 1.339,8756Fonte: Departamento de Produção

1.5 - Média HarmônicaÉ o inverso da média aritmética dos inversos dos n valores de uma variável aleatória.

1.5.1 - Dados isoladosDados isoladosSejam os valores x1, x2, x3.....xn de uma variável aleatória. A média harmônica da variável é:

Exemplo 38Determinar a média harmônica do conjunto 3, 4, 6 e 10

Page 81: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 81

1.5.2 - Dados AgrupadosDados Agrupados

No caso de dados agrupados, a média harmônica é definida por:

Exemplo 39Uma pessoa foi de Ouro Preto para o Rio de Janeiro com uma velocidade média de 80 km/h e veio do Rio de Janeiro para Ouro Preto, pela mesma rodovia, com uma velocidade média de 100 km/h. Qual foi a velocidade média da viagem (ida e volta)?Supondo que a distância de Ouro Preto a Rio de Janeiro seja de 400 km, calcula-se o tempo gasto na viagem de ida e de volta.Tempo gasto de Ouro Preto ao Rio de Janeiro = 400/80 = 5 horas.Tempo gasto do Rio de Janeiro a Ouro Preto = 400/100 = 4 horas.Distância total percorrida = 800 km em 9 horas. Logo a velocidade média foi de 800/9 = 88,89 km/h.

O cálculo foi feito com uso da média harmônica:

Exemplo 40Numa empresa há 24 funcionários. Para a realização de determinada tarefa, ela conta com 6 funcionários dos quais cada um gasta 12 dias; 12 funcionários dos quais cada um gasta 15 dias e 6 funcionários dos quais cada um gasta 8 dias. Qual será o tempo médio que um funcionário gastará

Page 82: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 82

para realizar a tarefa?Para o cálculo da média aritmética é fundamental o produto da freqüência pelo respectivo ponto médio. Para o cálculo da média geométrica é fundamental elevar cada ponto médio à sua respectiva freqüência. Para o cálculo da média harmônica divide-se cada freqüência pelo respectivo ponto médio.Dado um conjunto de valores positivos, não-constantes e diferentes de zero, a média harmônica é menor do que a média geométrica e esta é menor do que a médiaaritmética.

Mh < Mg < X

1.6 - MedianaÉ uma medida de tendência central. Determina um valor que divide um conjunto numérico em duas partes iguais. É uma posição abaixo ou acima da qual se situam 50% dos casos.Dividindo-se um conjunto em duas partes iguais, a parte central é a mediana.1.6.1 - Dados Isolados IsoladosDado um conjunto, em uma ordem de grandeza, a mediana é o valor central quando n for ímpar. E a média aritmética dos dois valores centrais, quando n for par.

Exemplo 41Determinar a mediana da variável aleatória que assume os valores 2, 5, 10, 9, 6, 8 e 4. Colocando o conjunto em ordem de grandeza, tem-se: 2, 4, 5, 6, 8, 9, 10 e, por uma simples inspeção, verifica-se que n é ímpar, isto é, n = 7.Logo a mediana é o valor central do rol: md = 6, porque 6 é o valor central.A posição do número mediano é:

No rol, o quarto número representa a mediana.

Exemplo 42Determinar a mediana da variável aleatória que assume os valores 1, 5, 3, 8, 7 e 6.Coloca-se o conjunto em ordem de grandeza: 1, 3, 5, 6, 7, 8. Observa-se que n é par, logo a mediana é a média dos dois valores centrais:

Page 83: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 83

A mediana é representada pela média aritmética entre o terceiro e o quarto valor do rol.

1.6.2 - Números TabuladosSe o número total de freqüências for n, a mediana será um número tal que 50% dos valores de n se situem abaixo dela e 50% acima dela. Para determinar a classe que contém a mediana, basta verificar qual é a primeira classe cuja freqüência acumulada crescente contém 50% dos casos, isto é, 50% de n. Com a fórmula apresentada, calcula-se o valor da mediana.

Os dados expressos na fórmula referem-se à classe que contém a mediana: lir = limite inferior real; fi = freqüência da classe; n = tamanho da amostra; h = intervalo da classe; Faca = freqüência acumulada crescente anterior à classe que contém a mediana.

Exemplo 43No 1.º trimestre de 2007, a empresa MMGG realizou 80 exportações, cujos valores estão registrados na tabela a seguir, expressos em milhões de dólares. Determinar a exportação mediana, isto é, o valor abaixo ou acima do qual se encontram 50% das exportações.

Para calcular a mediana, deve-se determinar a freqüência acumulada crescente de cada classe (FAC). Depois, verifica-se a 1.ª classe cuja freqüência acumulada crescente contém 50% dos casos, isto é, 50% de n.

Page 84: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 84

Tabela 19 - Exportações, Empresa MMGG, 1.º Trimestre / 2007. BH / MG

MilhõesUS$

xi fi xi fi fac

150 | 170 8 8170 | 190 12 20190 | 210 20 40210 | 230 16 56230 | 250 12 68250 | 270 8 76270 | 290 4 80

Total 80Fonte: Departamento de Produção

Observação: A linha em negrito representa a Classe que contém a Mediana.Para calcular a mediana: 50% de 80 = 40.Verifica-se que a classe, em ordem crescente, cuja freqüência acumulada crescente (fac) contém 50% dos casos é a terceira. Selecionam-se os valores.

Observa-se que a classe que contém 40 casos é a 3.ª, logo ela é a classe que contém a mediana. Os dados são:

lir = 190 n = 80 50% de 80 = 40 faca = 20 fi = 20 h = 20

Então a mediana é:

Exemplo 44No 1.º trimestre de 2007, foram realizadas 80 exportações: 40 exportações com valor entre 150 e 210 milhões de dólares e 40 exportações com valor entre 210 e 290 milhões de dólares. Qual foi o valor médio? Pode-se dizer que a exportação média é maior do que a exportação mediana? A mediana dividiu o conjunto em duas partes iguais. Se a freqüência acumulada crescente da classe que contém a mediana for exatamente igual

Page 85: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 85

a 50% de n, a mediana será o limite superior da classe.

1.7 - Moda, Modo ou NormaÉ a medida de tendência central definida como o valor de maior freqüência. É o valor que mais se repete entre os diversos valores de um conjunto. É o valor preponderante, o valor dominante de um conjunto.Um rol pode não ter moda como também pode haver um rol que possua mais de uma moda. 1.7.1 - Números IsoladosNúmeros IsoladosA moda será aquele valor de maior freqüência, valor preponderante, valor dominante, valor que mais se repete dentre os diversos valores de um conjunto.

Exemplo 45Determinar a moda deste conjunto de valores: 2, 2, 5, 6, 7, 8, 8, 8, 10, 10, 11, 12 e 18.O valor de maior freqüência, o número que mais se repete e o valor dominante do conjunto é o número 8, porque se repetiu três vezes. Logo ele é a moda. Sendo asssim, este é um conjunto unimodal.

1.7.2 - Números TabuladosNúmeros TabuladosModa bruta será o ponto médio da classe modal. Para dados agrupados a moda é calculada pela fórmula de Czuber ou de King. Pela fórmula de Czuber, a moda é definida assim:

lir representa o limite inferior real da classe modal. O valor ∆1 é a diferença entre a freqüência modal e a freqüência da classe imediatamente anterior à classe modal: ∆1 = fm - fa. O valor ∆2 é a diferença entre a freqüência modal e a freqüência da classe imediatamente posterior à classe modal: ∆2 = fm - fp. O valor h representa o intervalo da classe modal, classe que contém a maior freqüência simples ou relativa.

Para calcular a moda de uma distribuição de freqüências:1 - Localizar a classe modal, a classe que contém a maior freqüência simples/

Page 86: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 86

relativa.2 - Identificar os valores relativos à classe e aplicar a fórmula.

Exemplo 46Determinar o valor modal das vendas realizadas pela empresa HHFF, no primeiro trimestre de 2007, em Porto Alegre, segundo a tabela apresenta a seguir:

Tabela 20 - Vendas, Milhões de reais, Empresa HHFF, 1.º Trimestre / 2007, Porto Alegre / RS

Duração fi

150 | 170 8170 | 190 12190 | 210 20210 | 230 16230 | 250 12250 | 270 8270 | 290 4

Total 80Fonte: Departamento de Vendas

Cálculo da modaA - Fórmula de Czuber.A terceira classe desta tabela define a classe modal, ou seja, 190 a 210, porque tem a maior freqüência simples, no caso = 20. Nesta classe, buscam-se estas informações:

∆1 = fm - fa = 20 – 12 = 8 ∆2 = fm - fp = 20 – 16 = 4 lir = 190 h = 20

Logo a venda modal foi de 203,33 milhões de reais.

Page 87: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 87

B - Fórmula de King.

fp é a freqüência posterior à classe modal e a fa é a freqüência anterior à classe modal; h é o intervalo de classe e lir é o limite inferior real da classe.

Em uma distribuição de freqüências com duas freqüências modais consecutivas, segundo Czuber, a distribuição tem apenas uma moda, cujo valor é o ponto médio da grande classe modal. Contudo, se as classes modais não forem consecutivas, há tantas modas quantas forem as classes modais. Mas, segundo King, para cada classe modal existe uma moda, independentemente de ser consecutiva ou não.Viu-se que o valor modal das vendas foi de 203,3 milhões de reais. A venda mediana foi de 210 milhões de dólares. E a importação média? Teria um valor maior do que 210 milhões de reais ou menor do que 203,3 milhões de reais? Ou um valor intermediário? Podem-se tirar conclusões.

2 - Medidas SeparatrizesTêm por finalidade dividir em K partes iguais (K = 1, 2, 3...)um conjunto numérico relativo a um fenômeno, 2.1 - MedianaDivide um conjunto numérico em duas partes iguais.

Exemplo 47Dividir o conjunto salarial de uma empresa em duas partes iguais: salário bom e salário ótimo. No caso, o limite salarial que divide o conjunto em duas partes iguais é a mediana.

2.2 - QuartilResulta da divisão de um conjunto em 4 partes iguais, portanto cada parte representa 25% do conjunto. Seja:

Page 88: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 88

Na figura apresentada visualiza-se com facilidade que Q1 é um número abaixo do qual se situam 25% dos casos e acima do qual, portanto, se situam 75%. Q2 = Md, isto é, o 2.º quartil é igual à mediana, pois abaixo ou acima dele se situam 50% dos casos. Q3 é um número abaixo do qual se situam 75% dos casos e acima do qual se situam 25%.O desvio quartil ou intervalo semi-interquartílico é definido como (Q3 – Q1)/2 e o intervalo interquartílico como (Q3 – Q1).

2.3 - DecilResulta da divisão de um conjunto em 10 partes iguais. Portanto cada uma delas contém 10% do conjunto.

Na figura apresentada, verifica-se que o D1 é um número abaixo do qual se situam 10% dos casos. Já se sabe que Q2 = Md = D5 , pois D5 é um número abaixo ou acima do qual se encontram 50% das observações.O desvio decílico ou intervalo semidecílico é definido como (D9 – D1)/2 e o intervalo decílico como (D9 – D1).

2.4 - PercentilResulta da divisão de umconjunto em 100 partes iguais.

Exemplo 48Deseja-se dividir uma produção em 5 partes iguais: Ruim, Boa, Muito Boa, Ótima e Excelente. Para isso, recorre-se aos percentis P20 , P40 , P60 e P80.

Page 89: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 89

Tem-se o seguinte:• A produção Ruim envolve valores de P0 a P20 .• A produção Boa envolve valores de P20 a P40 .• A produção Muito Boa envolve valores de P40 a P60 .• A produção Ótima envolve valores de P60 a P80 .• A produção Excelente envolve valores de P80 a P100.Portanto uma produção é classificada como Ótima quando seu valor está compreendido entre P60 e P80 e como Excelente quando seu valor está acima de P80.Pode-se generalizar o cálculo das medidas separatrizes com os percentis. A fórmula para o cálculo é a da mediana, com as correções necessárias, em virtude da posição do valor calculado.Na fórmula da mediana:

Usam-se 50% dos casos pelo interesse em determinar a mediana. Desejando dividir o conjunto em cinco partes iguais, usam-se, no lugar de 50% de n, estes valores: 20% de n para P20; 40% de n para P40 e assim por diante.

Page 90: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 90

Exemplo 49Tabela 21 - Vendas Diárias Realizadas pela Empresa PPXX 1.O Trimestre / 2007, BH, em Mil Reais

Duração fi Fac

200 | 300 8 8300 | 400 9 17400 | 500 16 33500 | 600 20 53600 | 700 13 66700 | 800 7 73800 | 900 5 78900 | 1.000 2 80

Total 80Fonte: Departamento de Vendas

Dividem-se as vendas do trimestre em 4 grupos iguais (100 / 4 = 25). Quais são os limites que identificam os grupos?

Para identificar os quatro grupos deve-se calcular: P25, P50 P75 e P100. O primeiro grupo engloba todas as vendas abaixo de P25. O segundo engloba as vendas entre P25 e P50. O terceiro é aquele cuja faixa de vendas está no intervalo P50 a P75 e o quarto é aquele cuja faixa de vendas é igual ou superior a P75.

Cálculo de P25

1.º - 25% n = 25 x 80 / 100 = 202.º - Localiza-se a classe que contém o P20 . Neste caso verifica-se qual é a 1.ª freqüência acumulada crescente que contém 20 observações: é a 3.ª classe.Nesta classe, tem-se: lir = 400, f = 16, h = 100 e faca = 17

Pode-se concluir que 25% das vendas do trimestre estão abaixo de R$ 418,70, logo pertencem ao primeiro grupo todas as vendas de R$ 200.000,00 a R$ 418.700,00.

Cálculo do P50

Page 91: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas de PosiçãoPágina 91

1º - 50% n = 50 x 80 / 100 = 40.2º - Localiza-se a classe que contém o P50 = Md. Neste caso verifica-se qual é a 1.ª freqüência acumulada crescente que contém 40 observações: é a 4ª classe.Nesta classe tem-se: lir = 500, h = 100, f = 20 e faca = 33

Conclui-se que 50% das filiais alcançaram vendas abaixo de 535.000. Pertencem ao segundo grupo de vendas todas as filiais com vendas de 418.700,00 a 535.000,00, isto é, entre P25 e P50. Os demais cálculos ficaram a cargo do aluno.

Page 92: Apostila Estatistica - Autor CEADUFOP
Page 93: Apostila Estatistica - Autor CEADUFOP

Capítulo 8

Medidas de Dispersão

Page 94: Apostila Estatistica - Autor CEADUFOP
Page 95: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 95

Dois conceitos fundamentais aplicados à Estatística Descritiva são tendência central e variação. Foi mostrado como a tendência central de uma distribuição pode ser descrita usando-se a média/mediana/moda. Como medir a extensão de uma distribuição? É importante ter uma medida, um padrão de comparação para identificar a disseminação de dados em uma distribuição e para comparar os graus de extensão das distribuições.As medidas de dispersão têm o objetivo avaliar o grau de concentração dos diversos valores de um conjunto numérico de observações em torno de uma medida de tendência central. Quanto menor o valor da dispersão, mais concentrado vai se tornando o conjunto numérico, mais concentrado, mais homogêneo em relação às medidas de tendência central.

1 - Amplitude Total1.1 - Com Dados IsoladosA amplitude total é a diferença entre o maior e o menor valor do conjunto numérico. AT = V. Máx - V. Mín

Exemplo 50Dado o conjunto 7, 12, 9, 3 e 18, a amplitude total é AT = 18 - 3 = 15. Esse valor representa o comprimento do conjunto. Quanto maior for a amplitude, tanto maior será a dispersão.

Exemplo 51São dados estes conjuntos:A = {14, 18, 13, 11, 16} ⇒ AT = 18 - 11 = 7B = {15, 21, 22, 27, 28} ⇒ AT = 28 - 15 = 13C = {40, 48, 82, 78, 90} ⇒ AT = 90 - 40 = 50

O conjunto A é mais homogêneo que os demais. O conjunto A é mais denso ou menos disperso que os demais. O conjunto C é o de maior amplitude total, logo é mais disperso que os demais.

1.2 - Com Dados AgrupadosA amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = Ls (máx) - Li(min).

Exemplo 52Determinar a amplitude total da distribuição.

Page 96: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 96

Tabela 22 - Exportações Realizadas pela Empresa KKI, Março / 2.001, em Mil Dólares

Exportações fi

600 | 1000 31000 | 1400 81400 | 1800 111800 | 2200 132200 | 2600 72600 | 3000 7

TOTAL 47Fonte: Ministério da agricultura

At = 3000 – 600 = 2400

2 - Desvio MédioÉ a média aritmética dos valores absolutos dos desvios de um conjunto numérico, tendo-se como base a média ou a mediana.2.1 - Dados IsoladosDado um conjunto de valores x1, x2, x3 ... xn, o desvio médio é definido por:

Exemplo 53Seja o conjunto de valores 4, 6, 10 e 12. Qual é o desvio médio?1 - Calcula-se a média ou mediana.A média: = (4 + 6 + 10 + 12) / 4 = 82 - Calculam-se os desvios:

d1 = 4 - 8 = -4 d2 = 6 - 8 = -2 d3 = 10 - 8 = 2 d4 = 12 - 8 = 4

A soma dos desvios, com base na média, é nula: Σdi = (-4) + (-2) + 2 + 4 = 03 - Faz-se a soma, porque o desvio médio é a média aritmética dos valores absolutos dos desvios:Dm = | (-4) | + | (-2) | + | 2 |+ | 4 |: 4 = 3

Page 97: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 97

2.2 - Dados AgrupadosPara dados agrupados, o desvio médio é definido por:

Para calcular o desvio médio, é preciso calcular:Média ou mediana da distribuição;Desvio absoluto de cada ponto médio à média/mediana;Produto de cada freqüência simples pelo respectivo desvio absoluto

Exemplo 54Calcular o desvio médio das exportações da empresa KKI, em março de 2.000:

Tabela 23 - Exportações da Empresa HPP, Julho / 2.007, em Mil ReaisExportações fi xi fi | xi - |

80 | 100 4 90 4 | 90 - 150 | = 240100 | 120 7 110 7 | 110 - 150 | = 280120 | 140 10 130 10 | 130 - 150 | = 200140 | 160 15 150 15 | 150 - 150 | = 0160 | 180 10 170 10 | 170 - 150 | = 200180 | 200 7 190 7 | 190 - 150 | = 280200 | 220 4 210 4 | 210 - 150 | = 240

Total 57 1.440Fonte: Departamento de Vendas

Verifica-se que a distribuição é simétrica, uma vez que as classes eqüidistantes em torno da maior freqüência têm a mesma freqüência simples, logo a média, a mediana e moda são iguais e o valor dessas medidas é o ponto médio da classe central, que, no caso, é 150.Então o desvio é:

2.3 - Características do Desvio Médio-O cálculo pode ser efetuado com base na média ou na mediana, sendo

Page 98: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 98

mínimo quando for calculado com base na mediana.-Não se consideram os desvios negativos, porque o desvio médio é calculado em termos absolutos.-Deve-se substituir o desvio padrão quando for influenciado por valores que distorcem a realidade.-O desvio médio é menor que o desvio padrão. Para uma distribuição normal, o desvio médio é igual a 79,79% do desvio padrão. 3 - Variação TotalÉ a soma dos quadrados dos desvios calculados com base na média aritmética. A variação total por Sxx e pelas fórmulas pode ser assim representada:

Exemplo 55Calcular a variação total do conjunto de valores: 4, 7, 9 e 20.Calcular a média do conjunto:

Calcular os desvios:

d1 = 4 – 10 = -6 d2 = 7 – 10 = -3 d3 = 9 – 10 = -1 d4 = 20 – 10 = 10

Nota-se que a soma dos desvios calculados com base na média é nula.Como a variação total é a soma dos quadrados desses desvios, tem-se: VT = Sxx = ( -6 )2 + ( -3 )2 + ( -1 )2 + ( 10 )2 ⇒ VT = 14

A 2,ª formula:

Page 99: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 99

Sabe-se que Σxi2 = 42 + 72 + 92 + 202 = 546 e que a média é = 10. Logo

a variação total é:Sxx = 546 – 4 x 102 = 146

A 3.ª formula: Sxx = Σ xi2 - (Σi)

2 / nΣ xi

2 = 42 + 72 + 92 + 202 = 546

A soma dos valores de x é igual a 40, a variação total:Sxx = 546 – (402 / 4) = 146

4 - VariânciaÉ a média aritmética da soma dos quadrados dos desvios dos números. É uma medida de variabilidade ou dispersão que visa a medir a concentração quadrática de um conjunto em torno da média aritmética. Logo, dividindo-se a variação total por n, tem-se a variância. Mas, segundo Student, para se obter uma variância não tendenciosa, usa-se como divisor (n –1) no lugar de n.

Notas• A média ou a mediana são ferramentas principais para representar o comportamento de uma amostra, mas é importante ter uma ferramenta quantitativa que diga como os dados se comportam em relação à média.

• As observações, pontuações ou respostas estão próximas da média, estão todas agrupadas perto dela, ou estão espalhadas, com valores que variam muito em relação à média.

Todas essas notas descrevem o grau de dispersão ou variância em uma distribuição.

4.1 - Dados Isolados

Média:

Estas expressões podem ser substituídas por,

Page 100: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 100

Nas fórmulas da variância, o numerador é chamado de variação total e o denominador é (n - 1), para todos os casos.

Exemplo 56Calcular a variância do conjunto 7, 10, 14 e 17.

Com as fórmulas (1) e (2) da variância:

A média do conjunto:

Os desvios em torno da média

d1 = 7 - 12 = -5 d2 = 10 - 12 = -2 d3 = 14 - 12 = 2 d4 = 17 - 12 = 5

A soma dos desvios com base na média é nula.

Somando os desvios, temos: (-5) + (-2) + (2) + (5) = 0

Elevar cada desvio ao quadrado, realizar o seu somatório, dividindo-o por (n – 1):

A variação total: Sxx = 58.

A variância:

Page 101: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 101

Com a fórmula (3) da variância:♦ Calcular o somatório de X2

Σx2 = 72 + 102 + 142 + 172 ⇒ Σ x2 = 49 + 100 + 196 + 289 = 634 e n = 4

♦ A média é = 12 e elevando-a ao quadrado 2 = 144

Com a fórmula (4) da variância:

4.2 - Dados Agrupados

Se os valores X1, X2,, X3 ... Xn ocorrerem com as freqüências f1, f2 , f3, .... fn vezes, respectivamente, então a variância será definida por:

Para a fórmula (1), é necessário o produto do quadrado de cada desvio pela respectiva freqüência simples.Para fórmula (2), considera-se a soma do produto de cada freqüência pelo quadrado de cada um dos valores de x, além da soma dos produtos de cada freqüência pelo respectivo valor de x.5 - Desvio PadrãoMede a variação ou dispersão das observações em torno da média aritmética.

Page 102: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 102

É a raiz quadrada positiva da variância.

5.1 - Cálculo pelo processo abreviadoConsiste na criação de uma origem arbitrária, que tem desvio nulo, se a 1.ª classe for de origem arbitrária. Logo os demais desvios se desenvolvem de unidade a unidade, classe a classe, de acordo com o crescimento da distribuição.Recomenda-se a escolha de uma classe intermediária, a origem arbitrária, pois, assim sendo, trabalha-se com valores relativamente pequenos. O desvio padrão calculado em função de uma origem arbitrária e desvios em unidades de classe torna os cálculos mais simples.

Os desvios unitários são definidos por (xi - x0)/h, onde xi representa o ponto médio de cada classe e xo representa o ponto médio da classe origem. Assim, os desvios definem uma seqüência, como, por exemplo, 0, 1, 2, 3, 4, 5, 6... ou -2, -1, 0, 1, 2, 3, 4...ou -3, -2, -1, 0, 1, 2, 3... Tudo dependerda classe que se escolheu. O desvio padrão é definido por:

(F1)

onde u representa cada um dos desvios, em unidades de classe.

Se d = Xi – A é o desvio de cada valor da variável x, em relação a uma constante arbitrária A, o desvio padrão é definido por:

(F2)

A fórmula abaixo representa, de uma maneira geral, (F1):

Page 103: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 103

(F3)

Exemplo 57Determinar desvio padrão do faturamento da empresa BBHHZ, no mês de agosto de 2007.

Tabela 24 - Faturamento da Empresa BBHHZ, Agosto/2007, Belo Horizonte, Milhões de Reais

Vendas fi ui fiui% ui2 fiui

2

40 | 50 2 0 0 0 050 | 60 5 1 5 1 560 | 70 8 2 16 4 3270 | 80 12 3 36 9 10880 | 90 18 4 72 16 288

90 | 100 13 5 65 25 325100 | 110 10 6 60 36 360110 | 120 8 8 56 49 392120 | 130 4 8 32 64 256

Total 80 342 1.766Fonte: Departamento de Vendas

Cálculo do desvio padrão:1 - Calcular os desvios em unidade de classe ui.2 - Calcular o produto de cada freqüência pelo respectivo desvio: fiu i.

3 - Elevar cada desvio em unidade de classe ao quadrado 2iì

4 - Multiplicar o resultado pela respectiva freqüência 2ii ìf .

5 - Aplicar a fórmula.

Page 104: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 104

A fórmula (3), tem-se:

No primeiro caso, usa-se (n-1) e no segundo n e não encontramos uma diferença significativa, porque a população é grande, então usar 79 ou 80 não faz diferença. N é grande quando n >30

5.2 - Propriedades do Desvio Padrão / Variância

Primeira PropriedadeO desvio padrão é maior do que o desvio médio. Nas distribuições normais, o desvio padrão é, aproximadamente, 25% superior ao desvio médio ou maior do que ele e o desvio médio é, aproximadamente 20% menor do que o desvio padrão. Para distribuições com fraca assimetria pode-se ter as mesmas afirmativas.Assim, em uma distribuição normal, se o desvio padrão for igual a 25, o desvio médio será, aproximadamente, igual a 80% de 25 = 20.

Segunda PropriedadeA variância de uma série de valores constantes é nula. Var(C) = 0.

Sendo a variância nula, o desvio padrão também será nulo, bem como todas as medidas de dispersão: amplitude total, desvio médio, desvio quartil e a amplitude quartílica.

Page 105: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 105

Exemplo 58Para calcular a variância do conjunto de valores 4, 4, 4, 4, 4, 4 e 4, sendo constante a série de valores, a variância, o desvio padrão, o desvio médio, o desvio quartil são nulos.

Terceira PropriedadeSomando-se ou subtraindo-se uma constante (C ≠ 0) a cada um dos valores de um conjunto, o desvio padrão e a variância não alteram o valor original. Var (X + C) = Var(X).

Exemplo 59Calcular a variância do conjunto de valores 1, 2, 3, 4 e 5. Calculam-se os desvios com base na média. A média do conjunto é 3 e os desvios calculados com base na média são (-2 ), ( -1 ), ( 0 ), ( 1 ) e ( 2 ). A soma dos desvios é nula. A variação total é calculada somando-se cada desvio ao quadrado.

Sxx = 4 + 1+ 0 +1+ 4 = 10. Então a variância será Var ( x ) = 10 / 4 = 2,5.

Somand-se uma constante C a cada um dos valores desse conjunto, a variância e o desvio padrão não têm alterado o seu valor, mas a média fica somada com essa constante C.

Exemplo 60Determinado grupo de pessoas, em 2001, apresentavam a média de idade de 22 anos com um desvio padrão de 2 anos. Em 2007, a média de idade do grupo foi de 22 + 6 = 28 anos e o desvio o mesmo, ou seja, igual a 2 anos. Há dez anos atrás, a média era de 12 anos, apresentando o mesmo desvio padrão, ou seja, 2 anos.

Quarta PropriedadeMultiplicando/dividindo-se cada um dos valores de um conjunto por uma constante (C ≠ 0), o desvio padrão fica multiplicado/dividido por essa constante e a variância fica multiplicada ou dividida pelo quadrado dessa constante: Var(CX) = C2 Var(X).

Exemplo 61Um conjunto de dados apresenta a média igual a 10 e o desvio padrão igual a 3. Calcular a média, o desvio padrão e a variância do conjunto, se cada elemento foi multiplicado por 3 (3x).A média do conjunto é igual a 3 x 10 = 30. O desvio padrão da variável

Page 106: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 106

aleatória 3x é igual a 3 x 3 = 9 A variância da variável aleatória 3x é igual a 32 x 32 = 81

Quinta PropriedadeA variância da soma ou diferença de variáveis independentes é igual à soma das respectivas variâncias: Var(X ± Y) = Var(X) + Var(Y).Observa-se que a variância de uma soma ou de uma diferença resulta sempre na soma das respectivas variâncias, se as variáveis forem independentes.

Exemplo 62No mês de junho, a filial n. º1 da empresa PPYY vendeu 800 lanches/dia com desvio padrão de 60 lanches/dia e a filial n. º2 vendeu 600 lanches/dia com desvio padrão de 50 lanches/dia. Calcular o faturamento médio diário bem como o desvio padrão dos lanches da empresa PPYY.

As vendas das filiais são independentes.• O faturamento médio diário será a soma das duas médias. A media da soma é a soma das médias. = 800 + 600 = 1.400 lanches/dia.• Var ( x + y) = Var(x) + Var(x) = (60)2 + (50)2 = 3.600 + 2.500 = 6.100.• O desvio padrão é a raiz quadrada da variância, logo:

Sexta PropriedadeDistribuição normal é aquela que é simétrica e continua, em torno da média.A distribuição normal apresenta seu gráfico em forma de um sino, com pontos de inflexão em e a área limitada pela curva e pelo eixo dos x é igual a 1. Portanto, se uma distribuição for normal ocorrerá:

• A área compreendida entre a média mais ou menos um desvio padrão envolve 68,26% das observações do fenômeno: Área = 68,27%.• A área compreendida entre a média mais ou menos dois desvios padrões envolve 95,45% dos casos: Área = 95,45%.• A área compreendida entre a média mais ou menos três desvios padrões envolve 99,72% dos casos: Área = 99,72%.

A curva a seguir é exemplo de uma curva normal:

Page 107: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 107

Gráfico 11 - Curva Normal

6 - Coeficiente de Variação (CV)Tem como finalidade comparar a dispersão entre dois conjuntos. A dispersão entres dois conjuntos é calculado pela razão existente entre o desvio padrão e a média O coeficiente de variação é definido por:

O desvio padrão mede a dispersão absoluta de um conjunto, em torno da média, enquanto o coeficiente da variação mede a dispersão relativa em torno da média.A importância do CV está no estudo comparativo entre dois ou mais conjuntos, ou amostras de populações diferentes. O conjunto que tem o menor CV é o conjunto mais homogêneo.

Exemplo 63A produção média diária de uma empresa é de 480 unidades de televisores com o desvio padrão de 30 unidades e a produção média diária de rádios é de 400 unidades com o desvio padrão de 40 unidades.Observa-se que a produção de televisores mostra menor dispersão absoluta que a produção de rádios, mas, para comparação eficiente, usa-se o coeficiente de variação.

Page 108: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deDispersãoPágina 108 A produção de rádio tem maior dispersão relativa que a de televisores.

A produção de televisores é mais homogêna, mais constante e mais confiável.

Page 109: Apostila Estatistica - Autor CEADUFOP

Capítulo 9

Medidas de Assimetria/Curtose

Page 110: Apostila Estatistica - Autor CEADUFOP
Page 111: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 111

As medidas de assimetria / curtose têm como finalidade avaliar a forma de uma curva que retrata um polígono de freqüências, resultante de um conjunto de observações, tendo-se como referencial a curva definida pela Curva Normal.

1 - Coeficiente de AssimetriaVisa a avaliar o grau de afastamento ou deformação ou enviesamento de curva de uma distribuição de freqüência, cujo objetivo é indicar a grandeza do afastamento, tendo-se como base a curva normal.

Karl Pearson define a assimetria por:

Usando-se o primeiro coeficiente de Pearson, as distribuições são classificadas em:

• Assimetria Negativa Forte: Ass ≤ -1;• Assimetria Negativa Fraca: –1 ≤ Ass < 0;• Distribuição Simétrica: Ass1 = 0;• Assimetria Positiva Fraca: 0 < Ass1 < 1;• Assimetria Positiva Forte: Ass1 ≥ 1.

É necessário, para aplicação dos coeficientes de assimetria de Pearson, com a maior aproximação possível: A curva de freqüências ser unimodal; A distribuição de freqüências ter fraca assimetria; O número de obsevações ser suficientemente grande; A escala que divide a distribuição se pequena.

2 - Distribuição SimétricaÉ aquela em que as freqüências das classes eqüidistantes, em torno da maior freqüência, são iguais.

Na distribuição simétrica a média, a mediana e a moda são iguais. Mas, se essas três medidas forem iguais, a distribuição não será, necessariamente, simétrica, isto é, a recíproca não é verdadeira.

Page 112: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 112

3 - Distribuição AssimétricaÉ aquela que apresenta valores diferentes para a média, a mediana e a moda.Conjunto assimétrico positivo é aquele que possui maior volume de informação na parte inicial, porque, na curva, a maior altura indica, no eixo dos x, a posição da moda, através de um segmento perpendicular ao eixo dos x, e a maior cauda indica o sentido positivo.A relação é > md > mo ou mo < md < . A moda é a menor dessas três medidas, o que indica assimetria positiva. A maior cauda de um um polígono de freqüência indica o sentido positivo da distribuição e sempre se tem nela a mediana e a média.A mediana de uma amostra é uma medida de tendência central que divide os dados em partes iguais, metade abaixo da medida e a outra metade acima. Se o conjunto de dados é constituído por um valor par a mediada é o valor médio desses dados; se houver valor ímpar de dados, a mediana é o valor central.A moda da amostra é o valor da observação que ocorre com maior freqüência.

4 - Assimetria PositivaÉ aquela em que a média e a mediana são maiores que a moda. A maior cauda indica o sentido da assimetria.Por exemplo: Na Prefeitura de determinada cidade, a maior parte dos funcionários tem salários baixos, isto é, há uma forte concentração do números de funcionários com os menores salários. Nesse caso, a maior altura do polígono ou histograma está na parte inicial. Esse ponto é a moda, no caso o valor de maior freqüência.Empiricamente, a mediana se coloca a um terço de distância da média e da moda. Observando-se o gráfico a seguir, que representa um polígono de freqüências, a maior cauda indica o sentido negativo da distribuição.

Page 113: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 113

Gráfico 12 - Assimetria Positiva

Observando o gráfico, pode-se dizer:

1. Há mais funcionários com salários acima do salário mediano do que abaixo do modal.2. Há mais funcionários com salários acima do salário mediano do que acima do médio.3. Há mais funcionários com salários abaixo do salário médio do que abaixo do mediano.4. Dentre as três medidas, a moda é a menor.

5 - Assimetria NegativaÉ definida pela relação é < md < mo ou mo > md > .

Conjunto simétrico negativo é aquele que possui maior volume informações na parte final. Verifica-se, no polígono de freqüência, que a maior cauda indica o sentido negativo da distribuição. Nela estão a mediana e a média. A mediana fica entre a média e a moda. Essa relação tem a moda como a maior das medidas.

Page 114: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 114

Gráfico 13 - Assimetria Negativa

Sendo negativa a assimetria, a moda é a maior das medidas.

6 - Medidas de CurtoseTêm como finalidade medir o grau de achatamento da curva que retrata um polígono de freqüência resultante de um conjunto de observações, tendo como referencial a curva definida pela curva normal.

6.1 - Classificação da CurvaQuanto ao grau do achatamento ou afilamento da curva, tendo-se como referência a curva normal ou padrão, pode-se classificá-la em três modalidades:• Curva Leptocúrtica: Possui maior grau de afilamento, é mais fechada e mais aguda que a normal. Os dados estão mais concentrados em torno da moda, o que faz a curva ficar muito afilada.• Curva Mesocúrtica: Possui grau médio de achatamento e está entre a leptocúrtica e a platicúrtica. A curva normal é a uma curva mesocúrtica. Os dados estão razoavelmente concentrados em torno da moda, o que fornece uma curva menos afilada.• Curva Platicúrtica: É mais achatada que a normal. A concentração em torno da moda é fraca.

6.2 - Visão ConceitualPara medir o grau percentílico de curtose, utiliza-se a seguinte fómula:

Page 115: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 115

6.3 - Classificação da Curtose pelo Grau Percentílico

A curtose classifica-se em:• Se K < 0,263, a curva relativa à distribuição de freqüência é leptocúrtica.• Se K = 0,263, a curva relativa à distribuição de freqüência é mesocúrtica.• Se K > 0,263, a curva relativa à distribuição de freqüência é platicúrtica.

Segundo essas especificações, uma curva normal apresenta um coeficiente de curtose igual a 0,263, uma vez que esse valor define a curva mesocúrtica.À medida que esse valor vai aumentando, tem-se uma curva mais achatada, isto é, uma curva platicúrtica. Quando o valor do coeficiente de curtose fica aquém de 0,263, tem-se uma curva mais aguda que a normal, a curva leptocúrtica. Pode-se também definir a curtose por momentos. Segundo Pearson, a curtose é definida por:

m4 representa o quarto momento centrado na média e o S4 representa o desvio padrão elevado à quarta potência.

Para esses casos a classificação da curtose é:

• Se A4 < 3, a curva relativa à distribuição de freqüência é platicúrtica.• Se A4 = 3, a curva relativa à distribuição de freqüência é mesocúrtica.• Se A4 > 3, a curva relativa à distribuição de freqüência é leptocúrtica.

Segundo essas especificações, a curva normal apresenta coeficiente de curtose igual a 3, uma vez que esse valor define a curva mesocúrtica. À medida que esse valor for aumentando, tem-se uma curva mais afilada, mais condensada, mais homogênea, isto é, uma curva leptocúrtica. À medida que o valor do coeficiente de curtose vai ficando aquém de 3, tem-se uma curva mais achatada que a normal, uma curva platicúrtica.

A curtose pode ser também classificada curtose nula (quando a curva for mesocúrtica), curtose positiva (quando a curva for leptocúrtica) e curtose negativa (quando a curva for platicúrtica).

Page 116: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Medidas deAssimetria/Curtose

Página 116

Afirmar que uma curva tem curtose positiva permite concluir que ela é uma curva leptocúrtica, tendo coeficiente percentílico de curtose menor do que 0,263 e coeficiente de momento maior do que 3.

Afirmar que uma curva tem curtose nula permite concluir que ela é uma curva mesocúrtica, tendo coeficiente percentílico de curtose igual a 0,263 e coeficiente de momento igual a 3.

Afirmar que uma curva tem curtose negativa, permite concluir que ela é uma curva platicúrtica, tendo coeficiente percentílico de curtose maior do que 0,263 e coeficiente de momento menor do que 3.

Page 117: Apostila Estatistica - Autor CEADUFOP

Capítulo 10

Regressão x Correlação

Page 118: Apostila Estatistica - Autor CEADUFOP
Page 119: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 119

1 - IntroduçãoEntre as formas utilizadas para prever, estimar valores de uma população e identificar o grau de relacionamento entre duas ou mais variáveis estão a regressão e a correlação. A correlação refere-se à medida do grau ou da força de uma relação entre duas variáveis. A regressão refere-se à criação de um modelo matemático ou equação usada para prever o comportamento de uma variável em função do comportamento de outra variável.

Exemplo 64Observa-se que, à medida que o volume de vendas dos restaurantes aumenta, especialmente dos restaurantes mais caros, o número de empregos sobe. É possível criar um modelo para descrever essa relação. Existe uma relação positiva entre o crescimento do número de empregos e o crescimento do volume de vendas.

Exemplo 65Considerando o número de vacinas para gripe aplicadas em pessoas idosas, no inverno, e o número relatado de casos de gripe, existe uma relação inversa entre o número de vacinas e o número de casos de gripe.

2 - Aplicações A regressão/correlação pode ser utilizada para:• Sumarizar, descrever ou apresentar um conjunto de dados com um modelo matemático.• Prever valores da variável de interesse.• Controlar a variável de interesse em faixas pré-fixadas de valores.• Estimar os parâmetros desconhecidos de uma população por modelos, equações ou fórmulas que representam o relacionamento entre as variáveis.• Verificar a força ou grau de intimidade/relacionamento entre as variáveis em estudo.

A análise de regressão é uma técnica estatística utilizada para investigar e equacionar o relacionamento existente entre as diversas variáveis de um fenômeno. Ela define um modelo matemático que tenha a capacidade de representar o relacionamento existente entre as variáveis de um fenômeno. A análise de regressão é fundamentada por estudo de dados amostrais e identifica um modelo matemático e um número que definem a equação e o grau de relacionamento entre as variáveis.

O modelo matemático e o grau de relacionamento entre as variáveis

Page 120: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 120

estabelecem a forma e a precisão dos dados amostrais para se verificar como duas ou mais variáveis se relacionam entre si, numa pequena população.

A regressão está ligada a um modelo matemático que pode ser linear, exponencial, logarítmico, etc. A qualidade desse modelo é definida pela correlação. Se a qualidade desse ajustamento não for boa para determinado modelo, implica a escolha de um outro modelo matemático, que melhor se ajuste aos dados.

Quando se traçam os modelos matemáticos em um gráfico de linha, para representar a tendência do fenômeno, o modelo que melhor se ajustar aos dados tem a propriedade de apresentar o melhor grau de correlação, relacionamento ou intimidade entre as variáveis.

3 - Regressão Linear SimplesSeja um conjunto de dados amostrais emparelhados. A função definida pela equação = βo + β1 x expressa o relacionamento linear entre duas variáveis. O parâmetro βo é o intercepto de y, isto é, o ponto onde a reta corta o eixo dos y. O parâmetro β1 é a inclinação da reta ou o coeficiente angular ou o coeficiente de regressão ou variação marginal. Além disso, é preciso considerar o seguinte:

βo: Coeficiente linear. É o ponto onde a reta intercepta o eixo das ordenadas, onde intercepta o eixo de y.β1: Coeficiente angular. É o coeficiente de regressão, inclinação da reta. Variação marginal: a variação de uma variável quando a outra sofre variação de uma unidade.

Geralmente a reta estimada não passa por todos os pontos, portanto a equação apresentada deve ser modificada, considerando-se a existência de erros entre o valor observado e o valor estimado ou projetado pela equação.

O erro é representado pelo ponto que não pertencem à reta, haverá erros, logo o novo modelo será definido pela nova equação:

Page 121: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 121

O erro ε (épson) é definido pela diferença entre o valor observado e o estimado, levando-se em consideração a falha do modelo ao se ajustar aos dados. O modelo de regressão linear simples é representado pela equação (1). Os parâmetros βo e β1 da equação 1 são valores desconhecidos da população e deverão ser estimados pela análise de dados amostrais. A variável x, em geral, é denominada variável independente, explicativa, regressora ou preditora; a variável y é denominada variável dependente ou variável resposta. No estudo da regressão, a variável resposta é uma variável aleatória e a variável regressora não necessariamente. O fundamento básico é que ambas sejam aleatórias.

3.1 - Método dos Mínimos QuadradosÉ utilizado para ajustar uma linha reta/curva a um conjunto de pontos. A reta obtida ou ajustada tem duas características importantes:

- A soma dos desvios verticais dos pontos em relação à reta é zero:Σ (yi - ) = 0.

-A soma dos quadrados desses desvios é mínima e é calculada pela fómula:

Σ ( yi - ) 2

A reta de regressão calculada, partindo-se de dados amostrais, pode ser vista como uma estimativa do fenômeno ainda desconhecido que existe entre as duas variáveis na população. Assim, os coeficientes de regressão

e servem como estimativas pontuais dos respectivos parâmetros populacionais e a equação da amostra y = + x é uma estimativa da população definida pela equação: y = βo + β1 x + ε, onde ε representa a dispersão na população.

A dispersão na população significa que, para qualquer valor de x, há muitos valores possíveis de y, ou seja, a análise de regressão supõe que, para cada valor possível de x, há uma distribuição de valores de y que segue a lei normal.

Na regressão linear simples, os parâmetros populacionais βo e β1 são desconhecidos e, para estimá-los, usam-se os dados amostrais.

Page 122: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 122

3.2 - Equacionamento de um Fenômeno Sejam as variáveis aleatórias x e y de um fenômeno. O equacionamento do fenômeno, pelo método dos mínimos quadrados, envolvendo n pares (xi, yi) dessas variáveis, leva a um sistema de duas equações, em função dos parâmetros e que são os estimadores dos respectivos valores populacionais. Os valores de e , para a reta y = βo + β1 x, que minimizam a soma dos quadrados dos desvios, são as soluções das chamadas equações normais da reta de regressão. O sistema é definido por:Σ y = n + Σ xΣ xy = Σ x + Σ x2

Tem-se e que são os valores estimados dos parâmetros populacionais βo e β1.

Exemplo 66Foram selecionadas aleatoriamente, de determinado setor produtivo, quatro fábricas que apresentaram, em janeiro de 2.007, gastos com matéria-prima (x) da ordem de 1, 2, 3 e 4 milhões de reais, quando alcançaram um faturamento (y) da ordem de 7, 11, 15 e 19 milhões de reais, respectivamente.Para construir um modelo de regressão linear simples, para visualizar a tendência dos gastos e do faturamento dessas fabricas, monta-se uma tabela para identificar os valores do sistema

Σ y = n + Σ xΣ xy = Σ x + Σ x 2

Consideram-se os valores de Σ y, Σ x, Σ x y, Σ x2 e n (tamanho da amostra) que estão calculados na tabela a seguir. Resolvendo o sistema, temos os valores de e que são os estimadores dos respectivos parâmetros populacionais.

Tabela 25 - Gastos e Faturamento de Quatro Fabricas em Janeiro de 2007

x Y x y x2

1 7 7 12 11 22 43 15 45 94 19 72 16

Σ x = 10x = 10 Σ y = ��y = 52 Σ xy = 1�0xy = 150 Σ xx2 = 30Fonte: Setor de PlanejamentoA tabela fornece os seguintes valores:

Page 123: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 123

Σy = �� Σx = 10 Σxy = 1�0 Σx2 = 30 n = 4

Tem-se o sistema:

52 = 4 + 10 → 1.o equação

150 = 10 + 30 → 2.o equação

Pode-se eliminar a variável , multiplicando a 1.ª equação por (-10 / 4) =

- 2,5 . Ou, para eliminar , multiplicar a 1.ª equação por (-30 / 10) = -3.

Multiplica-se a 1.ª equação por (-10 / 4), elimina-se a variável e soma-se

o resultado à 2.ª equação.

52 = 4 + 10 → 1.ª equação x ( - 2,5 )

150 = 10 + 30 → 2.ª equação

Multiplica-se a 1.ª equação por - 2,5:

-2,5 x 52 = -2,5 x 4 - 2,5 x 10 ⇒ -130 = -10 - 25

Somando-se esta equação com a 2.ª, 150 = 10 + 30 , tem-se:

-130 = -10 - 25 → 1.ª equação multiplicada por -2,5

150 = 10 + 30 → 2.ª equação____________________ 20 = 0 + 5 → Equação resultante do sistema que nos dará o valor de

Observa-se que a equação se reduziu a: 20 = 5 ⇒ = 20 / 5 = 4.

Substituindo este valor em uma das equações, tem-se o valor de , então:

52 = 4 + 10 x 4 ⇒ 52 - 40 = 4 ⇒ 4 = 12 ⇒ = 3.

Page 124: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 124

O modelo de regressão linear simples é: = 3 + 4x

Com o modelo construído, podem-se fazer projeções como: se uma fabrica apresentar um gasto com matéria-prima de 5 milhões de reais, qual será a tendência de suas vendas?

Se x = 5 ⇒ = 3 + 4x ⇒ = 3 + 4 . 5 = 23 milhões de reais

Se uma fabrica pretender faturamento de 30 milhões de reais, qual será a tendência de seus gastos?

Se y = 30 ⇒ 30 = 3 + 4 ⇒ 30 – 3 = 4 ⇒ = 27/4 = 6,75 milhões de reais

4 - Variação TotalÉ o somatório dos quadrados dos desvios, calculados em torno da média de uma variável. É representada por VT ou SQT ou Sxx e Syy.A VT é o numerador da fórmula do desvio padrão ou da variância da respectiva variável. A variação total da variável x pode ser definida por:Sxx = Σ ( xi - )2 → F1Sxx = Σ xi

2 - n ( )2 → F2Sxx = Σ xi

2 - (Σ xi)2 / n → F3

A variação total, dividida por (n – 1), dá a variância.

Exemplo 67Calcular a variação total dos gastos com matéria-prima, para os dados do exemplo 66. 1) Calcular a variação total, usando-se a fórmula dos desvios: F1Calcula-se a média da variável, dos desvios, dos quadrados dos desvios e da soma. Pelo conceito, a variação total da variável x é a soma dos quadrados dos desvios em torno da média da variável x. 2) Calcular o gasto médio com matéria-prima: = ( Σ xi ) / n = 10 / 4 = 2,5

3) Calcular os desvios em torno do gasto médio com matéria-prima, isto é, ( xi - ):

(1 - 2,5 = -1,5), (2 - 2,5 = - 0,5), ( 3 - 2,5 = 0,5) e (4 - 2,5 = 1,5)

c) Variação total - Calcular o valor de cada desvio - a sua soma é denominada

Page 125: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 125

de variação totalSxx = (-1,5)2 + (0,5)2 + (1,5)2 + (0,5)2 = 5

Nota - 5 é igual ao do coeficiente do na equação definido no sistema.

2) Cálculo da variação total, usando a terceira fórmula: F3

Sxx = Σ xi2 - ( Σ xi )

2 / n = 30 - (10)2/ 4 = 30 - 25 = 5

3) Cálculo da variação total, usando a terceira fórmula: F2

Sxx = Σ xi2 - n ( )2 = 30 – 4 x ( 2,5 )2 = 5

Exemplo 68Calcular a variância total dos gastos com matéria-prima, para os dados do exemplo 66. A variância é a média aritmética dos quadrados dos desvios. Pode-se concluir que a variância é igual à variação total dividida por (n – 1).

Trabalhando com pequenas amostras usamos (n-1) no lugar de n.

Seja a fórmula da variância:

S2 = Σ ( xi - )2 / n -1 → F1

S2 = Σ xi2 - n ( )2 / n -1 → F2

S2 = Σ xi2 - [( Σ xi )

2 / n] / n -1 → F3

Usaremos a fórmula dos desvios: F1

Necessitamos da média da variável, dos seus desvios, dos quadrados destes desvios e de sua soma.a) Calculo do gasto médio com matéria prima de uma fabrica, = ( Σ xi ) / n = 10 / 4 = 2,5

b) Cálculo dos desvios em torno do gasto médio, isto é, ( xi - ) :(1 - 2,5 = -1,5), (2 - 2,5 = - 0,5), ( 3 - 2,5 = 0,5) e (4 - 2,5 = 1,5)

c) Elevando cada desvio ao quadrado, a sua soma é denominada de variação total.

Page 126: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 126

Sxx = (-1,5)2 + (0,5)2 + (1,5)2 + (0,5)2 = 5d) Dividindo a variação total por n -1:

A variância dos gastos será: S2 = Sxx / n - 1 = 5 / 3 = 1,67

Exemplo 69Calcular o desvio padrão dos gastos com matéria-prima, para os dados do exemplo 66.

O desvio padrão é a raiz quadrada positiva da variância:

Exemplo 70Calcular a variação total das vendas, para os dados do exemplo 66.Através da fórmula dos desvios: F1.Para o uso desta fórmula, necessita-se da média da variável, dos desvios, dos quadrados desses desvios e da soma.

A variação total das vendas (variável y) é a soma dos quadrados dos desvios em torno da média desta variável.

a) Cálculo do faturamento médio de uma fabrica: = ( Σ yi )/n = 52 / 4 = 13

b) Cálculo dos desvios em torno do faturamento médio de uma fábrica:

(7 - 13 = 6), (11 - 13 = 2), (15 - 13 = 2) e ( 19 - 13 = 6 )c) Cálculo da variação total

Syy = (6)2 + (2)2 + (2)2 + (6)2 = 36 + 4 + 4 + 36 = 80

Exemplo 71Calcular a variância total das vendas, para os dados do exemplo 66.

A variância é a média aritmética dos quadrados dos desvios e a variância é igual à variação total dividida por (n – 1). Pela fórmula da variância da variável y:

Page 127: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 127

S2 = Σ (yi - )2 / n -1 → F1

S2 = Σ yi2 - n ( )2 / n -1 → F2

S2 = Σ yi2 - [( Σ yi )

2 / n] / n -1 → F3

Usa-se a fórmula dos desvios: F1.

Necessita-se da média da variável, dos desvios, dos quadrados desses desvios e da soma.

a) Cálculo do faturamento médio de uma fabrica = ( Σ yi ) / n = 52 / 4 = 13

b) Cálculo dos desvios em torno do faturamento médio de uma filial:

(7 - 13 = 6), (11 - 13 = 2), (15 - 13 = 2) e (19 - 13 = 6)

c) Variação total :

Syy = (6)2 + (2)2 + (2)2 + (6)2 = 36 + 4 + 4 + 36 = 80

d) Variância:

A variância é definida por S2 = Syy / n - 1 = 80 / 3 = 26,67

Exemplo 72Calcular o desvio padrão das vendas destas fábricas para os dados do exemplo 66.O desvio padrão é a raiz quadrada positiva da variância:

S = 26 67, = 5,16

Exemplo 73Calcular a equação de regressão linear, por [fórmulas pré-definidas conforme o exemplo 66.

Estimativa do coeficiente angular:

Page 128: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 128

Estimativa do coeficiente linear: = - β1 ⇒ = 13 - 4 x 2,5 = 3

A equação é: = 3 + 4x

Pode-se usar uma fórmula mais simples:

Estimativa do coeficiente angular:

5 - Notas sobre a Regressão Linear Simples

Os dados para a análise de regressão provêm de observações de variáveis emparelhadas (pares ordenados). CONFERIR Um problema de duas variáveis, cada observação apresenta dois valores, um para cada variável.

A regressão linear simples estabelece uma equação matemática linear para descrever o relacionamento entre duas variáveis.

Na regressão, os valores da variável y são preditos, estimados ou ajustados, com base em valores dados ou conhecidos da variável x. A variável y é chamada variável dependente. A variável x, é chamada independente.

Partindo-se dos dados amostrais, cada valor de xi da variável explicativa corresponde a um valor teórico yi da variável resposta, que se diferencia do valor observado pelo erro ei = yi - .

Condições teóricas requeridas pelo modelo de regressão linear:

- A variável x é uma variável determinada e a variável y é aleatória.

Page 129: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 129

- Para cada valor xi de x, os valores de y correspondentes têm distribuição normal com média = E (y) no ponto xi e variância σ2.

- As variáveis yi para cada valor xi de x são independentes.

- As médias da variável y e da variável x estão situadas sobre a reta de regressão.

5.1 - Variação Residual

Dado um par de dados amostrais (x, y), um resíduo é a diferença (y – ) entre um valor amostral observado y e o valor previsto com base na equação de regressão.

Observe que os resíduos (ε) representam aquilo que o modelo de regressão não foi capaz de explicar. Elevando esses resíduos ao quadrado, o seu somatório define a Variação Residual ou a Soma Residual dos Quadrados.

VR = SQR = Σ (y i - )

Do conceito da variação residual surgem os conceitos da variância residual e do erro padrão da estimativa. Dividindo-se a variação residual por (n –1), teremos a variância e a raiz quadrada positiva desta variância define o erro padrão da estimativa.

Variância residual:

Erro padrão da estimativa;

A variação residual (VR) é a soma dos quadrados dos desvios residuais. A variação residual varia com a reta escolhida, isto é, depende dos estimadores de βo e β1. Quanto menor o valor de Variação Residual, melhor será o ajuste dos dados à equação de regressão. Um bom ajuste será aquele em que Variação Residual for o menor valor possível.

O princípio básico do método dos mínimos quadrados é tomar como estimativa dos parâmetros populacionais βo e β1 valores que minimizam a

Page 130: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 130

soma dos quadrados dos desvios residuais.

5.2 - Fundamentos do Erro Residual

No estudo da equação de regressão linear simples = βo + β1 x, + ε, o erro (ε) é uma variável aleatória sobre a qual se fazem estas as suposições:

- Os erros têm média zero e a mesma variância.

- Os erros são variáveis independentes. Os erros não são correlacionados, isto é, o valor de um erro não depende de qualquer outro erro.

- A variável explicativa x não é uma variável aleatória.

- Os erros têm distribuição normal.

- A variável resposta y, sendo em função de ε, é uma variável aleatória, isto é, para cada valor de x existe uma distribuição de valores de y.

- Todas as distribuições têm a mesma variância e suas médias estão sobre a reta de regressão = βo + β1 x, ainda desconhecida.

As distribuições que têm a mesma variância são denominadas de distribuições homoscedásticas: as que têm variâncias diferentes são denominadas de heteroscedásticas.

5.3 - Variação ExplicadaO erro explicado é o que o modelo de regressão tem condições de explicar. Tais erros são definidos pela diferença existente entre os valores esperados e o médio. Se elevados ao quadrado, o seu somatório é denominado de variação explicada ou soma explicada dos quadrados ou variação explicada pela regressão: VE = Σ ( - )2

A variação explicada é definida pelo produto do quadrado do coeficiente angular pela variação total da variável x: VE = ( )2 SxxA variação total é a soma das variações explicada e residual, portanto:

VT = VE + VR

Exemplo 74Calcular a variação explicada das vendas das diversas fabricas, para os

Page 131: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 131

dados do exemplo 66.A variação total de x, foi calculada sendo Sxx = 5, bem como o coeficiente angular 1 = 4, então a variação explicada é :

VE = ( )2 Sxx =(4)2 x 5 = 16 x 5 = 80

O quadrado médio da regressão (QMReg), ou seja, a variância da regressão (Sr

2), é definida por Student com um grau de liberdade. A variância explicada é igual à variação explicada:

Variância explicada = [( )2 Sxx] / 1 = (80 / 1 ) = 80 = VE.

Exemplo 75Calcular a variação residual das vendas, para os dados do exemplo 66.A variação total é a soma das variações explicada e não explicada:VT = Syy = VE + VR.A variação total e explicada é igual a 80, logo a variação residual ou não explicada é nula. Então, todas as variações das vendas são plenamente explicadas pelas variações dos gastos.Neste caso não há erros, porque todos os pontos pertencem à reta. Há relação perfeita entre as variáveis x e y.

Exemplo 76A variável X assume os valores: X = { 1, 2, 3, 4 } e a variável Y assume os valores: Y = { 7, 11, 15, 19 }A variável X cresce de unidade a unidade enquanto a variável Y cresce de quatro em quatro unidades. Então para cada unidade da variável X a variável Y cresce quatro unidades.

O coeficiente angular é uma constante a ser somada à variável Y em função do crescimento de uma unidade de X. Logo o coeficiente angular é igual a 4. A variável Y é igual a 4 vezes a variável X mais uma constante que será o valor do coeficiente linear. Neste caso:

7 = 4 x 1 + a ⇒ a = 311 = 4 x 2 + a ⇒ a = 3

15 = 4 x 2 + a ⇒ a = 3

À medida que o valor da variável x aumenta uma unidade, o valor esperado da variável y aumenta o valor de .

Page 132: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 132

No modelo acima, à medida que o valor de x aumentar uma unidade o valor de y aumenta 4 unidades e o modelo é 3 + 4x.Pode-se concluir que o conjunto X multiplicado por 4 e somado de três unidades é igual ao conjunto Y. Então se podem tirar algumas conclusões;- A média do conjunto Y é igual a quatro vezes a média de X mais três unidades.- O desvio padrão da variável Y é igual a quatro vezes o desvio padrão de X.Multiplicando-se cada elemento de um conjunto por uma constante, a média e o desvio padrão ficarão multiplicados pela respectiva constante. Mas somando-se uma constante a cada elemento de um conjunto, soma se também a média a essa constante, sendo que o desvio padrão não altera o seu valor.

A relação entre as variáveis x e y da equação = 3 + 4x é perfeita porque todos os pontos pertencem à reta.

5.4 - Propriedades do Coeficiente Angular

Seja um coeficiente angular igual a β1 definido pelas variáveis x e y. Multiplicando-se cada um dos valores da variável x por uma constante c1 e multiplicando-se cada um dos valores da variável y por uma constante c2, o coeficiente angular das variáveis c1 x e c2 y será igual a: c2 β1 / c1.

Seja um coeficiente angular igual a β1 definido pelas variáveis x e y. Somando-se a cada valor da variável x uma constante c1 e a cada valor da variável y uma constante c2, o coeficiente angular das variáveis (c1 + x) e (c2 + y) será igual β1, isto é, não se altera.

5.5 - Propriedades do Coeficiente LinearSeja um coeficiente linear igual a β0 definido pelas variáveis x e y. Multiplicando-se cada um dos valores da variável x por uma constante c1 e multiplicando-se cada um dos valores da variável y por uma constante c2, o coeficiente linear das variáveis c1 x e c2 y será igual a c2 β0.

Seja um coeficiente linear igual a β0 definido pelas variáveis x e y. Somando-se a cada valor da variável x uma constante c1 e a cada valor da variável y uma constante c2, o coeficiente linear das variáveis

Page 133: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 133

(c1 + x) e (c2 + y) será igual a β0 + c2 - c1 β1 .

6 - Diagrama de DispersãoÉ um gráfico de linha em que se registram, no eixo das abscissas, os valores da variável x e, no eixo das ordenadas, os valores da variável y. É um gráfico no qual cada par de observações das variáveis independente e dependente é registrado como um ponto no plano xy. Após o lançamento desses pontos no plano, traça-se por ele a reta projetada para uma visão do ajuste do modelo aos dados amostrais.

O objetivo básico é visualizar a existência ou não de uma relação linear aproximada entre as variáveis de um fenômeno em estudo. Um exemplo do diagrama de dispersão é apresentado a seguir.

Gráfico 14 - Gráfico de Dispersão

Sejam as variáveis vendas e gastos com propaganda. É de se esperar excelente grau de relacionamento entre as duas variáveis. A correlação é significante, porque existe causa e efeito, como pôde ser observado na figura.

6.1 - Correlação Linear SimplesDeterminar o grau de associação/relacionamento encontrado na análise de regressão é a finalidade da análise de correlação.

A análise de correlação de duas variáveis é representada por um número que resume o grau de intimidade entre duas variáveis e a

Page 134: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 134

análise de regressão tem como resultado uma equação matemática que descreve o relacionamento entre as variáveis.

A dispersão na população significa que, para qualquer valor de x, haverá muitos valores possíveis de y e quanto maior for a dispersão pior será o grau de relacionamento entre as variáveis.A correlação é um número real que mede o grau de intensidade, intimidade entre duas variáveis, sendo definida no intervalo de [-1, 1]. Se uma correlação linear simples apresenta um valor igual a -1 ou +1, definimos que ela é perfeita, ou seja, não houve erros. Logo todos os pontos pertencem à reta.

Se as variáveis crescerem no mesmo sentido, a correlação será positiva. Se as variáveis crescerem em sentido opostos, a correlação será negativa.

6.2 - Visual Gráfico da Correlação

A correlação é um número real que varia de [-1, 1]. Quanto mais próximo ao valor 1 ou -1, ou seja, quanto mais o valor tende aos extremos deste intervalo, a relação entre as variáveis atinge perfeição. Quando tal valor atinge a sua parte intermediária (tende a zero), dizemos que a correlação é nula.

A visão das diversas representações da correlação é apresentadas nos gráficos a seguir.

Page 135: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 135

Figura 1 - Gráficos de Correlação

6.3 - Observações sobre os gráficos da correlação

No gráfico a, a correlação é positiva (0 < r < 1) → valores crescentes de x estão associados a valores crescentes de y.

No gráfico b, a correlação é negativa (-1< r < 0) → valores crescentes de x estão associados a valores decrescentes de y.

Page 136: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 136

No gráfico c, a correlação é linear.

No gráfico d, a correlação é nula → as variáveis x e y são independentes. Neste caso, os valores da variável x estão associados a valores ora crescentes, ora decrescentes de y. Não existe relação de causa e efeito entre as variáveis.

No gráfico e, a correlação é perfeita positiva (r = +1), → as variáveis x e y são dependentes. Estas variáveis apresentam uma relação perfeita positiva ou direta, isto é, as variáveis crescem no mesmo sentido.

No gráfico f, a correlação é perfeita negativa (r = -1), → as variáveis x e y são consideradas dependentes. Estas variáveis apresentam uma relação perfeita negativa ou inversa. As variáveis crescem em sentidos opostos.

Observa-se que nos gráficos h e i que todos os pontos estão em uma reta. A correlação resultante não está definida, pois apresenta numerador e denominador nulos.

No gráfico h o desvio padrão de x é nulo e no i o desvio padrão de y é nulo, logo r = 0 em ambos os casos.

Para uma perfeita correlação ou uma correlação perfeita a correlação será +1 ou -1. Para esta situação todos os valores das variáveis definem pontos que satisfazem exatamente uma equação. Diz-se que elas estão perfeitamente correlacionadas ou que há uma correlação perfeita entre elas.

7 - Conceituar Correlação

7.1 - Primeiro Conceito da Correlação

Vamos definir a correlação, simbolizada por r como a raiz quadrada da razão existente entre a variação explicada (VE) e a variação total (VT), sendo representada por:

Page 137: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 137

Vamos definir a variação explicada em função das variações total e residual, logo:

VT = VE + VR ⇒ VE = VT - VR ou VR = VT - VE

A variação total pode ser calculada:

Syy = ∑ ( y - )2 Syy = ∑y2 - ( ∑ y )2 / n Syy = ∑y2 - n ( )2

A variação explicada pode ser calculada:

VE = ∑2 VE = ( )2 Sxx VE = Sxy

Pode-se calcular a variação não-explicada: VR = (1 - r2) Syy. Para quando desejarmos a variação residual de y

VR = (1 - r2) Sxx. Para quando desejarmos a variação residual de x

7.2 - Segundo Conceito da Correlação A correlação entre x e y é igual ao produto do coeficiente angular pela razão entre os desvios padrão de x e y.

Sendo assim definida por: r = β1 S / S.

7.3 - Propriedades da Correlação

- Um coeficiente de correlação significante não indica, necessariamente, uma ação de causa e efeito;

- A correlação existente entre duas variáveis é um número real pertencente ao intervalo [-1,1 ];- Se a correlação entre duas variáveis x e y for menor do que zero (negativo), então as variáveis x e y movem-se em direção oposta;

Page 138: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 138

- Se a correlação entre duas variáveis x e y for maior do que zero (positivo), então as variáveis x e y variam na mesma direção;

- Se a correlação entre duas variáveis x e y for igual a -1: (r = -1), então temos uma correlação negativa perfeita, isto é, todas as observações da amostra caem sobre uma linha reta de inclinação negativa ou coeficiente angular negativo;

- Se a correlação entre duas variáveis x e y for igual a 1: (r = +1), então a situação refere-se a uma correlação positiva perfeita, isto é, todas as observações da amostra estão sobre uma linha reta de inclinação positiva;

- Quanto mais próximo a correlação estiver dos extremos do seu intervalo, maior é o grau da relação linear entre as variáveis;

- Quando o coeficiente de correlação linear entre duas variáveis x e y for igual a zero, tais valores tendem a variar sem relação uns com os outros;

- Se as variáveis aleatórias x e y forem independentes, o coeficiente de correlação entre elas será nulo. A recíproca, em geral, não é verdadeira.- Coeficiente de correlação é um número adimensional, isto é, independe das unidades de medida das variáveis x e y.

- Somando-se ou subtraindo-se uma constante c1 a cada valor da variável X e uma constante c2 a cada valor da variável Y, o coeficiente de correlação não se altera.

- Multiplicando-se ou dividindo-se cada um dos valores da variável X por uma constante c1 e cada um dos valores da variável Y por uma constante c2, o valor absoluto do coeficiente de correlação linear não se altera, mas o seu sinal será o resultado do produto dos sinais destas constantes.

- Se a correlação linear simples for perfeita o desvio padrão da variável dependente é igual ao produto do coeficiente angular pelo desvio padrão da variável independente.

Page 139: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Regressão x CorrelaçãoPágina 139

7.4 - Determinação LinearO coeficiente de determinação indica quantos por cento a variação explicada pela regressão representa da variação total.

A determinação mede a qualidade do ajustamento de duas ou mais variáveis aleatórias. A determinação é razão entre a variação explicada e a total.

Quanto maior for a variação explicada maiores serão a determinação e a correlação. Simbolicamente representamos por:

O coeficiente de determinação é o percentual de flutuação da variável dependente plenamente justificado pelas variações da variável independente.

- Se o coeficiente de determinação for igual a 1: (se R2 = 1) → todos os pontos observados se situam sobre a reta de regressão. O ajuste é perfeito. As variações de y são 100% explicadas pelas variações de x através da função especificada, não havendo desvios em torno da função estimada.

- Se o coeficiente de determinação for igual a zero: (se R2 = 0) → as variações de y são exclusivamente aleatórias, e a introdução da variável x no modelo não definirá nenhuma informação sobre as variações de y.

- O valor da determinação R2 pode variar de 0 a 1. Quando a variação não explicada ou residual for um grande percentual da variação total (isto é, a variação explicada é uma percentagem pequena), R2 será pequeno.

- Quando a dispersão em torno da reta de regressão for pequena em relação à variação dos valores de y em torno de sua média, então a variação explicada responde por uma grande percentagem da variação total, e R2 estará mais próximo de 1.

Page 140: Apostila Estatistica - Autor CEADUFOP
Page 141: Apostila Estatistica - Autor CEADUFOP

Capítulo 11

Números Índices

Page 142: Apostila Estatistica - Autor CEADUFOP
Page 143: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 143

1. Introdução

Número índices podemos defini-lo com uma medida para demonstrar as variações de um conjunto de variáveis ou de uma variável em um período considerado e possibilita demonstrar a evolução de um fenômeno.

É um Instrumento utilizado para medir as alterações verificadas em um conjunto de variáveis ao longo de um determinado período de tempo e visa dar um valor quantitativo a um conjunto de medidas para as quais não existe uma unidade comum de medida.

2. Índices Simples

O índices simples é aplicado na análise quando envolve apenas uma variavel. Os índices simples podem ser: o índice relativo a preços, o de quantidade e o de valor.

2.1 - Índice Relativo a Preço - IRP

Sejam Pn e Po os preços atual e básico de um produto, respectivamente. O índice relativo a preços bem como a evolução dos preços, no período, serão:

A expressão IRP representa o índice relativo a preços.

A expressão Ep representa a evolução dos preços.

2.2 - Índice Relativo a Quantidade - IRQ

Sejam Qn e Qo as quantidades atual e básica, respectivamente de um produto. Então, o índice relativo a quantidades bem como a evolução destas quantidades neste período, serão de:

Page 144: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 144

A expressão IRQ representa o índice relativo a quantidade.

A expressão Eq representa a evolução das quantidades.

2.3 - Índice relativo a Valor - IRV

Seja:

• P Pn e Qn preço e quantidade de um produto no perido atual.• P Po e Qo preço e quantidade de um produto num período básica (referência).

• V Vn = Pn . Qn Vendas atuais.

• V Vo = Po . Qo Vendas no período básico (referência).

O número índice relativo a valor – IRV é a razão existente entre as vendas atuais e as de uma época de referência. Sendo:

A expressão IRV representa o índice relativo à valor / venda.A expressão Ev representa a evolução percentual deste valor/vendas.

O índice relativo a valor (IRV) é o resultado do produto do índice de preços pelo respectivo índice de quantidades, expressos em índices unitários.

2.4 - Fórmula Geral - Índices Relativos

As fórmulas dos índices relativos a preço, a quantidade, a valor ou de

Page 145: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 145

qualquer fenômeno, são representados:

A expressão IRF representa o índice relativo a um fenômeno qualquer.

A expressão Ef representa a evolução percentual do IRF

Exemplo 77

O preço de um determinado produto P em abril/2007 era de R$ 50,00 e em maio/2007 era R$ 70,00. Qual foi o índice relativo a preços em maio/2007 tendo como referencia ou com base em abril/2007?

O índice relativo a preços foi de 140% e a evolução dos preços foi de 40%.

O valor 40% representa a variação, o crescimento, o reajuste dos preços em maio com base em abril;

O valor 140% representa o índice de preços do produto P em maio, com base em abril;

O valor 1,4 que é o resultado de 70/50, representa o índice unitário relativo a preços do produto P, em maio. A taxa unitária 0,4 mais 1 representa o índice unitário que é de 1,4.

Exemplo 78

A inflação de fevereiro/2008 foi de 2%.

A inflação representa a variação dos preços de um conjunto de produtos.

Page 146: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 146

O valor 2% representa a elevação, a variação, o crescimento dos preços de um conjunto de produtos em fevereiro/2008, com base em janeiro/2008.

O valor 102%, isto é, a inflação mais 100% representa o índice da inflação e o valor 102/100 = 1,02 representa o índice unitário da inflação.

Vendas = Preços x Quantidades = Faturamento

As vendas representam o produto de cada um dos preços pelas respectivas quantidades vendida.

Usando a evolução dos preços e a das quantidades em um período considerado, transformadas em índices unitários, o índice relativo a vendas – IRV será:IRV = ( IRP x IRQ)

O Observe que o índice unitário relativo a valor é igual ao produto dos índices unitários relativos a preços e quantidades. Logo, a elevação, o crescimento ou a evolução do valor / vendas será:

Ev = ( IRP x IRQ) 100 - 100

Por outro lado, não podemos esquecer de que desta fórmula surgem as seguintes:

Sendo IRV, IRP e IRQ expressos em índices unitários.

Sendo que:

Dividir um valor por outro, temos como resultado um índice unitário. Multiplicar tal resultado por 100, obtem-se o índice percentual deste fenômeno e se subtraír 100 deste resultado, obtem-se a sua variação/crescimento/evolução percentual. Os calculos envolvidos no estudo de números índices são realizados

Page 147: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 147

utilizando os índices unitários.

Exemplo 79

Os preços do produto P, em agosto/2007, cresceram 20% e as suas quantidades vendidas aumentaram 10%. O índice relativo a vendas e a sua evolução serão:

IRV = (IRP x IRQ).100

IRV = (1,2 x 1,1).100 = 132% ⇒ Ev = (1,2 x 1,1).100 - 100 = 32%

O índice relativo a vendas foi 132%, a evolução ou crescimento das vendas foi 32% e o índice unitário das vendas de 1,32.

Exemplo 80

Em agosto/2007 as vendas di produto K cresceram 30% enquanto que os preços foram reajustados em 20%. Qual é o índice relativo a quantidades:

O índice relativo a quantidades foi 108,33%, as quantidades vendidas cresceram 8,33% e o índice unitário das quantidades foi 1,0833.

Exemplo 81

Em agosto/2007, a empresa faturou 120 mil toneladas do produto PP representando um crescimento de 20%, com base nas quantidades faturadas em julho/2007. Qual foi a sua quantidade faturada em julho/2007?

O valor futuro é igual ao valor passado (referencia) multiplicado pelo índice unitário do período elevado a n, sendo:

VF = VP(i + 1)n

VF = Valor futuro

Page 148: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 148

VP = valor presente

VF - Valor futuro vendas agosto/2007 = 120, i = 0,2 e n = 1. VP = representará as vendas de julho, então:

120 = VP(0,2 + 1)1 ⇒ 120 = VP x 1,2 ⇒ 120 = 1,2VP ⇒ VP = 120/1,2 = 100

3 - Evolução de um Fenômeno

No âmbito do gerenciamento das diversas variáveis que interferem no dia a dia da atividade econômica da empresa, surgem as variáveis: o preço, a quantidade faturada e o faturamento dos produtos da empresa.

Na gestão dos preços de um produto não deverão ser levados em consideração apenas os preços de custo, de matéria prima, de mão de obra, o preço fixo do produto mas sim toda uma rede de marketing necessária para, em primeiro lugar, conhecer todos os produtos similares do mercado e em segundo lugar, atrair e conscientizar a população sobre qualidade, preço, etc. dos produtos da empresa.

Desta forma, é importante o acompanhamento dos reajustes de preços, das quantidades faturadas, não somente da empresa mas dos principais concorrentes.

Dentro desta visão, para definir a evolução de um fenômeno em qualquer atividade, levaremos em consideração:

3.1 - Evolução de um Fenômeno Partindo-se de Dados Originais

Pode-se definir, como dados originais, o preço, a quantidade faturada ou produzida, o faturamento ou qualquer série de índices com base fixa.

Sejam dados: Vn representando um valor atual e Vo representando um valor básico ou referencial. Então, a evolução deste fenômeno, em um período, será definida por:

Page 149: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 149

Desejando-se a evolução média, a cada unidade de tempo, usar a média geométrica. A evolução média será:

Exemplo 82

O faturamento de um supermercado, em setembro foi de 600 mil reais. No mês seguinte, o seu faturamento foi de 660 mil reais. Qual foi a evolução de suas vendas?

Exemplo 83

Em dezembro/2007, a Empresa KK faturou 500 mil reais e em fevereirol/2008 o seu faturamento foi de 600 mil reais. É informado que, o Índice Geral de Preços de Mercado, o IGP-M, com base em janeiro de 2002, foi, em dezembro/2007 de 2.000%, e em abril/2008, de 2.200%. No período, qual foi a evolução das vendas e a da inflação?

As vendas e o IGP-M com base fixa (janeiro de 2002) definem dados originais, temos que:

Page 150: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 150

Conlcui-se que as vendas cresceram 20% e a inflação cresceu 10%.

3.2 - Utilizando-se das Variações de Cada Época

Sejam dadas as variações de um fenômeno, em cada época. Transfa-se tais variações em índices unitários, o seu produtório determina o índice acumulado das variações.

Sejam x1, x2, x3, x4, ... xn índices unitários. A evolução deste fenômeno em um período considerado será:

Ef = ( x1 . x2 . x3 . x4 . .... xn ).100 - 100 A evolução média, a cada unidade de tempo, será a média geométrica com n igual ao número de índices unitários. A evolução média será:

Exemplo 84

O faturamento da empresa KKK, apresentam uma evolução de 40%, 50% e 60% nos meses de fevereiro, março e abril/2007, respectivamente. Qual foi a evolução acumulada das vendas e qual foi o crescimento médio mensal das vendas no periodo?

O índices unitários em cada mês sera:

Fevereiro - evolução de 40% - Índice Unitário = 1,4Março - evolução de 50% - Índice Unitário = 1,5Abril - evolução de 60% - Índice Unitário = 1,6

A evolução acumulada do faturamento será:

Ev = (1,4 x 1,5 x 1,6).100 -100 = 236%

A a evolução média mensal do faturamento será:

Page 151: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 151

3.3 - Utilizando-se a Variação Média de uma época (referencia)

Seja i a evolução média de um fenômeno em uma determinada epoca. A sua evolução, em um período n, será:

Exemplo 85

Os precos de um determinado produto alcançaram um crescimento médio mensal de 20% nos últimos meses. Qual será a tendência de crescimento dos precos para os próximos três meses?

Ou aplicar a fórmula: Ef = (1,2 x 1,2 x 1,2).100 - 100 = 72,80%

3.4 - Evolução Acumulada e Cálculo da Evolução Média

Para calcular a evolução média de um fenômeno, em cada época, partindo-se da evolução acumulada em um período k, teremos:

O tempo é representado por K e i é a evolução acumulada em um período K.

Exemplo 86

O faturamento da Empresa HHH cresceram, nos últimos 12 meses, 600%.

Page 152: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 152

a) Calcular o crescimento médio mensal do faturamento, no período.

b) Calcular a evolução média trimestral do faturamento, no período.

c) Calcular a evolução média semestral do faturamento.

4 - Deflator

O deflator é um número índice relativo a preços aplicado para eliminar a influência inflacionária sobre os valores monetários, em um determinado periodo, com o objetivo de medir o poder de compra da moeda.

Finalidade do deflator:

Comparar ou igualar valores monetários correntes de diversos períodos de uma série temporal em função de um valor referente a um período básico.

Eliminar variações de preços relativos a um atividade empresarial ou setor economico para identificar as variações de produtividade física. Comparar ou reduzir valores momentâneos de diversas épocas, em função de um índice inflacionário, com um valor referencial, equivale tirar a influencia da inflação sobre a moeda, durante aquele período.

Os valores estariam deflacionados, sem a influência da inflação, utilizado para identificar o poder aquisitivo da moeda ou da Empresa.

Page 153: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 153

Deflacionar valores de uma série temporal, basta dividir tais valores por um índice deflator correspondente à época em que eles ocorreram e podemos denominar de deflacionamento.

Deflacionamento tem como finalidade reduzir, equiparar ou igualar valores correntes de diversas épocas com o valor de uma época básica. O objetivo é eliminar as variações dos preços provocadas pelas flutuações inflacionárias de cada época.

O valor real – VR da moeda será:

VR representa o valor real da moeda,IUI representa o índice unitário da inflaçãoVC representa o valor corrente da moedaÍnd.Inf representa o índice da inflação em %.

Elimenado a pressão da inflação sobre os valores monetários obtem-se a evolução real da moeda.

As atualizações dos depósitos nas contas de poupança é uma operação denominada de deflacionamento.

Exemplo 87

No mês de setembro/2007 o salário de uma pessoa era de R$1.000,00. Neste mês a inflação foi de 5%. Qual foi o salário real desta pessoa em setembro’2007?

O valor corrente dividido pelo índice unitário da inflação obetm-s o valor real do salário, sendo:

Page 154: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 154

4.1 - Evolução Real

Comparar a evolucão da amoeda com a inflacão denomimanos de evolução real. Considera-se a “diferença” existente entre a evolução da moeda e a da inflação, sendo:

IUM e IUI simbolizam os índices unitários da moeda e o da inflação, respectivamente.

a) A evolução da moeda: Em = IUR x IUI x 100 - 100

b) A evolução do índice inflacionário:

IUM representa o Índice Unitário da MoedaIUI representa o Índice Unitário da InflaçãoIUR representa o índice unitário real.Temos que:: IUM = IUR x IUI

Exemplo 88Em abril/2007, o faturamento da empresa PPP cresceu 25% e a inflação foi 4%. Calcular a evolução real do faturamento em abril/2007.

O crescimento real do faturamento em abril/2007 foi 20,19%.

Page 155: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 155

Exemplo 89Em abril/2007, os salários foram reajustados em 54% para compensar uma inflação acumulada de 40% em um período considerado. Qual foi a evolução real dos salários?

A evolução real dos salários foi de 10%, ou seja, os salários cresceram 10% acima do crescimento da inflacao.

5 - Índices Compostos

Em varias situacões nos interessa a comparação de preços, quantidades ou de valores de um grupo de produtos, que será aparesentado atraves do estudo dos índices compostos que envolvem a análise de diversos produtos.

5.1 - Índices Não Ponderados

O índice não ponderado é o mais simples para o cálculo envolvendo vários produtos, durante um determinado período são definidos por: Índices Médios Simples e o Agregativo Simples.

5.1.1 - Índice Aritmético Simples

O índice aritmético simples é a média aritmética dos índices relativos a preços ou quantidades de K produtos em um determinado período.

a) Índice médio aritmético relativo a preços:

O índice médio aritmético dos preços é a média aritmética dos índices desses preços.

Page 156: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 156

A variavel Pn representa cada um dos preços dos produtos em uma época n e K o número de produtos. Os preços dos produtos em uma época n são P1

n, P2

n, P3

n, .... Pkn e, Pi

0 simboliza os preços correspondentes em um período básico.

b) Índice médio aritmético relativo a Quantidades:

O índice médio aritmético das quantidades é a média aritmética dos índices dessas quantidades.

A variáve Qin e Qi

0 simbolizam cada uma das quantidades dos produtos em uma época n e básica (0), respectivamente e K é a quantidade de produtos.

5.1.2 - Índice Médio Geométrico Simples

O índice médio geométrico de preços ou de quantidades de n produtos é a raiz de ordem n do produto de n índices de preços ou de quantidades relativos aos respectivos produtos.

a) Índice Médio Geométrico Simples Relativo a Preços

A raiz de ordem n de um produto de n índices de preços fornce o índice médio geométrico.

Exemplo 90Os índices unitários relativos a preços dos produtos A, B, C e D, em agosto/2007 com base em julho/2007 foram respectivamente de 1,25;

Page 157: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 157

1,35; 1,15 e 1,05. Qual foi o reajuste médio dos preços em agosto?

O reajuste médio dos n produtos será calculado pela média geométrica dos índices.

Não podera ser calculado pela média aritmética dos índices.

O índice médio geométrico = 119,48%

Os preços foram reajustados, em média, em 19,48%.

O índice médio aritmético = (1,25 + 1,35 + 1,15 + 1,05)/ 4 = 120%.

O reajuste médio através do índice médio aritmético = 20%.

Dado um conjunto de números positivos, a média geométrica é menor que a média aritmética, logo a raiz quarta daquele produtório seria um valor menor que 20%.

b) Índice Médio Geométrico Simples Relativo a Quantidades

Na tabela abaixo apresenta os preços médios bem como as quantidades vendidas pela Empresa KKLP dos produtos A, B, C e D, no período 2004 a 2007. Preços em mil reais e quantidades em mil unidades.

Page 158: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 158

Tabela 26 - Preços e Quantidades Faturadas KKLP 2005/2007 KKLP 2005/20072004 2005 2006 2007

Produto Preço Qtde Preço Qtde Preço Qtde Preço QtdeA 10 15 12 200 15 300 20 450B 15 60 20 80 30 100 35 130C 8 40 14 50 20 60 25 100D 10 60 11 50 20 40 30 60

Exemplo 91

Calcular o índice médio aritmético e a evolução média aritmética dos preços dos diversos produtos em 2007 com base o ano de 2004.

O índice médio aritmético relativo a preços dos produtos de 2004 para 2005. Calcar o reajuste médio dos preços destes produtos neste período.

Preços de 2005: A = 12 B = 20 C = 14 e D = 11Preços de 2004: A = 10 B = 15 C = 8 e D = 10

O índice médio aritmético dos preços será definido por:

No período, os preços dos produtos A, B, C e D apresentaram um índice médio aritmético de 134,58% e um reajuste médio de 34,58%.Os preços dos produtos A, B, C e D cresceram, neste período (2004 a 2005), 20%, 33,33%, 75% e 10%. O crescimento médio aritmético será de:

Em = (20 + 33,33 + 75 + 10) / 4 = 34,58%

Page 159: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 159

5.2 - Índices Ponderados

Ponderamos os preços ou as quantidades de cada produto, mediante a escolha de um peso conveniente que poderá ser o preço ou a quantidade do produto consumido no período considerado.

Entre os índices ponderados destacam-se:

5.2.1 - Índices de Laspeyres

Os índices de Laspeyres são denominados de índices de uma época básica.

Os fatores de ponderação referem-se os da época básica. Considera que no comportamento dos preços, as quantidades da época atual são as mesmas que as da época base e no comportamento das quantidades, os preços da época atual são os mesmos da época base.

Os índices de Laspeyres são uma média aritmética ponderada dos relativos, tendo como fatores de ponderação os preços ou as quantidades da época base.Os pesos variam ao mudar a época básica.

a) Índice de Laspeyres Relativo a Preços

É a razão existente entre o faturamento de uma empresa com preços atuais e quantidades de uma época básica e o seu faturamento, nesta época básica.

As quantidades dos produtos da época básica são fatores de ponderação do índice. O índice de preços de Laspeyres é definido através de uma média aritmética ponderada dos relativos, tendo como fatores de ponderação as quantidades da época básica. Não conhecendo o fator de ponderação consideramos a participação relativa de cada item no valor total dos bens consumidos na data-base. A participação relativa de um produto i no valor total do conjunto de bens é definida por:

Page 160: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 160

O índice relativo a preços será definido por:

b) Índice de Laspeyres Relativo a Quantidades

É a razão existente entre o faturamento de uma empresa com preços de uma época básica e quantidades atuais e o seu faturamento nesta época básica.

Os preços dos produtos da época básica são fatores de ponderação do índice.

No índice de preços mede a variação nos preços enquanto no de quantidades, calcula a variação nas quantidades adquiridas, pois os preços permanecem constantes.

Sendo:

Os fatores de ponderação serão os preços da época base.Em sua essência intrínseca o fator de ponderação será a participação relativa de cada item no valor total dos bens consumidos na data-base.

No comportamento dos preços considera as quantidades atuais iguais às da época base e no comportamento das quantidades, considera os preços atuais iguais aos da época base e não leva em consideração o

Page 161: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 161

efeito da inflação.

5.2.2 - Índices de Paasche

Os índices de Paasche conhecidos como os “índices da época atual”

Os fatores de ponderação referem-se à esta época.

No índice de preços de Paasche verificamos que os fatores de ponderação são as quantidades da época atual, mas levando-se em consideração que a época atual é variável, os preços mudam quando as épocas atuais mudarem, o que o caracteriza como um índice agregativo com ponderações variáveis.

O indice de Paasche adota como fator de ponderação, a participação relativa de cada item no valor total dos bens consumidos na época atual.

Os índices médios harmônicos ponderados relativos a preços ou a quantidades definem os respectivos índices de Paasche.

a) Índice de Paasche Relativo a Preços

O índice relativo a preços de Paasche indica uma relação entre o faturamento, numa época atual e o valor total deste faturamento, em quantidades atuais aos preços de uma época básica. Considera-se as quantidades da época básica iguais às atuais.

A participação relativa de um produto i no valor total de um conjunto de bens é definida por:

O índice relativo a preços é definido por:

Page 162: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 162

O índice de Paasche, relativo a preços, tem como fatores de ponderação as quantidades da época atual.

b) Índice Relativo a Quantidades

O índice relativo a quantidades de Paasche indica uma relação entre o faturamento, numa época atual e o valor total deste faturamento em função dos preços atuais e quantidades de uma época básica. Considra-se os preços da época básica iguais às atuais.

O índice relativo a quantidades:

As quantidades atuais e básicas, têm como pesos os preços atuais dos produtos.

O índice de Paasche, relativo a quantidades, tem como fator de ponderação os preços da época atual.

Se as quantidades crescerem na mesma proporção os índices de preços de Laspeyres e Paasche serão iguais e se os preços crescerem na mesma proporção, os índices de quantidades serão iguais.

Exemplo 92

A tabela a seguir mostra o movimento das vendas dos produtos A, B, C e D, em junho e julho de 2007. Os preços e as quantidades estão em mil reais e mil unidades, respectivamente.

Page 163: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 163

Tabela 27 - Vendas dos produtos A, B, C e D, em junho e julho de 2007

Junho JulhoProdutos Preços Quantida-

desPreços Quantida-

desA 80 20 100 30B 60 30 85 40C 40 50 60 60D 20 60 25 40

Fonte: Diretoria de Produção

Calcular o índice de Laspeyres relativo a preços em Julho/2007, com base em Junho/2007.

Calcula-se o faturamento da empresa em função dos preços de Julho e quantidades de Junho: Em junho, temos Po e Qo e em julho, temos Pn e Qn, temos:

∑ Pn Qo = 100 x 20 + 85 x 30 + 60 x 50 + 25 x 60 = 9.050

∑ PoQo = 80 x 20 + 60 x 30 + 40 x 50 + 20 x 60 = 6.600

O índice de Laspeyres, relativo a preços será:

O índice de Laspeyres relativo à preços foi de 137,12%, em julho com base nas vendas de junho, representando um crescimento médio nos preços dos produtos faturados da ordem de 37,12%.

Exemplo 93

Calcular o índice de Laspeyres relativo a quantidades, em julho/2007 com base em junho/2007.

Page 164: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 164

No período houve um créscimo médio das quantidades produzidas dos diversos produtos da ordem de 21,21%.

• Observações sobre os índices de Laspeyres e Paasche Observações sobre os índices de Laspeyres e Paasche

De uma maneira geral, os índices de Laspeyres e Paasche não podem ser usados da mesma forma porque um é índice de base fixa e o outro é índice de base móvel.

Pode-se dizer que o índice de Laspeyres tem por finalidade avaliar o futuro e o de Paasche, o passado.

A principal vantagem do índice de Fisher é o fato de satisfazer as propriedades da decomposição das causas, da reversibilidade do tempo e da circularidade.

6 - Propriedades dos Índices

6.1 - Identidade

O preço, a quantidade ou o valor de um produto em uma época n comparado com os respectivos valores desta mesma época é igual a unidade ou 100%.

O número índice deve ser igual à unidade quando a época atual coincidir com a época básica.

Page 165: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 165

6.2 - Reversão do Tempo/Reversibilidade

Ao se permutarem dois períodos (a, b) em (b, a), os resultados correspondentes serão recíprocos, isto é:P(a,b) x P(b,a) = 1

6.3 - Reversão dos Fatores/Decomposição dos Fatores/Decomposição das Causas

O produto do índice unitário relativo a preços pelo índice unitário relativo a quantidades é igual ao índice unitário de valor.

6.4 - Circular

O produto circular de K números índices é igual a unidade.

P(a,b) x P(b,c) x P(c,d) x P(d,a) = 1

P(a,d) = P(a,b)xP(b,c)P(c,d)

Observe que o número índice da época d com base na época a é igual ao produto de uma série de índices intermediários. Então pode-se concluir que um número índice pode ser decomposto em diversos números índices.

6.5 - Homogeneidade

Mudanças nas unidades das variáveis componentes não deverão modificar o valor do índice.

6.6 - Proporcionalidade

Se todos os valores das variáveis componentes do índice tiverem a mesma variação, então o número índice obtido deverá fornecer esta mesma variação.

Os índices de Laspeyres e Paasche têm restrições conceituais, um define o fator de ponderação na data base e o outro na atual e numéricas porque só podem ser usadas para avaliar datas próximas e regiões assemelhadas e não resolvem plenamente o problema da

Page 166: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 166

variação de valores entre duas datas. O índice de custo de vida em Goiás não pode ser usado em Minas Gerais em funções de uma série de restrições: cesta base diferente como diferente é a importância de cada produto para o seu povo, além de restrições sociais e econômicas e temporais.

6.7 - Erros e Restrições nos Números-Índice

Os números-índice estão sujeitos a uma série de erros, entre os quais destacamos:

- Erros de Fórmula: escolha da fórmula adequada às características dos dados analisados;

- Erros de Amostragem: Existe a possibilidade de erros amostrais mesmo que as amostras sejam criteriosamente selecionadas. As amostras só permitem estimar valores populacionais com certa margem de erro (nunca fornecem o valor exato);

- Erros de Homogeneidade: os números-índice consideram os bens mais significativos para uma dada população. Quando observamos datas diferentes, podem haver produtos significativos numa delas que não são considerados na outra porque não são comuns a ambas (ou porque desapareceram ou porque surgiram entre os períodos analisados).Quanto às restrições podemos destacar:

- Geográficas: não são válidos para grandes regiões (como é o caso do Brasil);

- Sociais: Variação de preços de mercadorias especificas não afetará o padrão de vida das diversas camadas sociais do mesmo modo. Como exemplo, podemos citar que um forte aumento no preço dos cigarros, não terá nenhum efeito nos gastos dos não-fumantes. Alguns órgãos determinam índices diferentes para as classes A, B, C, D e assim por diante.

- Temporais: Devido às mudanças nos hábitos e preferências dos indivíduos ao longo do tempo e em razão dos avanços tecnológicos que tornam obsoletos bens anteriormente significativos, a estrutura de cálculo de um número-índice qualquer não pode ser mantida

Page 167: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 167

indefinidamente.

7 - Mudanças de Base

A data-base ideal para fixar uma série de números índices é aquela que se refere a um momento de grande estabilidade no âmbito da Empresa, ou em uma determinada região ou do tipo de negócio.*

Através de uma série de preços, quantidades ou vendas, de cada época, considerando um período, para construir uma série de índices com base fixa, basta dividir cada um dos valores pelo valor da nova base, multiplicando o resultado por 100.

Para construir uma série de índices com base móvel, através de uma série base fixa de preços, quantidades ou vendas, de cada época, em um determinado período considerado, basta dividir cada um dos valores pelo valor que o antecede, multiplicando o resultado por 100.

Exemplo 94

A tabela a seguir retrata produção de carne da Empresa KKPL, no período de 2000 a 2007, em mil toneladas. Neste período, a Empresa teve três momentos: 2000, 2002 e 2004. A Empresa deseja visualizar a tendência de sua produção com base nestas três épocas.

Tabela 28 - Produção de Carne Bovina - Empresa KKPL, 2000/2007Produção de Carne Bovina - Empresa KKPL, 2000/2007 - MIL. TON.

Período Produção 2000=100% 2002100% 2004=100%2000 20 100 40 202001 30 150 60 302002 50 250 100 502003 80 400 160 802004 100 500 200 1002005 150 750 300 1502006 190 950 380 1902007 250 1250 500 250

Fonte: Departamento de Produção

Construir uma série de índices para visualizarmos a tendência da produção de carne, com base em 2000

Page 168: Apostila Estatistica - Autor CEADUFOP

Estatística Aplicada à Administração

Números ÍndicesPágina 168

A produção de carne em 2000 está para 100, assim como o valor da produção de cada ano está para x.

Através de uma regra de três, vamos construindo a série desejada.

Aplicando o conceito tradicional, isto é, cada valor será dividido por 20, multiplicando o resultado por 100.

Exemplo 95

Construir uma série de índices para visualizarmos a tendência da produção de leite em pó, com base em 2002.

Em 2002 a produção foi de 50, logo 50 está para 100, assim como o valor da produção de cada ano está para x.

Através de uma regra de três, vamos construindo a série desejada.

Cada valor será dividido por 50, multiplicando o resultado por 100.

Observe que a série com base em 2000 apresenta a mesma evolução da série referente aos valores nominais.

Sendo assim, podemos construir a série com base em 2002 dividindo cada valor da série com base em 2000 pelo valor de encontrado no anos de 2002 (250), ou com base nos valores nominais (50), multiplicando o resultado por 100.

Page 169: Apostila Estatistica - Autor CEADUFOP
Page 170: Apostila Estatistica - Autor CEADUFOP

Referências Bibliográficas

Página 170

Referências Bibliográficas

FARIAS, A. A.; CESAR, C.; SOARES, J. F. Introdução à Estatística. Rio de Janeiro: LTC, 2.ª ed., 340 p., 2002.

MOORE, D. S. A Estatística Básica e sua Prática. Rio de Janeiro: LTC, 3.ª ed., 688 p., 2005.

MEYER, P. L. Probabilidade: Aplicações à Estatística. Rio de Janeiro: LTC, 2.ª ed., 426 p., 2000.

COSTA, A. F. B.; EPPRECHT, E. K.; CARPINETTI, L. C. R. Controle Esta-tístico de Qualidade. São Paulo: Atlas, 334p., 2004. MONTEGOMERY, D. C.; RUNGEE, G. C. Estatística Aplicada e Probabili-dade para Engenheiros. Rio de Janeiro: LTC, 2.ª ed., 446p., 2003.

Page 171: Apostila Estatistica - Autor CEADUFOP
Page 172: Apostila Estatistica - Autor CEADUFOP

Dados dos Autores

• Jorge Luiz Brescia MurtaJorge Luiz Brescia Murta

Natural de Belo Horizonte - MG, é Doutor em Ciências Empresariais, Mestre em Engenharia de Produção e Graduado em Matemática. É professor do Departamento de Engenharia de Produção, escola de Minas, Universidade Federal de Ouro Preto. Tem atuado na área de Engenharia de Produção, com ênfase em Suprimentos, Engenharia Econômica e Produtividade.

Page 173: Apostila Estatistica - Autor CEADUFOP

• Tays Torres Ribeiro das ChagasTays Torres Ribeiro das Chagas

Natural de Ipatinga - MG, é Mestre em Engenharia de Materiais e Graduada em Engenharia de Produção. É professora substituta do Departamento de Engenharia de Produção, Escola de Minas, Universidade Federal de Ouro Preto. Tem atuado na área de Engenharia do Trabalho e Economia.