iv - descrição e apresentação dos dados‡Ão-e-apresentaÇÃo-de-dados.pdf · regras de...

59
Prof. Herondino IV - Descrição e Apresentação dos Dados

Upload: dinhngoc

Post on 12-Dec-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Prof. Herondino

IV - Descrição e Apresentação dos

Dados

Dados

A palavra "dados" é um termo relativo, tratamento de dados

comumente ocorre por etapas, e os "dados processados" a

partir de uma etapa podem ser considerados os "dados

brutos" do próximo. (Wikipédia)

Dados Brutos

Em informática dados brutos (raw data) designam os

dados/valores recolhidos e estocados tal qual foram

adquiridos, sem terem sofrido o menor tratamento

(Wikipédia)

Dados Brutos

Suponhamos o seguintes dados Brutos como sendo a idade

de alunos de uma turma de informática

14 12 13 11 12 13

16 14 14 15 17 14

11 13 14 15 13 12

14 13 14 13 15 16

12 12

Frequência

A frequência de uma observação é o número de repetições

dessa observação no conjunto de observações, ou ainda, é o

número de vezes que conjuntos de dados aparecem em uma

“população”.

Tipos de Frequências

Frequência simples ou absoluta (fi ) - são os valores que

representam o número de dados de cada classe.

Frequência relativa(fr ) - são os valores das razões entre as

frequências simples e a frequência total.

Frequência acumulada(fa ) – é o total das frequências de

todos os valores inferiores ao limite superior do intervalo de

uma dada classe.

Frequência acumulada relativa(far ) é a frequência

acumulada da classe, dividida pela frequência total da

distribuição.

Distribuição de Frequência Simples ( )

11 2

12 5

13 6

14 7

15 3

16 2

17 1

ix if

if

Dados ou

variável

(Idade)

Frequência

(nº de Alunos)

Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido

pelo número total de observações.Variável

(idade)

frequência absoluta

(Nº de alunos)

frequência relativa

11 2 2/26 = 0,0769

12 5 5/26 = 0,1923

13 6 6/26 = 0,2308

14 7 7/26 = 0,2692

15 3 3/26 = 0,1154

16 2 2/26 = 0,0769

17 1 1/26 = 0,0385

TOTAL = 26 1,0000

ix if rf

ifN

Frequência AcumuladaVariável freqüência

absoluta

freqüência relativa frequência

absoluta

acumulada

frequência

relativa acumulada

11 2 2/26 = 0,0769 2 2/26 = 0,0769

12 5 5/26 = 0,1923 7 7/26 = 0,2692

13 6 6/26 = 0,2308 13 13/26 = 0,5000

14 7 7/26 = 0,2692 20 20/26 = 0,7692

15 3 3/26 = 0,1154 23 23/26 = 0,8846

16 2 2/26 = 0,0769 25 25/26 = 0,9615

17 1 1/26 = 0,0385 26 26/26 = 1,0000

TOTAL = 26 =1,0000

ixif rf

af raf

if rf

Regras de arredondamento na

Numeração Decimal

Norma ABNT NBR 5891

1) Quando o algarismo imediatamente seguinte ao último

algarismo a ser conservado for inferior a 5, o último

algarismo a ser conservado permanecerá sem modificação

Exemplo:

1,333 3 arredondado à primeira decimal tornar-se-á 1,3

Regras de arredondamento na

Numeração Decimal

2) Quando o algarismo imediatamente seguinte ao último

algarismo a ser conservado for superior a 5, ou, sendo 5,

for seguido de no mínimo um algarismo diferente

de zero, o último algarismo a ser conservado deverá ser

aumentado de uma unidade

Exemplo

1,666 6 arredondado à primeira decimal tornar-se-á: 1,7.

4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.

Regras de arredondamento na

Numeração Decimal

3) Quando o algarismo imediatamente seguinte ao

último algarismo a ser conservado for 5 seguido de

zeros, dever-se-á arredondar o algarismo a ser conservado

para o algarismo par mais próximo. Consequentemente, o

último a ser retirado, se for ímpar, aumentará uma unidade.

Exemplo:

4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.

Regras de arredondamento na

Numeração Decimal

4) Quando o algarismo imediatamente seguinte ao último

a ser conservado for 5 seguido de zeros, se for par o

algarismo a ser conservado, ele permanecerá sem

modificação.

Exemplo:

4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.

Atividade - III

1. Verificar a altura em centímetro de cada aluno da turma e

construir uma sequência de Dados Brutos;

2. A partir dos Dados Brutos obtidos, construir a distribuição

de frequência absoluta simples, a frequência relativa,

frequência acumulada e frequência relativa acumulada. Para

o arredondamento utilize a regra da ABNT 5891.

Séries Estatísticas

Tabela é um quadro que resume um conjunto de

observações.

Elementos da Tabela:

Título – o que? Quando? Onde?

Cabeçalho – parte superior da tabela que especifica o conteúdo

Corpo – linha e colunas que contém as informações

Rodapé – elementos complementares

Séries Estatísticas

Séries Históricas

Descrevem os valores da variável, em determinado local,

discriminado segundo intervalos de tempo variáveis.

Série Geográficas ou espaciais

Descrevem os valores da variável, em determinado instante,

discriminado segundo regiões.

Series Específicas ou categóricas

Descrevem os valores da variável, em determinado tempo e

local, discriminados segundo especificações ou categorias.

Exemplo:

Séries Conjugadas

Quando apresenta em uma única tabela, a variação de valores

de mais de uma variável.

Apresentação dos dados

“O gráfico estatístico é uma forma de apresentação dos

dados estatísticos, cujo objetivo é o de produzir, o

investigador ou no público em geral, uma impressão mais

rápida e viva do fenômeno em estudo, já que os gráficos

falam mais rápido à compressão que as séries” (Crespo, 2002)

Quando se dispõe de um grande número de observações,

torna-se extremamente difícil a leitura de valores colocados

em tabela.

Colunas ou em barras

É a representação de uma série por meio de retângulos,

dispostos verticalmente (em colunas) ou horizontalmente

(em barras)

Histograma

Um histograma é uma representação gráfica de uma única

variável que representa a frequência de ocorrências (valores

dos dados) dentro de categorias de dados.

O histograma tanto pode ser representado para as

frequências absolutas como para as frequências relativas.

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6 7 8 9 10

Nota nº de Alunos

0 1

1 1

2 2

3 4

4 6

5 8

6 12

7 10

8 3

9 2

10 1

Total 50

Polígono de Frequência

1 1

2

4

6

8

12

10

3

2

1

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6 7 8 9 10

O Polígono de frequências é obtido ligando-se os pontos

médios dos topos dos retângulos de um histograma.

Sobrepondo

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6 7 8 9 10

1 1

2

4

6

8

12

10

3

2

1

0

2

4

6

8

10

12

14

0 1 2 3 4 5 6 7 8 9 10

Histograma de frequência acumulada

(ou ogiva)

histograma de frequência acumulada (ou ogiva) é a

representação gráfica do comportamento da frequência

acumulada.

0

10

20

30

40

50

60

0 1 2 3 4 5 6 7 8 9 10

Fre

qu

ên

cia

Ac

um

ula

da

Distribuição por Frequência Acumulada

Gráfico de Setores

0% 2%

4%5%

7%

9%

11%

13%15%

16%

18%

Gráfico de Setores

0 1 2 3 4 5 6 7 8 9 10

É designado por um círculo, onde cada classe é representada

por um setor circular, cujo ângulo é proporcional ao tamanho

da amostra.

Distribuição de Frequência agrupadas

em Classe

Para a determinação de classes não existe uma regra pré

estabelecida, sendo necessário um pouco de tentativa e erro

para a solução mais adequada.

1. Definir o número de classes

Se n representa o número de observações (na amostra ou na

população, conforme for o caso) o número aproximado de

classes pode ser calculado por Número de Classes =

arredondando os resultados.

n

Exemplo

Nº de Classes =

Fonte: Marques, 2013

47,530

Fazendo arredondamento

para 6

Altura em cm da Turma CA 2013

2. Calcular a amplitude das classes

Essa será obtida conhecendo-se o número de classes e

amplitude total dos dados.

A amplitude total dos dados é o resultado da subtração valor

máximo - valor mínimo da série de dados

classes de

Total Amplitude = classe de Amplitudenúmero

MinValor -MaxValor = Total Amplitude

Distribuição de Frequência agrupadas em Classe

Exemplo

66

36 = classe de Amplitude

36152-188 = Total Amplitude

Rol

Fonte: Vaz,2013

3. Distribui a

frequência dos dados

agrupados por classe

O limite superior de cada

classe é aberto (e

consequentemente, o

limite inferior de cada

classe é fechado), ou seja,

cada intervalo de classe

não inclui o valor de seu

limite superior, com

exceção da última classe.

(Nº de

Ordem)

(Altura em cm) ( Nº de alunos)

01 152 158

02 158 164

03 164 170

04 170 176

05 176 182

06 182 188

Total

i ix if

Limite Inferior Limite Superior

Distribuição de Frequência agrupadas

em Classe

Distribuição de Frequência agrupadas

em Classe(Nº de

Ordem)

(Altura em cm) ( Nº de alunos)

01 152 158 9

02 158 164 8

03 164 170 5

04 170 176 4

05 176 182 3

06 182 188 1

Total 30 if

i ix if

Fonte: Tillmann, 2013

Medidas de posição ou tendência central

n

x

n

xxxX

n

i

i

n

121 ...

1. Média Aritmética

Exemplo: A nota final (NF) do curso será dada pela fórmula:

Em que: AP – Avaliação Parcial

AF – Avaliação Final

Sendo AP (Avaliação Parcial) a média aritmética das

atividades propostas (AT1, AT2,...,ATn)

A cada AT será atribuído valores de 1 a 5.

2

AFAPNF

n

ATnATATAP

...21

Exemplo:

164163,833...30

188...156155154154152152

X

1641

n

x

X

n

i

i

Medidas de posição ou tendência central

Propriedades da média aritmética

1. A média é um valor típico, ou seja, ela é o centro de gravidade da distribuição, um

ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de

dados sem mudar o total. Simbolicamente temos:

2. A soma dos desvios das observações em relação a média é igual a zero.

3. A soma dos desvios elevados ao quadrado das observações em relação a média é

menor que qualquer soma de quadrados de desvios em relação a qualquer outro

número. Em outras palavras,

é um mínimo.

0)( Xxi

)( 2 Xxi

n

x

n

xX

n

i

i

i

1

Exemplo

n

x

n

xX

n

i

i

i

1

0)( Xxi )( 2 Xxi

ix X Xxi 2)( Xxi

2. Média PonderadaMedidas de posição ou tendência central

i

n

i

ii

n

nnP

p

px

ppp

pxpxpxX 1

21

2211

...

......

Onde é o peso da observação iip

A universidade definiu que as avaliações parciais teriam

peso de 30% e a prova final teria peso de 40% no cálculo

dos rendimentos dos alunos. Veja o quadro abaixo e calcule

a média do aluno.

Exemplo

4,03,03,0

4,06,93,093,08

PX

8,0

0,30

0,30

Ap 2 9,0

9,6

Ap nota peso

Ap 1

Final 0,40

Média aritmética Ponderada em dados

agrupados

(Nº de

Ordem)

(Altura em cm) ( Nº de alunos)

01 152 158 9

02 158 164 8

03 164 170 5

04 170 176 4

05 176 182 3

06 182 188 1

Total

i ix if( Ponto

médio)

mx

30 if

im fx

i

n

i

im

f

fx

X 1

n

i

im fx1

.

Média aritmética Ponderada em dados

agrupados

(Nº de

Ordem)

(Altura em cm) ( Nº de alunos)

01 152 158 9

02 158 164 8

03 164 170 5

04 170 176 4

05 176 182 3

06 182 188 1

Total

i ix if( Ponto

médio)

155 1395

161 1288

167 835

173 692

179 537

185 185

4932

mx

2

supinf LLxm

30 if

im fx

i

n

i

im

f

fx

X 1

16430

932.4X

n

i

im fx1

.

Mediana (Md) A mediana é o valor do item central da série quando estes são

arranjados em ordem de magnitude

Exemplo:

a) 2, 4, 5, 7, 8 Md=5

b) 2, 5, 6, 9, 10, 13, 15 Md=9

c) 3, 5 ,8 ,10, 15 ,21 Md=9

Para o calculo da mediana, têm-se:

Se a série for ímpar sua posição será dada por ou se for

Par a sua posição é dada por

2

1

nposição

2

122

nn

posição

Mediana (Md)

Cálculo da mediana

Se série ímpar

Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

Md=2

2

1

nposição

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª

0 0 1 1 2 2 3 4 5

ª52

19

posição

Mediana (Md)

Cálculo da mediana

Se a sequência for par

Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª

0 0 1 1 2 3 3 4 5 6

2

122

nn

posição

2

ª6ª5

2

12

10

2

10

posição

5,22

32

Md

Dados Agrupados

Sem intervalos de

Classe

Identificar a frequência

Acumulada

imediatamente superior

à metade da soma das

frequência, ou seja,

152

30

2

if

Dados Agrupados

Se existir uma frequência

acumulada (fa ), tal que:

a mediana será dada por:

Veja no exemplo ao lado.

2

i

a

ff

2

1 ii xx

Md

xi fi fa

12 1 1

14 2 3

15 1 4

16 2 6

17 1 7

20 1 8

8 if

42

8af 5,15

2

31

2

1615

Md

Mediana em dados Agrupados

1º Determinar as frequências acumuladas.

2º Calcular

3º Encontrar a classe correspondente à frequência acumulada

imediatamente superior à - classe mediana

2

if

2

if

2

i

a

ff

Mediana (Md) para valores agrupados

af

ix

17

9

5,152

130

2

1

n

158 164Md

917

95,15

158164

158

Md

15868

5,6Md

8,162Md

cf

fnLMd

Md

aMd

2/)1(inf

= limite de classe inferior da classe da mediana;

= frequência acumulada da classe imediatamente anterior à

classe da mediana;

= frequência absoluta simples da classe da mediana,

= amplitude (tamanho) da classe da mediana.

MdL inf

af

Mdf

c

Mediana (Md) para valores agrupados

cf

fnLMd

Md

aMd

2/)1(inf

158inf MdL

9af

8Mdf

6c

Exemplo:

68

92/)130(158

Md

68

95,15158

Md

68

5,6158

Md

87,4158Md

87,162Md

Moda (Mo)

É o valor que ocorre com maior frequência em uma série de

valores.

Exemplos:

a){ 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

b){ 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

c){ 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas:

4 e 7. A série é bimodal.

Moda (Mo) – Dados agrupados

o Sem intervalo de classe: é o valor da variável de maior

frequência.

o Exemplo:Nota nº de Alunos0 11 12 23 44 65 86 127 108 39 210 1

Total 50

Moda (Mo) – Dados agrupadoso Com intervalos de

classe: A classe que apresenta a maior frequência é denominada classe modal. Nesta, é o valor dominante que está compreendido entre os limites da classe modal. O cálculo da moda consiste em tomar o ponto médio da classe modal (Moda Bruta).

1552

158152

2

)( supinf

Mo

LLMo

(Nº de

Ordem)

(Altura em cm)

01 152 158 9

02 158 164 8

03 164 170 5

04 170 176 4

05 176 182 3

06 182 188 1

Total

i ix if

Método pela fórmula de CZUBER:

: limite inferior da classe modal

: frequência anterior a classe modal

: frequência posterior a classe moda

: frequência da classe modal

: amplitude da classe modal

Moda (Mo) – Classes agrupada

4)811()911(

91158

Mo

54 58 9

58 62 11

62 66 8

66 70 5

ix if

432

258

Mo

45

258

Mo

6,596,158 Mo

hdd

dLMo

21

1inf

antffd Mo 1

postffd Mo 2

infL

antf

Mof

h

postf

Interpretação Geométrica

Mo

if

ix

Atividade IV

1. Procure exemplos de séries estatísticas em jornais e revistas de enfoque

ambiental e classifique essas séries;

2. Procure exemplos de gráficos em jornais e revistas de enfoque ambiental e

classifique esses gráficos

3. Um processo de medida no laboratório foi avaliada através da inserção

aleatoriamente de 27 amostras possuindo uma concentração conhecida de

η=8.0 mg/L para o fluxo normal de trabalho ao longo de um período de 2

semanas.

O resultado na ordem de observação foram 6.8, 7.8, 8.9, 5.2, 7.7, 9.6, 8.7,

6.7, 4.8, 8.0, 10.1, 8.5, 6.5, 9.2, 7.4, 6.3, 5.6, 7.3, 8.3, 7.2, 7.5, 6.1, 9.4, 5.3,

7.6, 8.1, e 7.9 mg/L.

A partir dos valores observados, obter:

a distribuição de frequência agrupada em classe, a frequência relativa, frequência

acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra

da ABNT 5891;

Construa o seu histograma, o polígono de frequência, ogiva e o gráfico de setores;

A média aritmética, a moda, a mediana e localize essas medidas no histograma.

4) Considerando os conjuntos de dados:

a)3,5,2,6,5,9,5,2,8,6

b)20,9,7,2,12,7,20,15,7

c)51,6; 48,7; 50,3; 49,5; 48,9

d)15, 18, 20, 13, 10, 16, 14

Calcule a média, a mediana e a moda.

5) Os dados de DBO coletados na tabela ao lado, são

do baixo Rio Jari, realizada no período de novembro de

2009 a novembro de 2010. A partir desses dados

construa:

a) a sua distribuição de frequência agrupada em

classe;

b) O histograma, a ogiva e o gráfico em função do

tempo;

c) A media, a mediana e a moda.

Atividade IV

MêsDBO(mg/L)

L 1 L2 L3 L4

nov 8,09 8,22 8,20 8,11

dez 8,46 9,11 9,72 8,66

jan 6,75 5,96 6,41 6,24

fev 5,51 5,48 5,39 4,91

mar 4,96 5,22 4,38 4,77

abr 6,37 6,24 5,74 5,92

mai 8,92 8,85 7,94 8,08

jul 7,87 7,94 7,75 7,85

ago 0,83 1,28 1,70 1,18

set 1,07 1,47 1,41 1,84

out 1,82 1,62 1,74 2,33

nov 2,53 2,58 2,44 2,31

Fonte: Oliveira,2013

Referência BERTHOUEX, Paul Mac; BROWN, Linfield C.. Statistics

for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002.

MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006.

TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999.

OLIVEIRA, B. S. Sangel. Qualidade da água associada à vulnerabilidade climática e riscos sanitários no baixo Rio Jarí – AP / Brunna Stefanny Sangel de Oliveira; orientador Alan Cavalcanti da Cunha. Macapá, 2013.