prof. herondino iv - descrição e apresentação dos dados
TRANSCRIPT
Prof. Herondino
IV - Descrição e Apresentação dos Dados
DadosA palavra "dados" é um termo relativo,
tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia)
Dados BrutosEm informática dados brutos (raw data)
designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia)
Dados BrutosSuponhamos o seguintes dados Brutos
como sendo a idade de alunos de uma turma de informática
14 12 13 11 12 1316 14 14 15 17 1411 13 14 15 13 1214 13 14 13 15 1612 12
FrequênciaA frequência de uma observação é o
número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”.
Distribuição de Frequência Simples ( )
11 2
12 5
13 6
14 7
15 3
16 2
17 1
ix if
if
Dados ou variável (Idade)
Frequência (nº de Alunos)
Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações.Variável
(idade)frequência absoluta
(Nº de alunos)frequência relativa
11 2 2/26 = 0,0769
12 5 5/26 = 0,1923
13 6 6/26 = 0,2308
14 7 7/26 = 0,2692
15 3 3/26 = 0,1154
16 2 2/26 = 0,0769
17 1 1/26 = 0,0385
TOTAL = 26 1,0000
ix if rf
ifN
Frequência AcumuladaVariável freqüência
absolutafreqüência relativa frequência
absolutaacumulada
frequência relativa acumulada
11 2 2/26 = 0,0769 2 2/26 = 0,0769
12 5 5/26 = 0,1923 7 7/26 = 0,2692
13 6 6/26 = 0,2308 13 13/26 = 0,5000
14 7 7/26 = 0,2692 20 20/26 = 0,7692
15 3 3/26 = 0,1154 23 23/26 = 0,8846
16 2 2/26 = 0,0769 25 25/26 = 0,9615
17 1 1/26 = 0,0385 26 26/26 = 1,0000
TOTAL = 26 =1,0000
ixif rf
af raf
if rf
Regras de arredondamento na Numeração DecimalNorma ABNT NBR 58911) Quando o algarismo imediatamente
seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação
Exemplo: 1,333 3 arredondado à primeira decimal
tornar-se-á 1,3
Regras de arredondamento na Numeração Decimal2) Quando o algarismo imediatamente
seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade
Exemplo1,666 6 arredondado à primeira decimal
tornar-se-á: 1,7.4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.
Regras de arredondamento na Numeração Decimal3) Quando o algarismo imediatamente
seguinte ao último algarismo a ser conservado for 5 seguido de zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade.
Exemplo: 4,550 0 arredondados à primeira decimal
tornar-se-ão: 4,6.
Regras de arredondamento na Numeração Decimal4) Quando o algarismo imediatamente
seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem modificação.
Exemplo:4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.
Atividade - III1. Verificar a altura em centímetro de cada
aluno da turma e construir uma sequência de Dados Brutos;
2. A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891.
Apresentação dos dadosQuando se dispõe de um grande número
de observações, torna-se extremamente difícil a leitura de valores colocados em tabela.
HistogramaUm histograma é uma representação
gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados.
O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas.
0 1 2 3 4 5 6 7 8 9 100
2
4
6
8
10
12
14Nota nº de Alunos0 11 12 23 44 65 86 127 108 39 210 1
Total 50
Polígono de Frequência
0 1 2 3 4 5 6 7 8 9 100
2
4
6
8
10
12
14
1 12
4
6
8
12
10
32
1
O Polígono de frequências é obtido ligando-se os pontos médios dos topos dos retângulos de um histograma.
Sobrepondo
0 1 2 3 4 5 6 7 8 9 100
2
4
6
8
10
12
14
0 1 2 3 4 5 6 7 8 9 100
2
4
6
8
10
12
14
1 12
4
6
8
12
10
32
1
Histograma de frequência acumulada (ou ogiva)histograma de frequência acumulada (ou
ogiva) é a representação gráfica do comportamento da frequência acumulada.
0 1 2 3 4 5 6 7 8 9 100
10
20
30
40
50
60
Distribuição por Frequência Acumulada
Freq
uênc
ia A
cum
ulad
a
Gráfico de Setores
2% 4%
5%
7%
9%
11%
13%15%
16%
18%
Gráfico de Setores
0 1 2 3 4 5 6 7 8 9 10
É designado por um círculo, onde cada classe é representada por um setor circular, cujo ângulo é proporcional ao tamanho da amostra.
Distribuição de Frequência agrupadas em ClassePara a determinação de classes não existe
uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada.
1. Definir o número de classesSe n representa o número de observações
(na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes = arredondando os resultados.
n
Exemplo
Nº de Classes =
Fonte: Marques, 2013
47,530
Fazendo arredondamento para 6
Altura em cm da Turma CA 2013
2. Calcular a amplitude das classes Essa será obtida conhecendo-se o número
de classes e amplitude total dos dados. A amplitude total dos dados é o resultado
da subtração valor máximo - valor mínimo da série de dados
classes de Total Amplitude = classe de Amplitude
número
MinValor -MaxValor = Total Amplitude
Distribuição de Frequência agrupadas em Classe
Exemplo
66
36 = classe de Amplitude
36152-188 = Total Amplitude
Rol
Fonte: Vaz,2013
3. Distribui a frequência dos dados agrupados por classe
O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe.
(Nº de Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158
02 158 164
03 164 170
04 170 176
05 176 182
06 182 188
Total
i ix if
Limite Inferior Limite Superior
Distribuição de Frequência agrupadas em Classe
Distribuição de Frequência agrupadas em Classe
(Nº de Ordem)
(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total 30 if
i ix if
Fonte: Tillmann, 2013
Medidas de posição ou tendência central
n
x
nxxxX
n
ii
n
121 ...
1. Média Aritmética
Exemplo: A nota final (NF) do curso será dada pela
fórmula:
Em que: AP – Avaliação ParcialAF – Avaliação Final
Sendo AP (Avaliação Parcial) a média aritmética das atividades propostas (AT1, AT2,...,ATn)
A cada AT será atribuído valores de 1 a 5.
2AFAPNF
nATnATATAP
...21
Exemplo:
164163,833...30
188...156155154154152152
X
1641
n
xX
n
ii
Medidas de posição ou tendência central
Propriedades da média aritmética 1. A média é um valor típico, ou seja, ela é o centro de
gravidade da distribuição, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total. Simbolicamente temos:
2. A soma dos desvios das observações em relação a média é igual a zero.
3. A soma dos desvios elevados ao quadrado das observações em relação a média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número. Em outras palavras,
é um mínimo.
0)( Xxi
)( 2 Xxi
n
x
nx
X
n
ii
i 1
Exemplo
n
x
nx
X
n
ii
i 1
0)( Xxi )( 2 Xxi
ix X Xxi 2)( Xxi
2. Média Ponderada
Medidas de posição ou tendência central
i
n
iii
n
nnP p
px
ppppxpxpxX 1
21
2211
.........
Onde é o peso da observação iip
A universidade definiu que as avaliações parciais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno.
Exemplo
4,03,03,04,06,93,093,08
PX8,0
0,300,30
Ap 2 9,09,6
Ap nota pesoAp 1
Final 0,40
Média aritmética Ponderada em dados agrupados (Nº de
Ordem)(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total
i ix if( Ponto médio)
mx
30 if
im fx
i
n
iim
f
fxX 1
n
iim fx
1
.
Média aritmética Ponderada em dados agrupados (Nº de
Ordem)(Altura em cm) ( Nº de alunos)
01 152 158 9
02 158 164 8
03 164 170 5
04 170 176 4
05 176 182 3
06 182 188 1
Total
i ix if( Ponto médio)
155 1395
161 1288
167 835
173 692
179 537
185 185
4932
mx
2supinf LL
xm
30 if
im fx
i
n
iim
f
fxX 1
16430932.4
X
n
iim fx
1
.
Mediana (Md)A mediana é o valor do item central da série quando
estes são arranjados em ordem de magnitudeExemplo: a) 2, 4, 5, 7, 8 Md=5b) 2, 5, 6, 9, 10, 13, 15 Md=9c) 3, 5 ,8 ,10, 15 ,21Md=9
Para o calculo da mediana, têm-se:Se a série for ímpar sua posição será dada por
ou se for
Par a sua posição é dada por
21
nposição
2
122
nn
posição
Mediana (Md)Cálculo da mediana
Se série ímpar
Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }
Md=2
21
nposição
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª0 0 1 1 2 2 3 4 5
ª52
19
posição
Mediana (Md)Cálculo da mediana
Se a sequência for par Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3,
5, 6 }
1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª
0 0 1 1 2 3 3 4 5 6
2
122
nn
posição
2ª6ª5
2
12
102
10
posição
5,22
32
Md
Mediana (Md) para valores agrupadosA partir da distribuição de frequência
acumulada ou ogiva, inicialmente determina-se a classe que contem a mediana.
(Nº de Ordem)
(Altura em cm)
01 152 158
9
02 158 164
8
03 164 170
5
04 170 176
4
05 176 182
3
06 182 188
1
Total
i ix if
30 if
9 30
17 57
22 73
26 87
29 97
30 100
af
fadeLimfadeLim
__%50__%50
sup
inf
%raf
Mediana (Md) para valores agrupadosmmm af
ix
17
9
5,152
1302
1
n
158 164Md
91795,15
158164158
Md
158685,6
Md
8,162Md
cf
fnLMdMd
aMd
2/)1(inf
= limite de classe inferior da classe da mediana; = frequência acumulada da classe imediatamente anterior à classe da mediana;= frequência absoluta simples da classe da mediana, = amplitude (tamanho) da classe da mediana.
MdL inf
af
Mdf
c
Mediana (Md) para valores agrupados
cf
fnLMdMd
aMd
2/)1(inf
158inf MdL
9af
8Mdf6c
Exemplo:
68
92/)130(158
Md
68
95,15158
Md
685,6158
Md
87,4158Md
87,162Md
Moda (Mo)É o valor que ocorre com maior frequência
em uma série de valores.Exemplos:
a){ 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.b){ 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.c){ 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.
Moda (Mo) – Dados agrupadoso Sem intervalo de classe: é o valor da
variável de maior frequência.o Exemplo:
Nota nº de Alunos0 11 12 23 44 65 86 127 108 39 210 1
Total 50
Moda (Mo) – Dados agrupadoso Com intervalos de
classe: A classe que apresenta a maior frequência é denominada classe modal. Nesta, é o valor dominante que está compreendido entre os limites da classe modal. O cálculo da moda consiste em tomar o ponto médio da classe modal (Moda Bruta).
1552
1581522
)( supinf
MoLL
Mo
(Nº de Ordem)
(Altura em cm)
01 152 158
9
02 158 164
8
03 164 170
5
04 170 176
4
05 176 182
3
06 182 188
1
Total
i ix if
Método pela fórmula de CZUBER:
: limite inferior da classe modal : frequência anterior a classe
modal : frequência posterior a classe
moda : frequência da classe modal : amplitude da classe modal
Moda (Mo) – Classes agrupada
4)811()911(
91158
Mo
54 58
9
58 62
11
62 66
8
66 70
5
ix if
432
258
Mo
45258
Mo
6,596,158 Mo
hdd
dLMo
21
1inf
antffd Mo 1
postffd Mo 2
infLantf
Mof
h
postf
Interpretação Geométrica
Mo
if
ix
Atividade IV
ReferênciaBERTHOUEX, Paul Mac; BROWN, Linfield
C.. Statistics for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002.
MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006.
TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999.