módulo 2 práticas de cálculos estatísticos básicos, de uso ... · automaticamente, por...

36
Módulo 2 Práticas de cálculos estatísticos básicos, de uso no CEP. Visão do software Minitab.

Upload: trinhdieu

Post on 12-Feb-2019

214 views

Category:

Documents


0 download

TRANSCRIPT

Módulo 2

Práticas de cálculos estatísticos básicos, de uso no CEP. Visão do software Minitab.

Cálculos estatísticos amostrais simples

1. Parâmetros (ou medidas) de posição (localização central):

�A) Média aritmética ( ):

�B) Mediana ( ): É o elemento do meio (central), quando o número dedados n é ímpar, ficando 50% dos dados para cada lado da mediana.

�Exemplo: Dadas as medições de uma característica de uma peça, emmm: 35 / 39 / 39 / 40 / 45 / 46 / 46,5 (n = 7, que é um número ímpar dedados), calcular a média e a mediana.

�Obs.: Se n for par, a mediana é a média dos 2 valores centrais.

�A mediana é mais fácil de calcular, mas é mais imprecisa (recomenda-seusar a média, nas cartas de controle). A mediana devia ser usada só emdistribuições muito assimétricas.

X

X~

(meio) mm 40X~

=

nX

X i∑=

41,5mmdados) de (número 7

dados) dos (soma 290,5X ==

Cálculos estatísticos amostrais simples

2. Parâmetros (ou medidas) de dispersão (variabilidade):

�A) Amplitude total ou Range (R), que é mais fácil de calcular, mas temmaior imprecisão, sendo usado só para pequenas amostras (n ≤ 5):

�B) Desvio padrão (S), que é mais difícil de calcular (usar calculadora?),mas tem maior precisão (recomenda-se usar este indicador, nas cartasde controle):

�No exemplo do slide anterior, em que a média era 41,5 mm, temos:

R = 46,5 – 35,0 = 11,5 mm

[ ]22

i

2

iXn.X.

1n

1

1n

)X(XS −

−=

−= ∑∑

menormaior XXR −=

4,37mm17

41,5)(46,5...41,5)(3941,5)(35S

222

=−

−++−+−=

Para se caracterizar bem uma distribuição estatística de dados, deve-se usar pelo menos um parâmetro de posição e pelo menos um de dispersão!!!

Exatidão e precisão

� Consideremos: = média do processo e M = média nominal dada pelo cliente.

� A expressão exatidão ocorre quando e precisão quando a variação do processo,dada pelo desvio padrão, é pequena.

MX ====

MX ====

X

MX ====

X

M

M

MX ====

X

MX ====

X

X

Exato e não precisoExato e preciso

Não exato e preciso Não exato e não preciso

MX ====

MX MX

MX ====

S

S S

S

Exatidão e precisão

� As figuras tentam simular um exercício com tiro ao alvo, sendo que, cada quadradomostrado, indica a posição atingida com um tiro. Comparemos com os conceitos deexatidão e precisão, que vimos no slide anterior.

Bem centradoPouco disperso

Mal centradoPouco disperso

Bem centradoMuito disperso

Mal centradoMuito disperso

Pequena dispersão

Grande dispersão

Distribuição de dados

� Para se representar bem uma distribuição de dados numéricos medidos,pode-se lançar mão de três mecanismos:

�Tabela simples de dados (ou Rol), onde os valores são mostrados naordem de obtenção, que se torna muito grande, à medida que sãocoletados mais e mais valores, dificultando a visualização.

�Tabelas de freqüências, nas quais os dados coletados são agrupadosem faixas de variação (ou classes) e, anota-se, para cada classe, aquantidade de valores encontrados (freqüência).

�Histograma, que é um gráfico construído a partir de uma tabela defreqüência, contendo as mesmas informações, mas com melhorvisualização (“uma imagem, ....”).

�Parâmetros representativos, que são conjuntos de parâmetros,característicos dos dados coletados, contendo pelo menos um tipo deposição e pelo menos um tipo de dispersão; eles podem ser:

• Posição: média, mediana, quartis, etc;

• Dispersão: amplitude total, desvio padrão, variância, etc;• Forma: indicadores de assimetria e curtose.

Elaboração de um histograma

� Coletar N dados da variável em estudo (ideal: N ≥ 80).

� Calcular a amplitude total, ou range (R):

� Calcular o número de classes (K):

Obs.: cálculo de K, com menos precisão:

� Calcular a amplitude das classes (H):

� Escrever as classes e anotar, para cada uma, o número de valores

observados (freqüência absoluta - Fi).

� Fazer a tabela de freqüências (Fi = absoluta, FRi = relativa, FAi = acumulada,

FRAi = relativa acumulada).

� Posteriormente, construir o histograma. Os.: Estes cálculos podem ser feitos,

automaticamente, por softwares, como o Excell e o Minitab (recomendado).

R = Xmáx – Xmín

K = 1 + 3,3 . log N

H = R / K

NK =

Tabelas de freqüências

Tabela mostra resultados de um grande levantamento de dados, distribuídos em faixas de variação (classes), que dará origem ao histograma.

20 30 = 20 inclusive até 30 exclusive (classe)

100200255060 70

75150408050 60

3570204040 50

30102030 40

1051020 30

FAiFRi (%)Classes Fi

15

5

FRAi (%)

Freqüências:

Fi= absoluta

FRi= relativa

FAi= acumulada

FRAi= relativa. acumul.

Histograma

Xi

3,5

4,4

5,3

6,2

4,4

5,3

6,2

7,1

7,1

8,0

0,8

1,7

1,7

-2,6

2,6

3,5

Fi

- -- - -- -

LIE = 0,7 LSE = 6,8

K = 8 classes, cada uma com amplitude H = 0,9 (1,7 – 0,8)

R = 8,0 – 0,8 = 7,2 (amplitude total)

LIE e LSE = limites de especificação (cliente)

Curvas de freqüências

� Representam um “histograma teórico”, numa condição limite em quea quantidade de dados é extremamente grande (tendendo a infinito).

Curva simétrica (forma de sino)

Fi

Xi

Fi

Xi

Diferentes tipos decurvas simétricas

alongada intermediária

achatada

Fi

XiCurva assimétrica à esquerda Curva assimétrica à direita

Fi

Xi

� Assimetria�Analisa a diferença entre média, mediana e moda (valor que tem a maior

freqüência, ou seja, o ponto de máximo da curva de freqüência).�Se eles forem iguais, a distribuição é simétrica.�Sendo diferentes, a distribuição é assimétrica, sendo essa assimetria à

direita (média > moda) ou à esquerda (média < moda).

�Coeficiente de assimetria α3 (skewness, no Minitab): α3 = 0 (simetria),α3 > 0 (assimetria à direita), α3 < 0 (assimetria à esquerda)

� Curtose

�Mede o grau de achatamento de uma distribuição simétrica, ou seja, se adistribuição é alongada, intermediária (ou normal), achatada.

�Coeficiente de curtose α4 (kurtosis, no Minitab): α4 = 0 (normal),α4 > 0 (alongada), α4 < 0 (achatada).

�Obs.: Esses conceitos podem ser visualizados, no slide anterior.

�Não recomendamos seus cálculos através das fórmulas, à mão, pelagrande dificuldade, daí estarmos indicando o Minitab (será visto à seguir).

Assimetria e Curtose

Curva da Distribuição Normal (Gauss)

� Gauss, propôs, há cerca de 150 anos atrás, que os valores de medição de uma dadacaracterística, tendem a uma distribuição, com um aspecto assemelhado com o dafigura, lembrando uma função exponencial, se o processo de trabalho for estável.Mais tarde, tendo sido validada essa conclusão, a curva de Gauss foi denominadaNormal, dado o fato de ser a mais normalmente encontrada na prática.

� O cálculo dos percentuais sob a curva foi tabelado, a partir da expressão: zi = (xi –x)2/S,chamada de escore reduzido da Distribuição Normal Tabela – Módulo complementar).

� Essa distribuição, teórica, é simétrica (média aritmética e mediana são iguais) e tem umaspecto de sino, sendo definida por 2 parâmetros: média e desvio padrão.

99,994%

99,73%

95,44%

68,26%

+1S

+2S

+3S

+4S

- 1S

- 2S

- 3S

- 4S

X

A figura mostra alguns percentuais sob a curva,

quando nos afastamos 1 ou 2 ou 3 ou 4 desvios padrões da

média (valor central), que serão importantes quando formos

interpretar as cartas de controle.

PPN = Papel de Probabilidade da Normal

�Objetivo: Analisar a eventual normalidade de um conjunto de dados.

�Construção: Plotar FRA, no eixo vertical, e os pontos médios das classes, Xi, no eixo horizontal (método trabalhoso e pouco preciso).

�Se der uma linha reta perfeita, os dados seguem uma distribuição Normal (teórica).

�Tendendo a uma reta, com pouca dispersão, temos uma distribuição Normal aproximada, podendo-se traçar uma reta média (estimada).

�O valor de Xi correspondente a FRA de 50% será a média (µ) e, de forma similar tem-se o desvio padrão (σσσσ), com ≅ 87%.

�O software Minitab constrói esse gráfico, com maior precisão (será visto depois).

FR

A(%

)

Pontos médios das classes

µµµµ

σσσσ

Apresentação do Minitab

� O Minitab é um dos melhores softwares estatísticos do mercado, estando já nasua versão 15.1 (mais atual). Ele tem o CEP como uma das opções de menu.

� Apesar de seu preço de compra não ser tão baixo, existe uma versão demo,free, que pode ser obtida na internet, com o endereço “minitab.com”, sendoválida por 30 dias (suficiente para conhecê-la). Vencido o prazo, para obter denovo, só em outra máquina.

� Nele, os dados a serem analisados são digitados numa planilha, semelhante àdo Excell, sendo que esses dados devem estar empilhados numa únicacoluna (default). A maioria dos comandos de seu menu (abrir, salvar, imprimir,copiar, colar, recortar, etc) é semelhante aos do Excell, facilitando seu uso.

�Vamos apresentar, a partir de agora, seus pontos e aplicações mais importantes, para uso no CEP (não será uma apresentação exaustiva).

�Vale acrescentar que o Minitab “conversa” com todos os itens do Office, da Microsoft, permitindo importar e exportar dados, por exemplo.

Janela de sessão e planilha

� Session (Janela de sessão): mostra adata e a hora da abertura do programa,além de uma mensagem de boas vindas,e tem por finalidade apresentar todos osresultados dos cálculos.

� Workshotsheet (Planilha): semelhanteao Excell, com linhas numeradas (1, 2, 3,etc) e colunas (C1, C2, C3, etc). Nela aprimeira linha, de cor cinza, é utilizadaapenas para se colocar textos (títulosindicativos dos dados da coluna).

� Nessa linha cinza poderá aparecer(espontaneamente), uma letra T,caracterizando que os dados digitados namesma representam textos, ou uma letraD, indicando que os dados são de datas(dias, meses, anos, etc). Nãoaparecendo nenhuma letra, significa quea coluna só tem dados numéricos.

Menus: Arquivo (File) e Editar (Edit)

� File (Arquivo) - Permite: Novo, Abrir, Salvar, Salvar como,Imprimir, Exportar e Importar (projetos, planilhas e gráficos),usando os comandos copiar/colar e, dessa forma, manipulararquivos.

� Edit (Editar) – Permite:Limpar células, deletar,copiar, recortar, colar, etc.

Menu: Dados (Data)

� Data (Dados) – Permite manipular dados: separar, fundir erefundir dados, empilhar (stack) e desempilhar colunas, transporcolunas (de horizontal para vertical), ordenar direta eindiretamente (sort), mudar o tipo de dado (ex.: texto paranúmero), etc.

Stack columns (Empilhar dados) - Janela da esquerda (stackcolumns, que aparece em quase todas as telas do Minitab), mostra as colunas que contém dados, a Janela superior (stack the followingcolumns) para selecionar as colunas a empilhar e sua parte inferior as condições para onde armazenar os dados empilhados (store stacked).

Colunas que se pode empilhar

Colunas escolhidas

Destinos escolhidos

Menu: Cálculos (Calc)

� Calc (Efetuando cálculos) – Este menu tem uma funçãocalculadora, semelhante à do Excell, e permite, ainda:fazer algumas estatísticas de coluna e de linha, gerardados aleatórios (random data), segundo escolha de umadistribuição, calcular distribuições de probabilidades.

� Calculator (Função calculadora) – A janela da esquerda permite selecionar colunas, a janela superior (store result) permite escolher coluna onde se quer armazenar resultados e a janela central, para criar uma expressão de cálculo.A janela inferior (functions) contém

várias funções, que podem ser usadas para criar a expressão.

Menu Calc: Estatística de colunas e geração de dados aleatórios de uma Normal

Column statistics (Estatística de colunas) -Indicar a estatística desejada, uma por vez, nas janelinhas (statistic) e selecionar a variável de interesse, que está na janela da esquerda, para a janela central (input variable).

Gerar dados aleatórios, de uma Normal -Indicar o número desejado de dados (janela generate rows), a coluna onde se quer colocar esses números (store), e fornecer valores para a média (mean) e para o desvio padrão (standard deviation).

Neste caso, queremos a soma, da coluna C1 (largura)

Menu: Cálculos estatísticos (Stat)

�Estatística básica (Basic statistics), que contém: estatística descritiva, sumário gráfico, intervalos de confiança, testes de hipótese, correlação e teste de normalidade.

�Análise de regressão (Regression), que contém: regressão linear (regression) e não linear (fitted line plot).

�Análise da variância (ANOVA), que contém: análise com 1 fator (one way) e com 2 fatores (two way), além de um teste de igualdade de variâncias (test for equal variances).

�Delineamento de experimentos (DOE), que contém: análise fatorial (factorial) e método de Taguchi.

�Cartas de controle do CEP (Control charts), que contém: várias cartas, para sub-grupos, para valores individuais e para atributos, além de outras cartas especiais (2ª. edição).

�Ferramentas da qualidade (Quality tools), que contém: gráfico de tendência (run chart), Pareto, espinha de peixe (cause and effect), análises de capacidade (capability analisys / capability sixpack), estudos de MSA (gage study).

Para cada opção, existem vários sub-tipos.

Menu: Construir gráficos (Graph)

�Diagrama de dispersão/correlação (Scatter plot))

�Matriz de dispersão (Matrix plot)

�Histograma (Histogram)

�Diagrama em caixa (Box plot)

�Gráfico em coluna (Bar chart)

�Gráfico setorial, ou “pizza” (Pie chart)

�Diagrama de série de tempo (Time series plot)

�Diagrama de área (Area graph)

�Diagrama de dispersão em 3 dimensões (3D scatterplot)

Para cada opção, existem vários sub-tipos.

Minitab: Gráfico de Pareto

Stat / Quality tools / Pareto chart

Escolher coluna, com tipos de

defeitos, indicada na janela da

esquerda (Pareto chart)

Escolher coluna, com

quantidades de defeitos, ou

custos, indicada na janela da

esquerda

�Na planilha, deve-se preencher/digitar pelomenos 3 colunas, com os dados (itens,freqüências obtidas desses itens, respectivoscustos (unitários e/ou totais).

�Utilidade do Pareto: fazer priorizações,sendo ferramenta auxiliar do CEP.

Pareto - Exemplo

C.Total 280,0 160,6 136,2 131,1 119,2 112,5 71,8

Percentual 27,7 15,9 13,5 13,0 11,8 11,1 7,1

% acumul. 27,7 43,6 57,0 70,0 81,8 92,9 100,0

Defeitos

Porosidade

Rebarba

Mancha

Furo grande

Risco

Ovalização

Resistência

1000

800

600

400

200

0

100

80

60

40

20

0

C.Total

Percentual acumulado

Pareto dos Defeitos

Minitab: Diagrama Espinha de Peixe

Stat / Quality tools / Cause and effectIndicar colunas das causas (1 para cada

“M”: mão de obra, máquina, método,

medição, material, meio ambiente, etc)

Efeito e Título

Sub-causas, para cada

“M” (opcional)

Espinha de peixe - Exemplo

Sucata

M.A.

MED.

MET.

M.P.

Maqu.

M.O.

Destreinada

Desmotiv ação

Falta

Sem. prev ent.

V elha

Dureza alta

A lta %S

Baixa %C

Umidade

A utoritarismo

Proc. v elho

Sem I.T.

Sem MSA

Lay out ruim

Falta luz

F alta cultura

Falta tempo

Falta tempo

Falta $

Causas da sucata - Abril/2009

Histograma

Graph / Histogram

Insira aqui a coluna com os dados

Escolher uma opção:

• Simples;

• Com ajuste;

• Linha externa e grupos;

•Ajuste e grupos.

Histograma

Frequency = FiPercent = FRi

Frequency, Accumulate = FAiPercent, Accumulate = FRAiOpção de traçar

linhas no gráfico

Opção de adicionar textos ao gráfico

Estudo da normalidade

Indicar variável

Melhor

Stat > Basic statistics > Normality test > Anderson Darling

Normal aproximada, quando Pvalue ≥ 0,05 (empírico)

Normal perfeita: Pvalue = 1

151413121110987

99,9

99

95

90

80

7060504030

20

10

5

1

0,1

Peso

Percentual acumulado (FRA)

Média 11,21

D.Padrão 1,135

N 200

P-Value <0,005

Plotagem de probabilidade do Peso (PPN)

Histograma e Normalidade - Exemplo

Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5 Amostra 6 Amostra 7 Amostra 865,25 65,39 70,94 67,83 64,38 69,53 72,38 78,0668,26 73,65 67,45 80,44 74,49 68,89 66,09 62,0758,74 71,33 69,66 67,46 72,22 79,50 65,40 68,4766,74 71,41 68,22 73,41 79,29 66,86 64,47 74,5958,62 69,47 67,19 67,65 72,92 81,34 71,90 63,46

Amostra 9 Amostra 10 Amostra 11 Amostra 12 Amostra 13 Amostra 14 Amostra 15 Amostra 1667,66 71,41 69,33 71,06 75,30 75,74 68,20 73,8867,35 68,73 67,80 70,29 68,47 71,07 64,41 68,8172,23 77,42 71,61 69,79 66,91 67,55 72,50 72,6275,57 69,83 62,38 78,70 67,27 69,03 78,05 74,9176,55 81,18 71,09 63,55 64,63 76,00 62,77 74,09

Amostra 17 Amostra 18 Amostra 19 Amostra 20 Amostra 21 Amostra 22 Amostra 23 Amostra 24 Amostra 2575,88 70,09 69,30 70,21 65,99 69,00 77,53 67,90 71,5872,26 69,37 72,86 55,93 63,95 60,89 60,29 72,08 71,7871,02 79,64 72,90 60,37 77,16 61,80 69,45 69,58 65,1768,27 68,94 72,88 69,31 74,38 65,48 66,55 65,23 70,1264,97 74,10 71,86 73,45 75,43 69,66 73,90 71,98 72,21

Medição do diâmetro de uma peça (mm), com micrômetro de 8% de

RR (característica crítica), em 25 amostras horárias, com 5 peças

cada (dados em Excell).

Dados são exportados para o Minitab e empilhados numa

única coluna (C1), e os nºs dasamostras na coluna C2

Sugestão: tentar resolver este exemplo, usando as fórmulas

dadas, à mão, e comparar seus resultados com os do Minitab,

que mostraremos a seguir.

Histograma e Normalidade - Exemplo

Histograma, com 125 dados, divididos em 10 classes, cada uma com

amplitude 3mm (H), tendo média de 70,03mm, desvio padrão de 4,97mm e amplitude total de 30mm (R = 84 – 54)

Os 125 dados, plotados no PPN (papel de probabilidade da Normal),

com baixa dispersão em torno da linha média, com um ótimo valor de Pvalue (≥ 0,05), caracterizando pois

uma distribuição Normal.

85807570656055

99,9

99

95

90

80

7060504030

20

10

5

1

0,1

Diâmetro

FRA (%)

Média 70,03

D.Padrão 4,967

N 125

P-Value 0,847

PPN do Diâmetro

847872666054

35

30

25

20

15

10

5

0

Diâmetro

Frequência

Média 70,03

D.Padrão 4,967

N 125

Histograma do Diâmetro

� O Minitab prepara, na Janela de Sessão, um relatório com diversos parâmetros amostrais e alguns gráficos (opção 1), além do sumário gráfico, já mostrado (opção 2).

Stat / Basic statistics / Display descriptive statistics (opção 1)

Colunas com os dados

Gráficos disponíveisEstatísticas disponíveis

Stat / Basic statistics / Graphycalsummary (opção 2)

Minitab – Estatística básica

Minitab – Estatística descritiva

Stat / Basic statistics / Display descriptive statistics

Estatísticas (Statistics) Gráficos (Graphs)

Estatísticas mais usadas

Gráficos mais usados

Estatística descritiva - Exemplo

85

80

75

70

65

60

55

Diâmetro

Boxplot do Diâmetro

Máximo = 81,34mm

Quartil 3 = 72,91mm

Mediana = 69,63mm

Quartil 1 = 67,22mm

Mínimo = 55,93mm

* = possível causa especial

Sumário gráfico - Exemplo

� Quando não se tem Normal, fazer o Sumário Gráfico, para ver se os dados seguem uma distribuição alongada (Assimetria = Skewness ≅ 0 e Curtose = Kurtosis > 0).

Stat > Basic statistic > Graphycal summary

847872666054

Mediana

Média

71,070,570,069,569,0

Quartil 1 67,228

Mediana 69,663

Q uartil 3 72,910

Máximo 81,342

69,152 70,910

69,001 71,089

4,418 5,673

P-V alue 0,847

Média 70,031

D.Padrão 4,967

A ssimetria -0,0810985

C urtose 0,0953710

N 125

Mínimo 55,932

Teste de normalidade de A nderson Darling

Interv . conf. da média popul. (95%)

Interv . conf. da mediana popul. (95%)

Interv . conf. do d. padrão popul. (95%)

Intervalos de confiança (95%)

Sumário gráfico do Diâmetro

Dados amostrais (estatística descritiva)

Dados populacionais

(estatística indutiva)

Assimetria ≅ 0 e curtose > 0

Exemplo do diâmetro (cálculos à mão)

� R = 81,34 – 55,93 = 25,41mm (amplitude total ou range)

� K = 1 + 3,3.log 125 ≅ 8 classes H = 25,41/8 = 3,20 ≅ 3,5mm (amplitude de classe)

Classes 55,5/59,0 59,0/62,5 62,5/66,0 66,0/69,5 69,5/73,0 73,0/76,5 76,5/80,0 80,0/83,5Frequ. 3 6 16 34 36 17 10 3

[ ] 4,98125.70,03616103,46.124

1S

2=−=

83,576,569,562,555,5

40

30

20

10

0

Diâmetro

Frequência

Média 70,03

D. Padrão 4,967

N 125

Histograma�Média = 8753,89 / 125 ≅ 70,03mm onde: ΣXi = 8753,89

�D. Padrão =

onde: ΣXi2 = 616103,46

�Obs: notar que existem pequenas diferenças, em relação ao Minitab, pois as fórmulas, citadas nos slides 2, 3 e 4, são apenas aproximadas.

Fim do Módulo 2