probabilidade e estatistica probabilidade e estatistica

Upload: lexulian

Post on 17-Oct-2015

303 views

Category:

Documents


4 download

TRANSCRIPT

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    1

    CENTRO UNIVERSITRIO DE ARARAQUARAUNIARA

    Probabilidade e Estatstica:Anotaes de aula

    Unidade 1 - Introduo

    O engenheiro resolve problemas de interesse da comunidade pela aplicaoeficiente dos mtodos cientficos. Essa resoluo pode ser o refinamento deum produto ou de um processo j existente, seja pela elaborao do projeto deum novo produto ou processo que atenda as necessidades dos consumidores.

    Mtodo de Engenharia ou cientfico a abordagem para formular e resolverproblemas. As etapas no mtodo de engenharia so dadas a seguir:

    1. Desenvolver uma descrio clara e concisa do problema.2. Identificar, ou tentar identificar, os fatores importantes que afetam esse

    problema ou que possam desempenhar um papel na soluo.3. Propor um modelo para o problema, usando conhecimento cientfico.

    Estabelecer limitao ou suposio do modelo.4. Conduzir experimentos apropriados e coletar dados para testar ou validar as

    concluses das etapas 2 e 3.5. Manipular o modelo de modo a ajudar o desenvolvimento da soluo do

    problema.6. Confirmar se a soluo proposta para o problema efetiva e eficiente.7. Tirar concluses ou fazer recomendaes baseadas na soluo do problema..

    Os engenheiros tm que saber planejar os experimentos, coletar dados,

    analisar, interpretar e entender como os dados observados esto relacionadoscom o modelo que eles propuseram para o problema em estudo.

    O campo da Estatstica lida com a coleta, apresentao, anlise e uso dosdados para tomar decises, resolver problemas e planejar produtos eprocessos. Os mtodos Estatsticos ajudam a entender a variabilidade presenteno dia a dia.Sabemos que sucessivas observaes de um sistema ou fenmeno noproduzem o mesmo resultado.

    Exemplo1: Considere o consumo de combustvel de um automvel. Ele varia.

    Essa variabilidade depende de muitos fatores:Tipo de estradaMudana nas condies do veculo ao longo do tempo ( desgaste de vlvulas,compresso do motor, desgaste dos pneus, marca ou octanagem da gasolinausada)Condies climticas.

    A Estatstica fornece uma estrutura para descrever essa variabilidade eapreender quais fontes potenciais de variabilidade so mais importantes e temmaior impacto no desempenho do consumo de gasolina.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    2

    Exemplo 2: Um engenheiro est projetando um conector de nylon para serusado em uma aplicao automotiva. O engenheiro estabelece comoespecificao do produto uma espessura de parede de 3/32 polegadas, masest inseguro com relao ao efeito desta deciso na fora de remoo doconector. Ele sabe que se a fora for muito baixa o motor pode falhar quando

    for instalado no motor. O que ele faz? Trabalha com 8 unidades do prottipomedindo suas foras de remoo ( libras-p): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5;12,6; 13,1. Todos foram produzidos igualmente, mas a variabilidade estpresente. Qual a mdia?______________Surge uma nova questo: Se aumentar a parede aumenta a fora de remoo?Novo experimento conduzido para responder a questo e mais 8 prottiposso construdos.Medidas da fora de remoo: 12,9; 13,7; 12,8; 13,9; 14,2; 13,2 ; 13,5 e13,1.Mdia? _____Cada vez que surgem novas questes, novos experimentos e conseqente uso

    da Estatstica para fazer a deciso.

    Raciocnio Estatstico:

    Melhoria da qualidade na produo

    Tipos de Estudos:

    Estudos enumerativos: faz a contagem das caractersticas de interessepresente na populao.

    Estudos analticos: envolvem a realizao de alguma ao num processopara melhorar o desempenho no futuro. Ex: investigao dos resultados de umprocesso de produo ou de servios.

    Foco de um estudo analtico:{

    }Estatstica

    Estatstica Descritiva: Estatstica Inferencial:

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    3

    Unidade 2- Coleta de Dados

    A- Dados:informao numrica necessria para ajudar a tomar deciso

    (Levine, Berenson e Stephan, 2000). Podemos ter dados de umapopulao ou de uma amostra.B- Populao: totalidade dos itens ou objetos produzidos ou considerados.

    Parmetro:medida calculada para descrever uma caracterstica de todaa populao.

    C- Amostra:parte da populao selecionada para anlise. Estatsticas,no plural, somedidas calculadas para descrever caractersticas deuma amostras. Tipos de amostras:no probabilsticas e Amostrasprobabilsticas.

    C.1. Amostras no probabilsticas:Amostragem por julgamento, amostragem

    por quota, etcAmostragem por julgamento um tipo de amostragem no-probabilstica queutiliza o julgamento do pesquisador para a seleo dos elementos da amostra,ou seja, com base em sua experincia e criatividade, o pesquisador escolhe oselementos que julga serem representativos ao estudo. um mtodo rpido ebarato, mas que apresenta como limitao a impossibilidade de se inferirparmetros da populao.

    Amostragem por quota uma amostragem por julgamento realizada em doisestgios. No primeiro estgio faz se a distribuio das quotas de modo que a

    proporo de elementos com caractersticas relevantes na amostra seja amesma que a proporo de elementos na populao com estascaractersticas.No segundo estgio esses elementos so escolhidos porjulgamento, como no caso anterior.

    C.2. Amostras probabilsticas: tem seus elementos escolhidos com base emprobabilidades conhecidas.

    Amostra Aleatria simples: composta por elementos retirados ao acaso dapopulao. Todo elemento da populao tem igual probabilidade de serescolhido para a amostra. Para se fazer uma amostra casual simples deve-se

    fazer uma listagem de todos os elementos da populao e obter os elementosda amostra por sorteio, tabela de nmeros aleatrios ou gerao de nmerosaleatrios por computador.

    Exemplo de amostra casual simples:De uma lista de 450 produtos sortearuma amostra de 50 deles para recebimento de um tratamento especial.

    Amostra sistemtica: Os seus elementos so escolhidos por um sistema.Para se fazer uma amostra sistemtica de c % da populao, buscamos oprimeiro elemento da amostra por sorteio entre os 100/cprimeiros elementoslistados da populao. Os outros elementos so localizados a cada 100 / c

    posio na populao.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    4

    Exemplo: Numa certa regio foram catalogados e numerados todos os 540produtos de uma indstria. Selecionar uma amostra de 2% desta populao.Soluo:

    1- Em primeiro lugar fazemos uma lista dos 540 elementos destapopulao.

    2- Efetuamos a diviso 100% / 2% = 50.3- Sorteamos o primeiro elemento da amostra entre 1 e 100 / 2 = 50.Imagine que neste sorteio tenhamos obtido o nmero 30. Isto significa que otrigsimo produto o primeiro elemento de minha amostra. Os demaiselementos so escolhidos a cada 50 elementos.

    4- Assim faro parte da amostra os produtos de nmero: 30, 80, 130,180, 230, 280, 330, 380, 430, 480 e 530.

    5- Sero ao todo em nmero de 11 os indivduos desta amostra.

    Exercicio:Numa populao de 1500 elementos selecionar os elementos que

    vo compor uma amostra para que ela 5% da populao.

    Amostra estratificada: aplicada quando a populao se divide em sub-populaes ou estratos, sendo razovel supor que a caracterstica de interesseapresente um comportamento mais ou menos homogneo dentro de cadaestrato e substancialmente diverso de estrato para estrato.

    A amostra estratificada pode ser:- uniforme, quando sorteado igual nmero de elementos em cada

    estrato;- proporcional se o nmero de elementos sorteados em cada estrato

    for proporcional ao nmero de elementos existentes no estrato.

    Amostra de convenincia formada por elementos que o pesquisador reuniusimplesmente porque dispunha deles. Se um profissional da sade tomar seuspacientes para estudar determinado problema estar usando uma amostra deconvenincia. O pesquisador que utilizar amostras de convenincia deve termuito senso crtico para que seus resultados no sejam tendenciosos.

    Unidade 3 - Variveis aleatrias

    Variveis aleatrias:fenmenos ou caractersticas que geram dados que oresultado da observao dessas variveis. As variveis aleatrias podem ser

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    5

    A- Variveis aleatrias categricas expressas por qualidades ou atributos.Dados obtidos a partir de uma varivel categorizada so interpretadoscomo tendo sido medidos numa escala nominal ou numa escala ordinal.

    Uma escala nominal classifica os dados em categorias distintas, nas quais

    nenhum ordenamento est implcito.Exemplo: produto: defeituoso (sim, no); qualidade do acabamento ( especial,bom, razovel, ruim); falhas nos componentes(sim,no).

    Uma escala ordinalclassifica os dados em categorias distintas, nas quais estimplcita uma ordenao. uma forma mais robusta de mensurao do que aescala nominal, uma vez que um valor observado classificado em umacategoria possui maior quantidade de determinada propriedade do que umvalor observado em outra categoria. ainda uma forma precria demensurao, uma vez que a escala ordinal no leva em conta a quantidade dediferenas entre as categorias. O ordenamento, do mais baixo para o mais alto,implica somente qual categoria maior, melhor ou preferida, embora nodiga o quanto.

    Exemplo:Satisfao do produto (muito insatisfeito, relativamente insatisfeito,neutro, relativamente satisfeito, muito satisfeito)

    B- Variveis aleatrias numricas: produzem respostas numricas. Asvariveis numricas so subdivididas em variveis discretas e contnuas.

    Variveis aleatrias discretas: apresentam valores numricos obtidos porcontagem. Exemplo: nmero de arranhes nos itens inspecionados, nmero

    de bits transmitidos com erro, nmero de defeitos por pea, nmero dereclamaes recebidas.

    Variveis aleatrias contnuas: produzem respostas numricas que surgemde um processo de mensurao. Exemplo: corrente eltrica, presso,voltagem, temperatura, altura, comprimento, tempo, peso, etc.

    Os dados oriundos de uma varivel numrica so medidos em uma escalaintervalar ou em uma escala de razo.

    Uma escala intervalarconstitui uma escala ordenada, na qual a diferena

    entre mensuraes uma quantidade significativa embora no envolva umverdadeiro ponto zero.

    Exemplo: Temperatura ( em graus Celsius ou Farenheit que tm origem emzeros artificiais); Resultado de um exame padronizado,teste de aptido(ACT ouSAT).

    Uma escala de razoconstitui uma escala ordenada, na qual a diferena entremensuraes envolve um ponto zero verdadeiro, como o caso da altura,peso, volume, presso, velocidade, brilho, tempo decorrido.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    6

    Unidade 4: Descrio de dados

    Sumrios e apresentao de dados so essenciais ao bom julgamentoestatstico. Permitem ao engenheiro focar nas caractersticas mais importantesdos dados; discernir acerca do modelo que deveria ser usado na soluo do

    problema.A - Diagrama de ramos e folhas: apresentao visual informativa de umconjunto de dados x1 , x2, ..., xn, em que cada nmero xiconsiste em, nomnimo, dois dgitos.Etapas para construir um diagrama de Ramos e Folhas:

    1- Divida cada nmero xiem duas partes: um ramo, consistindo de um oumais dgitos iniciais, e uma folha consistindo dos dgitos restantes.

    2- Liste os valores do ramo em uma coluna vertical.3- Ao lado do ramo registre a folha para cada observao.4- Escreva as unidades para os ramos e folhas no grfico.5- aconselhvel escolher entre 15 e 20 ramos.

    Exemplo: Resistncia Compresso em libras por polegada quadrada (psi) de80 corpos de prova da liga de alumnio ltio, submetida avaliao como umpossvel material para elementos estruturais de aeronaves. Os dados foramregistrados medida que os testes iam sendo realizados e assim eles nocontm muita informao a respeito da resistncia compressiva.

    105 221 183 186 121 181 180 14397 154 153 174 120 168 167 u141245 228 174 199 181 158 176 110163 131 154 115 160 208 158 133207 180 190 193 194 133 156 123134 178 76 167 184 135 229 146218 157 101 171 165 172 158 169199 151 142 163 145 171 148 158160 175 149 87 160 237 150 135196 201 200 176 150 170 118 149

    Questes como que percentagem dos corpos de prova cai abaixo de 120

    psi?, no so fceis de serem respondidas sem antes construir umaapresentao mais efetiva para os dados.

    O diagrama de ramos e folhas(abaixo) capacita a determinar rapidamentealgumas caractersticas importantes dos dados, que no estavam bvias.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    7

    Ramo Folha Frequncia7 6 18 7 19 7 110 5 1 2

    11 5 8 0 312 1 0 3 313 4 1 3 5 3 5 614 2 9 5 8 3 1 6 9 815 4 7 1 3 4 0 8 8 6 8 0 8 1216 3 0 7 3 0 5 0 8 7 9 1017 8 5 4 4 1 6 2 1 0 6 1018 0 3 6 1 4 1 0 719 960934 620 7 1 0 8 4

    21 8 122 1 8 9 323 7 124 5 1

    Numa Inspeo rpida possvel perceber que

    A maioria das resistncias compresso est entre 110 e 200psi.

    Um valor central est entre 150 e 160 psi.

    As resistncias esto distribudas aproximadamente de forma simtricaem torno de um valor central.

    B- Apresentao de dados em tabelas.

    A partir do diagrama de ramos e folhas (acima) possvel representar os dadosem uma tabela

    Resistncia compresso Freqncia Freqncia %70 | 90 02 2/80*100=2, 50

    90 |110 03 3, 75110 |130 06 7, 50130 |150 14 17, 50150 | 170 22 27, 50170 |190 17 21,25190 |210 10 12, 50210 |230 04 5, 00230 |250 02 2, 50Total 80 100,00

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    8

    C- Histogramas. A partir do diagrama de ramos e folhas (acima) tambm possvel representar os dados em um Histograma. Para construir umhistograma ( intervalos de classes iguais):

    Traar inicialmente o sistema de eixos cartesianos. Apresentar as classes no eixo das abscissas, marcando os seus

    limites.Traar barras retangulares com bases iguais, correspondendo aosintervalos de classe e com alturas determinadas pelas respectivasfreqncias (ou freqncias relativas percentuais).

    Exerccios de fixao

    1-Um fabricante de semicondutores produz dispositivos usados como unidades

    de processamento central em computadores pessoais. A velocidade, em

    megahertz, do dispositivo importante porque ela determina o preo que o

    fabricante pode cobrar pelos dispositivos.A tabela seguinte contm medidas de

    120 dispositivos.

    a) Construa um diagrama de ramos e folhas para esses dados e comente

    sobre importantes caractersticas que voc note.

    b) Monte uma distribuio de frequncias para esses dados.

    c) Faa um histograma para representar esses dados.

    680 669 719 699 670 710 722 663 658 634 720 690

    677 669 700 718 690 681 702 696 692 690 694 660

    649 675 701 721 683 735 688 763 672 698 659 704

    681 679 691 683 705 746 706 649 668 672 690 734

    652 720 660 695 701 724 668 698 668 660 680 739

    717 727 664 637 660 693 679 682 724 642 704 695

    704 652 710 702 661 720 695 670 656 718 660 648

    683 723 653 680 684 705 681 748 697 703 660 722

    662 644 683 695 678 678 656 667 683 691 680 685681 715 665 676 665 675 655 659 720 675 697 663

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    9

    2-Um artigo em Technometrics apresenta os seguintes dados sobre as taxas

    de octanagem de combustvel para motor, de varias misturas de gasolina:

    88,5 98,8 89,6 92,2 88,4 92,7 87,5 90,9

    94,7 88,3 90,4 83,4 92,6 87,9 87,8 89,9

    84,3 90,4 91,6 91,0 93,7 93,0 88,3 91,8

    90,1 91,2 90,7 88,2 96,5 94,4 89,2 89,7

    89,0 90,6 88,6 88,5 84,3 90,4 92,3 92,2

    89,8 92,2 88,3 93,3 93,2 91,2 88,9

    91,6 87,7 94,2 87,4 88,6 86,7 89,8

    90,3 91,1 85,3 91,1 88,7 94,2 92,7

    90,0 86,7 90,1 90,5 92,7 90,8 93,3

    91,5 93,4 89,3 100,3 89,3 90,1 86,7

    89,9 96,1 91,1 87,6 91,0 91,8 91,o

    a) Construa um diagrama de ramos e folhas para esses dados e comente

    sobre importantes caractersticas que voc note.

    b) Monte uma distribuio de frequncias para esses dados.

    c) Faa um histograma para representar esses dados.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    10

    Unidade 5- Software de apoio

    Planilha eletrnica Microsoft Excel, uma ferramenta verstil para manipular eanalisar dados numricos.

    Vantagens do uso do Excelsobre os pacotes estatsticos:

    1- Essa planilha possui recursos estatsticos expressivos (funes,ferramentas, grficos, etc).

    2- Apresenta uma interface funcional mais intuitiva para a maioria dosusurios do que os programas estatsticos ( Statistica, Minitab, SPSS,SAS, etc), que quase sempre exigem dos usurios o uso de comandosmuito semelhantes aos comandos de uma linguagem de programao.

    3- A maioria dos programas estatsticos composta por ferramentascriadas especialmente para quem j possui conhecimento na rea.

    4- Um pacote estatstico no est sempre disponvel.

    Vantagens dos pacotes estatsticos sobre o Excel:

    1- Eles, em sua maioria, fornecem uma variedade muito maior deprocedimentos estatsticos do que o Excel (Minitab, por exemplo).

    2- Tm a disposio informaes complementares ou opcionais que noesto disponveis no Excel.

    Preparando o Excel 2007: Carregar as Ferramentas de Anlise

    1. Clique no Boto do Microsoft Office e, em seguida, clique em

    Opes do Excel.

    2. Clique em Suplementos.

    3. Na caixa Gerenciar, clique em Suplementos do Excele, em seguida,clique em Ir.

    4. Na caixa Suplementos disponveis, siga um destes procedimentos:

    Para carregar as Ferramentas de Anlise, marque a caixa de seleo

    Ferramentas de Anlisee clique em OK.

    Para incluir as funes do Visual Basic for Applications (VBA) para

    Ferramentas de Anlise, marque a caixa de seleo Ferramentas de

    Anlise - VBAe clique em OK. Se Ferramentas de Anliseou

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    11

    Ferramentas de Anlise - VBAno constar na lista da caixa

    Suplementos disponveis, clique em Procurarpara localizar o item.

    5. Se for exibida uma mensagem informando que as Ferramentas de Anlise

    no esto instaladas no computador, clique em Simpara instal-las.

    Depois que voc carregar as Ferramentas de Anlise, o comando Anlise

    de Dadosestar disponvel no grupo Anliseda guia Dados.

    Preparando o Excel 1997- 2003: Carregar as Ferramentas de Anlise

    Preparando o Excel 1997-2003 para o trabalho estatstico:

    Dentro da planilha Excel, abra o menu ferramentase verifique seno final da barra do menu aparece a alternativa Analisar dados.

    Se a alternativa Analisar Dados estiver na barra do menuFerramentas significa que ao iniciar o Excel todas as funes eferramentas necessrias so incorporadas planilha. Aperte o botoCancelar.

    Se a alternativa Analisar Dados no constar do menuFerramentas, proceda da seguinte maneira: abra o menu Ferramentas eescolha Suplementos. O Excel apresentar uma caixa de dilogo com ossuplementos disponveis. Escolha Ferramentas de Analisee pressione oboto OK.

    Como teste, abra o menu Ferramentas e verifique no final da barrado menu a incorporao da alternativa Analisar Dados.

    Histograma no Excel 2007.

    1) Em uma planilha, digite seus prprios dados, da seguinte maneira:

    a) Em uma coluna, digite os dados de entrada (dados numricos

    quantitativos) um em cada clula, pois a ferramenta Histogramano funciona com dados numricos qualitativos).

    b) Em outra coluna, digite, em ordem crescente, os limites

    superiores das classes. Caso no sejam fornecidos, a

    ferramenta Histograma criar automaticamente esses limites, o

    que no recomendado. Se desejar, adicione um rtulo na

    primeira clula dessas colunas.

    2) Na guia Dados, no grupo Anlises, clique em Anlise de Dados.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    12

    3) Na caixa Ferramentas de Anlise, clique em Histogramae, em

    seguida, clique em OK.

    4) Em Entrada, na caixa Intervalo de Entrada, digite a referncia de

    clula do intervalo de dados que voc deseja analisar.

    5) Em Entrada, na caixa Intervalo do bloco, digite a referncia de

    clula para um intervalo que contm um conjunto opcional de valores

    de limite que definem intervalos de classes.

    6) Se tiver includo rtulos de coluna quando selecionou os dados de

    entrada e de intervalo de classes, marque a caixa de seleo

    Rtulos.

    7) Em Opes de sada, siga um destes procedimentos:

    a. Para colar a tabela de sada na mesma planilha, clique em

    Intervalo de Sadae digite areferncia da clula superior

    esquerda da tabela de sada.

    b. Para inserir uma nova planilha na pasta de trabalho atual e

    colar a tabela de sada comeando pela clula A1 da nova

    planilha, clique em Novo Mdulo de Planilha.

    c. Para criar uma nova pasta de trabalho e colar a tabela de

    sada em uma nova planilha na nova pasta de trabalho,

    clique em Nova Pasta de Trabalho.

    8) Em Opes de sada, execute um ou todos os procedimentos a

    seguir:

    a. Para apresentar os dados na tabela de sada em ordem de

    freqncia decrescente, marque a caixa de seleo Pareto

    (histograma classificado).

    b. Para gerar uma coluna de tabela de sada para porcentagens

    cumulativas e incluir uma porcentagem cumulativa no grfico

    de histograma, marque a caixa de seleo Porcentagem

    Cumulativa.

    c. Para gerar um grfico de histograma incorporado, marque a

    caixa de seleo Sada do Grfico. Este o que

    escolhemos neste caso.

    http://appendpopup%28this%2C%27xldefcellreference_3%27%29/http://appendpopup%28this%2C%27xldefcellreference_3%27%29/
  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    13

    9) Clique em OK.

    10) Para alterar a exibio do grfico, clicar com o boto direito do mouse

    em cima da barra do histograma. Na caixa de dilogo que se abre,

    selecionar a ltima opo formatar srie de dados. Emopes de

    srie escolher largura do espaamento entre as barrase digitar 0

    %. Fechar a caixa de dilogo.Quando clicar no histograma, voc

    poder usar o design, o layout e as opes de formato das

    Ferramentas de Grficopara alterar a exibio do grfico. Para obter

    mais informaes sobre como alterar o design e o formato de um

    grfico, consulte os links da seo Consulte tambm.

    Resistncia compresso( em psi) Freqncia

    90 2110 4130 5150 16170 21190 17210 9230 4

    250 2

    0

    5

    10

    15

    20

    25

    90 110 130 150 170 190 210 230 250 Mais

    Freqncia

    Resistncia compresso

    Histograma

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    14

    Para resumir um conjunto de dados ()

    Unidade 6- Resumos Numricos

    A- Medidas de Tendncia ou Posio Central:

    Mdia aritmtica: denotada por x , a medida de tendncia central maisutilizada. Para uma amostra contendo um conjunto de nobservaes x1, x2,...,xn, a mdia aritmtica calculada dividindo-se a soma dos valores de x pelonmero de observaes.

    Mediana: o valor que ocupa a posio central de uma srie de n

    observaes, quando estas esto ordenadas de forma crescente oudecrescente. A mediana uma medida de localizao. Ela divide a disposioordenada pela metade (50% das observaes so maiores e 50% dasobservaes so menores que a mediana).

    Para um nmero par de observaes a mediana a mdiaaritmtica dos elementos centrais.

    Para um nmero mpar de dados(n), a mediana o valor que ficano centro dos dados ordenados, isto , o valor da varivel queocupa o posto (n+1)/2.

    Moda o valor mais freqente de um conjunto de dados.

    Exemplo1:Um engenheiro est projetando um conector de nilon para serusado em uma aplicao automotiva. Ele estabelece como especificao doprojeto uma espessura de parede de 3/32 polegada, mas no est seguro doefeito desta deciso na fora de remoo do conector. Se a fora de remoofor muito baixa, o conector pode falhar se ele for instalado no motor. Oitounidades do prottipo so produzidas e suas foras de remoo so medidas,

    resultando os seguintes dados(em libras/p): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5;12,6; 13,1.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    15

    A mdia = 104/8=13 A mediana dos dados ordenados ( 12,3; 12,6; 12,6; 12,9; 13,1; 13,4;

    13,5; 13,6) dada pela mdia aritmtica dos termos centrais=( 12,9 +13,1)/2=13.

    A moda 12,6 ( valor de maior freqncia).

    Mdia de intervalo: a mdia entre a menor e a maior observao.

    Mdia de intervalo .B- Medidas de posicionamento

    Quartis: medidas descritivas que dividem os dados ordenados em quatropartes (conjuntos).

    Primeiro quartil (Q1) o valor que faz com que 25% das observaes sejammenores e 75% sejam maiores que ele.

    Segundo Quartil ou mediana (Q2) o valor que faz com que 50% dasobservaes sejam menores e 50% sejam maiores que ele.

    Terceiro Quartil (Q3) o valor que faz com que 75% das observaes sejammenores e 25% sejam maiores que ele.

    Para calcular os quartis, so usadas as frmulas de ponto deposicionamento a seguir:

    Q1= valor correspondente observao ordenada .

    Q2= valor correspondente observao ordenada() .

    Q3= valor correspondente observao ordenada() .

    As regras abaixo sero usadas para obter o valor dos quartis:

    1- Se o ponto de posicionamento um inteiro, o quartil a observaonumrica correspondente quele posicionamento.

    2- Se o ponto de posicionamento estiver na metade entre dois nmerosinteiros, o quartil a mdia dos respectivos valores.

    3- Se o ponto de posicionamento no um nmero inteiro e nem est nomeio de dois inteiros, faz-se o arredondamento para o inteiro maisprximo e seleciona o valor numrico da observao correspondente comoo quartil.

    Primeiro quartil (Q1) = 12,6

    ( segundo elemento da srie, pois (n+1)/4= 9/4= 2,25 que se arredonda para2).

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    16

    Segundo Quartil ou mediana (Q2) = 13(pois (n+1)/2= 4,5 e o quartil a mdia entre o quarto e o quinto valor numricoda srie, ou seja, (12,9+13,1)/2=13).

    Terceiro Quartil (Q3)=13,5(stimo elemento da srie, pois 3(n+1)/4= 27/4=6,75 que se arredonda para 7).

    Mdia das Juntas ou Midhinge a mdia entre o primeiro e terceiro quartil.

    Mdia das Juntas ou Midhinge = Q1= primeiro quartil; Q3= terceiro quartil.

    Mdia das Juntas ou Midhinge=(12,6+13,5)/2=13,05.

    C- Medidas de Tendncia Central no Excel

    Para realizar os clculos com as medidas de posio, o Excel dispe dasseguintes funes estatsticas: MEDIA, MED e MODO.

    MEDIA(nm1;nm2;...;nm30): retorna o valor da mdia dos valores.

    MED(nm1;nm2;...;nm30):retorna o valor da mediana dos valores.

    MODO(nm1;nm2;...;nm30):retorna o valor da moda dos valores.

    Se os dados forem registrados em uma planilha basta informar o intervalo, porexemplo, MEDIA (A1: A8) no lugar de toda a seqncia nm1; nm2;...;nm30, que podem ser selecionados arrastando o mouse.

    i. Medidas de Localizao no centrais no Excel.

    Para ordenar um conjunto de valores em ordem crescente, basta digit-losnumacoluna e clicar no boto Classificao crescente que se situa no MenuIncio.

    .A funo estatstica QUARTIL (srie de dados; quartil) d como resultado o

    elemento do conjunto de observaes correspondente ao quartil definido,

    identificado da seguinte maneira:

    Se quartil = 0 o resultado o menor valor do conjunto de dados.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    17

    Se quartil =1 o resultado da funo o primeiro quartil.

    Se quartil =2 o resultado da funo o segundo quartil.

    Se quartil =3 o resultado da funo o terceiro quartil.

    Se quartil = 4 o resultado o maior valor do conjunto de dados.

    Procedimento para encontrar os quartis:

    1- Digite o conjunto de dados.

    2- Abrir o assistente de funo fx.

    3- Em selecione uma categoria, escolha Estatstica.

    4- Em selecione uma funo, escolha QUARTIL (OK).

    5- Em Matriz selecione ao conjunto de dados.

    6- Em quarto, escolha 1, 2 ou 3.

    Unidade 7 - Medidas de Disperso

    Medidas de Disperso: so medidas estatsticas utilizadas para avaliar o graude variabilidade, ou disperso, dos valores em torno da mdia.

    7.1. Amplitude total ou intervalo:mede a disperso total no conjunto dedados, sem contudo, levar em conta a maneira como os dados sedistribuem entre o menor e o maior valor.

    Amplitude = XmaxX min

    No exemplo dado acima a amplitude =13,6-12,3= 1,3.

    7.2. Amplitude interquartil a diferena entre o terceiro e o primeiroquartil.

    Amplitude interquartil = Q3Q1

    Esta medida considera a disperso nos dados que esto entre os 50% deobservaes centrais da srie de dados (entre o primeiro e o terceiro quartis)e,deste modo, no , de maneira alguma influenciada por valores extremos.

    No exemplo dado acima a amplitude interquartil = 13,512,6= 0,9.

    7.3. Varincia amostral: representada por s, pode ser definida pelasoma dos quadrados dos desvios dividida por n-1. Os estatsticos

    chamam o valor n - 1 de nmero de graus de liberdade.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    18

    ( ) Dados

    xi

    Desvios

    (xi - x )

    Quadrados dos desvios

    (xi - x )2

    12,3 (12,3- 13) (-0,7)=0,4912,6 (12,6-13) (-0,4)=0,1612,6 (12,6-13) (-0,4)=0,1612,9 (12,9-13) (-0,1)=0,0113,1 (13,1-13) (0,1)=0,0113,4 (13,4-13) (0,4)=0,1613,5 (13,5-13) (0,5)=0,2513,6 (13,6-13) (0,6)=0,36

    x = 13 (xi - x ) = 0 (xi - x )2= 1,6

    ( ) 7.4. Desvio padro da amostra: representado pelo smbolo s, a raiz

    quadrada da varincia da amostra, expressa do seguinte modo:

    ( )

    A varincia e o desvio padro medem a disperso mdia em torno da mdiaaritmtica, isto , como as observaes maiores flutuam acima dela e asobservaes menores se distribuem abaixo dela.

    7.5. Coeficiente de Variao: umamedida de disperso relativa.

    Interpretao: Se C.V. < 15% h baixa disperso.

    Se 15% < C.V. < 30% h mdia disperso.Se C.V. >30% h elevada disperso.

    7.6. Escore padronizado para uma medida xi e deteco de outliers. Um escore zi negativo indica que a observao xiest esquerda da mdia;positivoindica que a observao xiest direita da mdia; maior do que 3 em

    valor absoluto indica que a observao xi foge das dimenses esperadas(outlier).

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    19

    Exerccios:

    1-Foram feitas oito medidas do dimetro (em mm) interno de anis forjados de

    pisto de um motor de um automvel. Os dados codificados so: 1, 3, 15, 0, 5,2, 5 e 4.a) Calcule as medidas de tendncia central para estes dados e interprete-os.b) Calcule as medidas de disperso para estes dados e interprete-os.

    2-Os dados a seguir se referem ao consumo de oxignio (ml/kg/min) para umaamostra de 10 bombeiros em uma simulao de supresso de incndio:

    29,5 49,3 30,6 28 28 26,3 33,9 29,4

    a)Dar o consumo mdio de oxignio.b)Dar o consumo mediano.c)Dar o consumo modal.d)Calcular a varincia e o desvio padro.e)Calcular e interpretar o coeficiente de variao.

    Unidade 8Medidas de Assimetria

    Medidas de Assimetria: referem-se forma da curva de uma distribuio de

    freqncias, mais especificamente do polgono de freqncia ou dohistograma.

    a) Curva ou Distribuio de Freqncias Simtrica: quando a mdia,mediana e moda so iguais.

    x = Me = MoGraficamente:

    x = Me = Mob) Curva ou Distribuio de Freqncias Assimtrica Positiva:

    predominam valores superiores moda.

    x > Me > MoGraficamente:

    Fi

    Classe

    Fi

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    20

    c) Curva ou Distribuio de Freqncias Assimtrica Negativa:predominam valores inferiores moda.

    x < Me < MoGraficamente:

    Primeiro coeficiente de Pearson:(mdiamoda)/desvio padro.

    Segundo Coeficiente de Assimetria de Pearson

    As = 0Distribuio Simtrica

    As > 0Assimetria Positiva

    As < 0Assimetria Negativa

    Unidade 9: Medidas de curtose

    Curtose indica o grau de achatamento de uma curva de freqncias emrelao a uma curva padro, denominada curva normal.De acordo com o grau de curtose, podemos ter trs tipos de curvas defreqncia.

    a) Curva ou Distribuio de Freqncias MesocrticaQuando a curva de freqncias apresenta um grau de achatamento

    equivalente ou da curva normal.

    Mo Me x Classe

    x Me Mo

    Fi

    Classe

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    21

    b) Curva ou Distribuio de Freqncias PlaticrticaQuando uma curva de freqncias apresenta um alto grau de

    achatamento, superior ao da normal.

    c) Curva ou Distribuio de Freqncias LeptocrticaQuando uma curva de freqncias apresenta um alto grau de afilamento,superior ao da normal.

    Se k = 0, 263 Curva ou distribuio mesocrticak > 0, 263 Curva ou distribuio platicrtica

    k < 0, 263 Curva ou distribuio leptocrtica

    Exerccio: O ultra-som foi usado para obter informaes sobre dados decorroso na espessura da chapa do assoalho de um reservatrio usado paraarmazenar leo bruto. Cada observao a maior profundidade do orifcio naplaca, expressa em milipolegadas.

    40 52 55 60 70 75 85 85 90 90

    92 94 94 95 98 100 115 125 125 127Classificar o conjunto de dados quanto assimetria e quanto curtose.

    Unidade 10 - BOX PLOT ou Diagrama de caixas.

    Diagrama de caule e folhas e histograma conduzem a impresses gerais sobreum conjunto de dados, enquanto um nico valor como mdia ou desvio padro

    Curva Platicrtica

    Curva Mesocrtica

    Curva Leptocrtica

    1090

    13 2/)(

    CC

    QQk

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    22

    enfoca apenas um aspecto dos dados. Nos ltimos anos um resumo

    esquemtico denominado Box plot vem sendo usado para descrever as

    caractersticas mais proeminentes de conjuntos de dados.

    Estas caractersticas incluem: centro, disperso, a extenso e a natureza de

    qualquer desvio em relao simetria e a identificao de outliers, observa

    es que normalmente esto distantes da maior parte dos dados. Como

    apenas um outlier pode afetar drasticamente os valores da mdia e do desvio

    padro, um Box plot baseado em medidas resistentes presena de

    alguns outliers: mediana e quartis.

    O Box plot mais simples tem base no seguinte resumo de cinco nmeros:

    menor, primeiro quartil, mediana, terceiro quartil e maior.

    Para fazer um Box plot:

    1- Desenhar um eixo de medida horizontal.

    2- Coloque um retngulo sobre o eixo: a extremidade inferior do retngulo

    estar posicionada no primeiro quartil e a extremidade superior do retngulo

    estar posicionada no terceiro quartil.

    3- Trace um segmento de reta vertical dentro do retngulo na posio da

    mediana.

    4-Usando a amplitude interquartlica, AIQ = Q3Q1 calcule os limites para o

    grfico ( 1,5 AIQ abaixo de Q1 e 1,5 AIQ acima de Q3. Os dados fora destes

    limites so os outliers. Os limites so sempre calculados mas podem no estar

    desenhados no Box plot.

    5-As linhas tracejadas so desenhadas a partir dos lados do retngulo at os

    valores menores e maiores dentro dos limites calculados.

    Exerccios:

    1- Considere as 20 observaes a seguir ordenadas da menor para a maior,

    cada uma representando a vida til (em horas) de determinado tipo de lmpada

    incandescente:

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    23

    612 623 666 744 883 898 964 970 983 1003

    1016 1022 1029 1058 1085 1088 1122 1135 1197 1201

    a) Classificar o conjunto de dados quanto assimetria e quanto curtose.

    b) Fazer um Box plot.

    2-Os efeitos de descargas parciais na degradao de materiais de cavidades

    isolantes tm importantes implicaes na vida til de componentes de alta

    voltagem. Consideremos a seguinte amostra de larguras de pulso de

    descargas lentas em uma cavidade cilndrica de polietileno.

    5,3 8,2 13,8 74,1 85,3 88 90,2 91,5 92,4

    92,9 93,6 94,3 94,8 94,9 95,5 95,8 95,9 96,6

    96,7 98,1 99 101,4 103,7 106 113,5 115 116

    a) Classificar o conjunto de dados quanto assimetria e a curtose.

    b) Fazer um Box plot.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    24

    Unidade 11- Medidas de Disperso no Excel

    Para realizar clculos com medidas de disperso, o Excel dispe das funes

    VAR, VARP, DESVPAD, DESVPADP e CURT.

    Tem tambm a ferramenta de anliseEstatstica Descritiva.VAR(nm1, nm2, ...) retorna o valor da varincia da amostra.

    VARP(nm1, nm2, ...) retorna o valor da varincia da populao.

    DESVPADP(nm1, nm2, ...) retorna o valor do desvio padro da populao.

    DESVPAD(nm1, nm2, ...) retorna o valor do desvio padro da amostra.

    CURT(nm1, nm2, ...) retorna o valor do coeficiente de curtose e o seu

    resultado deve ser interpretado da seguinte maneira:

    Se o resultado for DISTORO(nm1, nm2, ...) retorna o valor do coeficiente de assimetria e oseu resultado deve ser interpretado da seguinte maneira:

    Se o resultado

    for

    Unidade 12- Estatstica Descritiva no Excel

    Para usar esta ferramenta: preparar inicialmente a planilha de dados.Acrescentar as seguintes informaes:

    Intervalo de Entrada: selecionar os dados digitados.Agrupado por: selecionamos colunas, pois os dados foram registrados emcoluna.

    Rtulos: selecionar rtulos na primeira linha.

    Em Opes de sada devemos informar o endereo da clula inicial a partir daqual a ferramenta de anlise apresentar os resultados.

    Escolhendo o parmetro Resumo Estatstico, a ferramenta de anlise

    apresenta o resumo estatstico completo.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    25

    Fora deremoo Fora de remoo

    12,6

    12,9 Mdia 1313,4 Erro padro 0,16903085112,3 Mediana 1313,6 Modo 12,613,5 Desvio padro 0,47809144412,6 Varincia da amostra 0,22857142913,1 Curtose -1,558375

    Assimetria-

    0,115040754Intervalo 1,3

    Mnimo 12,3Mximo 13,6Soma 104Contagem 8

    Exerccios

    1- Os seguintes dados so medidas de viscosidade para um produto qumico

    observado de hora em hora.

    47,9 48,0 48,9 47,9 43,2 43,6 43,647,9 48,6 48,6 48,3 43,0 43,3 43,248,6 48,8 48,0 48,5 43,5 43,0 43,548,0 48,1 47,5 48,1 43,1 42,8 43,048,4 48,3 48,6 48,0 43,0 43,1 49,148,1 47,2 48,0 48,3 42,9 43,2 42,3

    a) Calcular as medidas de disperso.

    1.Fazer um diagrama de ramos e folhas.2. Montar uma distribuio de freqncias para estes dados.

    3. Fazer um histograma para estes dados.

    4. Fazer um Box Plot.

    5. Interpretar os resultados.

    2- Os dados mostrados a seguir representam o rendimento de 90 bateladas

    consecutivas de um substrato cermico, no qual um revestimento de metal foiaplicado por um processo de deposio a vapor.

  • 5/27/2018 Probabilidade e Estatistica Probabilidade e Estatistica

    26

    94,1 86,1 95,3 84,9 88,8 84,6 94,4 84,1 89,1 83,193,2 90,4 94,1 78,3 86,4 83,6 96,1 83,7 88,3 96,890,6 89,1 97,8 89,6 85,1 85,4 98,0 82,9 95,6 97,391,4 87,3 93,1 90,3 84,0 89,7 85,4 87,3 82,6 90,688,2 84,1 86,4 93,1 93,7 87,6 86,6 86,4 86,4 86,7

    86,1 90,1 87,6 94,6 87,7 85,1 91,7 84,5 86,6 87,395,1 95,2 94,1 96,3 90,6 89,6 87,5 91,2 93,2 88,292,4 86,1 92,1 94,7 89,4 90,0 84,2 83,0 92,4 84,192,4 94,3 96,4 91,1 88,6 90,1 85,1 85,0 94,3 90,5

    a) Calcular as medidas de disperso.

    b) Fazer um diagrama de ramos e folhas.

    c) Montar uma distribuio de freqncias para estes dados.

    d) Fazer um histograma para estes dados.

    e) Fazer um Boxplot.f) Interpretar os resultados.