Análise e apresentação de resultados
Armando Traini FerreiraJose Jorge Chaguri Junior
Heber Martins de PaulaRodrigo Argenton Freire
Osmar da Silva Laranjeiras
IC043 Metodologia de pesquisa e redação científica
Universidade Estadual de Campinas - Unicamp
Medidas e Probabilidade• A medição é um procedimento no qual um pesquisador atribui
números (números ou outros símbolos) para propriedades empíricas (variáveis) de acordo com as regras que estão intimamente ligadas às abordagens de pesquisa.
• Esta apresentação enfoca estes níveis de medições a fim de preparar o terreno para a próxima parte que são as análises dos resultados.
• E fornece uma introdução sobre probabilidade que é um termo importante entender em testar a sua hipótese de pesquisa.
Análise de Resultados
Níveis de Medidas
Escala Nominal Ex.: Matrículas de
automóveis, códigos postais
Escala Ordinal Ex.: Escala social
Escala Métrica
Escala Intervalar – Ex.: escalas de
temperatura Celsius e Fahrenheit
Escala de razão Ex.: escalas de razão são
a idade, salário, preço
Probabilidade e Estatística
Análise de Resultados
ProbabilidadeA história da teoria das probabilidades, teve início com os jogos de cartas, dados e de roleta. A teoria da probabilidade permite que se calcule a chance de ocorrência de um número em um experimento aleatório.• Experimento Aleatório
– É aquele experimento que quando repetido em iguais condições, podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve cálculo de experimento aleatório.
• Espaço Amostral– É o conjunto de todos os resultados possíveis de um experimento aleatório. A
letra que representa o espaço amostral, é S.
A Probabilidade dirá se as diferenças nos resultados são devidos à sua manipulação das variáveis, como previsto pelo sua hipótese de pesquisa
ou se as diferenças são apenas devido à flutuações aleatórias.
• Usamos a palavra 'provavelmente' quase todos os dias para expressar nossos pontos de vista sobre determinado coisas. Considere as seguintes afirmações:1 - Provavelmente vai chover na próxima semana.2 - Eu provavelmente vou visitar o meu amigo amanhã.3 - Com certeza vou passar no meu exame de matemática.
• O termo 'Probabilidade' é definido como a porcentagem que ocorre um evento em um número de vezes. É calculado para determinar a direção de seu estudo.
Conceito de Probabilidade
Se em um fenômeno aleatório as possibilidades são igualmente prováveis, então a probabilidade de ocorrer um evento A é:
𝑃 ( 𝐴)=n úmero de casos favor á veisn ú mero de casos poss í veis
• A análise de dados tem as suas raízes no positivismo lógico e por isso é uma categoria descritiva;
• A análise de dados em forma de gráficos, tabela, equações, deve ser descrita ao longo da pesquisa e não se recomenda analisá-la somente ao término da dissertação/tese;
• No caso de várias análises na revisão bibliográfica recomenda-se uma análise abrangente relacionando as análises anteriores ao final da tese/dissertação.
Análise de dados
• Após a análise dos dados de formato descritivo, partir para a teorização e estabelecer conexões de modo a interpretar um dado ou fenômeno além da descrição;
• Os dados coletados devem ter uma inter-relação e numa perder o foco com o problema da pesquisa;
• Coletar e analisar dados que tenham “afinidade” com a questão ou problema
Análise de dados
Fonte: www.ime.unicamp.br
Análise de dados
Ranking da ONU: China 101 – Brasil 84
Análise de dados
Análise de dados exploratóriosAnálise de dados exploratórios Codificação de perguntas abertas
Registro de informações
Estatísticas descritivas
Distribuição de frequência
Medidas de tendências centrais
Desvio padrão
Distribuição normal
Etapas antes e depois das estatísticas inferenciais
Estatística inferencial (bivariada)
O teste t
O teste qui-quadrado
Coeficiente de correlação Spearman rank
Coeficiente de correlação de momento produto Pearson
Codificação de perguntas abertas
• Utilização em questionários postais, ou entrevistas;• Separação das questões em códigos em função de ideias e
temas;• Utiliza-se as seguintes etapas:
Etapa 1
Juntar todas as respostas similares
Etapa 2
Dividir os grupos em sub-categorias – estabelecer códigos
Etapa 3
Definir métodos de análise
Registro de informações
• Coloca em uma planilha os códigos correspondes das respostas de questionários (abertas ou fechadas);
• Avalia-se as questões por números correspondentes:
Método de estatística descritiva
• Frequência de distribuição
– Tabulação– Gráfico de barras (histogramas)– Gráfico pizza
Método de estatística descritiva
• Medição de tendências centrais
– Média– Mediana– Modo
Método de estatística descritiva
• Medição de dispersão baseada na média
– Desvio Médio– Desvio padrão– Distribuição Normal
Dispersão baseada na média
• Descreve o quanto os dados analisados distam de um valor central (média)
• Também chamado de variabilidade
Medidas de dispersão
Desvio (absoluto) médio
Variância
Desvio Padrão
Desvio (absoluto) médio Média dos desvios absolutos
Variância Média do quadrado dos desvios
Desvio Padrão Raiz quadrada da variância
ou variabilidade
¿∑(𝑋 −𝑋 ´ )
𝑁
¿∑(𝑋 −𝑋 ´ )²
𝑁
¿√ ∑(𝑋 −𝑋 ´ )²𝑁
(25,28,23,18,31,27)
X´= média aritmética das
amostras
X´ =
Ex. X´ = 25,33
Desvio Padrão
¿∑ √( 𝑋−𝑋 ´ ) ²𝑁
Porque é a raiz quadrada da variância?• Valores positivos• Mesma medida dos dados fornecidos inicialmente
Distribuição NormalInforma sobre a dispersão ou distribuição de determinado dado.
Princípios (Nachmias and Nachmias, 1996):
1. Simétrico e curva em forma de sino
2. A média, modo e meio coincidem no centro da distribuição
3. A curva é baseada em um infinito número de observações
4. Uma única fórmula matemática permite descrever como as
frequências se relacionam com o valor da variável
5. Regra 68%, 95%, 99,7% (1SD, 2SD, 3SD)
68% 95% 99,7%
Método de estatística inferencial• Métodos para estimar a respeito das propriedades de uma
população amostral baseando-se nas informações obtidas de
uma amostra.
• Permite estabelecer relações de causa-efeito, estimativas e
diferenças entre grupos.
Paramétricos
• Exigem uma distribuição normal, principalmente com amostras menores de 30
• Acima de 30, a curva aproxima-se da distribuição normal.
Ex. (t-test)
Não-Paramétricos
• Não necessita de requisitos como a normalidade. Indicados para amostras pequenas
• Amostra com distribuição não normal.
• Conclusões mais conservadoras
Ex. (chi-square test)
Método de estatística inferencial1. Formulação da hipótese
Municípios maiores de 300.000 hab. apresentam maiores índices de
alfabetismo do que municípios com menos de 300.000
2. Hipótese nulaNão existe relação entre o tamanho (em habitantes) do município e o índice de
alfabetismo.
3. Escolha do tipo de testeParamétricos ou não-paramétricos
4. Cálculo e resultado das estatísticas do testeManualmente ou através de um software (SPSS, Minitab, Stastmaster)
5. Observar significância ou não do teste.Após o cálculo estatístico deve-se analisar o resultado obtido com uma tabela
estatística referente ao tipo de teste aplicado.
Cada tabela possui valores críticos para qual o resultado obtido de ve ser
comparado.
Se o valor do teste for menor do que o valor crítico, então os resultados
encontrados não são significantes.
Tabela para o teste t
Grau de liberdade
• Utilizado para encontrar os valores críticos em uma tabela.
• Determinado pelo número exato de elementos em uma amostra, ou número de elementos – 1, ou pelo número de categorias.
Teste t : exemplo
Amostra 1 (Contrato pelo sistema projeto e
construção)
Amostra 2(Contrato normal)
564 505521 557445 465560 458480 530540 480585 665426 525530 605475 495
Valores em R$/m²
X1´= R$512.60 X2´= R$528.50
Teste t : exemplo1. Formulação da hipótese
O custo por m² de contratos do tipo tradicional é mais alto do que o modelo
projeto-construção.
2. Hipótese nulaNão existe diferença significativa entre os dois tipos de projeto.
3. Escolha do tipo de teste tComparação entre duas amostras
Amostras em distribuição normal
4. Cálculo e resultado das estatísticas do teste
X1´ = Média da amostra 1
X2´ = Média da amostra 2
SD1 = Desvio padrão da amostra 1
SD2 = Desvio padrão da amostra 2
n1 e n2 = n° de elementos da amostra 1 e 2
Teste t : exemplo5. Análise do resultado
Verifica-se o grau de liberdade por:
Teste t : exemplo
Para se confirmar a hipótese, portanto, valor de t deve ser
maior do que o valor crítico de 2.10
No entanto,
¿ 2.10
A hipótese não pode ser aceita.
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Mês R$ / m2
mai/11 5568jun/11 5616jul/11 5732
ago/11 5955set/11 6065out/11 6123nov/11 6190dez/11 6223jan/12 6291fev/12 6402mar/12 6346abr/12 6340
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Que dados obter?• Média?• Desvio Padrão?• Correlação?...Pergunta: Qual a tendência de preços para o final do ano?
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000
5200
5400
5600
5800
6000
6200
6400
6600
R$ / m2
R$ / m2
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000
5200
5400
5600
5800
6000
6200
6400
6600
f(x) = 2.51729565247805 x − 96716.138513868R² = 0.904875822359211
R$ / m2
R$ / m2Linear (R$ / m2)
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Conclusões:• Tendência de crescimento? Alta• Valor provável dez /12:• P = 76,829 (18) – 5571,5 ≅ R$ 6954,00• R2?
Pergunta: E se fosse outra curva?
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
1 2 3 4 5 6 7 8 9 10 11 125000
5200
5400
5600
5800
6000
6200
6400
6600
f(x) = − 7.33391608391608 x² + 172.16958041958 x + 5349.06818181818R² = 0.980202656252514
R$ / m2
R$ / m2Polynomial (R$ / m2)
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Conclusões:• Tendência de crescimento? Queda• Valor provável dez /12: ≅ R$ 6072,00• R2 = 0,9802
E assim por diante ...
Análise de Dados – Teste Qi Quadrado - AderênciaExemplo: Existe dependência entre o número de filhos e a renda
da família?
N° de filhos Renda
(R$) 0 1 2 >2 Total< R$ 2.000 25 17 40 53 135R$ 2.000 a R$ 5.000 35 20 10 10 75
> R$ 5.000 11 12 9 8 40TOTAIS 71 50 61 71 250
Análise de Dados – Teste Qi Quadrado – Aderência
N° de filhos Renda
(R$) 0 1 2 >2 Total< R$ 2.000 38 28 31 38 135R$ 2.000 a R$ 5.000 21 15 17 21 74
> R$ 5.000 11 8 9 11 40TOTAIS 71 52 59 71 250
Proporção esperada: (71*135)/250 ≅ 38
Análise de Dados – Teste Qi Quadrado – Aderência
No caso em questão: (Excel)=TESTE.CHI(intervalo_real;intervalo_esperado)≅ 0,000213% < 5% => NÃO HÁ DEPENDÊNCIA!
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Mês R$ / m2
mai/11 5568jun/11 5616jul/11 5732
ago/11 5955set/11 6065out/11 6123nov/11 6190dez/11 6223jan/12 6291fev/12 6402mar/12 6346abr/12 6340
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
Que dados obter?• Média?• Desvio Padrão?• Correlação?...Pergunta: Qual a tendência de preços para o final do ano?
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP
May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000
5200
5400
5600
5800
6000
6200
6400
6600
R$ / m²
R$ / m2
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m2 imóveis venda bairro Lapa - SP
May/11 Jun/11 Jul/11 Aug/11 Sep/11 Oct/11 Nov/11 Dec/11 Jan/12 Feb/12 Mar/12 Apr/125000
5200
5400
5600
5800
6000
6200
6400
6600
f(x) = 2.51729565247805 x − 96716.138513868R² = 0.904875822359211
R$ / m2
R$ / m2Linear (R$ / m2)
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP
Conclusões:• Tendência de crescimento? Alta• Valor provável dez /12:• P = 76,829 (18) – 5571,5 ≅ R$ 6954,00• R2?
Pergunta: E se fosse outra curva?
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP
1 2 3 4 5 6 7 8 9 10 11 125000
5200
5400
5600
5800
6000
6200
6400
6600
f(x) = − 7.33391608391608 x² + 172.16958041958 x + 5349.06818181818R² = 0.980202656252514
R$ / m²
R$ / m2Polynomial (R$ / m2)
Análise de Dados – Correlações - Linha de TendênciaExemplo: Evolução Preços m² imóveis venda bairro Lapa - SP
Conclusões:• Tendência de crescimento? Queda• Valor provável dez /12: ≅ R$ 6072,00• R2 = 0,9802
E assim por diante ...
Análise de Dados – Teste Qi Quadrado - AderênciaExemplo: Existe dependência entre o número de filhos e a renda
da família?
N° de filhos Renda
(R$) 0 1 2 >2 Total< R$ 2.000 25 17 40 53 135R$ 2.000 a R$ 5.000 35 20 10 10 75
> R$ 5.000 11 12 9 8 40TOTAIS 71 50 61 71 250
Análise de Dados – Teste Qi Quadrado – Aderência
N° de filhos Renda
(R$) 0 1 2 >2 Total< R$ 2.000 38 28 31 38 136R$ 2.000 a R$ 5.000 21 15 17 21 74
> R$ 5.000 11 8 9 11 40TOTAIS 71 52 59 71 250
Proporção esperada: (71*135)/250 ≅ 38
Análise de Dados – Teste Qi Quadrado – Aderência
No caso em questão: (Excel)=TESTE.CHI(intervalo_real;intervalo_esperado)≅ 0,000213% < 5% => NÃO HÁ DEPENDÊNCIA!
BIBLIOGRAFIADANTAS, Carlos Alberto "Testes Qui-Quadrado: Aderência e Independência" - 2010 – USP, disponível no site: www.zapimoveis.com.br acessado.em13/05/2012,.às10:00h.
NAOUM, Shamil. Dissertation Research and Writing for Construction Students. Londres: Elsevier, 2007.
ONU – Organização das Nações Unidas, disponível no site www.onu.org. site visitado em 13/05/2012, às 18h00
RICHARDSON, R. J. Pesquisa Social: Métodos e Técnicas. São Paulo: Atlas, 1999.
Instituto de Matemática e estatística. Disponível em: www.ime.unicamp.br. Acesso em: 14/05/2012
Stanford. The Normal Distribution. Disponível em: http://www-stat.stanford.edu/~naras/jsm/NormalDensity/NormalDensity.html. Acesso em 14/05/2012