análise discriminante
TRANSCRIPT
-
Anlise Discriminante
MCTD 2010/11
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante (AD)
Mtodo estatstico multivariado utilizado para descobrir as caractersticas que melhor distinguem os membros de diferentes grupos (2 ou +), de modo que ao conhecer as mesmas caractersticas de um novo indivduo, seja possvel prever a que grupo pertence.
Mtodos Complexos de Tomada de Deciso
-
Objectivos
Identificar variveis que melhor discriminam entre 2 ou mais grupos;
Criar uma funo discriminante que represente as diferenas entre os grupos;
Classificao a priori de novos indivduos.
Mtodos Complexos de Tomada de Deciso
-
Exemplo 1
Um psiclogo social pode estar interessado em identificar as variveis que discriminam entre funcionrios de uma empresa que apresentam Alta Vs. Baixa Produtividade no trabalho;
A identificao das variveis e a construo da funo discriminante permitiria prever a produtividade de novos candidatos atravs da anlise das mesmas variveis.
Mtodos Complexos de Tomada de Deciso
-
Exemplo 2
Um psiclogo forense responsvel pelo acompanhamento de presos, pode estar interessado em prever quais os indivduos que apresentam maior risco de reincidirem aps terem sido libertados.
Mtodos Complexos de Tomada de Deciso
-
Exemplo 2 (cont.)
Atravs do conhecimento de dados tais como a idade, o nmero de condenaes prvias e o grau de abuso de drogas, seria possvel analisar se existe uma combinao ponderada entre estas variveis que permita discriminar (funo discriminante) aqueles que sero de novo condenados, aps obterem a liberdade, daqueles que no sero condenados.
Com base na funo discriminante seria possvel prever o risco de reincidncia de novos presos atravs da anlise das variveis includas na funo;
Mtodos Complexos de Tomada de Deciso
-
AD Vs. MANOVA
A AD pode considerar-se como uma MANOVA invertida;
MANOVA
Manipulao de um ou + factores (VI) de forma a investigar o seu efeito na(s) VD(s).
Se existir um efeito significativo podemos prever (parcialmente) o resultado da VD se soubermos a que grupo pertence o indivduo;
Anlise Discriminante
Atravs do conhecimento de uma ou + variveis pretendemos discriminar a pertena a diferentes grupos;
Se houver um efeito discriminante podemos prever a que grupo pertence o indivduo ao conhecermos os valores das variveis;
Mtodos Complexos de Tomada de Deciso
-
AD Vs. Regresso Linear
Ambas as tcnicas procuram fazer predies com base num conjunto de variveis;
Regresso Linear
Previso do resultado de uma VD com base nos valores das variveis preditoras;
Anlise Discriminante
Classificao (prever a pertena a um determinado grupo) a priori de um indivduo com base nos valores das variveis com poder discriminante;
Mtodos Complexos de Tomada de Deciso
-
Etapas na AD
AD Descritiva: utilizao de casos cuja pertena a diferentes grupos conhecida de forma a desenvolver uma funo discriminante que permita classificar a pertena a essas mesmas categorias;
AD Preditiva: Utilizao da funo discriminante em novos casos, de modo a prever a pertena a diferentes categorias.
Mtodos Complexos de Tomada de Deciso
-
Pressupostos
Distribuio Normal Multivariada;
Homogeneidade das matrizes de varincia-covarincia;
Existncia de diferenas significativas entre os grupos.
Multicolinearidade.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Uma VD de tipo qualitativo (categorias/grupos);
Uma ou + VI de tipo quantitativo;
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Considere o seguinte caso:
Existem diferenas significativas a nvel da satisfao com salrio e com o trabalho entre funcionrios de diferentes categorias profissionais: Tcnicos; Dirigentes; Chefias.
Mtodos Complexos de Tomada de Deciso
-
Chefias
TcnicosDirigentes
A varivel Trabalho permite discriminar a categoria dos Tcnicos das outras duas.
Os Tcnicos sentem-se menos satisfeitos com o Trabalho que
os chefes ou dirigentes.
Contudo no permite discriminar entre os
chefes e os dirigentes. No existem
diferenas a nvel da satisfao com o
Trabalho.
-
Chefias
TcnicosDirigentes
A varivel Salrio permite discriminar a categoria das
Chefias das outras duas.
Os Chefes sentem-se mais satisfeitos com o Salrio que os
dirigentes ou tcnicos.
Contudo no permite discriminar entre os
tcnicos e os dirigentes. No
existem diferenas a nvel da satisfao
com o Salrio
-
Anlise Discriminante
Considere o seguinte caso:
A varivel Trabalho permite discriminar os Tcnicos das outras categorias;
A varivel Salrio permite discriminar os Chefes das outras categorias;
Ser possvel encontrar uma funo que nos permite discriminar ao mximo as trs categorias profissionais utilizando as duas variveis: Salrio e Trabalho?
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
A anlise discriminante procura encontrar um novo eixo que permita discriminar ao mximo os trs grupos:
O eixo definido pela Funo discriminante.
Mtodos Complexos de Tomada de Deciso
-
D1 = 0.07Trabalho + 0.1Salrio- 6.117
D2 = 0.097Trabalho - 0.072Salrio- 0.302
Chefias
TcnicosDirigentes
O novo eixo consegue discriminar melhor as
trs categorias profissionais.
criada uma segunda funo discriminante para ajudar na
discriminao entre os grupos.
-
Anlise Discriminante
Caso:
Qual ou quais das dimenses de Satisfao permitem discriminar melhor a avaliao global do clima social da Organizao?
Ser possvel a partir do conhecimento dos ndices das variveis prever o tipo de avaliao feita pelo funcionrio (baixa ou alta)?
Analisar primeiro as diferenas com a MANOVA.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Mtodos Complexos de Tomada de Deciso
Distribuio Normal das VIs
No se verifica o pressuposto de distribuio normal Multivariada, uma vez que a varivel Trabalho no apresenta distribuio normal (p = .02).
-
Anlise DiscriminanteAnalyze
ClassifyDiscriminant
VD Qualitativa (Categoria Profissional)
VIs Quantitativas (Salrio, Trabalho)
Mtodos Complexos de Tomada de Deciso
-
Anlise DiscriminanteMtodo de Seleco de Variveis
Enter: Todas as variveis em anlise so introduzidas na funo discriminante (independentemente do poder discriminante)
Stepwise: Mtodo que selecciona automaticamente as variveis com capacidade discriminativa (mtodo hbrido dos mtodos Forward e Backward)
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Statistics
MeansMedidas descritivas
Univariate ANOVAsAnovas univariadas para cada VI
Boxs MTeste de homogeneidade da matriz de varincia-covarincia
Fishers CoefficientsCoeficientes estandardizados
Unstandardized CoefficientsCoeficientes no estandardizados
Mtodos Complexos de Tomada de Deciso
-
Anlise DiscriminanteMethod
Critrios de Seleco de variveis no mtodo Stepwise:
Wilks Lambda: As variveis so introduzidas (ou removidas) no modelo consolante a sua incluso diminui significativamente (ou no) o valor de lambda.
Quanto menor o valor de Lambda, maiores as diferenas entre os grupos.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Classify
Summary TablePercentagem de casos correctamente classificados
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Univariate ANOVAs
Variveis com poder discriminante significativo. Esta tabela apresenta o clculo de One-Way ANOVAs para cada uma das Vis.
Existem diferenas a nvel da categoria profissional para a varivel Salrio ( = .388; F(2, 98) = 77.394, p=.000)) e Trabalho ( = .314; F(2, 98) = 107.208, p=.000))
A varivel Trabalho a que apresenta o maior poder discriminante ( = .314).
Correco do nvel de Significncia
O p-value deve ser comparado com /n de Vis.
= 0.05/2 = 0.025
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Homogeneidade da Matriz de Varincia-Covarincia
Teste M de Box
p > .05
Verifica-se o pressuposto de Homogeneidade da matriz de varincias-covarincias (M=2.286; F(6, 99983.151) = .369, p=.899).
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Procedimento Stepwise
Indica em cada passo que variveis foram includas na funo discriminante.
No procedimento Stepwise as variveis so introduzidas na funo por decrescente de poder discriminante (so includas as variveis que reduzem o valor do Lambda de Wilks).
Todas as variveis introduzidas no modelo (no mtodo Stepwise) tm um poder discriminante significativo.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante Nem todas as variveis com poder discriminante significativo necessitam de
ser includas na anlise;
As variveis so includas na funo por ordem decrescente de poder discriminante. Apesar de algumas apresentarem um poder discriminante significativo podem no trazer nada de novo ao modelo em comparao com as que j foram includas e deste modo so excludas;
Outra razo possvel para a no incluso de variveis com poder discriminante significativo o facto de poderem estar significativamente correlacionadas com as variveis j includas. Assim sendo as variveis seriam redundantes e portanto dispensveis.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Eigenvalue ()Medida do grau em que a funo realmente discrimina entre as categorias (permite verificar at que ponto os grupos diferem na respectiva funo). Quanto maior o maior o poder discriminante do modelo.
= 0 : O modelo no apresenta poder discriminante.
% of VariancePercentagem de varincia que explicada pelas funes discriminantes (o total sempre 100%)
O nmero de funes discriminantes sempre igual ao n de Grupos menos 1
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Significncia da Funo Discriminante: Lambda de Wilks Medida inversa do grau de diferenciao: quanto menor o seu valor maior o grau de diferenciao.
0 < < 1
A funo que apresentar o menor a mais significativa.
p < O poder discriminante da funo estatisticamente significativo
H0: As mdias dos grupos so iguais na funo.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Mtodos Complexos de Tomada de Deciso
A primeira funo discrimina significativamente os 3 grupos ( = .135; X2(4)=195.340, p=.000). A segunda funo discrimina significativamente os 3 grupos ( =.518; X2(1)= 64.226, p=.000).
A primeira funo explica 75.3% da variabilidade entre os grupos ( = 2.837)enquanto que a segunda funo explica apenas 24.7% ( = .932).
-
Anlise Discriminante
Coeficientes estandardizados
Contribuio de cada varivel para a discriminao entre as categorias.
Permitem-nos comparar directamente o peso relativo de cada varivel na funo discriminante.
A varivel Trabalho (d1=.813) a que apresenta maior contributo na funo 1, enquanto que a varivel Salrio a que apresenta maior contributo na funo 2 (d2=.812).
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Coeficientes no estandardizados
Funes discriminantes.
D1 = .070 * Salrio + .100 * Trabalho 6.117
D2 = .097 * Salrio - .072 * Trabalho - .302
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Coordenadas dos centrides
Valor da mdia da funo discriminante para cada uma das categorias.
Quanto mais afastados, maior a diferena entre as categorias.
Cada caso classificado segundo a proximidade aos centrides.
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Coeficientes das funes de classificaoPermitem criar as funes de classificao
O nmero de funes igual ao nmero de grupos existentes.
Atravs da funo possvel prever a que grupo pertence um novo caso
Para cada novo caso e conhecendo os valores das variveis possvel resolver cada uma das funes. O grupo daquela que apresentar o valor mais elevado o grupo ao qual pertence o novo caso. Deste modo possvel classificar a priori novos casos.
F Chefias= .706 * Salrio + .703 * Trabalho 34.899
F Dirigentes = .387 * Salrio + .706 * Trabalho 22.840
F Tcnicos= .344 * Salrio + .313 * Trabalho 8.493
Mtodos Complexos de Tomada de Deciso
-
Anlise Discriminante
Resultados das Classificaes
Permite avaliar o sucesso da funo discriminante.
A percentagem de casos classificados correctamente com a classificao original foi de 92.1%. O modelo criado classificou com maior preciso o grupo Tcnicos (96.7%).
Mtodos Complexos de Tomada de Deciso
-
Exerccio
Verifique que dimenses do constructo de Imerso melhor discriminam entre os sexos.
Nota: Utilizar a base de dados: Dbase_exerc;
Mtodos Complexos de Tomada de Deciso