tomada de decisÃo sob risco: um estudo do game show … · as teorias mais conhecidas sobre o...
Post on 09-Nov-2018
214 Views
Preview:
TRANSCRIPT
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
INSTITUTO COPPEAD DE ADMINISTRAÇÃO
DANIELLE BRITO SANTIAGO
TOMADA DE DECISÃO SOB RISCO: um estudo das escolhas dos participantes
do “Topa ou Não Topa”
RIO DE JANEIRO
2012
1
DANIELLE BRITO SANTIAGO
TOMADA DE DECISÃO SOB RISCO: um estudo do game show “Topa ou Não
Topa”
Dissertação de Mestrado apresentada ao Programa
de Pós-Graduação em Administração do Instituto
COPPEAD de Administração da Universidade
Federal do Rio de Janeiro, como parte dos
requisitos à obtenção de título de Mestre em
Administração (M.Sc.).
Orientador: Marcos Gonçalves Avila, Ph.D
Co-orientadora: Beatriz Vaz de Melo Mendes, Ph.D
RIO DE JANEIRO
2012
2
S235t
Santiago, Danielle Brito
Tomada de decisão sob risco: um estudo do game show “Topa ou não topa” /
Danielle Brito Santiago. -- Rio de Janeiro: UFRJ, 2012.
76 f.: il.; 31 cm.
Orientador: Marcos Gonçalves Avila
Dissertação (mestrado) – Universidade Federal do Rio de Janeiro – UFRJ,
Instituto COPPEAD de Administração, 2012.
1. Tomada de decisão. 2. Processo decisório. 3. Administração – Teses. I.
Avila, Marcos Gonçalves. II. Universidade Federal do Rio de Janeiro, Instituto
COPPEAD de Administração. III. Título.
CDD: 658.403
3
DANIELLE BRITO SANTIAGO
TOMADA DE DECISÃO SOB RISCO: um estudo do game show “Topa ou Não
Topa”
Dissertação de Mestrado apresentada ao Programa
de Pós-Graduação em Administração do Instituto
COPPEAD de Administração da Universidade
Federal do Rio de Janeiro, como parte dos
requisitos à obtenção de título de Mestre em
Administração (M.Sc.).
Aprovada por:
_____________________________________________________________
Marcos Gonçalves Avila, Ph.D – Orientador
(Instituto COPPEAD de Administração - UFRJ)
_____________________________________________________________
Beatriz Vaz de Melo Mendes, Ph.D – Co-orientadora
(Instituto de Matemática Aplicada / Instituto COPPEAD de Administração - UFRJ)
_____________________________________________________________
Isabel de Sá Affonso da Costa, D.Sc.
(Universidade Estácio de Sá, UNESA)
4
AGRADECIMENTOS
Ao meu orientador Marcos Avila, pelo direcionamento, apoio e encorajamento
durante o desenvolvimento desse trabalho.
À minha co-orientadora Beatriz Vaz de Melo Mendes, por acreditar nesse trabalho e
pela imensa dedicação e auxilio, sem os quais o entendimento e aplicação das
equações necessárias ao estudo seriam impossíveis.
À professora Isabel de Sá Affonso da Costa, por aceitar o convite de participar da
Banca Examinadora.
Aos professores do COPPEAD, pelo aprendizado e atenção dada ao mestrado.
Aos funcionários do COPPEAD, pela dedicação aos alunos do mestrado.
À minha irmã Ana Paula, por todos os textos revisados, power points avaliados,
treinos de apresentações, enfim, pelo apoio em todos os momentos. À minha mãe
Walkiria, que me ensinou a importância do estudo. E à minha madrinha Cristina,
seus conselhos me ajudaram a decidir fazer o mestrado.
Aos amigos do mestrado, por tornarem divertidos e prazerosos mesmo os momentos
mais tensos do curso.
Aos meus amigos, pela paciência durante o período de mestrado e por entenderem
minhas ausências.
5
RESUMO
SANTIAGO, Danielle Brito. Tomada de decisão sob risco: um estudo do game
show “Topa ou Não Topa”. Dissertação (Mestrado em Administração) – Instituto
COPPEAD de Administração, Universidade Federal do Rio de Janeiro, Rio de
Janeiro, 2012.
Escolher a melhor alternativa entre as diferentes opções apresentadas é um
processo comum no dia-a-dia das pessoas. No entanto, entender como a tomada de
decisão ocorre se mostrou complexo e tem sido o objetivo de diversos estudiosos ao
longo dos anos. As teorias mais conhecidas sobre o assunto são a teoria da
utilidade esperada, desenvolvida por von Neumann e Morgenstern (1944), e a teoria
das perspectivas, desenvolvida por Kahneman e Tversky (1979). Essa dissertação
objetiva verificar a adequação das escolhas realizadas pelos participantes do game
show “Topa ou Não Topa” aos padrões de comportamento descritos por essas
teorias e avaliar a presença da aversão ao risco no momento das decisões. Para
isso foram analisadas as escolhas realizadas ao longo do jogo por 34 participantes
utilizando a metodologia empregada por Post et al. (2008), que consiste na
observação das decisões tomadas nas situações envolvendo incertezas do
ambiente controlado do programa televisivo. Os resultados encontrados mostram
uma baixa aversão ao risco, com tendências à propensão ao risco em alguns casos,
e demora em aceitar os montantes oferecidos. A aversão ao risco relativo constante
e a redução do grau de aversão ao risco com a diminuição do montante envolvido,
observados a partir da teoria da utilidade esperada, consegue explicar em parte
esses efeitos. Porém, o impacto de acontecimentos recentes e o lento ajuste dos
valores usados como ponto de referência, sugeridos para a amostra pela teoria das
perspectivas consegue explicar de forma mais satisfatória os efeitos.
Palavras-chave: Finanças comportamentais, teoria da utilidade esperada, teoria das
perspectivas, tomada de decisão.
6
ABSTRACT
SANTIAGO, Danielle Brito. Tomada de decisão sob risco: um estudo do game
show “Topa ou Não Topa”. Dissertação (Mestrado em Administração) – Instituto
COPPEAD de Administração, Universidade Federal do Rio de Janeiro, Rio de
Janeiro, 2012.
Choose the best alternative among different options is usually a common process for
people. However, understanding how decision making occurs proved complex and
has been the goal of many researchers over the years. The main theories on the
subject are the expected utility theory, developed by von Neumann and Morgenstern
(1944), and the prospect theory, developed by Kahneman and Tversky (1979). This
study aims to test if the choice pattern expected by these theories suit the decisions
made by contestants in the game show "Topa ou Não Topa", the Brazilian version of
“Deal or No Deal”, and verify the presence of risk aversion. The choices made
throughout the game by 34 participants were analyzed using the methodology
employed by Post et al. (2008), which consists in observing the decisions made in
situations involving uncertainties in the controlled environment of the television show.
The findings of this study indicate a low risk aversion, with tendencies toward risk
propensity in some cases, and delay in accepting the amount offered. For the
sample, expected utility theory shows constant relative risk aversion and decrease in
the degree of risk aversion as the amount involved reduces, explaining part of the
effects found. Prospect theory, on the other hand, suggest that recent events impact
the decision an lead to slow adjustment of the value used as reference point, which
can better explain the choices of contestants.
Key Word: Behavioral finance, expected utility theory, prospect theory, decision
making.
7
LISTA DE FIGURAS
Figura 1: Exemplo de dependência. Fonte: KAHNEMAN, 2002 ............................... 21
Figura 2: Função valor hipotética. Fonte: KAHNEMAN; TVERSKY, 1979 ................ 23
Figura 3: Esquema do jogo ...................................................................................... 33
Figura 4: Distribuição empírica do prêmio total restante ........................................... 38
Figura 5: Distribuição empírica do prêmio médio restante ........................................ 39
Figura 6: Classificação dos concorrentes por rodada e valor recebido ..................... 47
Figura 7: Impacto do nas ofertas a cada rodada ................................................... 52
Figura 8: Exemplos de trajetória do calculado a cada rodada ............................... 53
Figura 9: Ofertas Percentuais Previstas x Observadas ............................................ 55
Figura 10: Valores das Ofertas Previstas x Observadas .......................................... 55
Figura 11: Função Utilidade ..................................................................................... 61
Figura 12: Função Utilidade dos Jogadores Classificados com “Perdedores”,
“Neutros” e “Ganhadores” ........................................................................................ 63
Figura 13: Função Valor ........................................................................................... 70
8
LISTA DE TABELAS
Tabela 1: Sumario das Estatísticas .......................................................................... 40
Tabela 2: Ofertas e Decisões dos Participantes ....................................................... 42
Tabela 3: Exemplo de Participante sem Sorte.......................................................... 43
Tabela 4: Exemplo de participante com Sorte .......................................................... 44
Tabela 5: Decisões por Categoria ............................................................................ 48
Tabela 6: Resultados para a Teoria da Utilidade Esperada ..................................... 61
Tabela 7: Resultado Teoria da Utilidade Esperada para Jogadores Classificados
como “Perdedores”, “Neutros” e “Ganhadores” ........................................................ 62
Tabela 8: Resultados para a Teoria das Perspectivas ............................................. 69
9
SUMÁRIO
1 INTRODUÇÃO................................................................................................... 10
1.1 Contexto e Relevância ....................................................................................... 10
1.2 Objetivo ............................................................................................................. 12
1.3 Limitações ......................................................................................................... 12
2 REVISÃO DE LITERATURA .............................................................................. 14
2.1 Teoria da Utilidade Esperada............................................................................. 14
2.2 Teoria das Perspectivas .................................................................................... 20
2.3 Estudos Anteriores ............................................................................................ 28
3 DESCRIÇÃO DO PROGRAMA ......................................................................... 32
4 METODOLOGIA ................................................................................................ 35
4.1 Método .............................................................................................................. 35
4.2 Dados ................................................................................................................ 35
4.3 Análises Preliminares ........................................................................................ 40
4.3.1.Resultados Encontrados ................................................................................. 47
4.4 Análise pela Teoria da Utilidade Esperada ........................................................ 49
4.4.1 Resultados....................................................................................................... 58
4.5 Análise pela Teoria das Perspectivas ................................................................ 64
4.5.1 Resultados....................................................................................................... 67
5 CONCLUSÃO .................................................................................................... 71
REFERÊNCIAS ....................................................................................................... 74
10
1 INTRODUÇÃO
1.1 Contexto e Relevância
A necessidade de escolher entre alternativas é comum no dia-a-dia das pessoas.
A cada momento novas possibilidades são apresentadas e o indivíduo precisa
escolher qual será a alternativa mais adequada. No entanto, muitas vezes o
processo de decisão ou a situação apresentada é tão comum que a pessoa não
percebe estar diante de um cenário de escolha. Apesar de parecer um processo
simples, entender como as decisões são tomadas é algo complexo e tem sido objeto
de diversos estudos.
Compreender como o indivíduo decide não é uma preocupação recente dos
estudiosos, sendo um dos pontos mais amplamente explorados por pesquisadores
de diversas áreas, como filósofos, psicólogos e economistas. Os estudiosos
acreditavam que a racionalidade humana era o ponto de partida para entender a
tomada de decisões. Por esse pensamento, as escolhas são realizadas através da
ponderação e da lógica, ou seja, as pessoas conseguiriam pesar os prós e os
contras de todas as situações e escolher aquela que apresenta maior beneficio.
Assim, as escolhas racionais deveriam sempre ser consistentes e coerentes.
Considerando essas premissas, John von Neumann e Oskar Morgenstern
desenvolveram, em 1944, a Teoria da Utilidade Esperada. Essa teoria foi aceita
durante muitos anos como o modelo normativo das escolhas racionais e dominou o
campo da análise de decisão em situações arriscadas ou de incerteza (KAHNEMAN;
TVERSKY, 1979). A tomada de decisões, segundo essa teoria, ocorre através da
ponderação do valor das opções pela probabilidade de seu acontecimento. A
alternativa selecionada será aquela que apresentar maior valor.
Ao longo dos anos, diversas pesquisas e experimentos foram realizados tanto
para corroborar a teoria quanto para mostrar falhas e violações ao padrão de
comportamento esperado por ela. Assim, através do estudo das escolhas de
participantes em diversos experimentos, Daniel Kahneman e Amos Tversky
desenvolveram a Teoria das Perspectivas, em 1979. Essa teoria prevê violações a
premissa da racionalidade humana e afirma que a escolha pode depender de outras
variáveis além do valor da opção, quando for uma escolha financeira, e da
11
probabilidade de ocorrência. Na teoria das perspectivas, as escolhas em situações
de incerteza podem ser explicadas por fatores como os resultados de escolhas
anteriores, o framing dado ao problema, os resultados ou as opções, além de
características pessoais de quem está avaliando o problema.
Para estudar o padrão de escolhas dos indivíduos, diferentes métodos podem ser
usados. Testes mais antigos utilizavam experimentos teóricos nos quais o
participante deveria imaginar qual seria sua reação à situação apresentada e
reportá-la (POST et al., 2008). Esse é um procedimento mais simples e permite
investigar diversas questões teóricas, mas dependem do correto julgamento dos
participantes quanto a seu comportamento em diferentes situações. Mais
recentemente, experimentos utilizando valores reais vêm sendo utilizados para
avaliar a tomada de decisão em situações de risco ou de incertezas. No entanto,
esses experimentos, em geral, utilizam valores pequenos, dificultando a análise para
escolhas que significam uma parte maior da riqueza total da pessoa. Outro método
possível seria a observação de situações reais, que poderiam prover dados mais
completos. Porém, a distribuição de probabilidades e as crenças pessoais do
participante são desconhecidas, além de haver grande nível de incerteza envolvido
nessas situações, tornando muito difícil para pesquisadores conseguirem identificar
as preferências sobre riscos.
Com o objetivo de contornar esses problemas, alguns programas de televisão
têm sido utilizados como fonte de dados para análise do comportamento humano.
Nesses programas os valores em jogo são maiores do que em experimentos e os
problemas de decisão são simples e bem-definidos.
Esse estudo irá utilizar o programa televisivo “Topa ou Não Topa” como fonte de
informação para análise de tomada de decisão em situações de incerteza. O game
show foi escolhido, pois, diferente dos experimentos normalmente realizados, o
montante em jogo é alto e bem distribuído (o participante pode ganhar entre R$ 0,50
e R$ 1.000.000,00) e as decisões a serem tomadas são simples e com
probabilidades definidas.
12
1.2 Objetivo
As teorias mais conhecidas sobre tomada de decisões em situações de risco ou
incerteza são a Teoria da Utilidade Esperada e a Teoria das Perspectivas. Essas
teorias apresentam visões bastante diversas sobre como o indivíduo se comporta.
Enquanto a Teoria da Utilidade Esperada supõe que as pessoas são racionais e
escolhem com base na utilidade esperada das opções, a Teoria das Perspectivas
entende que o ser humano não é completamente racional e que a tomada de
decisões é influenciada por aspectos mais subjetivos.
Esse trabalho tem por objetivo principal verificar a adequação dos padrões de
comportamento descritos pela Teoria da Utilidade Esperada e pela Teoria das
Perspectivas ao comportamento apresentado pelos participantes do game show
“Topa ou Não Topa” através da análise das escolhas realizadas pelos participantes
do programa. O estudo pretende, ainda, verificar a presença da Aversão ao Risco,
ou da Propensão ao Risco, entre os concorrentes no momento de escolher entre
aceitar ou não a proposta do negociador.
1.3 Limitações
A dissertação tem como base o artigo de Post et al., Deal or no Deal? Decision
Making Under Risk in a Large-Payoff Game Show, publicado em 2008. Nessa
análise será utilizada a versão brasileira do programa, denominado “Topa ou Não
Topa”, para avaliar o padrão de comportamento dos participantes.
O programa analisado se aproxima mais de uma situação real do que os
experimentos utilizados normalmente para estudar as decisões das pessoas. No
entanto, o game show constitui um ambiente artificial, com luzes, câmeras e várias
pessoas (público e produção) observando e avaliando as decisões tomadas. Tais
fatores podem influenciar na forma como as pessoas fazem suas escolhas. Porém, a
forma de influência varia para cada indivíduo, podendo alterar seu julgamento de
forma a aumentar ou diminuir seu grau de aversão ao risco. Essa variação na
maneira de enfrentar e responder aos fatores apresentados provoca vieses
contrários em cada indivíduo, o que torna a análise menos propensa a esses fatores,
não prejudicando, assim, o resultado.
13
Além dos fatores acima, outras características da atração podem trazer vieses ao
estudo. O processo de seleção dos participantes aplicado pela produção do
programa, por exemplo, pode privilegiar determinado padrão de comportamento,
como pessoas mais extrovertidas ou que se mostram mais dispostas a permanecer
por mais rodadas no programa. Porém, conforme citado anteriormente, o
comportamento do indivíduo frente ao risco não pode ser previsto com precisão ao
ser colocado em meio a tantas pessoas e câmeras.
Mais uma característica da atração que pode influenciar nos resultados
encontrados no estudo é sua penetração pelo território nacional. O “Topa ou Não
Topa” é exibido por uma grande emissora de televisão do país e é transmitido por
todo o território, indicando que os candidatos ao programa tendem a ser pessoas
menos inibidas. Além disso, o game show é gravado com antecedência, exigindo
que o participante esteja disponível no horário escolhido pela produção. Tal
exigência poderia indicar um maior grau de ociosidade entre os participantes do
jogo.
Todas as características apresentadas poderiam levar a um viés no grau de
aversão ao risco encontrado no estudo. Porém, conforme citado por Brooks et al.
(2009), não foi comprovado que esses fatores estejam relacionados com o grau de
aversão ao risco.
14
2 REVISÃO DE LITERATURA
Nesse capítulo serão apresentadas as duas teorias utilizadas nesse estudo como
padrões de escolha em situações de risco ou incerteza. Serão apresentados
também os resultados encontrados em pesquisas anteriores realizadas com
diferentes versões do game show analisado. Assim, na seção 2.1 serão mostrados
os princípios da Teoria da Utilidade Esperada e como essa teoria espera que o
indivíduo decida entre as alternativas possíveis. A Teoria das Perspectivas, como a
teoria descreve o comportamento humano frente a situações de incerteza e os
efeitos que as pessoas podem sofrer são explicados na seção 2.2. Por fim, a seção
2.3 mostra os resultados encontrados em estudos realizados através da análise de
diferentes versões do programa “Deal or No Deal” em alguns dos países em que é
exibido.
Antes de iniciar a explicação das teorias, mostra-se importante explicitar o que é
considerado risco para esse estudo. Risco será tudo o que possui caráter duvidoso,
incerto. Dessa forma, uma decisão envolvendo risco ocorre quando uma pessoa
precisa escolher entre perspectivas (KAHNEMAN; TVERSKY, 1979), mas não
consegue precisar seu resultado. Assim, de acordo com a postura apresentada por
um indivíduo diante das alternativas, no caso o valor que ele aceitará receber para
abrir mão de um jogo com probabilidades definidas (denominado equivalente
certeza), ele pode ser considerado avesso, neutro ou propenso ao risco. Se o valor
aceito for menor do que a média dos resultados possíveis ponderada por suas
probabilidades de acontecimento – valor esperado –, a postura é de aversão ao
risco. Quando o valor certo aceito for igual ao valor esperado dos resultados, a
pessoa será considerada neutra ao risco. Por fim, a propensão ao risco será
encontrada quando o equivalente certeza for superior ao valor esperado.
2.1 Teoria da Utilidade Esperada
A Teoria da Utilidade Esperada é muito usada como modelo normativo de
decisões racionais e descritivo do padrão de comportamento econômico. Seguindo
esse propósito, a teoria pode auxiliar nas escolhas entre alternativas arriscadas, que
envolvem decisões complexas ou situações de incerteza.
15
Desde sua proposição, o modelo já foi objeto de diversos testes empíricos e
pesquisas teóricas, que foram incluindo novas interpretações do comportamento
humano em situações de risco e modificações na fórmula utilizada para descrever o
padrão de decisão (RUBINSTEIN, 1988). Conforme lembrado por Schoemaker
(1982), a forma matemática da Teoria da Utilidade Esperada vem desde o século
XVIII, quando foi introduzida a ideia de que decisões em situações envolvendo risco
deveriam seguir a regra de maximização da utilidade esperada da riqueza
(KAHNEMAN, 2002). Mas, somente em 1944, John Von Neumann e Oskar
Morgenstern provaram formalmente a teoria como um critério de decisão racional.
Para tanto, mostraram que a utilidade de uma perspectiva pode ser medida
seguindo uma série de axiomas que definem as preferências (WEIRICH, 1986).
Assim, conforme exposto por Schoemaker (1982), o comportamento sob risco pode
ser definido a partir dos axiomas a seguir:
(i) A preferência por uma determinada alternativa deve ser completa e transitiva.
Logo, dadas duas opções, deve haver uma relação de preferência de uma
opção sobre a outra ou ambas devem ser igualmente atrativas. Além disso, pela
transitividade, se A é preferida em relação a B e B é preferida em relação a C,
então, A deve ser pelo menos tão atrativa quanto C;
(ii) Dados os resultados possíveis x1, x2 e x3, existe uma probabilidade p entre 0 e
1 tal que ganhar x1 com probabilidade p ou x3 com probabilidade (1-p) seja tão
atrativo quanto um ganho certo de x2;
(iii) Se x1 e x2 são igualmente atrativos (ambas alternativas arriscadas ou não
arriscadas), então a loteria com opção de ganhar x1 com probabilidade p ou x3
com probabilidade (1-p) e a loteria com opção de ganhar x2 com probabilidade p
ou x3 com probabilidade (1-p) também devem ser igualmente atrativas (para todo
p e todo x3);
(iv) Dados dois jogos que diferem apenas nas probabilidades: jogo A com
probabilidades de ganho x1 e x2 iguais a p e (1-p), respectivamente; e jogo B
com probabilidades q e (1-q) de ganhar x1 e x2. Considerando x1 > x2, o jogo A
será preferido em relação ao jogo B se, e somente se, p > q;
(v) Um jogo composto é tão atrativo quanto o jogo simples que resulta da
multiplicação das probabilidades de suas etapas. Assim, o jogo
16
deve ser tão atrativo quanto o jogo abaixo.
A partir dos axiomas, é possível notar que, segundo essa teoria, as pessoas
avaliam as alternativas de forma racional, sendo capazes de analisar todos os
resultados e consequências de suas escolhas antes de tomar uma decisão arriscada
ou envolvendo incertezas. Tal decisão ocorre de acordo com a utilidade atribuída a
cada opção, que deve ser consistente entre as opções e as demais escolhas
realizadas por cada indivíduo. Por exemplo, uma decisão tomada em uma situação
complexa deve poder ser prevista avaliando uma situação similar mais simples
(FRIEDMAN; SAVAGE, 1948).
Assim, respeitando-se os axiomas acima, é possível encontrar a utilidade que
representa o valor de cada situação apresentada de forma a organizá-las para a
tomada de decisão (HASTIE; DAWES, 2001). Uma pessoa seria, então, capaz de
escolher dentre as alternativas maximizando a utilidade esperada, através da
ponderação das probabilidades das utilidades das consequências possíveis de uma
alternativa (WEIRICH, 1986), de forma a decidir por aquela que proporciona melhor
resultado. Para a teoria, a utilidade atribuída às alternativas coincide com as
preferências do indivíduo.
Algumas propriedades destacadas pela teoria da utilidade esperada podem ser
observadas quando uma pessoa precisa escolher entre perspectivas arriscadas.
Kahnemann e Tversky (1979) resumem essas propriedades conforme explicado a
seguir. Ainda considerando um resultado x com probabilidade de ocorrência p, a
utilidade global de uma perspectiva U, na teoria da utilidade esperada, é igual a
soma da utilidade esperada de cada um de seus resultados. Essa é a propriedade
17
da expectativa e pode ser representada por U (x1, p1; ...; xn, pn) = p1 u(xn)+...+pn u(xn).
Outra propriedade importante na teoria é a da integração de riqueza. Segundo essa,
uma alternativa só é aceitável se a utilidade resultante da integração da perspectiva
com a riqueza do indivíduo for maior que a utilidade da riqueza, ou seja, para que a
perspectiva (x1, p1;...; xn, pn) seja aceitável na posição de riqueza w, U (w+x1, p1; ...;
w+xn, pn) > u(w). A partir dessa propriedade, é possível perceber que a função
utilidade não analisa ganhos e perdas, mas sim a riqueza total dos indivíduos e o
estado final alcançado com a perspectiva.
A teoria da utilidade esperada, então, se baseia na regra de maximização da
utilidade esperada na busca por produzir decisões racionais quando as opções
envolvem risco. Porém, conforme mostrado em estudos anteriores através de
diferentes experimentos, existem diversas situações nas quais tal comportamento é
violado (SCHOEMAKER, 1982, 1992; KAHNEMANN; TVERSKY, 1979;
KAHNEMANN, 2002; RUBINSTEIN, 1988). Nos experimentos mostrados pelos
autores, as violações parecem ocorrer porque as pessoas não são racionais ou
porque a teoria não consegue prever a atitude das pessoas perante situações de
incertezas (WEIRICH, 1986). Dentre as violações explicadas pelos autores, algumas
serão destacadas a seguir.
Um exemplo importante de violação à teoria da utilidade esperada é o efeito
certeza. Tal efeito ocorre quando, diante de uma situação de escolha entre uma
alternativa de resultado certo e outra de resultado possível, a opção certa ganha
uma importância extremamente maior. Dessa forma, o peso dado ao resultado certo
é muito maior do que o peso dado ao resultado provável na ponderação dos
resultados por suas probabilidades de acontecimento para a tomada de decisão.
Isso acontece, em geral, ainda que o ganho esperado do cenário possível seja maior
que o ganho considerado certo.
O peso exagerado dado ao resultado certo pode acontecer tanto para o domínio
dos ganhos quanto para o das perdas. Mas, situações envolvendo perdas trazem
resultados inversos: quando a perda é certa, a opção onde a perda é apenas uma
probabilidade é preferida. Assim, em situações envolvendo 2 opções com
probabilidades, a que tiver a menor probabilidade de perda é preferida. Esse
comportamento inverso de aversão ao risco quando há ganho envolvido e
18
propensão ao risco quando há possibilidade de perdas é conhecido como reflection
effect (XIE; WANG, 2003).
Em seu artigo, Schoemaker (1982) mostra como o efeito certeza se manifesta
nas escolhas das pessoas no domínio das perdas. No experimento, foi solicitado a
um grupo de pessoas que escolhesse entre duas alternativas, em cada uma das
situações abaixo:
Situação A: (A1) uma perda certa de $45
(A2) 50% de chance de perder $100 e 50% de chance de perder $0
Situação B: (B1) 10% de chance de perder $45 e 90% de perder 0
(B2) 5% de chance de perder $100 e 95% de chance de perder $0
Na situação A, a maior parte dos participantes escolheu a alternativa 2. Isso
mostra que, nessa situação, as pessoas atribuíram utilidade menor para a perda de
$45 do que para a perda de $50 (0,5U(-100) + 0,5U(0)). A situação B trouxe um
resultado inverso. A maioria dos indivíduos preferiu a primeira opção, mostrando
que, nesse caso, a utilidade de perder $4,5 (0,1U(-45) + 0,9U(0)) foi maior do que a
utilidade de perder $5 (0,05U(-100) + 0,95U(0)). Apesar de trazer resultados
diferentes, as situações são equivalentes. Comparando as situações A e B, é
possível notar que o resultado da opção A1 é igual ao da opção B1 multiplicado por
10, enquanto o resultado de A2 é igual ao de B2 também multiplicado por 10. Logo,
seguindo a teoria da utilidade esperada, as escolhas deveriam ser iguais nas 2
situações. Como isso não ocorre, o terceiro axioma é violado.
Como observado no exemplo, os efeitos certeza e reflection implicam uma
aversão ao risco no lado positivo – já que há uma preferência pelo ganho certo –
mesmo que o ganho da opção provável seja maior. No lado negativo – quando há
perda envolvida –, por outro lado, há uma tendência ao risco, pois é preferida a
opção onde existe probabilidade de perda, ainda que seja uma perda maior que a o
valor certo da outra opção. Assim, nota-se que tanto a aversão a perda quanto o
desejo por ganhos são intensificados quando há certeza.
Outra forma de violação a teoria é o isolation effect, segundo o qual as pessoas
tendem a isolar as características das alternativas de forma a simplificá-las para
19
facilitar no processo de escolha (KAHNEMAN; TVERSKY, 1979; SCHOEMAKER,
1982). As características diferentes entre as opções recebem um foco maior e as
características em comum são ignoradas. O efeito pode ser observado em cenários
cujas alternativas possuem o mesmo resultado, mas com etapas ou valores
intermediários diferentes. A existência de preferência por uma ou outra alternativa
contraria o quinto axioma, além de não respeitar a segunda propriedade mencionada
anteriormente. Por esse efeito, ao invés de considerar apenas o resultado final, é
dada maior importância aos ganhos e perdas. Logo, mudanças na riqueza parecem
importar mais para os indivíduos do que o estado final (KAHNEMAN; TVERSKY,
1979).
Uma característica importante incorporada a teoria da utilidade esperada é a
questão da aversão ao risco em relação a resultados monetários, segundo a qual
uma pessoa prefere uma perspectiva certa a qualquer perspectiva incerta com o
mesmo resultado esperado . Avaliando a aquisição de seguros, por exemplo, é
possível verificar que essa característica também é violada. Conforme observado por
Fuchs (apud KAHNEMAN; TVERSKY, 1979), as pessoas, em geral, preferem
adquirir seguros que oferecem cobertura limitada, mas possuem taxas baixas, do
que seguros com coberturas máximas maiores, mas taxas também maiores. Tal
preferência contraria a aversão ao risco esperada pela teoria. Outro exemplo de
violação a aversão ao risco são os chamados seguros probabilísticos. Num seguro
probabilístico, a pessoa paga parte do valor do seguro para ter a chance de não ter
que arcar com todos os custos de um possível prejuízo ao bem segurado. Não há a
certeza de que o prejuízo será pago pela seguradora, apenas uma probabilidade. No
caso de a seguradora arcar com o prejuízo, a pessoa teria que pagar o valor
restante do seguro apenas se algo acontecer com o ativo. Porém, existe uma
probabilidade de acontecer algo e a seguradora não resolver, nesse caso o valor
pago pelo seguro seria ressarcido. Por outro lado, o seguro normal seria aquele cujo
valor exigido pelo seguro é pago em sua totalidade e a seguradora arca, sempre que
necessário, com os custos ao bem segurado. Pela teoria da utilidade esperada, o
seguro probabilístico seria mais vantajoso do que o seguro normal. No entanto, em
um experimento demonstrado por Kahneman e Tversky (1979) no qual as pessoas
deveriam escolher entre os dois tipos de seguro, o resultado encontrado foi
diferente. Para a maior parte dos participantes do experimento, um seguro mais
20
caro, com cobertura certa, pareceu mais atrativo, mostrando que reduzir a
probabilidade de ocorrência é menos valioso do que reduzi-la a zero.
Conforme demonstrado, a utilização da teoria da utilidade esperada como um
modelo descritivo para auxiliar na tomada de decisões apresenta falhas. Duas falhas
comuns estão relacionadas à estruturação e à interpretação dos problemas. As
pessoas não estruturam os problemas da forma holística e compreensiva como
esperado pela teoria, além de não processarem as informações segundo as regras
esperadas (SCHOEMAKER, 1982). Assim, a teoria da utilidade esperada precisaria
se adaptar às evidências de que os indivíduos não seguem o padrão de
comportamento racional, com as preferências e as crenças, esperadas pela teoria
(SCHOEMAKER, 1992).
2.2 Teoria das Perspectivas
Conforme mostrado no item anterior, escolhas realizadas em diversas situações
não podem ser completamente explicadas utilizando a teoria da utilidade esperada.
Um modelo alternativo de tomada de decisões em situações de risco foi, então,
desenvolvido por Daniel Kahneman e Amos Tversky, em 1979: a Teoria das
Perspectivas. Diferente da teoria da utilidade esperada, que assume que a avaliação
das perspectivas para tomada de decisões utiliza apenas o estado final da riqueza
do indivíduo, a teoria das perspectivas assume que o estímulo para aceitar ou
rejeitar uma perspectiva irá depender do nível de riqueza inicial utilizado como ponto
de referência. Dessa forma, para a teoria, a diferença entre o novo nível de riqueza e
o nível anterior usado para comparação é o que guia a escolha entre perspectivas
(KAHNEMAN, 2002).
A teoria se baseia na ideia de que a percepção humana depende da referência
utilizada, ou seja, os atributos percebidos de uma situação irão depender do
contexto no qual ela está inserida e de estímulos anteriores recebidos pelo indivíduo.
Um exemplo dessa relação de dependência entre a referência utilizada e o que é
percebido pode ser observado na Figura 1, apresentada por Kahneman em seu
artigo de 2002. Na figura, os quadrados internos parecem de cores diferentes. No
entanto, eles possuem a mesma tonalidade. Conforme enfatizado pelo autor, a
percepção das cores dos quadrados não se dá apenas pela observação desse ponto
21
da figura, mas também da observação e comparação com as áreas vizinhas, dando
a impressão de tonalidades diferentes.
Figura 1: Exemplo de dependência. Fonte: KAHNEMAN, 2002
Segundo essa teoria, o processo decisório ocorre em etapas. A primeira é a fase
de edição, na qual as perspectivas são reorganizadas e reformuladas de forma a
torná-las mais simples e fáceis de analisar. Dessa forma, através de processos
como codificação – quando os possíveis resultados são classificados como perda ou
ganho a partir de um ponto de referência que irá depender da riqueza do indivíduo –,
cancelamento – quando perspectivas cujos resultados possíveis possuem
componentes iguais são descartados – e outros, as situações complexas são
editadas com o objetivo de tornar o processo decisório mais simples (KAHNEMAN;
TVERSKY, 1979).
Após a fase de edição, as perspectivas são analisadas e aquela que apresentar
maior valor será escolhida. Essa fase é chamada de avaliação. Apesar de facilitar a
tomada de decisão, a fase de edição pode provocar alterações nas preferências já
que a fase seguinte, de avaliação, depende da simplificação realizada. Utilizando
essas etapas, a tomada de decisão se torna um processo mais simples que
depende mais de atalhos mentais, emoções e instintos e menos de avaliações
cuidadosas das informações e análises das probabilidades de resultados (LEHRER,
2010)
O valor das perspectivas depois de editadas, denominado , dependerá da
função peso da decisão, , e do valor dado ao resultado, , que é subjetivo.
Dessa forma, conforme explicitado por Kahneman e Tversky em seu artigo de 1979,
o valor das perspectivas será dado pela equação abaixo.
22
, onde:
e resultados poss veis da perspectiva;
probabilidade de ocorr ncia de ;
probabilidade de ocorr ncia de ; e
e .
Nos casos em que a soma das probabilidades é igual a 1 e ou
, a fórmula usada passa a ser:
A diferença na equação a ser utilizada em cada caso ocorre devido às operações
realizadas na fase de edição. Assim, na última fórmula, o componente certo dos
resultados, aqui , é separado do restante da fórmula para a avaliação e o peso
da decisão é associado ao fator arriscado, ou seja, a diferença entre os valores dos
resultados.
Conforme explicado anteriormente, os resultados são codificados como ganhos
ou perdas. Assim, é dado maior valor às mudanças na riqueza do indivíduo do que
ao estado final da mesma. Dessa forma, a função valor é definida por variações a
partir do ponto de referência. Essa afirmativa é compatível com princípios básicos de
percepção e julgamento que afirma que estamos preparados para avaliar mudanças
e diferenças e não magnitudes absolutas (KAHNEMAN; TVERSKY, 1979). Mas, é
preciso haver um ponto de referência, que será utilizado para comparar as
alternativas.
Outra característica importante da equação acima é que o valor marginal dado a
ganhos e perdas, em geral, diminui com o aumento da magnitude dos resultados,
logo, a representação gráfica da função é côncava no lado dos ganhos e convexa
para as perdas. Tal formato da função valor indica que as pessoas apresentam
aversão ao risco no domínio dos ganhos e tendência ao risco quando no domínio
das perdas (KAHNEMAN, 2002). As pessoas costumam sentir maior desprazer com
a experiência de perder uma quantia do que a satisfação proporcionada pelo ganho
da mesma quantia, fazendo com que a representação da função apresente o lado
23
das perdas mais íngreme que o lado dos ganhos, tendo com ponto de torção o ponto
de referência e mostrando que a aversão ao risco é maior para perdas. O formato da
função valor para a teoria das perspectivas pode ser observado na Figura 2, onde é
representado o gráfico de uma função valor hipotética.
Figura 2: Função valor hipotética. Fonte: KAHNEMAN; TVERSKY, 1979
Uma importante contribuição da teoria das perspectivas, a função peso da
decisão ( ) não segue a probabilidade de ocorrência do resultado e não deve ser
interpretada como uma medida de gradação ou de crenças do tomador de decisão.
Essa função mede o impacto do evento no desejo pelas perspectivas. Algumas das
propriedades dessa função ressaltadas por Kahneman e Tversky em seu artigo de
1979 são:
Subaditividade: Quando o valor da probabilidade é pequeno, é possível
perceber que , para .
Excesso de peso: Quando as probabilidades são muito baixas, em geral, são
atribuídos pesos exagerados para decisão dessas, ou seja, para ’s
pequenos.
Subcertainty: A soma dos pesos associados a eventos complementares é
menor do que o peso associado ao evento certo, ou seja, para todo
, . Por essa propriedade, pode-se dizer que as
preferências são menos sensíveis a variação das probabilidades do que
supõe a propriedade da expectativa da teoria da utilidade esperada.
Valor
Perdas Ganhos
24
Subproporcionalidade: Para uma proporção fixa de probabilidades, a
proporção dos pesos de decisão correspondentes é mais próximo de 1
quando as probabilidades são baixas do que quando são altas.
Outro aspecto relevante da função de ponderação é seu comportamento
perto dos extremos. As pessoas, normalmente, não compreendem ou não avaliam
corretamente probabilidades extremas, tanto as muito pequenas quanto as
elevadas. Eventos extremamente improváveis são ignorados, ainda na etapa de
edição, ou tem seu peso superavaliado. As altas probabilidades, por sua vez, são
exageradas ou confundidas com o ganho certo. Assim, diz-se que a função não se
comporta bem nos extremos.
Com o que foi apresentado até o momento sobre a teoria das perspectivas, é
possível verificar que atitudes em relação ao risco são determinadas por e em
conjunto e que há uma aversão ao risco no lado das perdas, e uma tendência ao
risco no lado dos ganhos, especialmente quando as probabilidades são baixas,
quando o exagero nos pesos é esperado.
Na teoria das perspectivas, considera-se que as mudanças, ou seja, os ganhos e
perdas, possuem maior valor do que a posição final de riqueza e que os pesos
decisórios e as probabilidades dos resultados não coincidem. Com isso, é possível
acomodar os efeitos sofridos pelo tomador de decisão que fazem com que as
escolhas sejam inconsistentes ou que violem a relação de dominância. Dessa forma,
a teoria consegue prever a existência de certas anomalias.
Ao ser confrontado com situações envolvendo múltiplas opções, o indivíduo
escolhe de acordo com a análise realizada do problema seguindo um determinado
padrão. Observando a representação em S da função valor, como a apresentada na
Figura 2, percebe-se que o indivíduo apresenta aversão ao risco em situações com
chances de ganho e propensão ao risco quando existem chances de perda
(KAHNEMAN; TVERSKY, 1979). Assim, alguns fatores e efeitos podem provocar
essas anomalias. Dois fatores críticos a análise de decisões são a localização do
ponto de referência e a maneira como o problema de decisão é editado.
Uma alteração no ponto de referência adotado pelo tomador de decisão é um
fator que pode provocar escolhas inconsistentes. No momento da codificação dos
25
resultados em ganhos ou perdas, o ponto de referência usado pode ser a riqueza do
indivíduo, a situação atual, ou uma determinada expectativa de resultado – a
posição de riqueza que se espera alcançar depois da escolha. Essa alteração no
ponto de referência da situação atual para uma expectativa de resultado pode
provocar diferenças na ordem de preferência das opções (TVERSKY; KAHNEMAN,
1981).
Existem situações, ainda, nas quais existe uma diferença entre o ponto de
referência atual e a posição de riqueza atual do indivíduo. Normalmente, tais
diferenças ocorrem devido a uma mudança recente na riqueza, a qual o indivíduo
ainda não se adaptou. Assim, diminuições na riqueza devido a perdas recentes que
ainda não foram devidamente processadas pelo indivíduo podem levar a uma busca
pelo risco, levando-o a aceitar apostas que normalmente não aceitaria.
Outra alteração no ponto de referência ocorre quando uma pessoa formula seu
problema de decisão em termos da riqueza final, como defende a análise de
decisões, e não em termos de ganhos e perdas, como as pessoas normalmente
fazem. Essa formulação, segundo a teoria, elimina a procura pelo risco, exceto em
aposta com baixas probabilidades.
As pessoas enfrentam diariamente situações que podem ser comparadas a
conjuntos de problemas, que podem ser analisados separadamente ou de forma
combinada para todo o conjunto. Dependendo da forma como a análise é realizada,
ou do enquadramento dado às ações, as relações de preferências são modificadas.
Seguindo esse raciocínio, como mostram Tversky e Kahneman (1981), ainda que a
avaliação separada de cada situação traga uma resposta que pareça ideal para os
problemas específicos, uma avaliação combinada das opções escolhidas pode
apresentar, muitas vezes, um resultado contraditório. Nesses casos, a avaliação
conjunta dos problemas proporcionaria uma ordem de preferência mais vantajosa
para o tomador de decisão.
Diversos experimentos mostraram como alterações aparentemente simples na
formulação de problemas podem mudar significativamente a ordem de preferência
do indivíduo. Em seu artigo de 1981, Kahneman e Tversky, por exemplo, mostram
que as pessoas fazem escolhas diferentes quando problemas iguais são
apresentados com pequenas alterações em sua formulação e que, normalmente, os
26
indivíduos não percebem as diferenças. Esse fenômeno é chamado pelos autores
de efeito framing e ocorre devido à necessidade de simplificação de realidades
complexas para facilitar sua compreensão e uma tomada rápida de decisão. Assim,
os frames são estruturas mentais usadas para simplificar e guiar o indivíduo em
diversas situações, mas que tornam as perspectivas limitadas (RUSSO;
SCHOEMAKER, 2002).
Percebe-se que a tomada de decisão depende muito da forma dada às ações, às
contingências e aos resultados. A maneira como o problema é interpretado também
influencia a ordem de preferência dada às alternativas. Assim, cada indivíduo
interpreta e avalia a situação apresentada de uma forma, podendo apresentar
diferentes tipos de efeito framing (PETERS; LEVIN, 2008).
O efeito framing ocorre, também, quando a análise passa de uma situação
condicional para uma situação com opções agregadas. A análise na forma
condicional ocorre, quando existe uma opção cujo resultado independe da ação do
tomador de decisão, atingindo resultado único, e os resultados possíveis da outra
opção dependem da não ocorrência da primeira. Nesse caso, a avaliação do
problema passa a ser feita apenas para as etapas subsequentes, como se a
primeira condição tivesse sido satisfeita. Ao avaliar apenas as etapas subsequentes,
eventos que dependem de outro acontecimento passam a parecer certos, pois a
condição anterior foi ignorada. Esse efeito é conhecido como efeito pseudocerteza e
pode acontecer em situações apresentadas com uma formulação sequencial ou
quando uma eventualidade causal é introduzida.
Comparando 3 problemas apresentados por Kahneman e Tversky (1981), é
possível observar o efeito descrito acima. No experimento, os problemas variavam
na forma de apresentação e os participantes deveriam escolher 1 entre as 2 opções
dadas. Assim, no primeiro problema as pessoas deveriam escolher entre (a) um
ganho certo de $30 ou (b) 80% de chance de ganhar $45. O segundo problema
possuía 2 estágios: no estágio 1 o participante tinha 75% de chance de não ganhar
nada e 25% de chance de ir para o segundo estagio e escolher entre (c) um ganho
certo de $30 ou (d) 80% de chance de ganhar $45. No último problema, a escolha
deveria ser feita entre (e) 25% de chance de ganhar $30 ou (f) 20% de chance de
ganhar $45. As escolhas dos participantes foram (a) para o problema 1 com 78%, (c)
27
para o segundo com 74% e (f) para o terceiro problema com 58%. Examinando os
problemas é possível perceber que os problemas 2 e 3 são idênticos em suas
probabilidades. A diferença é que enquanto o problema 2 foi apresentado de forma
sequencial, o outro foi apresentado de forma agregada. Já os problemas 1 e 2
diferem apenas pela inclusão de uma etapa no problema 2. Atingindo a etapa 2 do
segundo problema, a pessoa passa a ter uma situação igual a apresentada no
problema 1.
Através da análise das decisões dos participantes do experimento, percebe-se
que a avaliação realizada para os dois primeiros problemas foi bem parecida.
Indicando que o estágio 1 do segundo problema foi ignorado na avaliação das
opções e mostrando presença do efeito pseudocerteza. Por outro lado, ao avaliar as
escolhas dos problemas 1 e 3, cujas opções variam apenas por um fator de 0,25
aplicado às 2 opções do problema 3, nota-se uma alteração considerável na
preferência. Como no problema 3 não há mais opção de ganho certo, a opção
preferida passou a ser a que possui menor probabilidade, mas maior ganho
possível. Essa alteração na ordem de preferência pode ser creditada ao efeito
certeza, explicado no item 2.1. Esse resultado mostra que a redução de
probabilidade de um resultado tem maior impacto quando o resultado era
inicialmente certo – opção (a) vs. opção (e) – do que quando era apenas provável –
opção (b) vs. opção (f). Esse efeito pode provocar uma aversão exagerada a perdas
certas em comparação a perdas prováveis.
Outro framing que pode provocar alterações na ordem de preferência é o framing
dos resultados. Nesse caso, a referência usada como base de comparação com o
resultado é de extrema importância, já que os resultados são percebidos como
positivos ou negativos em relação a um resultado de referência, que é considerado
neutro. Variações do ponto de referência podem determinar se um resultado é
avaliado como perda ou como ganho. Conforme exemplificado por Kahneman e
Tversky (1984), para um funcionário de uma empresa, um aumento de salário menor
do que o recebido por seus colegas será interpretado como uma perda já que o
ponto de referência utilizado será o aumento recebido pelos demais funcionários. No
exemplo, a mudança no ponto de referência mudou o valor da diferença entre os
resultados e inverteu a ordem de preferência. Diversos fatores determinam o
resultado que será usado como referência no dia-a-dia. Normalmente, a referência é
28
uma situação para a qual a pessoa está adaptada, que é estabelecido por normas
sociais e expectativas, mas também pode corresponder a um nível de aspiração
(que pode ser realista ou não).
Diversos autores já estudaram a adequação das duas teorias apresentadas ao
comportamento das pessoas em situações de tomada de decisões envolvendo
incerteza. Os estudos realizados foram, em sua maioria, utilizando experimentos
com grupos de pessoas. No entanto, assim como nesse estudo, algumas pesquisas
foram feitas com base na observação de programas televisivos. No item a seguir,
serão descritos os resultados e conclusões encontrados por alguns desses estudos.
2.3 Estudos Anteriores
O uso crescente de programas de televisão como experimento natural para
análise do comportamento das pessoas possibilita a avaliação da tomada de
decisão em cenários de risco com grandes valores em jogo. A vantagem desse tipo
de análise consiste na quantia em jogo e na dispersão dos valores. Normalmente,
estudos acadêmicos avaliam as escolhas dos indivíduos em experimentos com
hipóteses ou envolvendo pequenas quantias monetárias. Essa prática dificulta a
extrapolação das conclusões para situações com valores maiores envolvidos. Assim,
para analisar a tomada de decisão quando valores elevados estão em risco diversos
pesquisadores utilizaram game shows como fonte de informação. Nessa seção
serão apresentados os estudos e conclusões relacionados apenas ao programa
“Deal or No Deal”.
O programa é ou foi exibido em diversos países, mas, apesar de seguir o mesmo
formato, dependendo do local em que é exibido as regras sofrem pequenas
alterações. Na Itália, por exemplo, existem opções de troca de mala e na Austrália, o
participante pode ser surpreendido com opções de Chance e Supercase. Assim, o
programa permite estudar aspectos diversos da aversão ao risco dos concorrentes.
O comportamento dos participantes em relação a opção de troca de malas da
versão italiana do game show foi o foco escolhido por Pogrebna e Blavatskyy (2006).
Os autores avaliaram a decisão dos concorrentes para testar se seriam indiferentes
entre aceitar ou rejeitar a oferta de troca, conforme previsto pela teoria da utilidade
29
esperada, ou se rejeitam a oferta devido à aversão ao risco, como sugerido pela
teoria das perspectivas. Em seu estudo, não perceberam aversão considerável ao
risco, com 46% dos concorrentes tendo aceitado, ao menos uma vez, a oferta de
trocar sua maleta por uma das que ainda não haviam sido abertas. Esse resultado
sugere que as pessoas não são tão avessas ao risco como esperado pela teoria das
perspectivas e que indivíduos inexperientes não são tão afetados pelo efeito de
aversão a perda em problemas com prêmios monetários elevados.
No programa exibido na Austrália, conforme explicado por Brooks et al. (2009) e
por Roos e Sarafidis (2006), além das rodadas normais do programa, a produção da
atração pode oferecer ao participante uma rodada extra. Tal rodada pode ocorrer
quando faltam apenas 2 malas a serem abertas. Nesse caso, o participante deve
escolher entre o valor certo já ganho ou uma loteria entre os dois valores. Essa
rodada é chamada de “Chance”. Na outra rodada extra poss vel, todas as maletas já
foram abertas e o jogador deve escolher entre o valor ganho ou a “Supercase”, uma
loteria onde o jogador pode ganhar um entre 8 valores possíveis. Para Brooks et al.
(2009), as rodadas extras provocam uma alteração no padrão de referência do
jogador, possibilitando a análise do efeito framing. Assim, o artigo além de avaliar se
o padrão de decisões realizadas evidencia o efeito framing, analisa a disposição ao
risco dos participantes em apostas envolvendo altas somas e o impacto de
características pessoais (especialmente sexo, idade e riqueza dos participantes), no
padrão de escolhas realizadas. Em seu estudo, os autores encontraram que, apesar
de grandes diferenças entre os concorrentes, em geral a aversão ao risco aumenta
junto com o valor da aposta. Quanto às características pessoais, a conclusão foi que
idade e sexo possuem certa influencia nas escolhas, com mulheres tendendo a
aceitar mais cedo as ofertas do banqueiro, mas a riqueza inicial não altera as
decisões. Por fim, os autores encontram que a alteração do quadro, provocada pela
oferta de Chance ou Supercase, possui impacto significante na disposição para
aceitar risco, com nível maior de aversão a risco que em rodadas anteriores do jogo.
Com isso, a existência do efeito framing é evidenciada, o que, conforme lembrado
pelos autores, está de acordo com a teoria das perspectivas.
A versão australiana foi estudada também por Roos e Sarafidis (2006). Através
da análise das escolhas dos participantes do programa, os autores avaliaram o grau
e a heterogeneidade da aversão ao risco dos participantes, verificaram a adequação
30
do modelo rank dependent da teoria da utilidade esperada aos dados e buscaram
violações à teoria da escolha racional. Para esse último são comparadas as
escolhas realizadas nas rodadas extras em relação às feitas nas rodadas normais
do jogo. Um grau de aversão ao risco em rodadas extras maior que o encontrado
nas rodadas anteriores indica um “preço de venda”, ou seja, arriscar o valor já
ganho, maior que o “preço de compra”, no caso aceitar uma nova rodada com a
possibilidade de maiores ganhos. Esse efeito, conforme lembrado pelos autores, é
denominado efeito endowment e não foi observado na amostra coletada para o
artigo. Para avaliar a aversão ao risco dos concorrentes, os autores assumiram que
os jogadores conseguem maximizar a utilidade esperada e utilizam a metodologia da
Aversão ao Risco Constante Absoluta e Constante Relativa, encontrando grande
heterogeneidade ao avaliar os limites de aversão ao risco de cada participante. Ao
avaliar generalizações da teoria da utilidade esperada, os autores observaram que o
modelo de utilidade rank dependent possui maior poder explanatório que o modelo
da utilidade esperada e que o modelo da teoria das expectativas. Por fim, os
estudiosos observaram que resultados favoráveis possuem pesos maiores que os
desfavoráveis.
Deck, Lee e Reyes (2008) utilizaram o programa mexicano para avaliar a
tomada de decisões. Nesse artigo, os autores classificam os participantes em 4
tipos, variando a forma como avaliam as ofertas futuras – utilizando apenas o valor
esperado ou considerando também as variâncias – e quantas rodadas a frente o
participante considera – podendo ser míope, que só avalia o período seguinte, ou
dinâmico, que consegue pensar em todas as ramificações até o fim do jogo. A partir
dessa separação, os autores avaliaram a adequação dos dados à função utilidade e
as fronteiras de atitude perante o risco dos participantes. O estudo encontrou
evidência de aversão ao risco dos participantes, porém em grau menor do que o
encontrado em estudos anteriores citados pelos autores. Além disso, a variação
encontrada da atitude dos concorrentes perante o risco foi grande, com pessoas
bastante avessas ao risco e outras propensas ao risco.
Já no artigo de Post et al. (2008), utilizado como base para essa dissertação, foi
realizada uma análise das escolhas considerando que os participantes avaliam as
ofertas de forma míope. Esse tipo de avaliação foi selecionada como mais adequada
ao estudo por ser considerada mais apropriada para a teoria da utilidade esperada.
31
Dessa forma, a estimação dos parâmetros para a teoria das perspectivas também
considerou que os concorrentes avaliam apenas até a rodada seguinte para tomada
de decisão. Os autores enfatizam a importância de avaliações dinâmicas para
melhor adequação à teoria das perspectivas, porém, para possibilitar a comparação
entre os modelos, optaram por manter apenas a perspectiva míope. A seguir, os
pesquisadores estimaram os parâmetros das funções utilizadas para cada teoria
através do método da máxima verossimilhança. Assim, foram encontradas
evidências da importância das jogadas anteriores para definição da decisão tomada
pelo participante, indicando dependência de referência e de caminho, previstas pela
teoria das perspectivas. O nível encontrado de aversão ao risco foi moderado. No
entanto, esse nível reduz consideravelmente depois que expectativas anteriores de
bons resultados não se concretizam devido à abertura de uma mala de valor elevado
e depois que as expectativas são superadas devido à eliminação de um valor baixo.
32
3 DESCRIÇÃO DO PROGRAMA
O programa de televisão “Topa ou Não Topa” é a versão brasileira do game show
desenvolvido e comercializado pela produtora holandesa Endemol. Exibido
inicialmente na Holanda, no ano de 2000, o programa rapidamente se tornou popular
e teve seu formato exportado para mais de 60 países. O “Deal or No Deal”, nome
pelo qual é conhecido em diversos países, possui diferentes versões, dependendo
do local de exibição, mas suas características principais são as mesmas. A
descrição a seguir se refere ao programa brasileiro exibido a partir de 2006.
O jogo é composto de um participante, um apresentador, um negociador e 26
(vinte e seis) malas contendo diferentes valores em dinheiro que vão de R$ 0,50 a
R$ 1 milhão. Os 26 valores possíveis são conhecidos, mas a localização de cada um
só é divulgada conforme as maletas são abertas ao longo do programa.
No início do episódio, o competidor escolhe uma mala, cujo valor só será
revelado após a abertura de todas as outras 25 maletas. Nove rodadas, no máximo,
separam o participante do prêmio que irá levar para casa. Em cada uma, o jogador
seleciona as malas que serão abertas e terão seu valor revelado. A cada rodada o
número de maletas que devem ser abertas diminui. Na primeira rodada são 6
maletas, a seguir 5, 4, 3, 2, 1, 1, 1 e 1. Após a nona rodada ainda restam 2 malas
fechadas: a escolhida no inicio do jogo e mais uma.
Ao fim de cada rodada, o Negociador faz uma oferta pela mala do participante. A
decisão entre aceitar ou não a proposta realizada deve ser tomada em poucos
minutos. Mas, depois da segunda rodada, 3 a 4 amigos e familiares podem ser
consultados – além da plateia, que pode se manifestar durante o programa. Se o
participante não aceitar a proposta (“Não Topa”) o jogo continua e uma nova rodada
começa, o competidor deve escolher mais algumas maletas antes de escutar a nova
oferta por sua mala. Se a proposta for aceita (“Topa”), o jogo termina e o jogador vai
embora com o montante aceito.
As ofertas do negociador se baseiam nos valores das maletas restantes no
programa ao fim de cada rodada. Se o participante passar por todas as rodadas sem
aceitar nenhuma proposta, ele ainda pode escolher se troca sua maleta pela outra
que ainda não foi aberta. A maleta escolhida é então aberta e a quantia que o
33
participante levará para casa é revelada. A Figura 3 mostra o funcionamento do
jogo.
Figura 3: Esquema do jogo
Durante o jogo, os valores disponíveis aparecem num telão localizado ao fundo
do cenário. Conforme os valores vão saindo, os números ficam mais escuros. Dessa
forma, o competidor não precisa memorizar os valores e pode, sempre que desejar,
checar suas chances de abrir um valor alto ou baixo.
Conforme explicado, as ofertas dependem dos valores possíveis nas maletas
restantes. Dessa forma, a proposta pode aumentar ou diminuir dependendo dos
valores das últimas maletas retiradas. Assim, se o participante abre malas de
montantes altos é possível deduzir que o valor ofertado ao final dessa rodada será
menor que o da rodada anterior. Por outro lado, se os valores eliminados durante a
rodada forem baixos, a nova oferta provavelmente será mais alta.
Apesar de estarem relacionadas aos valores ainda em jogo, as propostas do
Negociador não dão indícios sobre o valor contido na mala do concorrente. Esse
valor é desconhecido não apenas do participante e do público, mas também dos
componentes do programa. Os montantes são distribuídos de forma aleatória entre
as maletas por uma equipe de produção e a seguir outra equipe numera as maletas.
Ambos os processos são realizados de forma independente para garantir que
ninguém saiba qual valor está em que maleta.
Escolha Mala Principal
Topa
Não Topa
Fim do Jogo
Abertura de 6 Malas
1ª. Oferta
Inicio do Jogo
Rodada 1 Rodada 2 Rodadas 3 a 8 Rodada 9
Troca Mala Principal
Topa
Não Topa
Fim do Jogo
2ª. OfertaAbertura
de 5 Malas...
...
Fim do Jogo
OfertaTopa
Não Topa
9ª. OfertaAbertura de 1 Mala
Topa
Não Topa
Fim do Jogo
Sim
Não
Abertura da Mala Restante
Abertura da Mala Restante
Abertura Mala Principal
Abertura Última Mala
Fim do Jogo
Final do Jogo
34
As ofertas realizadas são um percentual da média dos montantes restantes,
iniciando com um percentual baixo na primeira rodada (em torno de 10%) e
chegando mais próximo de 100% nas últimas rodadas. Essa estratégia pode ser
entendida como um mecanismo do programa para prolongar a duração do jogo e
adiar a decisão do concorrente de aceitar a proposta.
35
4 METODOLOGIA
4.1 Método
A metodologia utilizada para desenvolvimento do estudo será a observação de
situações envolvendo incertezas em um ambiente controlado. Assim, serão
analisadas as escolhas realizadas pelos participantes do programa de televisão
“Topa ou Não Topa” quando precisam decidir entre aceitar uma quantia em dinheiro
ou arriscar um valor maior.
Diferente de outras metodologias normalmente empregadas, a observação de
programas televisivos permite avaliar o comportamento das pessoas em situações
de incertezas envolvendo montantes elevados e com distribuição de probabilidades
conhecida. Além disso, nesse programa as decisões exigidas dos concorrentes são
simples, não exigindo conhecimento prévio do participante sobre nenhum assunto
especifico.
4.2 Dados
Os dados utilizados na análise são referentes às decisões dos programas “Topa
ou Não Topa” exibidos entre os dias 25 de agosto de 2010 e 06 de junho de 2011,
totalizando 34 edições.
O programa “Topa ou Não Topa” começou a ser exibido no Brasil em 2006.
Porém, a transmissão não se deu de forma continua e houve períodos em que o
programa não foi produzido. A temporada utilizada nesse estudo iniciou no dia 25 de
agosto de 2010 e foi exibida semanalmente até o dia 25 de julho de 2011, com
apresentador diferente dos episódios dos anos anteriores.
A emissora de televisão responsável pela transmissão do programa brasileiro
mantém um site onde disponibiliza a íntegra dos episódios do game show e de
outros programas de sua grade horária. Esse canal foi utilizado para coleta da maior
parte das informações utilizadas nesse estudo. Para os episódios não encontrados
nesse site, o site youtube foi utilizado como fonte, já que nesse também é possível
encontrar muitos episódios do “Topa ou Não Topa”. Em algumas ocasiões, ainda, a
coleta foi realizada diretamente através da observação do programa enquanto
36
transmitido pela televisão, sem que esse episódio fosse arquivado mais tarde em
nenhum dos sites citados anteriormente. Dada a maneira como os programas foram
disponibilizados para estudo, não foi possível utilizar todas as edições exibidas no
período citado da amostra, apenas as encontradas via internet ou assistidas via
televisão.
Em algumas ocasiões, a produção do game show preparou surpresas para os
participantes do programa que dependia da permanência no jogo até que uma mala
especifica fosse aberta. Essa estratégia introduz um novo fator a análise e incentiva
um comportamento mais propenso ao risco por parte do concorrente, já que
representa um incentivo para que o participante recuse mais ofertas, ainda que
favoráveis. Assim, decidiu-se, inicialmente, retirar os episódios nos quais os
participantes poderiam ser presenteados com prêmios extras porque poderiam levar
a interpretações errôneas quanto ao nível de aversão/propensão ao risco
apresentado pelos participantes.
No entanto, ao avaliar cuidadosamente as ocasiões em que esse tipo de
estratégia foi empregada pela produção, percebeu-se que em apenas 1 programa, o
especial de natal (exibido no dia 22/12/2010), o participante pode realmente ter sido
influenciado pela existência de um prêmio extra. Nesse caso, o prêmio extra
dependia da abertura de todas as 26 maletas. Só assim a surpresa contida na
vigésima sétima caixa seria revelada – nesse programa foram usadas caixas de
presente no lugar das tradicionais maletas. Tal regra pode ter influenciado o jogador
na tomada de decisões, conforme interpretado nesse estudo, fazendo com que o
concorrente recusasse ofertas superiores 90% da média de prêmios não revelados.
Por esse motivo, o episódio foi retirado da amostra utilizada na análise. Porém, a
influencia é discutível uma vez que 2 dos 3 maiores prêmios permaneceram no jogo
até o fim. Após recusar todas as ofertas e conseguir o prêmio surpresa do programa,
o participante saiu com o segundo maior prêmio do jogo, R$ 750.000.
Além do programa descrito acima, outros 2 episódios dentre os utilizados para
coleta de dados tiveram prêmios extra. Mas, diferente do especial de natal, a
surpresa não estava vinculada a abertura de todas as maletas. Bastava continuar no
jogo até que a maleta contendo o prêmio extra fosse aberta. Como a localização da
surpresa permanecia desconhecida até a abertura da mala, havia um incentivo para
37
a permanência do participante por mais rodadas, podendo chegar ao caso citado no
parágrafo anterior se a maleta com a surpresa fossa a escolhida como principal. No
entanto, em nenhum dos 2 episódios o mistério da localização do prêmio extra durou
muito tempo. No programa do dia 22 de setembro de 2010, o prêmio saiu na terceira
rodada e a participante continuou jogando até a rodada 9, quando aceitou a oferta
do negociador. No dia 31 de março de 2011, o outro episódio no qual a produção se
utilizou de um prêmio extra para presentear a participante, a mala com a surpresa
saiu logo na segunda rodada do jogo, mas o programa continuou até a abertura da
vigésima sexta mala. Nesses episódios, o artifício do prêmio extra para manter o
participante por mais tempo no jogo não parece ter funcionado conforme o planejado
já que em ambos os casos a surpresa saiu ainda no inicio do jogo. Nenhum
participante aceitou a oferta do negociador tão cedo no programa, rodadas 2 ou 3,
conforme mostra a Tabela 1. Os primeiros concorrentes a “topar” as ofertas sa ram
na rodada 6. Dessa forma, pode-se considerar que a presença dos incentivos não
influenciou nas decisões dos jogadores nesses programas, o que torna possível a
utilização das informações dessas datas para o estudo.
Outro programa que merece ser citado aqui foi exibido no dia 30 de maio de
2011. O tomador de decisões escolhido para esse episódio não seguiu o padrão dos
demais programas, dessa vez um casal foi escolhido para participar do “Topa ou
Não Topa”. Inicialmente, cogitou-se a retirada desse dia da amostra. Porém, ao
observar a dinâmica do casal durante o programa percebe-se que a maior parte das
decisões foram tomadas por apenas uma pessoa. Assim, pode-se considerar que
houve apenas um participante e que o outro participante se comportou como um dos
familiares. Conforme explicado anteriormente (item 3, página 32), alguns familiares e
amigos ficam no palco para ajudar no decorrer do programa. Nesse programa, pode-
se considerar que um desses parentes ficou ao lado do concorrente. Importante
também considerar que em muitas ocasiões os participantes já pensam com
antecedência sobre o caminho que tomarão nas escolhas durante o programa e que
as decisões podem ser influenciadas pelos amigos e familiares presentes no palco
ou pela plateia. Dessa forma, optou-se por manter esse episódio no estudo.
As informações coletadas dos programas foram os valores eliminados pela
abertura das malas, os valores restantes em jogo, os valores das ofertas do
negociador e as decisões de “Topa ou Não Topa”, para cada rodada de todos os
38
participantes. Também foram guardadas as informações qualitativas de cada
participante, como nível de escolaridade, sexo e idade. Essas informações são
passadas ao telespectador durante a apresentação inicial do participante, durante as
conversas que ocorrem ao longo do programa e através das notícias divulgadas no
site da emissora.
A distribuição empírica dos valores restantes a cada rodada pode ser observada
nas figuras Figura 4 e Figura 5. Na primeira, são apresentadas as somas dos valores
restantes dos participantes da amostra por rodada. Como esperado, nota-se que os
prêmios totais reduzem a cada rodada, conforme as malas são abertas, e que a
dispersão das somas dos valores aumenta. A Figura 5 mostra a distribuição empírica
do valor médio restante em cada rodada. Através da figura, percebe-se uma grande
variação dos prêmios médios possíveis para os participantes de uma rodada para
outra, além da presença de grande dispersão dos valores médios restantes entre os
jogadores. É possível notar, também, que a dispersão dos valores aumenta durante
o jogo, como aconteceu com as somas dos valores na Figura 4. Pelas figuras,
observa-se a existência de outliers, que representam participantes que conseguiram
eliminar mais valores baixos que os outros e/ou manter quantias elevadas por mais
tempo, conseguindo se destacar dos outros e apresentando soma dos valores dos
prêmios restantes e média dos valores restantes muito superior aos demais
concorrentes. Há ainda um outlier na primeira rodada que representa um jogador
cujos valores restantes estavam, nessa rodada, bastante inferiores aos dos outros.
Figura 4: Distribuição empírica do prêmio total restante
010
^62*
10^6
3*10
^6
Distribuição empírica do prêmio total restante
39
Figura 5: Distribuição empírica do prêmio médio restante
Conforme citado anteriormente, ao final da segunda rodada, amigos e familiares
do participante são apresentados e passam a poder ajudar o concorrente na tomada
de decisões. Além desses, a plateia pode dar palpites durante todo o programa
quanto a qual mala escolher e quanto a aceitar ou não as ofertas. Assim, o jogador é
influenciado na hora de realizar escolhas, diminuindo a importância da interpretação
dos dados de idade, sexo e escolaridade para entender seu comportamento em
situações de risco. A Tabela 1 mostra um resumo estatístico dessas informações. As
informações de Sexo e Escolaridade foram consideradas variáveis dummies. Assim,
para participantes mulheres foi atribuído o valor 1 e para homens o valor 0. Em
escolaridade, o valor 1 foi dado aos jogadores com nível superior, ou maior,
completo, níveis inferiores de escolaridade receberam o valor 0. A última rodada
jogada pelo participante foi reportada na informação Última Rodada. O concorrente
que permanece até a abertura da mala principal jogou até a rodada de número 10.
As informações de Melhor Oferta Rejeitada e Oferta Aceita são informações
percentuais em relação a média de prêmios restantes. A primeira indica a maior
oferta percentual rejeitada pelo participante. Aqui não são avaliados os valores
monetários, apenas os percentuais das ofertas em relação ao valor médio da
rodada. Em oferta aceita (%) são indicados os percentuais da oferta aceita em
relação a média de valores ainda não revelados até a rodada. Para os participantes
que rejeitam todas as propostas e recebem o valor contido na vigésima sexta
maleta, a oferta percentual é igual a 100%. Por fim, a Tabela 1 mostra o valor, em
reais, que o jogador levou para casa.
010
0000
2000
0030
0000
4000
0050
0000
Distribuição empírica do prêmio médio restante
40
Pela tabela, é possível perceber que os participantes permanecem no jogo até
que a oferta do negociador ultrapasse a metade da média dos prêmios restantes,
aceitando a oferta apenas quando atinge um patamar mínimo de 66% (menor oferta
aceita). Em média, as ofertas são aceitas ao atingir 95% do valor médio restante,
mas, em alguns casos, propostas superiores a 100% da média de valores restantes
são rejeitadas. Conforme explicado anteriormente (item 2.1), uma alternativa com
ganho certo possui um peso muito maior que uma apenas com probabilidade de
ganhos, ainda que maiores, quando as pessoas são avessas ao risco. Assim, nota-
se que os jogadores não aceitam propostas muito menores do que a média dos
prêmios ainda em jogo, como esperado caso os participantes tivessem alto grau de
aversão ao risco. Na amostra observada, os concorrentes aguardam até que o valor
da oferta fique próximo ao valor médio dos prêmios restantes, o que pode ser
entendido como baixa aversão ao risco. Nos casos em que ofertas superiores ao
valor esperado são rejeitadas, pode-se dizer que o participante apresenta certa
propensão ao risco. A Tabela 1 mostra, ainda, que os jogadores saem, em média,
após a oitava rodada.
Tabela 1: Sumario das Estatísticas
4.3 Análises Preliminares
Antes de iniciar a análise das escolhas dos participantes do “Topa ou Não Topa”
frente às 2 teorias utilizadas nesses estudo, teoria da utilidade esperada e teoria das
perspectivas, mostra-se necessário entender o funcionamento das ofertas passadas
aos concorrentes, assim como a forma como os participantes recebem tais ofertas,
ou seja, as decisões de “Topa” ou “Não Topa”. Para auxiliar nesse trabalho, foi
montada a Tabela 2. Nessa, foram colocadas as informações por rodada de número
de participantes (Nº), prêmio médio restante (nomeado como Premios na tabela) e
Média Desv. Padrao Min Mediana Max
Idade (anos) 37.59 11.98 18.00 35.00 71.00
Sexo (feminino = 1) 0.53 0.51 - 1.00 1.00
Escolaridade (superior = 1) 0.71 0.46 - 1.00 1.00
Última Rodada 8.21 1.63 6.00 8.00 10.00
Melhor Oferta Rejeitada (%) 87.5% 16.6% 55.1% 89.9% 112.9%
Oferta Aceita (%) 95.0% 15.0% 65.9% 100.0% 150.0%
Valor Recebido (R$) 103.423.97 124.124.54 1.00 57.500.00 400.000.00
41
percentual da média de ofertas em relação a média de prêmios restantes (colunas
%ON da tabela). Além de fornecer as informações de forma agregada para todos os
concorrentes da amostra (“Todos”), foram colocadas as mesmas informações de
forma separada entre os participantes que aceitaram as ofertas (“Topa”) e os que
não aceitaram (“Não Topa”).
Observando a Tabela 2 é possível perceber que, ao longo do jogo, as ofertas
feitas pelo negociador aumentam progressivamente em relação ao prêmio restante.
Inicialmente as ofertas representam um percentual pequeno dos valores médios das
maletas fechadas, em torno de 10% na rodada 1. O percentual das ofertas cresce
rapidamente até a sexta rodada, passando de 10% para 81%, em média, da rodada
1 para a 6, e depois passam a apresentar uma aumento mais lento até o fim do jogo,
quando ficam mais próximas a 100% do valor esperado dos prêmios.
Em relação às ofertas aceitas, é possível notar que os jogadores não aceitam
propostas pouco representativas do valor restante nas malas. Conforme mostrado
na Tabela 1 (página 40), o menor valor aceito por um jogador representava 65,9% e
a média fica em 95,6%, indicando uma aversão a risco não muito acentuada entre
os participantes já que esperam que a proposta ultrapasse a metade da média dos
prêmios restantes antes de topar uma oferta. Em muitos casos, ofertas superiores
ao valor médio restante são recusadas pelos jogadores em busca do maior prêmio
em jogo, sugerindo a presença de propensão ao risco.
Apesar de permitir uma melhor visualização do funcionamento do jogo, a Tabela
2 não mostra como os valores variam de um episódio para outro, ou como a ordem
dos valores retirados podem influenciar nas escolhas dos concorrentes. Nas últimas
rodadas, os percentuais das propostas do negociador diferem muito dependendo
dos valores em jogo, não seguindo, necessariamente, a regra de aumentar o
percentual conforme a aproximação do fim do jogo. Assim, o padrão pode variar
bastante dependendo do caso, como ocorreu no dia 13 de janeiro de 2011, por
exemplo. Depois de seguir a crescente esperada até a sexta rodada, atingindo
87,6% da média dos prêmios restantes, os percentuais da oferta passaram a variar,
caindo para 0,3% na rodada seguinte e voltando a 84,4% na rodada 8. A essa altura
os prêmios restantes já estavam bem menores do que os grandes prêmios
esperados pelo participante, que saiu do game show com apenas R$ 10,00, depois
42
de recusar a última oferta de R$ 13,00, apenas 74,3% dos valores ainda não
revelados. Para melhor exemplificar o efeito da sequência dos valores retirados nas
decisões dos jogadores, serão relatados os casos de 2 participantes: um sem sorte
na escolha de maleta e outro cuja trajetória proporcionou ganhos mais altos.
Tabela 2: Ofertas e Decisões dos Participantes
O episódio escolhido como exemplo de jogador sem sorte foi exibido no dia 17 de
março de 2011. A sequência de valores revelados e as decisões tomadas pela
participante podem ser observadas na Tabela 3. Assim, pode-se notar que ainda na
rodada 6, restando apenas 1 valor alto no jogo (R$ 100.000), a oferta chega a
103,1% do valor esperado. Apesar do alto percentual, a participante recusa a
proposta de R$ 21 mil, valor muito aquém do valor mais alto almejado pela
concorrente. Na rodada seguinte, em mais uma escolha sem sorte da concorrente
naquela noite, a maleta de R$ 100 mil é aberta e a média dos prêmios restantes cai
de R$ 20.361 para apenas R$ 451. Nesse ponto, a oferta vai a R$ 350, 77,6% dos
valores restantes, e é mais uma vez recusada. Por fim, após recusar todas as
ofertas da noite, mesmo a última oferta de R$ 370, equivalente a 98% da média das
duas maletas fechadas (R$ 5 e R$ 750), a concorrente sai do jogo com o valor
revelado na última mala, R$ 5. Avaliando as ofertas recusadas, é possível dizer que
a jogadora apresentou um comportamento propenso ao risco, recusando proposta
superior ao prêmio médio. Esse comportamento pode ser interpretado como
consequência de sua falta de sorte, que pode ter levado à demora na adaptação ao
novo ponto de referência, o novo valor médio após a “perda” de valores elevados
Rodada %ON Premios Nº %ON Premios Nº %ON Premios Nº
1 10.3% 137.630 34 - - - 10.3% 137.630 34
2 21.3% 139.702 34 - - - 21.3% 139.702 34
3 20.1% 147.844 34 - - - 20.1% 147.844 34
4 48.6% 144.477 34 - - - 48.6% 144.477 34
5 62.0% 154.258 34 - - - 62.0% 154.258 34
6 80.8% 138.213 34 80.6% 111.413 8 80.8% 146.459 26
7 88.3% 138.701 26 83.9% 271.078 5 90.9% 107.182 21
8 89.6% 86.913 21 97.5% 125.772 5 85.4% 74.769 16
9 93.5% 71.465 16 92.0% 175.200 4 95.8% 36.886 12
Todos Topa Não Topa
43
após a abertura das maletas, fazendo com que a participante recusasse propostas
que, em outras situações, poderiam ser aceitas.
Tabela 3: Exemplo de Participante sem Sorte
A trajetória do participante do programa transmitido no dia 15 de dezembro de
2010 mostra um caminho bem diferente do relatado anteriormente, com a abertura
de malas com valores menores no inicio do episódio, conforme mostrado na Tabela
4. Nesse dia, depois de um começo fraco, com a eliminação do prêmio principal
(R$1 milhão) logo na primeira rodada, o jogador consegue mudar sua sorte e abre
boa parte dos valores baixos. Na rodada sete o concorrente precisa decidir entre
aceitar uma oferta de 103% do prêmio médio restante ou continuar jogando.
Premio (R$) 1 2 3 4 5 6 7 8 9
0,50 X X
1
5 X X X X X X X X X
10 X
25 X X
50 X X X X X X X X
75 X
100 X X X
200 X
300
400
500 X X
750 X X X X X X X X X
1.000 X X X X X X X
5.000
10.000 X X X X
25.000
50.000 X X X X X
75.000 X X X X
100.000 X X X X X X
200.000 X X X
300.000
400.000 X X
500.000 X X X
750.000 X
1.000.000 X
Media (R$) 154.386 89.162 85.173 29.601 25.301 20.361 451 268 378
Oferta (R$) 17.000 12.000 30.000 10.000 19.000 21.000 350 200 370
Oferta (%) 11,0% 13,5% 35,2% 33,8% 75,1% 103,1% 77,6% 74,5% 98,0%
Decisão Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa
Rodada do Jogo ( r )
44
Confiando em sua sorte, o participante rejeita a proposta e abre mais uma maleta.
Depois de muito suspense, mais um valor baixo é revelado, R$ 5, e o valor da oferta
sobe de R$ 181 mil para R$ 241 mil, novamente uma oferta equivalente a 103% do
valor médio restante. Mais uma vez, a oferta é recusada e outra maleta baixa é
eliminada. Dessa vez o jogador precisa escolher entre aceitar uma proposta de 97%
do valor esperado, que estava em R$ 350 mil, ou uma aposta com 50% de chance
de ganhar R$ 300 mil ou 50% de chance de ganhar R$ 400 mil. A decisão de
continuar abrindo as maletas se mostrou acertada, apesar de arriscada, e o
concorrente terminou o jogo com R$ 400 mil. Pelas propostas recusadas, algumas
com valores superiores a média restante, é possível dizer que o participante
apresentou um comportamento de tendência ao risco.
Tabela 4: Exemplo de participante com Sorte
Premio (R$) 1 2 3 4 5 6 7 8 9
0,50 X X X
1 X
5 X X X X X X X
10 X
25 X X X X X X
50
75 X
100 X X X X X X X X
200 X X
300 X
400 X
500 X X
750
1.000 X X X
5.000 X X X X X
10.000 X X X
25.000 X X
50.000
75.000
100.000 X X X X
200.000
300.000 X X X X X X X X X
400.000 X X X X X X X X X
500.000 X X X X
750.000 X X
1.000.000
Media (R$) 104.631 139.455 119.648 163.141 117.522 140.026 175.026 233.367 350.000
Oferta (R$) 8.000 40.000 30.000 90.000 73.000 127.000 181.000 241.000 340.000
Oferta (%) 7,6% 28,7% 25,1% 55,2% 62,1% 90,7% 103,4% 103,3% 97,1%
Decisão Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa Não Topa
Rodada do Jogo ( r )
45
Em ambos os casos apresentados foi possível verificar uma aversão baixa ao
risco, com evidências de propensão ao risco em algumas rodadas. Na primeira
história, o comportamento da participante demonstra uma tendência a aceitar novas
apostas para compensar a retirada dos valores altos, numa tentativa de recuperar o
ponto de referência anterior, ou seja, um efeito break-even. Já no segundo caso, o
jogador parece bastante confiante na sorte e continua apostando que não irá perder.
Tal comportamento pode ser interpretado como um efeito house-money, quando o
apostador joga como se o dinheiro não fosse dele.
Como realizado no artigo de Post et al. (2008), para uma melhor análise inicial
dos efeitos dos resultados anteriores nas escolhas realizadas, os participantes serão
classificados, a cada rodada, de acordo com os valores restantes no jogo. Assim,
dependendo de sua situação no jogo, os concorrentes poderão ser classificados
como “perdedores” ou “ganhadores” e suas decisões serão avaliadas de acordo com
sua categoria.
A divisão dos jogadores entre as categorias irá depender do cálculo do valor
médio restante após a retirada do menor ou do maior valor ainda em jogo, melhor e
pior cenário, respectivamente. Dessa forma, a classificação considera tanto o lado
positivo quanto o negativo de recusar uma oferta, ou seja, considera tanto o risco de
queda na média dos valores restantes (no caso de a próxima maleta aberta conter
valor elevado) quanto a possibilidade de aumento do valor médio dos prêmios
restantes (caso um valor baixo seja eliminado através da mala seguinte). Um
perdedor, então, será aquele cujo valor médio das malas fechadas é baixo, mesmo
que o menor valor em jogo esteja na próxima maleta a ser aberta, o melhor cenário.
Assim, a média dos prêmios restantes sob o melhor cenário será:
(1)
Na fórmula, é a média dos valores em jogo na rodada atual, é o número de
malas restantes na rodada = 1, ... 9, e é o menor valor restante. O pior
cenário – a média dos prêmios restantes caso a maleta com o maior valor em jogo
( ) seja a próxima a ser aberta – será utilizado para verificar quais concorrentes
serão classificados como ganhadores. A média dos prêmios restantes sob o pior
cenário será encontrada através da fórmula:
46
(2)
A partir das fórmulas acima, os melhores e piores cenários dos participantes são
ordenados. São considerados perdedores aqueles cujo valor do melhor cenário
( ) estiver entre os menores da rodada. Assim, os valores encontrados como
são ordenados e, a seguir, os jogadores são divididos em 3 grupos de mesmo
tamanho. Os participantes pertencentes ao grupo contendo os menores valores são
classificados como perdedores. A classificação dos ganhadores será realizada
utilizando os valores encontrados como pior cenário ( ). Os concorrentes
pertencentes ao grupo com os maiores valores de serão os ganhadores. Os
participantes que não caírem em nenhuma das categorias serão considerados
neutros.
A Figura 6 mostra as trajetórias dos 34 concorrentes ao longo das rodadas
segundo suas classificações em Perdedor (-1), Neutro (0), e Ganhador (+1). Cada
gráfico mostra também o total recebido pelo participante. Observando as
classificações dos jogadores ao longo do programa, percebe-se que os concorrentes
não permanecem numa mesma classe durante todo o jogo, podendo ser classificado
em categorias diferentes a cada rodada, de acordo com os valores que foram
eliminados. Através da Figura 6, é possível perceber que participantes classificados
como perdedores tendem a permanecer mais tempo no jogo e dificilmente aceitam
uma oferta. Nota-se, ainda, uma relação entre o valor recebido e as classificações
dos jogadores nas rodadas. Concorrentes classificados com mais frequência como
perdedores, por exemplo, tendem a receber quantias menores, enquanto os
participantes classificados como ganhadores costumam receber valores mais
elevados ao fim do jogo. Exceções a essa relação podem ocorrer, especialmente
quando o participante abre todas as malas e recebe o valor contido na última mala.
47
Figura 6: Classificação dos concorrentes por rodada e valor recebido
4.3.1. Resultados Encontrados
Conforme explicado na seção 4.3, antes de avaliar as escolhas dos jogadores de
acordo com a teoria da utilidade esperada e com a teoria das perspectivas, foi
realizada uma análise das decisões dos participantes de acordo com o grupo ao
qual foram alocados. Assim, nessa seção será realizada a análise dos efeitos dos
resultados anteriores nas escolhas dos concorrentes. Os jogadores podem ser
classificados em perdedores, neutros ou ganhadores, e a separação em cada classe
foi realizada de acordo com as equações (1) e (2).
Na Tabela 5 é possível verificar as decisões dos participantes de cada categoria,
demonstrando o efeito de resultados anteriores nas escolhas. São apresentados,
para cada rodada, os valores das ofertas feitas pelo negociador em relação ao valor
médio contido nas malas ainda não abertas (%ON), o valor médio ainda em jogo
(Premios), o número de participantes e o percentual de jogadores que aceitaram a
-1.0
-0.5
0.0
0.5
1.0
2 4 6 8
1 - 1 0 1 0 0 0
0.0
0.2
0.4
0.6
0.8
1.0 1 0 - 1 9 0 0 0 0
-1.0
-0.5
0.0
0.5
1.0
2 4 6 8
1 1 - 2 7 0 0 0
0.8
0.9
1.0
1.1
1.2
1 2 - 3 7 9 0 0 0-1
.0-0
.50.
00.
51.
0
2 4 6 8
1 3 - 7 5
0.8
0.9
1.0
1.1
1.2
1 4 - 3 7 0 0 0 0
-1.0
-0.5
0.0
0.5
1.0
2 4 6 8
1 5 - 7 0 0 0
-1.0
-0.5
0.0
0.5
1.0 1 6 - 4 0 0 0 0 0
-1.0
-0.6
-0.2
1 7 - 1 0 0
0.0
0.2
0.4
0.6
0.8
1.0 1 8 - 9 8 0 0 0
-1.2
-1.0
-0.8
1 9 - 1 0
-1.0
-0.5
0.0
0.5
1.0 2 - 3 0 0 0 0
-1.0
-0.6
-0.2
2 0 - 9 9 0 0 0
0.0
0.2
0.4
0.6
0.8
1.0 2 1 - 1 0 0 0
-1.0
-0.5
0.0
0.5
1.0 2 2 - 2 0 0
-1.0
-0.5
0.0
0.5
1.0 2 3 - 5
-1.0
-0.6
-0.2
2 4 - 7 0 0 0 0
-1.0
-0.6
-0.2
2 5 - 5 0 0
-1.0
-0.5
0.0
0.5
1.0 2 6 - 2 2 0 0 0 0
0.0
0.2
0.4
0.6
0.8
1.0 2 7 - 5 0 0 0 0
-1.0
-0.5
0.0
0.5
1.0 2 8 - 1 0 0 0
-1.0
-0.5
0.0
0.5
1.0 2 9 - 1 6 0 0 0 0
-1.0
-0.5
0.0
0.5
1.0 3 - 5 0 0
-1.2
-1.0
-0.8
3 0 - 4 1 0 0 0
0.0
0.2
0.4
0.6
0.8
1.0 3 1 - 3 5 9 0 0 0
-1.0
-0.6
-0.2
3 2 - 1 3 3 0 0 0
-1.0
-0.6
-0.2
3 3 - 2 5
0.0
0.2
0.4
0.6
0.8
1.0 3 4 - 1 5 9 0 0 0
-1.0
-0.6
-0.2
4 - 9 9 9 9 9
0.0
0.2
0.4
0.6
0.8
1.0
2 4 6 8
5 - 2 2 0 0 0 0
-1.0
-0.5
0.0
0.5
1.0 6 - 1
-1.0
-0.5
0.0
0.5
1.0
2 4 6 8
7 - 2 0 0 0 0
0.0
0.2
0.4
0.6
0.8
1.0 8 - 2 1 5 0 0 0
-1.0
-0.6
-0.2
2 4 6 8
9 - 6 5 0 0 0
Trajetórias: Perdedor==-1, Neutro==0, Vencedor==1
48
oferta da rodada (%T). Essas informações estão apresentadas de forma separada
para cada categoria.
Tabela 5: Decisões por Categoria
Observando os percentuais de “Topa” na tabela, percebe-se que há uma
tendência muito maior de perdedores continuarem jogando do que neutros ou
ganhadores, com apenas 2,3% dos perdedores aceitando propostas durante o
programa. Ainda avaliando o “Topa ou Não Topa” como um todo, nota-se que os
concorrentes neutros tendem a aceitar mais as ofertas que as outras categorias,
11,8% de todos os neutros aceitaram as propostas recebidas.
Apesar de apresentar maior proporção de jogadores que escolheram “Topa”, os
neutros só possuem o maior percentual na rodada 6 (41,7%). Nas rodadas
seguintes, os ganhadores aceitaram mais ofertas do que as demais categorias.
Avaliando as rodadas separadamente, a rodada 6 parece ser uma rodada
decisiva para muitos concorrentes. A partir dessa, passa-se a abrir apenas 1 mala
por rodada, iniciando uma etapa mais tensa do programa. Dessa forma, os
participantes que ficam em dúvida quanto a aceitar ou não a oferta na rodada 5
esperam até, pelo menos, a rodada seguinte antes de escolher “Topa”, já que só
uma maleta será aberta. Na Tabela 5 é possível verificar que a sexta rodada é a que
apresenta maior proporção de “Topa”, sendo a única na qual perdedores aceitaram
ofertas. Nenhum perdedor aceitou ofertas depois dessa rodada.
Ainda entre os jogadores classificados como perdedores, ao verificar os valores
que estes receberam no fim do programa percebe-se que as quantias não foram
muito altas, mesmo para aqueles que arriscaram e chegaram à última maleta. O
“perdedor” que conseguiu a maior quantia foi um dos que saiu na sexta rodada.
Rodada %ON Premios Nº %T %ON Premios Nº %T %ON Premios Nº %T
1 7.2% 106.663 11 0.0% 22.4% 156.691 12 0.0% 19.2% 157.105 11 0.0%
2 16.5% 85.812 11 0.0% 22.1% 150.347 12 0.0% 20.1% 206.484 11 0.0%
3 21.0% 74.488 11 0.0% 46.0% 116.480 12 0.0% 48.9% 250.651 11 0.0%
4 42.7% 43.620 11 0.0% 64.0% 123.507 12 0.0% 60.8% 294.875 11 0.0%
5 69.5% 32.357 11 0.0% 81.7% 111.156 12 0.0% 78.6% 275.584 11 0.0%
6 94.8% 15.452 11 18.2% 84.0% 52.365 12 41.7% 88.9% 261.687 11 9.1%
7 93.2% 7.533 9 0.0% 92.2% 19.973 8 25.0% 88.3% 178.774 9 33.3%
8 94.5% 450 7 0.0% 93.7% 19.877 7 28.6% 93.5% 142.900 7 42.9%
9 72.7% 102 5 0.0% 100.0% 16.875 6 33.3% 100.0% 76.000 5 40.0%
1 - 9 27.5% 40.719 87 2.3% 50.8% 85.253 93 11.8% 64.6% 204.895 87 10.3%
Perdedores Neutros Ganhadores
49
Esse competidor saiu com R$ 41.000,00, o 19º maior prêmio entre os 34
participantes analisados. Analisando os jogadores classificados como perdedores
em pelo menos 1 das 2 últimas rodadas jogadas, o maior valor conseguido foi R$
65.000,00.
Entre os perdedores, o percentual de participantes que aceitam as ofertas é
extremamente mais baixo que o das outras categorias. Isso pode indicar que o grau
de aversão ao risco diminui junto com a sorte do jogador na escolha de maletas.
Além disso, os valores médios dos prêmios restantes para esses jogadores são bem
menores do que os valores possíveis nas demais classes, o que pode indicar a
presença de uma menor aversão ao risco quando os valores são pequenos.
4.4 Análise pela Teoria da Utilidade Esperada
Dando continuidade ao estudo do comportamento dos participantes do programa,
essa seção irá analisar as decisões de “Topa ou Não Topa” usando a Teoria da
Utilidade Esperada. Para tanto, a escolha da função utilidade adequada é importante
devido a grande amplitude dos valores a serem analisados (POST et al., 2008), os
quais variam de 50 centavos a 1 milhão de reais. Assim como realizado nas análises
preliminares com a classificação dos jogadores, aqui também será utilizada a
metodologia empregada em Post et al. (2008). Dessa forma, a função utilidade
esperada usada será uma variante da família flexible expo-power mostrada por
Atanu Saha em seu artigo de 1993 usada por Holt e Laury (2002) e Abdellaoui,
Barrios e Wakker (2007). Essa função permite incluir os casos particulares de
aversão a risco relativo crescente (IRRA) e aversão ao risco absoluto decrescente
(DARA) e se mostrou superior a outras na previsão de escolhas dos participantes de
experimentos envolvendo escolhas arriscadas. A fórmula da função utilidade
empregada nesse estudo será:
(3)
Os coeficientes e de aversão ao risco e o parâmetro de riqueza inicial ( )
são desconhecidos na equação (3). Como provavelmente os jogadores não somam
suas posses aos valores ganhos no jogo e a riqueza mais correta a ser utilizada – a
50
riqueza total do indivíduo, considerando também as entradas futuras – não é
observável, a riqueza inicial é considerada um parâmetro livre no modelo.
Na equação (3), a função potência relacionada com aversão a risco relativo
constante (CRRA), é obtida como o caso limite quando , ao passo que a
função exponencial relacionada com a aversão a risco absoluto constante (CARA)
corresponde a .
Os três parâmetros desconhecidos serão estimados através do método da
máxima verossimilhança. A distribuição de probabilidade a ser maximizada é da
variável aleatória dicotômica “Topa” (1) ou “Não Topa” (0) condicionadas aos valores
da função de utilidade calculada supondo as duas possibilidades do jogador aceitar
a proposta corrente do negociador ou continuar no jogo. Para tanto serão definidos
um “valor de parada”, o (stop value), e um “valor de continuidade”, o
(continuation value).
O valor de parada em uma rodada será igual ao valor da função utilidade
aplicada a , onde , definida na equação (7), representa a oferta corrente
do negociador como uma função do conjunto de prêmios restantes . Assim, o stop
value será:
(4) ( )
O valor de continuidade será a utilidade esperada dos ganhos desconhecidos
quando a oferta não é aceita. Para determinar os ganhos desconhecidos, seria
necessário considerar as ofertas e as decisões ótimas de todas as rodadas
posteriores a rodada que está sendo avaliada. A solução de tal problema de
otimização dinâmica, conforme explicado em Post et al. (2008), poderia ser
encontrada através da indução retroativa. Iniciando da nona rodada, poderíamos
determinar qual seria a decisão ótima na rodada anterior através da análise dos
diferentes cenários possíveis. Isto equivale a assumir que os participantes iriam
analisar toda a sequência possível de decisões ótimas a partir da jogada corrente,
antes de realizar uma escolha. No entanto, estudos anteriores sugerem que, em
geral, as pessoas analisam apenas um ou dois passos à frente e ignoram os
seguintes (JOHNSON et al, 2002; BINMORE et al., 2002; apud POST et al., 2008).
51
Em diversas edições do “Topa ou Não Topa” é possível observar o concorrente
afirmar que irá jogar apenas mais uma rodada e/ou o apresentador “ajudar” o
jogador a pensar o que poderá acontecer com a próxima oferta caso determinados
valores sejam eliminados. Esse comportamento pode ser observado em várias
rodadas de um mesmo jogo. Por esse motivo, o estudo irá assumir que os
participantes comparam a oferta atual apenas com a oferta desconhecida da rodada
seguinte, ignorando a possibilidade de continuar jogando depois da próxima
proposta. Assim, a visão míope do jogo será utilizada para modelar a maneira como
os participantes avaliam o jogo.
Os valores ainda não revelados e a probabilidade de determinado conjunto de
prêmios permanecer desconhecido na próxima rodada irão influenciar o valor de
continuidade no programa. Assim, dado o conjunto atual de prêmios ( ), para
qualquer subconjunto de elementos do conjunto a distribuição de
probabilidades do conjunto de prêmios na próxima rodada ( ) é:
(5) | (
)
Por essa fórmula, pode-se afirmar que a probabilidade de ocorrência de
determinado subconjunto de prêmios na próxima rodada é igual 1 dividido pelo
número de combinações possíveis de elementos dentro do conjunto atual de
. O valor da continuidade para um participante míope será dado por:
(6) ∑ ( )
onde X( ) representa todos os possíveis subconjuntos de tamanho .
Assumindo uma visão míope, mostra-se agora importante quantificar o
comportamento do negociador. Considerando um participante com um conjunto
de prêmios restantes na rodada atual = 1,...,9 e cuja oferta percentual da rodada é
, o comportamento das ofertas do negociador pode ser modelado como:
(7)
52
(8)
onde mede a velocidade com que a oferta percentual chega a 100% da média dos
valores restantes. O peso do componente no acréscimo a ser colocado na oferta
do negociador pode ser observado na Figura 7 onde foram colocados 3 valores
possíveis de , 0,1 (verde), 0,5 (rosa) e 0,9 (azul), além do igual a 0,7858,
estimado para os dados desse estudo. Conforme mostra a figura, o impacto do
aumenta com as rodadas, podendo, dependendo do utilizado, apresentar
crescimento lento até a rodada 5 ou 6 e depois mostrar um crescimento acelerado,
como . Quando o for 0,9, o crescimento se dá de forma mais acelerada nas
últimas rodadas.
Figura 7: Impacto do nas ofertas a cada rodada
Antes de estimar o da amostra como um todo foram verificadas as velocidades
de crescimento das ofertas percentuais de cada participante. A Figura 8 mostra as
trajetórias dos ’s obtidos através da equação (8). Assim, nota-se grande variação
no de uma rodada para outra e dependendo do participante avaliado. Os
participantes 24 e 16, por exemplo, apresentam bem acima dos demais, enquanto
os jogadores 13 e 19 chegam ao fim do jogo com um bastante negativo. Essas
grandes variações ocorrem porque, para a versão brasileira do game show, há
grande variação das ofertas percentuais de uma rodada para outra, podendo reduzir
em uma rodada (trazendo negativo) e aumentar muito na seguinte. Como é
possível observar na Figura 8, em diversos momentos o foi superior a 1. Isso
Rodadas
Pe
rce
ntu
al
2 4 6 8
0.0
0.2
0.4
0.6
0.8
1.0
Ro=0.5
Ro=0.9
Ro=0.1
Ro=0.7858
53
ocorreu quando o aumento da oferta percentual foi muito grande de uma rodada
para outra, especialmente logo após uma redução na oferta. Pela equação (8) é
possível perceber que quando uma oferta percentual é inferior a oferta percentual
anterior o deverá ser negativo. Por outro lado, quando o crescimento da oferta
percentual é elevado entre duas rodadas, o pode ser maior do 1, como ocorre para
a amostra.
Figura 8: Exemplos de trajetória do calculado a cada rodada
A partir de um modelo de regressão linear simples baseado na equação (8) foi
estimado o valor de . Assumiu-se que as ofertas percentuais seguiriam uma
trajetória crescente, sem reduções nos percentuais ofertados ou crescimentos muito
grandes de uma rodada para outra, e que as velocidades de crescimento de todos
os participantes de uma mesma edição (nesse caso, toda a amostra) seriam iguais.
Dessa forma, o ajustado para a amostra deverá ser .
Inicialmente o modelo foi estimado utilizando o método clássico de mínimos
quadrados, obtendo uma estimativa de 0.7864 com erro padrão igual a 0.01. No
entanto, como mostrado na Figura 8, a amostra apresenta outliers, o que sugere que
esse método de regressão pode não ser o mais indicado para a amostra e que um
método robusto deve fornecer estimativas mais confiáveis (menos viciadas) para os
parâmetros do modelo de regressão. Um estimador robusto é mais indicado quando
há outliers, pois sua distribuição não é afetada por sua presença. Assim, utilizando
os MM-estimadores (BIANCO; YOHAI, 1996; MENDES; TYLER, 1996) encontramos
Rodadas
Pe
rce
ntu
al
2 4 6 8
-10
12
3
Ro Ajus tado = 0.7858
P3
P13
P16
P19
P24
54
a estimativa 0.7858 para , com erro padrão de 0.008. É possível verificar que o
estimador robusto capturou o padrão linear sugerido pela maioria dos pontos e não
foi influenciado pelos pontos atípicos. Foram utilizados ainda, apenas para
comparação, outros métodos de estimação robustos. Todos deram resultados
semelhantes, mas as estimativas dadas pelo MM-estimador foram escolhidas devido
as suas ótimas propriedades estatísticas, como por exemplo, alto ponto de ruptura e
eficiência.
Dessa forma, o valor utilizado para o , nesse estudo, será 0,7858. Com esse
valor, a previsão consegue explicar grande parte das ofertas, como é possível
observar nas figuras abaixo. A Figura 9 mostra as ofertas percentuais realizadas
pelo negociador versus as ofertas percentuais previstas utilizando a equação (8).
Como mostrado, o ajuste da previsão realizada foi bom, explicando mais de 72%
das ofertas percentuais realizadas. Já a Figura 10 mostra as quantias ofertadas pelo
negociador e as quantias previstas usando o modelo. Para os valores das ofertas, é
possível dizer, conforme a figura, que o modelo consegue realizar previsões ainda
melhores, trazendo um R2 de 97%. Para facilitar a visualização do que seria a
previsão perfeita, com todas as previsões correspondendo ao valor realmente
ofertado, foi inserida uma linha de 45o em ambas as figuras, o que representaria as
previsões perfeitas. Cada rodada foi representada nas figuras por uma determinada
cor: pontos pretos representam a rodada 2, rosas representam a rodada 3, verdes a
rodada 4, laranjas a rodada 5, azuis a rodada 6, marrons a rodada 7, vermelhos a
rodada 8 e rosas claro a rodada 9.
Na Figura 9, é possível observar a presença de 3 outliers. O primeiro deles é o
participante do dia 01/09/2010, cuja oferta percentual da rodada 8 foi bem maior do
que a prevista e bastante superior as demais ofertas percentuais realizadas ao
jogador. Dessa forma, a oferta prevista utilizando o ajustado para todos os
participantes não conseguiu prever uma variação tão grande para essa rodada. Os
jogadores dos dias 13/01/2011 e 30/05/2011 nas rodadas 7 e 9, respectivamente,
também apresentaram percentuais previstos e observados bem diferentes. Nesses
casos, a oferta prevista foi bastante superior à observada, pois essa foi bastante
reduzida nessas rodadas para esses jogadores.
55
Figura 9: Ofertas Percentuais Previstas x Observadas
Figura 10: Valores das Ofertas Previstas x Observadas
Na teoria da utilidade esperada, a posição final de riqueza de um indivíduo possui
influência na tomada de decisão. Além disso, o grau de aversão ao risco, em geral,
varia dependendo do montante apostado. Assim, o elevado poder explanatório das
previsões das ofertas monetárias traz maior segurança à interpretação do grau de
aversão ao risco apresentado pelos participantes do game show. A previsão
realizada das ofertas percentuais também ocorre de forma satisfatória no modelo, o
que favorece o bom ajuste das estimativas monetárias e auxilia no entendimento do
comportamento dos participantes.
Previsto
Ob
se
rva
do
0.0 0.5 1.0 1.5
0.0
0.5
1.0
1.5
Previsto
Ob
se
rva
do
0 100000 200000 300000 400000 500000
01
00
00
02
00
00
03
00
00
04
00
00
05
00
00
0
R2 = 0,7262
R2 = 0,9713
56
Através das equações (7) e (8), é possível prever apenas as ofertas da rodada
seguinte. Tal limite de previsão condiz com a visão míope adotada no modelo. A
oferta da primeira rodada do jogo é dita ao participante e aparece num telão para
que a primeira decisão de “Topa ou Não Topa” seja tomada. Assim, a proposta
dessa rodada não é prevista usando a fórmula acima. O percentual final e a oferta
final, ou seja, e , se referem ao valor contido na mala principal, escolhida
no começo do jogo pelo concorrente. No final do programa faltam abrir 2 malas. Mas
foi considerado como oferta final o valor da última oferta, já que a mala escolhida no
começo do programa será, para os jogadores que chegarem a essa etapa, a última
proposta.
Seguindo a metodologia utilizada no artigo de Post et al. (2008), o estudo irá
assumir que a decisão entre “Topa ou Não Topa” realizada por um participante
em uma rodada se baseia na diferença entre o valor de
continuidade e o valor de parada ( ( ) ( )), mais um erro. Os erros das
decisões serão tratados como independentes, normalmente distribuídos, com média
zero e desvio padrão .
Para capturar a dificuldade da escolha entre “Topa ou Não Topa”, o desvio
padrão dos resultados encontrados para calcular o valor de continuidade pode ser
utilizado. Quanto mais difícil for a escolha, maior o desvio padrão. O cálculo do
desvio padrão, como indicado aqui, pode ser realizado através da fórmula:
(9) ( ) √∑ ( ) ( )
O desvio padrão do erro será considerado proporcional ao desvio padrão
amostral acima. Assim, ( ) , onde é um parâmetro de escala constante.
Essa suposição faz com que o peso recebido por escolhas simples seja maior do
que por escolhas mais difíceis. Conforme reportado por Post et. al (2008), se não
forem atribuídos pesos aos dados, o ajuste do modelo se deteriora.
Os parâmetros desconhecidos ( e ) serão estimados através da
verossimilhança das decisões de “Topa ou Não Topa”. Para tanto, será utilizado um
modelo Probit para estimar as escolhas dos participantes ( ). Aqui, a variável irá
57
representar a decisão do participante entre “Topa” ( 0) e “Não Topa” ( 1).
Assim, | , onde é a variável regressora:
Assim, o modelo Probit usado no estudo assume que , onde é o
erro com distribuição normal e ⁄ . Dessa forma, o modelo assume
que | , onde é a função distribuição acumulada da normal
padrão e o parâmetro da regressão a ser estimado. A decisão entre “Topa” ou
“Não Topa” será:
{ (Não Topa)
(Topa)
Dessa forma, | ( |
)
e, considerando
todas as decisões tomadas, a função de verossimilhança será dada por:
(10) ∏
onde é igual a probabilidade de sucesso, ou seja, | (
)
. Assim, se “Não Topa” e se “Topa”. A função de log-
verossimilhança é dada por:
(11) ∑
A log-verossimilhança será maximizada para os parâmetros desconhecidos , ,
e através da função abaixo:
(12) ∑ ∑ ( )
onde é igual a última rodada jogada pelo participante .
As estimativas de máxima verossimilhança obtidas a partir de (12) são utilizadas
também para calcular o equivalente certeza implícito. O equivalente certeza irá
auxiliar na identificação do grau de aversão ao risco dos participantes do “Topa ou
Não Topa”, indicando o valor da oferta que tornaria os concorrentes indiferentes
entre aceitar a oferta (“Topa”) ou rejeitá-la e continuar jogando (“Não Topa”). O
cálculo do equivalente certeza foi realizado considerando apostas com 50% de
58
chances de ganho zero e 50% de chance de ganhar um determinado valor. Nesse
estudo foram utilizados valores entre R$10 e R$1 milhão.
O equivalente certeza auxiliará na identificação do grau de aversão ao risco, pois
representa a utilidade de aceitar a aposta, mostrando qual o valor da oferta do
negociador (o valor de parar o jogo) teria o mesmo valor de continuar jogando.
A utilidade da aposta foi encontrada através da equação utilidade usada nesse
estudo – equação (3). Os parâmetros utilizados na equação foram os encontrados
para a amostra de programas, conforme mostrado no item a seguir. O coeficiente
certeza (CC), o valor do equivalente certeza em relação ao valor esperado da
aposta, foi calculado com base na utilidade encontrada para a aposta, conforme
equação abaixo.
(13)
[( ( )
)
⁄
]
⁄
Um coeficiente certeza igual a 1 indica um participante neutro ao risco, já que
aceita ofertas de valor igual ao valor esperado. Coeficiente certeza entre zero e 1,
sugere que o participante é avesso ao risco, pois aceita ofertas inferiores ao valor
esperado do jogo. O grau de aversão ao risco aumenta conforme o CC se aproxima
do zero. Por outro lado, um coeficiente certeza maior do 1, indica que o participante
é propenso ao risco, só aceitando sair do “Topa ou Não Topa” com ofertas maiores
do que a média dos valores em jogo.
4.4.1. Resultados
Os parâmetros desconhecidos do modelo foram estimados tanto para a amostra
como um todo, como para as classes de jogadores encontradas na seção de
análises preliminares (seção 4.3, página 40). O resultado encontrado para o modelo
da utilidade esperada pode ser observado na Tabela 6 para a amostra completa e
na Tabela 7 para os “perdedores”, para os “neutros” e para os “ganhadores”. Além
dos parâmetros desconhecidos, as tabelas apresentam os p-valores dos valores, o
percentual de acertos da previsão da decisão de “Topa” ou “Não Topa” feita de
59
acordo com a função utilidade encontrada em relação às escolhas realizadas pelos
jogadores (Hits), o número de decisões realizadas ao longo do jogo (Nº) e os
Coeficientes Certeza (CC), calculados conforme a equação (13) mostrada no item
anterior.
O cálculo do p-valor dos resultados encontrados foi realizado utilizando 2
métodos diferentes de teste de hipóteses: o teste t e o teste de Wilcoxon. No estudo,
ambos os testes verificaram a hipótese nula de que o parâmetro que está sendo
testado realmente é o verdadeiro parâmetro observado versus a hipótese alternativa
de que o real valor seria diferente daquele apresentado. O primeiro teste realizado
(teste t) considera, para encontrar o p-valor, que os valores utilizados apresentam
uma distribuição normal enquanto o segundo (Wilcoxon) é um teste não paramétrico
e pode ser usado mesmo quando a distribuição dos valores se distancia da normal.
Analisando os valores utilizados nos testes de hipóteses, foi verificado que os
mesmos não apresentaram distribuição normal. Dessa forma, o teste de Wilcoxon
parece apresentar resultados mais consistentes de p-valores para os resultados do
estudo.
Como observado na Tabela 6, para a amostra utilizada o coeficiente de aversão
ao risco é muito baixo, não sendo significativamente diferente de zero,
aproximando a equação de uma aversão a risco relativo constante (CRRA). O p-
valor encontrado pelo teste de Wilcoxon é de 0,248, não rejeitando o valor
encontrado ao nível de significância de 0,05. Por esse resultado, seria esperado que
a tendência a aceitar a oferta do banqueiro não sofresse alteração conforme o
decorrer do programa e o aumento da média dos valores ainda em jogo. Tal
comportamento parece estar de acordo com o encontrado para os participantes do
programa uma vez que, conforme observado anteriormente (Tabela 2), os
concorrentes permanecem no jogo mesmo após a rodada 5, rodada que apresenta
maior média de resultados para todos os participantes.
Para o coeficiente , o valor encontrado foi 0 (zero). O parâmetro também indica
a aversão ao risco do jogador e, para o valor encontrado, indica que a função mais
adequada aos dados utilizados seria uma aversão a risco absoluto constante
(CARA). Com isso, quanto maior o valor em risco, mais avesso seria o participante
do jogo. No entanto, o p-valor encontrado rejeita o , mesmo ao nível de
60
significância de 0,01. Esse resultado pode indicar uma grande diferença no grau de
aversão ao risco entre os participantes, dificultando a generalização do
comportamento através de uma fórmula única.
Em relação à riqueza inicial encontrada ( ), os dados indicam um valor de R$
945.750, quantia significativamente maior do que 0 (zero). Pela equação usada,
esse valor deveria indicar a riqueza possuída pelo participante durante toda a vida,
porém, considerando a renda per capita da população brasileira do ano de 2011,
R$21.252, nota-se que a riqueza inicial utilizada pelos participantes do programa
está bem acima da riqueza de uma vida. Esse resultado indica que o ajuste da
riqueza inicial realizado pelos participantes já inclui os valores que esperam receber
ao fim do programa. Aqui o p-valor parece confirmar o resultado apresentado, uma
vez que os testes realizados não rejeitaram a hipótese nula ao nível de significância
de 0,05.
Após a definição dos parâmetros, foram verificadas as decisões que seriam
tomadas de acordo com a função encontrada e comparadas às escolhas realizadas
pelos concorrentes. O percentual de decisões previstas corretamente pelo modelo
foi de 89,9% entre as 267 escolhas realizadas pelos jogadores nos episódios
avaliados. Porém, esse ajuste parece melhor para as escolhas dos concorrentes
classificados como “perdedores” do que para os demais. O modelo indica que os
jogadores deveriam aceitar a oferta do banqueiro antes do que acontece no
programa tanto para os “perdedores” quanto para “ganhadores”, no entanto, o
resultado diverso ocorre com menos frequência para os primeiros.
Ainda na Tabela 6, é possível observar os valores de coeficiente certeza (CC)
calculados para os parâmetros encontrados. Nota-se que o coeficiente certeza é
igual a 1 para valores pequenos e diminui conforme os valores em jogo aumentam.
No entanto, a redução do coeficiente certeza ocorre de forma lenta, se acentuando
apenas quando a aposta envolve o valor mais elevado, de R$1.000.000. Esse
resultado reflete a baixa propensão dos participantes a aceitar ofertas,
especialmente nas rodadas iniciais, quando os valores ofertados são mais baixos,
indicando a neutralidade ao risco para quantias pequenas e aumento da aversão ao
risco com o aumento das apostas. Tal resultado condiz com o valor encontrado para
, que indica o aumento da aversão ao risco de acordo com o aumento dos valores
61
em jogo, especialmente para o CC encontrado para o valor mais elevado. Esse
último indica que uma oferta de apenas 46% do valor esperado da aposta já seria
aceita pelo concorrente, indicando grande aversão ao risco, o que seria mais
adequado a um modelo de aversão a risco relativo crescente (IRRA).
Tabela 6: Resultados para a Teoria da Utilidade Esperada
α β W σ Hits Nº
Resultado 2.76E-06 0.000 945,750 0.245 89.9% 267
p-valor (Teste t) 0.993 0.009 0.325 0.800
p-valor (Teste Wilcoxon) 0.248 0.001 0.332 0.338
0/101 0/102 0/103 0/104 0/105 0/106
Coeficiente Certeza 1.000 1.000 0.999 0.993 0.931 0.458
A Figura 11 mostra o comportamento da função utilidade para a estimativa dos
parâmetros encontrados. Pela figura, nota-se que o valor da utilidade cresce de
forma acelerada para valores menores, mas de forma extremamente lenta para
valores grandes. Quando o valor avaliado é pequeno, o modelo atribui um valor
utilidade elevado. Por outro lado, quando a quantia analisada possui um valor
grande, o modelo atribui um valor menor como utilidade. Assim, o comportamento da
função, mostrado na figura, evidência a aversão ao risco quando o valor em jogo é
elevado e indica uma propensão ao risco quando o montante é pequeno.
Figura 11: Função Utilidade
330,000
335,000
340,000
345,000
350,000
355,000
360,000
365,000
0 200,000 400,000 600,000 800,000 1,000,000
Uti
lidad
e
Valores
Todos
62
Para melhor entender o comportamento dos jogadores de acordo com sua
posição como “perdedor”, “neutro” ou “ganhador” no jogo, foram verificados os
parâmetros da equação para cada classe em separado. A Tabela 7 mostra os
parâmetros encontrados. Para os “perdedores”, é poss vel notar um extremamente
negativo, um positivo e uma riqueza inicial igual a 0 (zero). Tais valores indicam
uma aversão ao risco absoluto decrescente, o que pode ser confirmado através do
CC. Para valores baixos esses jogadores já apresentam propensão ao risco, com
CC acima de 1. Conforme os valores em jogo aumentam, o CC também aumenta,
indicando propensão maior ao risco com o aumento da quantia.
Tabela 7: Resultado Teoria da Utilidade Esperada para Jogadores Classificados como “Perdedores”, “Neutros” e “Ganhadores”
Perdedores
α β W σ Hits Nº
Resultado -2.49E+02 0.992 0 0.331 96.5% 86
p-valor (Teste t) 0.665 0.160 1.000 0.843
p-valor (Teste Wilcox) 0.001 0.164 1.000 0.005
0/101 0/102 0/103 0/104 0/105 0/106
Coeficiente Certeza 1.421 1.430 1.439 1.447 1.456 1.464
Neutros
Α β W σ Hits Nº
Resultado 8.50E-06 0.048 1,000,000 0.211 87.4% 95
p-valor (Teste t) 0.584 0.796 0.001 0.758
p-valor (Teste Wilcox) 0.073 0.204 0.001 0.066
0/101 0/102 0/103 0/104 0/105 0/106
Coeficiente Certeza 1.000 1.000 0.999 0.989 0.896 0.326
Ganhadores
α β W σ Hits Nº
Resultado 1.10E-02 0.660 1,000,000 0.364 93.0% 86
p-valor (Teste t) 0.951 0.714 0.032 0.806
p-valor (Teste Wilcox) 0.030 0.167 0.015 0.025
0/101 0/102 0/103 0/104 0/105 0/106
Coeficiente Certeza 1.000 1.000 1.000 0.997 0.974 0.808
63
No caso dos concorrentes classificados como “ganhadores”, e são
pequenos, mas diferentes de 0 (zero), e é elevado – próximo ao encontrado para
a amostra completa. Esses valores indicam aversão ao risco moderada. Ambos os
testes de hipótese realizados rejeitaram o encontrado, o que mostra a dificuldade
na determinação do valor da riqueza inicial utilizado pelos participantes
considerados “ganhadores” e indica uma variação grande desse parâmetro. Pode-se
confirmar a aversão moderada ao risco avaliando os coeficientes certeza
encontrados. Para os “ganhadores”, o CC só reduz quando o valor apostado passa
de R$ 1.000. Mesmo apresentando coeficientes menores conforme o valor em jogo
aumenta, é possível perceber que a queda ocorre de forma menos abrupta do que
para a amostra completa, chegando a 0,8 no maior valor testado (contra 0,4
encontrado para toda a amostra).
Na Figura 12 são mostrados os gráficos das funções utilidade para as
diferentes classes. Através da figura é possível perceber o rápido crescimento da
utilidade dada aos valores pelos “perdedores” e a utilidade quase constante
percebida pelos “ganhadores”. No gráfico dos “neutros”, é poss vel perceber que a
curva da utilidade para esses jogadores é similar à curva observada para a amostra
completa, porém, a utilidade atribuída aos valores é menor.
Figura 12: Função Utilidade dos Jogadores Classificados com “Perdedores”, “Neutros” e “Ganhadores”
Os resultados apresentados nas tabelas Tabela 6 e Tabela 7 constituem as
melhores combinações de valores encontrados até a finalização desse estudo para
os parâmetros do modelo. Apesar da grande quantidade de valores e combinações
verificados para as variáveis, devido ao tempo de processamento exigido para
encontrar os resultados através das equações explicitadas no item anterior e ao
0
5000
10000
15000
20000
25000
30000
35000
0 200,000 400,000 600,000 800,000 1,000,000
Uti
lidad
e(R$’10^1
14)
Valores
Perdedores
116000
116200
116400
116600
116800
117000
117200
117400
117600
117800
0 200,000 400,000 600,000 800,000 1,000,000
Uti
lidad
e
Valores
Neutros
62
63
64
65
66
67
68
69
70
71
72
0 200,000 400,000 600,000 800,000 1,000,000
Uti
lidad
e
Valores
Ganhadores
64
prazo existente para finalização dessa dissertação, não é possível assegurar que
todos os valores necessários foram testados. Porém, observando as tabelas, é
possível notar um alto percentual de acertos na previsão da decisão dos jogadores
(Hits). Dessa forma, os valores encontrados parecem adequados à amostra.
4.5 Análise pela Teoria das Perspectivas
Nessa seção as decisões de “Topa” ou “Não Topa” serão analisadas através da
Teoria das Perspectivas. Mais uma vez, será assumida uma visão míope dos
jogadores. Essa visão será usada nessa seção para permitir uma comparação
melhor entre os resultados, assim como realizado no artigo de Post et al. (2008).
Assume-se, ainda, que os participantes não integram sua riqueza inicial aos
resultados obtidos ao avaliar a continuidade ou não no jogo.
Para a teoria das perspectivas, a função usada para avaliar a utilidade das
escolhas na teoria da utilidade esperada será substituída pela função valor abaixo.
Nessa, as alterações em relação a um ponto de referência (RP) definem o valor da
decisão. Assim, a função valor da teoria das perspectivas usada no estudo será:
(14) | {
Na fórmula acima, é o ponto de referência usado para definir o que será
considerado perda e o que será considerado ganho, é o parâmetro de aversão
à perda e é a medida da curvatura da função valor. Com o objetivo de reduzir
o número de parâmetros livres no modelo, serão utilizadas curvaturas iguais tanto
para perdas quanto para ganhos ( e ), conforme realizado em Post et
al. (2008).
Diferente da função utilidade, as funções dos valores de parada e de
continuidade para a teoria das perspectivas serão as mesmas utilizadas na teoria da
utilidade esperada.
Segundo a teoria das perspectivas originalmente atesta, o ponto de referência
deveria ser igualado à situação atual do concorrente. Porém, os participantes do
“Topa ou Não Topa” não precisam desembolsar nenhum valor, o que poderia levar o
65
ponto de referência a ser igual a zero. No entanto, conforme explicado anteriormente
nesse estudo (item 2.2), ganhos e perdas podem ser classificados em relação a uma
determinada expectativa do participante, ao invés de sua situação financeira atual, e
pessoas que não se adaptaram a uma perda recente podem aceitar apostas que
normalmente pareceriam ruins. Assim, jogadores podem avaliar valores como
ganhos ou perdas de acordo com uma expectativa de terminar o jogo com
determinado valor, por exemplo. Além disso, podem ocorrer situações nas quais o
concorrente recusa propostas com percentuais elevados em relação aos valores
médios restantes por não ter se acostumado com a queda na média dos prêmios
não revelados após a abertura de maletas com valores elevados. Como é possível
perceber, conhecer o ponto de referência e sua variação durante o jogo é de
extrema importância para o estudo, já que ele define o que será classificado como
perda e ganho pelo participante.
Em seu artigo, Post et al. (2008) explicam o modelo que desenvolveram e
usaram para definir o ponto de referência usado pelos jogadores. Os autores se
baseiam em suposições e restrições ao ponto de referência para criar o modelo
estrutural que será utilizado também nesse estudo.
Conforme explicado pelos autores, uma oferta recebida está relacionada a média
dos prêmios restantes em jogo e as expectativas quanto ao resultado futuro. Assim,
considerando um participante que precisa escolher entre a oferta atual e a oferta
desconhecida da próxima rodada, pode-se dizer que a proposta representa tanto
uma opção de valor certo quanto o custo de oportunidade da alternativa incerta. Por
esse raciocínio, é possível supor uma ligação entre o ponto de referência ( ) e a
oferta da rodada ( ) conforme especificado a seguir:
Por essa fórmula, quando , o ponto de referência será igual à situação
atual do concorrente, ou ( ). Nesse caso, todos os resultados possíveis serão
avaliados pelo jogador como ganho. Se , então o ponto de referência será
sempre positivo e, apesar de não precisar realizar nenhum desembolso, o
participante poderá experimentar o sentimento de perda. Um ponto de referência
conservador ocorre quando , fazendo com que o ponto de referência seja
menor do que a oferta. Aqui, muitos resultados possíveis serão classificados como
66
ganhos. Por outro lado, muitos resultados serão classificados como perdas e poucos
como ganhos quando o ponto de referência for otimista, ou seja, .
Apesar da utilização da fórmula anterior para definição do ponto de referência
parecer simples, isso pode não se mostrar verdadeiro uma vez que os valores
possíveis e as ofertas variam em todas as rodadas do jogo, tornando necessária a
atualização do ponto de referência a cada variação. Além disso, o ponto de
referência de uma rodada pode ser afetado por acontecimentos anteriores uma vez
que a adaptação dos participantes aos valores revelados e às alterações nos valores
médios restantes pode ocorrer de forma lenta. Assim, os autores consideram
importante medir o efeito da rodada anterior , nos resultados atuais
através do aumento relativo na média dos prêmios restantes, conforme indicado
abaixo:
onde
é o efeito da rodada anterior na rodada atual . Quando ,
será
igual a variação relativa da média de valores da rodada atual ( ) para a inicial ( ).
Conforme lembrado pelos autores, a medida da variação em um modelo ideal
seria utilizada para todas as rodadas anteriores. Porém, os termos são fortemente
correlacionados e o número de observações é limitado. Assim, os termos foram
limitados aos dois termos a seguir:
e
. O termo
irá medir as
mudanças recentes, ocorridas na rodada anterior, enquanto
medirá as
alterações em relação ao inicio do jogo. Incluindo esses termos ao modelo, o ponto
de referência será:
(15) (
)
Com o objetivo de melhorar o ajuste empírico do modelo foi considerado, assim
como em Post et al. (2008), que o ponto de referência não poderia ser menor do que
a menor oferta possível na rodada, nem maior do que a maior proposta possível.
Assim, essa informação é incluída na definição do ponto de referência:
67
O procedimento usado para estimar os parâmetros do modelo da teoria das
perspectivas foi o mesmo procedimento de máxima verossimilhança utilizado para a
teoria da utilidade esperada. Foram estimados um total de 5 parâmetros livres no
modelo completo da teoria das perspectivas: aversão a perda , curvatura e os 3
parâmetros do modelo do ponto de referência , e . Foi estimado, também, o
parâmetro de ruído . As ofertas do negociador foram estimadas usando o mesmo
modelo usado na tória da utilidade esperada.
4.5.1. Resultados
Diferente da análise realizada para a Teoria da Utilidade Esperada, para a Teoria
das Perspectivas os parâmetros desconhecidos foram estimados apenas para a
amostra completa dos participantes do programa. Na tabela Tabela 8 é possível
observar os valores encontrados para o modelo, os p-valores, o número de decisões
tomadas ao longo do programa (Nº) e o percentual de acerto das previsões das
escolhas dos participantes realizadas pelo modelo em relação às decisões tomadas
durante o jogo (Hits).
Assim como realizado anteriormente, os resultados foram testados utilizando o
teste t e o teste de Wilcoxon. Mais uma vez, as distribuições dos valores usados nos
testes de hipóteses não apresentaram características de uma distribuição normal,
indicando que o teste de Wilcoxon traz resultados estatísticos mais consistentes
para o estudo. Os testes verificaram se os parâmetros encontrados representavam
os reais valores para a população (hipótese nula). A hipótese alternativa usada foi a
afirmativa de que o verdadeiro parâmetro seria diferente do encontrado.
O parâmetro indica a relação do ponto de referência utilizado com a oferta
realizada pelo Negociador na rodada. Conforme apresentado na Tabela 8, tal
resultado é significativamente maior que 0 (zero), mostrando que, mesmo não
desembolsando nenhuma quantia para participar do programa, o jogador irá
experimentar sensação de perda ao longo do jogo. No entanto, como o coeficiente
está abaixo de 1 (um), pode-se dizer que o ponto de referência utilizado será
conservador em relação à oferta, o que permite que muitos valores sejam
consideradas ganhos. Assim, o referencial utilizado para avaliar os montantes como
68
ganhos ou perdas está bastante relacionado à oferta realizada pelo Negociador na
rodada. O p-valor encontrado não rejeita esse valor a um nível de significância 0.05.
Os demais parâmetros relacionados ao ponto de referencia, e , indicam a
velocidade do ajuste realizado pelo jogador em relação ao ponto de referencia usado
em rodadas anteriores. De acordo com o resultado de -0,226 encontrado para o ,
a redução da média dos prêmios restantes de uma rodada para outra causa um
aumento no ponto de referência, enquanto o aumento dessa média provoca o efeito
inverso. Com isso, é possível dizer que os concorrentes não se adaptam
rapidamente a retirada dos valores revelados na última rodada. Tal comportamento
pode levar os jogadores a recusar ofertas justas por não terem ainda adequado o
ponto de referência à perda recente, por exemplo.
O efeito da rodada inicial na referência usada pelo jogador encontrado nesse
estudo – representado pelo de 0,546 – mostra que o concorrente consegue
adaptar sua percepção de valor em relação ao in cio do “Topa ou Não Topa”. Esse
parâmetro sugere, também, que a variação das médias dos prêmios restantes em
relação a rodada inicial é um fator importante e mais relevante do que variações
ocorridas em relação à rodada imediatamente anterior (representada pelo ). Tal
resultado confirma o impacto de rodadas anteriores no processo decisório dos
participantes e mostra que o ajuste do ponto de referência ocorre de forma lenta. Os
p-valores calculados para os coeficientes avaliados não rejeitaram o resultado do
estudo.
O grau de aversão à perda é representado aqui pelo parâmetro . Tal parâmetro
só aparece quando o valor avaliado pelo jogador é menor do que o ponto de
referencia utilizado, sendo percebido como uma perda. Dessa forma, o valor
encontrado de 3,587 indica que nesses casos o valor da perda para o indivíduo é
bem maior do que deveria, evidenciando o excesso de peso dado a resultados
considerados negativo. O alto grau de aversão à perda encontrado explica porque
participantes aceitam ofertas abaixo do prêmio médio das maletas restantes,
sugerindo aversão a risco por parte desses participantes. Na Tabela 2 é possível
observar o percentual das ofertas aceitas pelos jogadores a cada rodada em relação
ao valor médio dos prêmios restantes.
69
Por fim, a curvatura da função valor é indicada pelo de 1,468. O resultado
apresentado na Tabela 8 sugere um crescimento acelerado do valor dado à situação
avaliada, conforme mostra a Figura 13: Função Valor, e não foi rejeitado pelos testes
de hipóteses. Como é possível perceber pela figura, com o aumento do montante
analisado, o valor percebido também aumenta, porém, de forma mais rápida. Nota-
se que a curva da função valor do modelo para a amostra brasileira é convexa no
lado dos ganhos (diferente do esperado pela teoria), indicando uma propensão ao
risco e explicando a recusa de ofertas melhores do que a média dos valores em jogo
por parte de alguns jogadores.
A Tabela 8 mostra ainda o percentual de acerto nas previsões do modelo em
relação às decisões realizadas pelos jogadores durante o programa. Assim, foram
previstas as decisões tomadas pelos participantes durante o “Topa ou Não Topa”
usando as equações explicadas anteriormente (itens 4.5 e 4.4) e os valores
encontrados para os parâmetros. A seguir, as escolhas previstas foram comparadas
com as decisões realizadas. O percentual de acerto foi de 93,3% entre as 267
decisões realizadas ao longo dos programas. Dentre as escolhas avaliadas
incorretamente pelo modelo, percebe-se uma tendência dos jogadores a aceitar
ofertas antes do que o modelo prevê, podendo indicar que os participantes não são
tão propensos ao risco quanto se supõe pelos parâmetros encontrados.
Tabela 8: Resultados para a Teoria das Perspectivas
λ α θ1 θ2 θ3 σ Hits Nº
Resultado 3.587 1.468 0.523 -0.226 0.546 0.272 93.3% 267
p-valor (Teste t) 0.757 0.944 0.982 0.989 0.970 0.963
p-valor (Teste Wilcox) 0.141 0.688 0.282 0.229 0.420 0.211
A figura 13 mostra o gráfico da função valor com os parâmetros encontrados,
considerando diferentes possibilidades de ponto de referência. Como é possível
perceber pela figura, e conforme explicado anteriormente, o valor dado a uma
situação depende do ponto de referência utilizado. Assim, conforme esse valor
aumenta mais montantes serão considerados perdas. Ainda avaliando as perdas,
nota-se que a curva da função valor para valores negativos é mais íngreme que a
70
curva dos valores positivos. Isso é explicado pelo elevado grau de aversão a perda
( ) utilizado para a construção do gráfico.
Figura 13: Função Valor
Mais uma vez, devido ao tempo de processamento exigido para testar diversas
combinações de valores através das equações explicitadas no item anterior e o
prazo existente para finalização dessa dissertação, não é possível assegurar que
todos os valores necessários foram testados. No entanto, o elevado percentual de
acerto das previsões encontrado (93,3%) e os resultados dos testes de significância
indicam que os valores estimados estão adequados às decisões observadas.
RP = 0
RP = 25.000
RP = 50.000
RP = 75.000
RP = 100.000
-75,000,000
-50,000,000
-25,000,000
0
25,000,000
50,000,000
75,000,000
100,000,000
125,000,000
150,000,000
0 60,000 120,000 180,000 240,000 300,000
𝑣(𝑥
)
Valores
71
5 CONCLUSÃO
Esse estudo buscou analisar as escolhas realizadas pelas pessoas em situações
de incertezas observando o comportamento e as decisões tomadas pelos
participantes do programa “Topa ou Não Topa”. Conforme explicado, esse programa
de televisão foi escolhido como base para análise de escolhas sob risco por envolver
quantias elevadas e distribuição de probabilidades conhecidas, tornando a avaliação
menos complexa e permitindo a extrapolação para situações reais.
Através de uma análise inicial, foi possível perceber uma baixa aversão ao risco
por parte dos jogadores podendo-se, inclusive, identificar evidências de propensão
ao risco mais próximo ao fim do jogo. Em alguns casos, verificou-se o ajuste lento do
ponto de referência utilizado pelos participantes, com ofertas elevadas sendo
recusadas, possivelmente, para compensar perdas recentes de valores. Entre as
classes dos jogadores, percebeu-se uma maior tendência dos classificados como
perdedores em recusar ofertas acima do valor médio esperado.
A análise do comportamento pela teoria da utilidade esperada consegue explicar
boa parte dos efeitos observados, porém, a propensão ao risco apresentada pelos
jogadores é mais bem entendida através a teoria das perspectivas. A aversão ao
risco relativo constante e a redução do grau de aversão ao risco com a diminuição
do montante em jogo encontrado na primeira teoria parece explicar a demora dos
participantes em aceitar as ofertas, especialmente após a abertura de malas com
valores elevados. No entanto, o modelo utilizado da teoria das perspectivas indica
uma propensão ao risco dos participantes que parece se adequar melhor ao
comportamento apresentado.
Outro aspecto importante evidenciado ao comparar as duas teorias utilizadas é a
adequação do uso do ponto de referência pela teoria das perspectivas. Pela análise,
percebeu-se o impacto de acontecimentos recentes no valor usado como base para
avaliar uma situação, provocando o ajuste lento percebido nas análises iniciais e
explicando porque ofertas elevadas são muitas vezes recusadas após perda de um
valor elevado. Já a riqueza inicial encontrada no modelo da teoria da utilidade
esperada, diferente do previsto pela teoria, prevê um valor bastante elevado, o que
indica a presença da quantia que o participante espera receber como prêmio além
de sua riqueza inicial.
72
Ao tentar prever as escolhas dos concorrentes, mais uma vez, a teoria das
perspectivas se mostrou superior a teoria da utilidade esperada, conseguindo
acertar o que foi decidido mais vezes durante o jogo. Dentre as previsões incorretas,
é possível notar que para a teoria das perspectivas alguns jogadores param antes
do esperado, indicando uma tendência a exagerar a propensão ao risco dos
participantes. Por outro lado, o modelo encontrado para a teoria da utilidade
esperada tende a aumentar o grau de aversão ao risco dos jogadores.
A partir do que foi analisado, é possível afirmar que a teoria das perspectivas
conseguiu explicar melhor o comportamento dos participantes do “Topa ou Não
Topa” do que a teoria da utilidade esperada. Essa conclusão está de acordo com
estudos anteriores onde modelos que preveem a influência de situações recentes na
tomada de decisão se mostraram melhores que os baseados na teoria da utilidade
esperada (BROOKS et al, 2009; POST et al, 2008; ROOS; SARAFIDIS, 2006).
Apesar de concluir pela superioridade do modelo empregado para a teoria das
perspectivas como encontrado no artigo de Post et al (2008), usado como base para
o estudo, foram observadas algumas diferenças importantes no comportamento dos
participantes da edição brasileira do programa. O ajuste lento do ponto de referência
em relação ao início do jogo encontrado pelo artigo, por exemplo, não se repetiu
para a amostra brasileira. Outra diferença importante apareceu na curvatura da
função valor. Diferente do mostrado no artigo, e do esperado pela teoria das
perspectivas, montantes maiores parecem ter maior impacto no valor dado à
situação do que quantias menores entre os concorrentes analisados.
A diferença encontrada na curvatura da função valor usada na teoria das
perspectivas, assim como outras diferenças entre os estudos, pode ter ocorrido
devido à dificuldade do brasileiro em atribuir valor aos montantes elevados e à forma
como o impacto das altas quantias em sua renda é interpretado. Além disso,
diferenças econômicas e culturais da população brasileira em relação aos países
presentes no artigo de Post et al (2008), países com economias mais estáveis e
população menos carente, podem ajudar a explicar a maior tendência dos jogadores
brasileiros a recusar ofertas.
Aqui foram usados os episódios do programa televisivo, com valores elevados
em jogo. Pode ser interessante avaliar, assim como realizado no artigo original
73
utilizado no trabalho, o efeito da magnitude das apostas nas escolhas dos indivíduos
através da simulação de situações similares às enfrentadas pelos participantes do
“Topa ou Não Topa”, com alteração dos valores possíveis. Com isso, seria possível
verificar se baixo grau de aversão ao risco se mantém ou se esse foi um efeito dos
montantes avaliados.
74
REFERÊNCIAS
ABDELLAOUI, M.; BARRIOS, C. Reconciling Introspective Utility with Revealed
Preference: Experimental Arguments Based on Prospect Theory. Journal of
Econometrics, v. 138, n. 1, p. 356-378, 2007.
ARIELY, D. Previsivelmente Irracional: as Forças Ocultas que Formam as Nossas
Decisões. Tradução de Jussara Simões. Rio de Janeiro: Elsevier, 2008.
BIANCO, A. M.; YOHAI, V. J. Robust estimation in the logistic regression model. In:
______ Robust Statistics, Data Analysis, and Computer Intensive Methods.
Springer Verlag: Helmut Rieder, v. 109, 1996. p. 17-34.
BLAVATSKYY, P.; POGREBNA, G. Loss Aversion? Not with Half-a-Million on the
Table! Institute for Empirical Research in Economics (University of Zurich), v.
Working Paper 274, Março 2006.
BROOKS, R. et al. Deal or No Deal, That is the Question: The Impact of increasing
stakes ans framing effects on decision-making under risk. International Review of
Finance, v. 9, n. 1-2, p. 27-50, 2009.
DECK, C.; LEE, J.; REYES, J. Risk Attitudes in Large Stake Gambles: Evidence from
a Game Show. Applied Economics, v. 40, n. 1, p. 41-52, 2008.
FRIEDMAN, M.; SAVAGE, L. J. The Utility Analysis of Choices Involving Risk. The
Journal of Political Economy, v. 56, n. 4, p. 279-304, Agosto 1948.
HASTIE, R.; DAWES, R. M. Rational Choice in an Uncertain World: The
Psychology of Judgement. Thousand Oaks: Sage Publications, 2001. 249-312 p.
HOLT, C. A.; LAURY, S. K. Risk Aversion and Incentive Effects. America Economic
Review, v. 92, n. 5, p. 1644-1655, Abril 2002.
KAHNEMAN, D. Maps of Bounded Rationality: A Perspective on Intuitive Judgement
and Choice. American Economic Review, Dezembro 2002. Prize Lecture.
KAHNEMAN, D.; TVERSKY, A. Prospect Teory: An Analysis of Decision under Risk.
Econometrica, v. 47, n. 2, p. 263-291, Março 1979.
KAHNEMAN, D.; TVERSKY, A. Choices, Values, and Frames. American
Psychologist, v. 39, n. 4, p. 341-350, Abril 1984.
LEHRER, J. O Momento Decisivo. Tradução de Marcelo Schild. Rio de Janeiro:
Best Business, 2010.
MENDES, B. V. M.; TYLER, D. E. Constrained M-estimation fo Regression. In:
______ Robust Statistics, Data Analysis and Computer Intensive Methods.
Lecture Notes in Statistics. Springer Verlag: Helmut Rieder, v. 109, 1996. p. 299-
320.
75
PETERS, E.; LEVIN, I. P. Dissecting the Risky-Choice Framing Effect: Numeracy as
an Individual-Difference Factor tn Weighting Risky and Riskless Options. Judgment
and Decision Making, v. 3, n. 6, p. 435-448, Agosto 2008.
POST, T. et al. Deal or No Deal? Decision Making under Risk in a Large-Payoff
Game Show. American Economic Review, v. 98, n. 1, p. 38-71, Março 2008.
ROOS, N. D.; SARAFIDIS, Y. Decision Making under Risk in Deal or No Deal. Social
Science Research Network, 7 Fevereiro 2006. ISSN 881129. Disponivel em:
<http://ssrn.com/abstract=881129>. Acesso em: 16 Junho 2011.
RUBINSTEIN, A. Similarity and Decision-making under Risk (Is There a Utility Theory
Resolution to the Allais Paradox?). Journal of Economic Theory, v. 46, p. 145-153,
1988.
RUSSO, J. E.; SCHOEMAKER, P. J. H. Decisões Vencedoras. In: RUSSO, J. E.;
SCHOEMAKER, P. J. H. Winning Decisions. São Paulo: Saraiva, 2002. Cap. 2, p.
43-93.
SCHOEMAKER, P. J. H. The Expect Utility Model: Its Variants, Purposes, Evidence
and Limitations. Journal of Economic Literature, v. 20, p. 529-563, Junho 1982.
SCHOEMAKER, P. J. H. Subjective Expected Utility Theory Revisited: A Reductio ad
Absurdum Paradox. Theory and Decision, v. 33, p. 1-21, Junho 1992.
SITE Endemol. Endemol. Disponivel em:
<http://www.endemol.com/programme/deal-or-no-deal>. Acesso em: 8 Abril 2011.
SITE SBT. SBT. Disponivel em: <http://www.sbt.com/topaounaotopa/>. Acesso em:
8 Abril 2011.
SITE YouTube. Disponivel em:
<http://www.youtube.com/results?search_query=topa+ou+n%C3%A3o+topa&aq=f>.
Acesso em: 12 Abril 2011.
TVERSKY, A.; KAHNEMAN, D. The Framing of Decisions and the Psychology of
Choice. Science, v. 211, n. 4481, p. 453-458, Janeiro 1981.
WEIRICH, P. Expected Utility and Risk. The British Journal for the Philosophy of
Science, v. 37, n. 4, p. 419-442, Dezembro 1986.
XIE, X.-F.; WANG, X. T. Risk Perception and risky choice: Situational, Informational
and Dispositional Effects. Asian Journal of Social Psychology, v. 6, p. 117-132,
2003.
top related