meta 01 anÁlise do rendimento escolardownload.inep.gov.br/download/estudos_pesquisas/edu... ·...
Post on 15-Dec-2018
214 Views
Preview:
TRANSCRIPT
UNIVERSIDADE FEDERAL DE MINAS GERAIS CENTRO DE DESENVOLVIMENTO E PLANEJAMENTO REGIONAL
Rua Curitiba, 832 – 9ª andar - Centro - 30.170-120 - Belo Horizonte-MG – Brasil Tel.: (31)3279.9144/3279.9148/3279.9149 – Fax: (31)3279.9146/3201.3657
http://www.cedeplar.ufmg.br
META 01 ANÁLISE DO RENDIMENTO
ESCOLAR
AVALIAÇÃO DE DESEMPENHO: FATORES ASSOCIADOS
1999 A 2003
VOLUME 1
Convênio nº 29/2002
Belo Horizonte, Março/2005
SUMÁRIO VOLUME I PáginaIntrodução................................................................................................................ 4 Ação 1.1 – Processamento e preparação do microdados................................... 10
1.1 – Preparação dos microdados 4ª a 8ª série................................. Limpeza do banco de dados – 1999 a 2003.............................. Construção do dicionário de dados da base de dados “Avaliação de Desempenho: Fatores Associados”.......................... 1.2 – Conclusão da documentação e da base de dados definitiva
e completa da pesquisa longitudinal........................................... 1.3 – Disseminação da base de dados da pesquisa longitudinal
para a comunidade científica e educacional...............................
11 18
22
26
64 Ação 1.2 – Implementação da pesquisa de campo..............................................
1.1 – Elaboração da ficha escolar do aluno referente a 2002.......... 1.2 – Aplicação da ficha escolar do aluno referente a 2002............ 1.3 – Elaboração da ficha escolar do aluno referente a 2003......... 1.4 – Aplicação da ficha escolar do aluno referente a 2003............ 1.5 – Processamento e geração do Banco de Dados 8ª série
(2003) e 7ª série (2003)................................................................... Processamento dos instrumentos provas e questionários da 8ª série/2003 e da 7ª série/2003...................................................... Processamento de dados das fichas escolares da 7ª série/2002, 8ª série/2003 e da 7ª série/2003 – REP7.......................... Gerenciamento do banco de dados da 8ª série/2003............... Gerenciamento do banco de dados da 7ª série/2003-REP7.... Processamento de dados das Fichas Histórico Escolar – Alunos 1999..........................................................................................
68 71 78 88
100
111
112
114 116 124
132
Ação 1.3 – Estimativas de fatores determinantes do rendimento escolar no ensino fundamental................................................................................................
1.1 – Análise descritiva da base de dados longitudinal (4ª a 8ª série)................................................................................................
Analises descritivas dos escores clássicos para as disciplinas de matemática e de português........................................ Análises descritivas dos escores equalizados para as disciplinas de matemática e de português........................................ Análise de trajetórias segundo os escores clássicos e equalizados........................................................................................... 1.2 – Análise final dos determinantes do rendimento escolar,
com base nos dados longitudinais (4ª a 8ª séries)..................... Qualidade dos itens e processos de equalização para as provas de português e matemática de acordo com a Teoria da Resposta ao Item (TRI)......................................................................... Estimação de modelos hierárquicos longitudinais para as disciplinas de matemática e português............................................. Apêndice do relatório sobre estimação de modelos hierárquicos longitudinais para as disciplinas de matemática e português.............................................................................................. 1.3 – Avaliação do impacto do bolsa escola e renda mínima
sobre o rendimento escolar..........................................................
134
137
138
176
214
222
223
242
298
311
Ação 1.5 – Estudos sobre apermanência e transições dos alunos no sistema educacional brasileiro............................................................................................
1.1 – Análise sobre promoção, permanência e aproveitamento escolar dos alunos (4ª a 8ª série).................................................
1.2 – Avaliação do impacto do bolsa escola e renda mínima sobre o desempenho escolar (promoção, permanência escolar e aproveitamento)............................................................
328 329
339
Considerações finais.............................................................................................. 345 Bibliografia.............................................................................................................. 347 Anexos..................................................................................................................... VOLUME 2 Anexo 1 – Gráficos e tabelas do relatório de Qualidade dos itens e processos de equalização para as provas de português e matemática de acordo com a Teoria da Resposta ao Item (TRI).................................................. VOLUME 3 Anexo 2 – Dissertação “Fatores Associados ao Rendimento Escolar de Alunos da 5ª série (2000) – uma abordagem do valor adicionado e da heterogeneidade” autoria de Gláucia Alves Macedo...........................................
351
Vol. 2
Vol. 3
4
META 1 – ANÁLISE DO RENDIMENTO ESCOLAR
APRESENTAÇÃO
O cenário delineado, nas últimas décadas, para o sistema educacional
brasileiro revela importantes transformações em diversos aspectos. Destaca-se
a ampliação do acesso à escola no ensino fundamental e uma melhoria nos
níveis médios de escolarização atingidos. Entretanto, muitas lacunas ainda se
fazem notar. A escolaridade média, mensurada em termos de anos médios de
estudo, ainda se encontra abaixo da alcançada por diversos países em
desenvolvimento, enquanto persistem acentuadas desigualdades,
principalmente regionais, em termos de acesso a oportunidades educacionais
(MARTELETO, 2002).
As mudanças demográficas, principalmente a queda nos níveis de
fecundidade, a partir da década de 1970, têm proporcionado uma diminuição
proporção de população em idade de cursar a educação primária, de tal sorte
que a falta de escolas parece não ser o principal problema do sistema brasileiro
de educação e maior atenção deve ser dada a questões como a qualidade da
educação e à repetência (FLETCHER & RIBEIRO, 1987; KLEIN, 1995). Abre-
se um cenário onde assume crucial importância a investigação de aspectos
ligados à qualidade, eficácia e rendimento escolar.
De uma forma geral, a literatura da proficiência educacional, incluindo
especialmente áreas como Economia e Educação, estabelece, em geral, três
níveis de fatores aos quais a proficiência está associada: nível do aluno, nível
da turma e nível da escola (HANUSHEK, 2002; WILLMS & SOMERS, 1999;
SOARES, CÉSAR & MAMBRINI, 2001). Isto se deve ao fato dos dados
educacionais apresentarem uma estrutura hierárquica, estando os alunos
aninhados em turmas e estas aninhadas em escolas.
5
Entretanto, essa literatura não é consensual, nem quanto aos fatores
associados à proficiência, nem quanto às definições do efeito-escola e nem
quanto às suas formas de operacionalização (WILLMS, 2000; TOOD &
WOLPIN, 2003; FERRÃO & FERNANDES, 2003).
O termo efeito-escola foi definido, por FERRÃO & FERNANDES (2003), como
a proporção da variância total que está associada à variância entre as escolas,
ou seja, o quanto da variação do rendimento escolar entre os alunos é
explicado por diferenças existentes entre as escolas que eles frequentam. Nos
modelos estimados num das ações a seguir, o efeito-escola pode estar
associado ao status inicial de desempenho, à taxa linear média de crescimento
no desempenho do aluno de um período para o seguinte ou à taxa não linear
média de crescimento.
Considerando a necessidade de se conhecer melhor os fatores associados à
proficiência escolar, visando contribuir de alguma forma para a melhoria do
sistema educacional brasileiro, este relatório pretende investigar quais são os
fatores associados à proficiência educacional da quarta à oitava série do
ensino fundamental no norte, no nordeste e no centro-oeste brasileiros que,
conforme SAEB (2004), são as regiões do Brasil com os piores resultados em
termos de desempenho.
Por outro lado, têm se observado uma preocupação, por parte dos órgãos
governamentais com questões ligadas à educação de crianças provenientes de
famílias de baixa renda, principalmente visando a permanência na escola, por
meio de incentivo financeiro, buscando contribuir para a melhoria das
condições de vida no seio dessas famílias e, conseqüentemente, no país.
Nesse sentido, iniciativas vêm sendo desenvolvidas, como por exemplo o
programa bolsa escola e mais recentemente o bolsa família, visando quebrar o
círculo da transmissão intergeracional da pobreza, via educação.
Este relatório procura cumprir a descrição detalhada das atividades
relacionadas à meta 1: Análise de Rendimento Escolar. Esta meta está dividida
em quatro ações : Ação 1.1. Processamento e preparação dos microdados;
Ação 1.2. Implementação da pesquisa de campo; Ação 1.3. Estimativas de
fatores determinantes do rendimento escolar o ensino fundamental e Ação 1.5.
6
Estudos sobre a permanência de transições dos alunos no sistema educacional
brasileiro.
Cada uma dessas ações está sub-dividida em seções. Desta forma, a ação que
informa sobre o processamento e preparação dos microdados indica o
processo de “limpeza” por que passaram os dados, descreve o banco de dados
disponível em versão SAS e SPSS e sua documentação correspondente (como
por exemplo, dicionários, manual de utilização, programas para label de
variáveis e suas categorias em SPSS, dentre outros). Neste ponto vale
ressaltar que o banco de dados ainda sofre com problemas em variáveis
chaves, como por exemplo, as variáveis identificadoras do aluno e da escola e
a variável turno.
Diante dessas circunstâncias, para a estimação dos fatores determinantes do
desempenho nas disciplinas de matemática e português, a opção adotada foi
considerar apenas os alunos de trajetória completa na estimação de tais
modelos, ou seja, alunos que estiveram presentes ao longo de todas as seis
rodadas realizadas pela pesquisa. Esta opção foi escolhida em virtude da
grande quantidade de valores em branco (missings) presentes nas variáveis
preditoras, mas, principalmente, pelo fato do banco de dados, ainda,
apresentar erros na variável identificadora do aluno. Desta forma, tentou-se
minimizar problemas de identificadores diferentes para o mesmo aluno ao
longo da pesquisa, uma vez que todos os alunos considerados participaram de
todas as rodadas e, portanto, apresentavam o mesmo identificador ao longo da
pesquisa. Contudo, este relatório apresenta um apêndice, contendo resultados
de modelos estimados com alunos que participaram de pelo menos duas
rodadas da pesquisa.
Faz parte ainda desta ação o item sobre disseminação da base de dados.
Neste item são descritos os três seminários em que foram apresentados
resultados com a utilização do banco de dados da pesquisa “Avaliação de
Desempenho: Fatores Associados”.
A ação 1.2, como dito anteriormente, diz respeito à implementação da pesquisa
de campo, informando sobre a elaboração e aplicação das fichas escolares dos
alunos que cursaram a sétima série em 2002 e, a oitava em 2003. Nesta ação,
consta ainda um relatório sobre o processamento e a geração do banco de
7
dados das respectivas séries citadas acima. Consta, também, nesta ação o
processo de elaboração e da coleta da Ficha Histórico Escolar, bem como a
construção e formação do seu banco de dados. Este banco de dados foi criado
com o intuito de resgatar a trajetória escolar dos alunos que compuseram a
amostra inicial da pesquisa e vai permitir estudos futuros com o cruzamento do
banco longitudinal da pesquisa “Avaliação de Desempenho: Fatores
Associados”.
Por sua vez, a ação 1.3 é voltada a análises estatísticas, desde aquelas mais
simples até a estimação de modelos mais complexos. Esta ação está dividida
em três seções, que compreendem seis relatórios. Para a primeira seção, são
apresentados três relatórios sobre análises descritivas da base de dados
longitudinal: 1) Análises estatísticas descritivas dos escores clássicos para as
disciplinas de matemática e de português; 2) Análises estatísticas descritivas
dos escores equalizados para as disciplinas de matemática e de português e 3)
Análise de trajetórias, segundo os escores clássicos e equalizados em
matemática e português.
Nos dois primeiros relatórios podem ser encontradas análises descritivas dos
escores clássicos e equalizados por estado e por turno, separadamente para
cada disciplina. O principal objetivo desses relatórios era mostrar a diferença
nos resultados descritivos, quando se utiliza escores clássicos e escores
equalizados. Esta diferença foi também evidenciada no relatório de Análises de
Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de
uma curva de aprendizagem, quando se utiliza os escores equalizados, ou
seja, aqueles estimados e equalizados de acordo com a Teoria da Resposta ao
Item (TRI).
Na segunda seção “Análise final dos determinantes do rendimento escolar,
com base nos dados longitudinais (quarta a oitava séries)” constam dois
relatórios: 1) Qualidade dos itens e processos de equalização para as provas
de português e matemática, de acordo com a Teoria da Resposta ao Item e 2)
Estimação de modelos hierárquicos longitudinais nas disciplinas de matemática
e de português.
No relatório sobre estimação (calibração) e equalização de acordo com a
Teoria da Resposta ao Item, inicialmente, apresenta-se uma introdução sobre
8
a TRI, incluindo além da especificação teórica do modelo, critérios, geralmente,
utilizados por especialistas da área para a determinação da qualidade dos
itens. Complementando esta introdução, a seguir é mostrado um resumo
teórico sobre processos de equalização de acordo com a TRI. Posteriormente,
são interpretados os resultados da estimação (calibração) e da qualidade dos
itens para as disciplinas de matemática e de português, assim como foram
também descritos os processos e os resultados da equalização para as provas
das referidas disciplinas.
Tendo modelado a variável latente o escore equalizado, estimado de acordo
com a TRI, passou-se então ao processo de estimação de modelos
hierárquicos longitudinais para as disciplinas de português e matemática,
separadamente. Para a estimação desses modelos, conforme mencionado
anteriormente, optou-se por trabalhar com os alunos de trajetória completa, ou
seja, alunos que estiveram presentes ao longo de todas as seis rodadas
realizadas pela pesquisa.
Esta opção foi escolhida em virtude da grande quantidade de valores em
branco (missings) presentes nas variáveis preditoras, mas, principalmente, pelo
fato do banco de dados, ainda, apresentar erros na variável identificadora do
aluno. Desta forma, tentou-se minimizar problemas de identificadores
diferentes para o mesmo aluno ao longo da pesquisa, uma vez que todos os
alunos considerados participaram de todas as rodadas e, portanto,
apresentavam o mesmo identificador ao longo da pesquisa. Contudo, este
relatório apresenta um apêndice, contendo resultados de modelos estimados
com alunos que participaram de pelo menos duas rodadas da pesquisa. Assim,
é possível observar a diferença nos modelos que consideram os alunos de
trajetória completa e aqueles que levam em conta os alunos que participaram
de pelo menos duas avaliações.
No terceiro tópico “Avaliação do impacto da bolsa escola e renda mínima sobre
o rendimento escolar”, apresenta-e um relatório com análises descritivas,
sugerindo qual o tipo de relação entre o impacto do programa bolsa escola e o
rendimento escolar.
Para a ação 1.5 “Estudos sobre a permanência e transições dos alunos no
sistema educacional brasileiro” foi realizado apenas um relatório em função da
9
falta de disponibilidade que impossibilitou a realização do segundo relatório. O
primeiro deles se refere à análise descritiva sobre a promoção, a permanência
e o aproveitamento escolar dos alunos, de 1999 a 2003. O segundo diz
respeito à avaliação do impacto do bolsa escola e renda mínima sobre o
desempenho escolar, no que tange à promoção, permanência escolar e
aproveitamento. Contudo, este último relatório não pôde ser realizado em
virtude, especialmente, da não disponibilidade dos bancos de dados de
pagamento e de freqüência. O único banco de dados disponível até o momento
é o do cadastro, por meio do qual não é possível identificar exatamente a que
data se refere cada observação. Sendo assim, espera-se que com a
disponibilidade futura desses bancos, o estudo da avaliação do impacto do
bolsa escola no rendimento - no que tange à promoção, permanência e
aproveitamento escolar – possa ser realizado com a adoção de modelagem
mais acurada e adequada a este tipo de dados.
10
AÇÃO 1.1 – PROCESSAMENTO E PREPARAÇÃO DOS MICRODADOS
APRESENTAÇÃO
Esta ação se refere ao processo de preparação dos dados que foram digitados
em formato MS Access 2000 e convertido para microdados, no formato SAS V8
Windows e em SPSS, envolvendo, portanto, todo o processo de limpeza dos
dados, a formação e a construção do banco de dados longitudinal, além do
dicionário do banco de dados referente à pesquisa “Avaliação de Desempenho:
Fatores Associados”. Faz parte, também, desta ação o processo de
disseminação de informações sobre a pesquisa “Avaliação de Desempenho:
Fatores Associados”, por meio de workshops e seminários realizados para a
comunidade científica e educacional.
Sendo assim, esta ação está dividida em três produtos:
1.1 – Preparação dos microdados 4ª a 8ª série;
1.2 - Conclusão da documentação e da base de dados definitiva e completa da
pesquisa longitudinal.
1.3 - Disseminação da base de dados da pesquisa longitudinal para a
comunidade científica e educacional.
É parte integrante deste relatório toda a documentação referente ao banco de
dados: base de dados em versão SAS e SPSS, os arquivos format e labels, e o
Dicionário da base de dados “Avaliação de Desempenho: Fatores Associados”.
Os arquivos estão sendo apresentados em mídia CD, juntamente com a versão
impressa deste relatório.
11
1.1 – PREPARAÇÃO DOS MICRODADOS 4ª a 8ª SÉRIE
APRESENTAÇÃO
A análise de rendimento escolar dos alunos que compõem o banco de dados
da pesquisa “Avaliação de Desempenho: Fatores Associados” (4ª a 8ª séries),
demandou a preparação e o processamento dos dados da base longitudinal
gerada pela pesquisa no período de 1999 a 2003.
Os dados coletados referem-se aos resultados finais dos alunos, notas nos
testes de matemática e de português aplicados para alunos de 4ª a 8ª série,
além de informações características (questionários auto declarados) de alunos,
professores e diretores, como também questionários sobre as condições das
escolas, preenchidos por aplicadores. Vale ressaltar ainda que também se
encontram disponíveis neste banco de dados os escores equalizados de
matemática e de português, de acordo com a Teoria da Resposta ao Item
(TRI).
Tendo em vista a complexidade e o volume das informações obtidas, os dados
sofreram um processamento, que incluiu diferentes etapas de crítica e
checagem de consistência das respostas, limpeza e padronização com os
demais anos, além da conversão dos dados do formato MS Access 2000 para
o formato SAS V8 Windows e o formato SPSS, procurando facilitar a sua
utilização para as análises estatísticas.
Os dados originalmente recebidos pelo CEDEPLAR, fornecidos pela Café
Software S/C estavam em formato MS Access 2000 e organizados conforme o
modelo relacional clássico para estruturação de dados.
O pesquisador da área de ciências sociais precisa dos dados, objeto da
pesquisa, em formato de microdados. Neste formato, as tabelas são
organizadas tendo como unidade estruturante uma entidade. No caso da
presente pesquisa, as entidades principais eram ESCOLA, PROFESSOR e
ALUNO. Além disso, estes dados foram coletados em diversos pontos no
12
tempo. Nada mais natural do que dividir a organização das bases de
microdados em anos, assim como outros institutos de ciências sociais
aplicadas o fazem, como, por exemplo, o IBGE e o IPEA, entre outros.
Foram então desenvolvidos programas de conversão de dados da plataforma
MS Access 20900 para a Plataforma SAS. A escolha do pacote SAS é
justificada pela comprovada eficiência no tratamento estatístico de base de
dados. As rotinas de processamento da base de 2003 seguiram o padrão
apresentado no tratamento das bases de 1999 a 2002, conforme relatório
apresentado em 2003. A forma de ligação dessas bases de microdados é
explicada e exemplificada com programas em Stata, SPSS, SAS e em SQL na
documentação anexa.
As tabelas originais em formato eram:
Referentes a escola
CAD_ESCOLA
CAP_ESCOLA_PDE
QUEST_ROTEIRO_ESCOLA_1999
QUEST_DIRETOR_1999
QUEST_ROTEIRO_ESCOLA_2000
QUEST_DIRETOR_2000
QUEST_ROTEIRO_ESCOLA_2001
QUEST_DIRETOR_2001
QUEST_ROTEIRO_ESCOLA_2002
QUEST_DIRETOR_2002
QUEST_ROTEIRO_ESCOLA_2003
QUEST_DIRETOR_2003
13
Referentes ao professor
CAD_GERAL_PROFESSOR
7REP CAD_GERAL_PROFESSOR
QUEST_PROF_1999
QUEST_PROF_2000
QUEST_PROF_2001
QUEST_PROF_2002
QUEST_PROF_2003
7REP QUEST_PROFESSOR_2003
Referentes ao aluno
CAD_GERAL_ALUNO
7REP CAD_GERAL_ALUNO
QUEST_ALUNO_1999
QUEST_ALUNO_2000
QUEST_ALUNO_2001
QUEST_PAI_2001
QUEST_ALUNO_2002
QUEST_ALUNO_2003
7REP QUEST_ALUNO_2003
FICHA_ALUNO_1999
FICHA_ALUNO_2000
FICHA_ALUNO_2001
FICHA_ALUNO_2002
FICHA_ALUNO_2003
7REP FICHA_ALUNO_2003
14
FICHA_ALUNO_REND_DISCIPLINA
7REP FICHA_ALUNO_REND_DISCIPLINA
PROVA_ALUNO
7REP PROVA_ALUNO
Referente ao relacionamento das entidade ALUNO/PROFESSOR, identificado
em toda a documentação como PROFESSOR DOCENTE
PROVA_PROFESSOR
FICHA_PROFESSOR
7REP FICHA_PROFESSOR
PROF_FUNC_DOC_ALU
PROF_FUNCAO_DOC
7REP PROF_FUNCAO_DOC
CAD_UFS
GABARITO_ALUNO
GABARITO_PROF
Ao final do processamento, optamos por fornecer bases de microdados no
formato SAS e, também, no formato SPSS, outro importante pacote estatístico
disponível no mercado.
Os arquivos são:
esco1999.sas7bdat,
esco1999.sav,
esco2000.sas7bdat,
esco2000.sav,
esco2001.sas7bdat,
esco2001.sav,
15
esco2002.sas7bdat,
esco2002.sav,
esco2003.sas7bdat,
esco2003.sav,
prof1999.sas7bdat,
prof1999.sav,
prof2000.sas7bdat,
prof2000.sav,
prof2001.sas7bdat,
prof2001.sav,
prof2002.sas7bdat,
prof2002.sav,
prof2003.sas7bdat,
prof2003.sav,
prof2003r.sas7bdat,
prof2003r.sav,
pdma0499.sas7bdat,
pdma0499.sav,
pdpo0499.sas7bdat,
pdpo0499.sav,
pdma1199.sas7bdat,
pdma1199.sav,
pdpo1199.sas7bdat,
pdpo1199.sav,
pdma2000.sas7bdat,
pdma2000.sav,
16
pdpo2000.sas7bdat,
pdpo2000.sav,
pdma2001.sas7bdat,
pdma2001.sav,
pdpo2001.sas7bdat,
pdpo2001.sav,
pdma2002.sas7bdat,
pdma2002.sav,
pdpo2002.sas7bdat,
pdpo2002.sav,
pdma2003.sas7bdat,
pdma2003.sav,
pdpo2003.sas7bdat,
pdpo2003.sav,
pdma2003r.sas7bdat,
pdma2003r.sav,
pdpo2003r.sas7bdat,
pdpo2003r.sav,
alun1999.sas7bdat,
alun1999.sav,
alun2000.sas7bdat,
alun2000.sav,
alun2001.sas7bdat,
alun2001.sav,
alun2002.sas7bdat,
alun2002.sav,
18
LIMPEZA DO BANCO DE DADOS – 1999 A 2003
APRESENTAÇÃO
As atividades de limpeza do banco de dados da pesquisa “Avaliação de
Desempenho: Fatores Associados” tiveram grande importância para o produto
final da geração de uma base de dados de domínio público, tendo em vista que
elas contribuíram para garantir uma melhor qualidade da informação coletada.
As limpezas da base de dados foram iniciadas em 2002 – quando a pesquisa
passou a ser coordenada pelo CEDEPLAR/FACE/UFMG – para as bases de
cada ano da pesquisa, correspondente a cada série pesquisada (4ª a 8ª
séries). A limpeza consistiu em uma correção dos campos, seguindo uma
padronização destes campos para todo o conjunto da base.
Para os anos de 1999 a 2002 foi realizada em todas as tabelas uma
conferência de todas as respostas das questões em relação às imagens
digitalizadas encontradas.
Além disso, foi realizada a consistência dos dados das imagens em relação ao
que estava na base digitada, sendo encontrados erros de consistência.
Partindo desta conferência, foram corrigidos todos os erros encontrados nas
questões conforme as respectivas imagens: incluídos registros que estavam
faltando em algumas tabelas e excluídos registros que estavam errados em
outras.
Assim, a limpeza da base de dados, até a 7ª série - 2002, seguiu as atividades
previstas no plano de trabalho e que foram as seguintes:
19
Conferência de todos os questionários de Diretores (1999, 2000, 2001 e
2002).
Padronização de respostas nas questões do Questionário Diretor 2001.
Preenchimento das questões texto e/ou numéricas em branco, que
possuem respostas, de acordo com as imagens dos questionários.
Padronização de “W” e “w” que significa a mesma resposta (resposta em
branco), para os Questionários Diretores, Professores, Alunos e Roteiro
Escola (1999, 2000, 2001 e 2002).
Conferência de todos os Questionários Roteiros Escolas (1999, 2000, 2001
e 2002).
Inclusão do campo Comentários nos Questionários Roteiro Escola (1999,
2000, 2001 e 2002), ou seja, digitar o campo de comentários, que os
aplicadores responderam nos questionários, nas tabelas dos quatro anos,
de acordo com suas respectivas imagens.
Análise das provas de alguns professores que não estão na tabela
Prova_Professor do ano de 2000, e que possuem imagem de provas.
Conferência de todos os questionários de pais, conforme suas imagens.
Desdobramento de algumas questões da tabela Quest_Pais_2001 (25, 26 e
31), dado que tais questões permitem mais de uma resposta.
Preenchimento de questões da tabela Quest_Professor_2001 que estão em
branco e há respostas dos professores para esta questão nas imagens dos
questionários.
Revisão dos dados de Turno e Turma do questionário de diretor 1999 que
estão com respostas confusas, considerando se há necessidade destes
campos continuarem na tabela Quest_Diretor_1999.
Complementação do campo sexo da tabela Cad_Geral_Professor do
restante de registros que ainda estão em branco. Para isso foram
verificados os questionários, provas e ficha de professores.
Verificação das imagens dos questionários de alunos com páginas inteiras
em branco (tabela Quest_Aluno_1999).
20
Revisão e padronização das informações relativas a tabela Ficha_Aluno.
Por exemplo, os alunos com média zero que foram aprovados. O “zero”
atribuído a estes alunos não corresponde a uma nota zero.
Incorporação à base de dados de informações sobre entrada no PDE (se
participa, ano e mês de entrada, o que corresponde à fase de capacitação
da equipe escolar).
Padronização de respostas digitadas em caracteres maiúsculos e
minúsculos com o mesmo significado.
Resgate do resultado final de alguns alunos através da avaliação das
imagens e da checagem das notas. Os resultados finais apresentavam
erros de digitação que foram padronizados e/ou campos em branco. Ficha
Aluno (1999, 2000 e 2001)
Tratamento das respostas compostas em questões que apresentavam
opções fechadas e únicas através da listagem das combinações que
apresentavam freqüência relevante.
Checagem nas imagens e questões com opções que não constavam entre
as possíveis respostas.
Para a 8ª série e a REP7 – 2003, foi criado, desde o processo inicial de
entrada de dados, mecanismos controladores, para reduzir o número de
ocorrências de erros. Assim, todo o processo de digitação foi acompanhado
pelo CEDEPLAR, contudo pela própria dimensão do banco de dados, foi ainda
necessário fazer novas limpezas, porém em proporção e escalas bem menores
que nos anos anteriores.
Para a variável sexo, por exemplo, foram detectados e corrigidos em torno de
700 alunos que responderam esta questão equivocadamente. Isto foi detectado
em função da comparação do nome do aluno presente no seu cadastro com
suas respostas aos questionários ao longo da pesquisa.
No caso da ficha escolar do aluno, até 2001, foram preenchidos alguns campos
em branco para as variáveis turno e turma, de acordo com as respostas que
haviam sido dadas nas provas dos anos correspondentes.
21
Conforme dito anteriormente, apesar de todo o empenho do CEDEPLAR no
processo de limpeza e consistência dos dados, ainda foram identificados erros,
em especial, com a variável identificadora do aluno, levando este banco de
dados a ser utilizado com determinada cautela.
Recomenda-se que, posteriormente, este banco de dados passe por um
processo de identificação e correção de erros em variáveis chaves como a de
identificação do aluno e da escola.
22
CONSTRUÇÃO DO DICIONÁRIO DE DADOS DA BASE DE DADOS “AVALIAÇÃO DE DESEMPENHO: FATORES
ASSOCIADOS”
APRESENTAÇÃO
O dicionário de dados da banco de dados da pesquisa “Avaliação de
Desempenho: Fatores Associados” tem por objetivo permitir ao usuário da base
de dados encontrar uma descrição de todas as variáveis contidas na base, que
tiveram seus nomes modificados em relação à base original em formato MS
Access 2000.
Os procedimentos adotados para elaboração do Dicionário de Dados seguiram
um determinado padrão, capaz de atender as principais estratégias de análise.
As convenções assumidas para construção do citado padrão foram
apresentadas nos relatórios anteriores e que são reproduzidas abaixo.
O Dicionário de Dados, parte integrante deste relatório, está disponível em
meio eletrônico (CD) juntamente com as versões da base de dados da
pesquisa.
23
TABELAS DE CONVENÇÕES
Tabela 1 – Nomes das Variáveis 1º dígito = Letras A(Aluno),P(Professor),D(Diretor) ou E(Escola) 2ºdígito = informação da rodada da pesquisa
Abril de 1999 8 Novembro de 1999 9 Novembro de 2000 0 Novembro de 2001 1 Novembro de 2002 2 Novembro de 2003 3
Dígitos restantes (3 a 8)= identificação da variável Matemática m Português p Resultado final res Situação final sit Respostas das questões das provas r
Tabela 2A– Padrões de Re-codificação dos Dados Branco e W 8888 *, Questão anulada 9999
24
Tabela 2B– Padrões de Re-codificação dos Dados Sim/Não NÃO = 0 SIM = 1 Sexo Masculino = 0 Feminino = 1 Quantidade Nenhum/um/dois ou + 0-1-2 Alfabeto Alfabeto (ABCDE...) 0-1-2-3-4-5.....
MATEMATICA 0 Matérias PORTUGUÊS 1 Integral 0 Manhã 1 Turno Tarde 2 Aprovado 1 Reprovado 0 Evadido 2 Transferido 3 Aluno inexistente 4 Classe de aceleração 5 Mudança de turma 6 Progressão parcial 7 Ver OBS 8
Resultado e Situação Final
Desistente 9 Ruim 0 Razoável 1 Boa 2
Nota da escola
Ótima 3 Branca 0 Mulato 1 Negro 2 Amarelo 3
Raças
Indígena 4 Solteiro 0 Casado 1 Viúvo 2 Separado 3
Estado Civil
Outro 4 Nunca 0 Às vezes 1
Resposta com conotação gradativa (1) Com freqüência 2
A 0 B 1 C 2
Questões das provas de prof. e alunos de port. e mat. para todas as séries D 3
(1) Trata-se de apenas um exemplo de respostas com conotação gradativa. Questões semelhantes são tratadas admitindo o mesmo padrão: da menor para a maior
freqüência.
25
Tabela 2C– Padrões de Re-codificação dos Dados Média (Ficha do aluno) 0 a 10 Nota da prova aplicada (score) 0 a 100 Correções das respostas das questões das provas Certo Errado
1 0
DESCRIÇÃO DO DICIONÁRIO DE DADOS
No documento Livro de Códigos, cada variável representa uma linha, contendo
as seguintes informações:
Primeira coluna (Identificação da questão no instrumento): localização da
variável no respectivo questionário (ex: questão 1, questão 2, etc.) Sendo
que cada questionário representa uma seção na tabela;
Segunda coluna (Nome da variável): nome atribuído à variável que segue o
princípio das convenções adotadas;
Terceira coluna (Descrição da variável): descrição e significado da variável;
Quarta coluna (Alternativas de respostas dos instrumentos): indica as
opções possíveis de resposta na base de dados original para cada variável
(ex: A,B,C, etc).
Quinta coluna (Recodificação das respostas): recodificação das opções de
resposta, baseada na Tabela de Convenções para facilitar o processamento
dos dados.
26
1.2 – CONCLUSÂO DA DOCUMENTAÇÃO E DA BASE DE DADOS DEFINITIVA E COMPLETA DA PESQUISA LONGITUDINAL
APRESENTAÇÃO
O objetivo do presente documento é apresentar a estruturação dos diversos
arquivos que compõem os microdados da pesquisa “Avaliação de
Desempenho: Fatores Associados” – 1999/2003.
Para tal estruturação foi adotado um modelo relacional (entidades e
relacionamentos) em que cada entidade seja ALUNO, ESCOLA ou
PROFESSOR, seria dividida em diversos arquivos sendo um arquivo para cada
ano. Esse procedimento é justificado pelo interesse natural dos pesquisadores
que utilizarão as bases de dados em estudarem separadamente cada ano.
Aqueles que quiserem realizar um estudo ao longo dos anos poderão fazê-lo
unindo os arquivos que compõem a entidade a partir do campo chave primária.
Além de abordar os aspectos que envolvem a utilização das bases de dados da
pesquisa “Avaliação de Desempenho: Fatores Associados”, serão
apresentados os programas utilizados para a entrada de dados das fichas
escolares dos alunos em 2002 (7ª série) e em 2003 (8ª série). Também foram
coletadas as fichas dos alunos que estavam na 7ª série em 2003, e que foi
chamado de REP7. Estes alunos receberam uma atenção especial e seus
dados foram separados em bases distintas, constituindo microdados distintos
para os dados dos alunos e dos professores. Também será apresentado o
programa utilizado para a entrada de dados da Ficha Histórico Escolar, ficha
que registra a trajetória escolar dos alunos que faziam parte da fase inicial da
pesquisa – 4ª série/1999. Estes dados foram um banco de dados distinto do
banco de dados longitudinal.
27
Outro tópico que será abordado, trata-se da base de dados do SEBE da
Prefeitura Municipal do Recife/PE. Procurou-se identificar alunos que
pertencessem às bases de dados tanto da pesquisa “Avaliação de
Desempenho: Fatores Associados” quanto do SEBE.
28
DESCRIÇÃO DAS ENTIDADES
ENTIDADE ESCOLA:
Arquivos:
• esco1999
• esco2000
• esco2001
• esco2002
• esco2003
Chave primária em cada um dos arquivos: IdEscola
Relacionamento UM-PARA-MUITOS com a entidade ALUNO
Relacionamento UM-PARA-MUITOS com a entidade PROFESSOR
Para unir os diversos arquivos formando apenas um arquivo escola basta
utilizar o campo IdEscola comum a todos arquivos.
Exemplo de programa SAS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idescola.
proc sort data=esco1999; by idescola; run; proc sort data=esco2000; by idescola; run; proc sort data=esco2001; by idescola; run; proc sort data=esco2002; by idescola; run; proc sort data=esco2003; by idescola;
29
run; data escola; merge esco1999 esco2000 esco2001 esco2002 esco2003; by idescola; run;
Exemplo de programa SPSS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idescola.
GET FILE="esco1999.sav". SORT CASES BY idescola. SAVE OUTPUT="esco1999.sav". GET FILE="esco2000.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2000.sav". GET FILE="esco2001.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2001.sav". GET FILE="esco2002.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2002.sav". GET FILE="esco2003.sav". SORT CASES BY idescola. SAVE OUTPUT="esco2003.sav". MATCH FILES FILE="esco1999.sav" /FILE="esco2000.sav" /FILE="esco2001.sav" /FILE="esco2002.sav" /FILE="esco2003.sav" /BY idescola. SAVE OUTPUT="escola.sav". Exemplo de programa STATA para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idescola. A sintaxe do programa STATA apresenta o inconveniente de limitar a
união de apenas dois arquivos por instrução, portanto arquivos temporários
precisando ser gerados.
30
clear use "esco1999.dta" su sort idescola save temp1 clear use "esco2000.dta" su sort idescola merge idescola using temp1 save temp2 clear use "esco2001.dta" su sort idescola merge idescola using temp2 save temp3 clear use "esco2002.dta" su sort idescola merge idescola using temp3 save temp4 clear use "esco2003.dta" su sort idescola merge idescola using temp4 save escola
31
ENTIDADE PROFESSOR:
Arquivos:
• prof1999
• prof2000
• prof2001
• prof2002
• prof2003
Chave primária em cada um dos arquivos: IdProfes
Chave estrangeira em cada um dos arquivos: IdEscola
Para unir os diversos arquivos formando apenas um arquivo professor basta
utilizar o campo IdProfes comum a todos arquivos.
Exemplo de programa SAS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
IdProfes.
proc sort data=prof1999; by idprofes; run; proc sort data=prof2000; by idprofes; run; proc sort data=prof2001; by idprofes; run; proc sort data=prof2002; by idprofes; run; proc sort data=prof2003; by idprofes; run; data prof; merge prof1999 prof2000 prof2001 prof2002 prof2003; by idprofes; run;
32
Exemplo de programa SPSS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idprofes.
GET FILE="prof1999.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof1999.sav". GET FILE="prof2000.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2000.sav". GET FILE="prof2001.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2001.sav". GET FILE="prof2002.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2002.sav". GET FILE="prof2003.sav". SORT CASES BY idprofes. SAVE OUTPUT="prof2003.sav". MATCH FILES FILE="prof1999.sav" /FILE="prof2000.sav" /FILE="prof2001.sav" /FILE="prof2002.sav" /FILE="prof2003.sav" /BY idprofes. SAVE OUTPUT="prof.sav".
Exemplo de programa STATA para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idprofes. A sintaxe do programa STATA apresenta o inconveniente de limitar a
união de apenas dois arquivos por instrução, portanto arquivos temporários
precisando ser gerados.
clear use "prof1999.dta" su sort idprofes
33
save temp1 clear use "prof2000.dta" su sort idprofes merge idprofes using temp1 save temp2 clear use "prof2001.dta" su sort idprofes merge idprofes using temp2 save temp3 clear use "prof2002.dta" su sort idprofes merge idprofes using temp3 save temp4 clear use "prof2003.dta" su sort idprofes merge idprofes using temp4 save prof
Agora, é apresentado um exemplo de programa SAS para fazer a união do
arquivo de professores e de escolas. Para tanto, o diagrama a seguir
demonstra o relacionamento entre as entidades. Trata-se de um
relacionamento UM-PARA-MUITOS, ou seja, uma escola pode ter muitos
professores. É importante destacar que os arquivo devem ser ordenados
previamente pela variável IdEscola. Nos arquivos dos professores, as variáveis
correspondentes a IdEscola são p9idesc, p0idesc, p1idesc e p2idesc para os
anos de 1999 a 2002 respectivamente. Tal procedimento é justificado pela
possibilidade do professor estar em escolas diferentes em cada ano. Portanto,
se a variável idescola tivesse o mesmo nome em todos os arquivos de
professores, quando fizessemos a união de todos os anos, o valor dessa
variável se perderia pois seria guardado apenas o valor da variável idescola
referente ao último ano.
34
Variáveis foram criadas para indicar a existência do registro na base de dados
original. Por exemplo, as variáveis qupr1999, qupr2000, qupr2001 e qupr2002
e qupr2003 indicam a existência do registro do questionário do professor em
cada ano. Tais variáveis podem ser usadas como filtros após a união das
bases de dados.
proc sort data=esco1999; by idescola; run; data prof1999; set prof1999; rename idescola = p9idesc; run; proc sort data=prof1999; by idescola; run; /* uniao de professores com escolas para 1999 */ data pfes1999; /* base professores e escolas em 1999 */ merge prof1999 esco1999; by idescola; if qupr1999=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2000; by idescola; run; data prof2000; set prof2000; rename idescola = p0idesc; run; proc sort data=prof2000; by idescola; run; /* uniao de professores com escolas para 2000 */ data pfes2000; /* base professores e escolas em 2000 */ merge prof2000 esco2000; by idescola; if qupr2000=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */
Escola: IdEscola
Professor: IdProfes IdEscola
35
run; proc sort data=esco2001; by idescola; run; data prof2001; set prof2001; rename idescola = p1idesc; run; proc sort data=prof2001; by idescola; run; /* uniao de professores com escolas para 2001 */ data pfes2001; /* base professores e escolas em 2001 */ merge prof2001 esco2001; by idescola; if qupr2001=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2002; by idescola; run; data prof2002; set prof2002; rename idescola = p2idesc; run; proc sort data=prof2002; by idescola; run; /* uniao de professores com escolas para 2002 */ data pfes2002; /* base professores e escolas em 2002 */ merge prof2002 esco2002; by idescola; if qupr2002=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run; proc sort data=esco2003; by idescola; run; data prof2003; set prof2003; rename idescola = p3idesc;
36
run; proc sort data=prof2003; by idescola; run; /* uniao de professores com escolas para 2003 */ data pfes2003; /* base professores e escolas em 2003 */ merge prof2003 esco2003; by idescola; if qupr2003=1; /* condição opcional para filtrar apenas aqueles que responderam ao questionário do professor */ run;
Segue a sintaxe para o mesmo procedimento em SQL:
create table pfes1999 as select * from prof1999, esco1999 where prof1999.p9idesc = esco1999.idescola and qupr1999=1; create table pfes2000 as select * from prof2000, esco2000 where prof2000.p0idesc = esco2000.idescola and qupr2000=1; create table pfes2001 as select * from prof2001, esco2001 where prof2001.p1idesc = esco2001.idescola and qupr2001=1; create table pfes2002 as select * from prof2002, esco2002 where prof2002.p2idesc = esco2002.idescola and qupr2002=1; create table pfes2003 as select * from prof2003, esco2003 where prof2003.p3idesc = esco2003.idescola and qupr2003=1;
37
ENTIDADE ALUNO:
Arquivos:
• alun1999
• alun2000
• alun2001
• alun2002
• alun2003
Chave primária em cada um dos arquivos: IdAluno
Chave estrangeira em cada um dos arquivos: IdEscola, turno, turma, serie
(através da concatenação de tais variáveis foi criada a variável “chave”).
Para unir os diversos arquivos formando apenas um arquivo aluno basta utilizar
o campo idaluno comum a todos arquivos. Entretanto, vale ressaltar que
existem duplicações de identificações de alunos, ou seja, existem alunos com
mais de um número de identificação. Estes casos são justificados quando
alunos mudam de escola e recebem uma nova identificação na escola destino.
Esta escola destino também faz parte da pesquisa “Avaliação de Desempenho:
Fatores Associados”.
Exemplo de programa SAS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idaluno.
proc sort data=alun1999; by idaluno; run; proc sort data=alun2000; by idaluno; run; proc sort data=alun2001; by idaluno; run; proc sort data=alun2002;
38
by idaluno; run; proc sort data=alun2003; by idaluno; run; data aluno; merge alun1999 alun2000 alun2001 alun2002 alun2003; by idaluno; run;
Exemplo de programa SPSS para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idaluno.
GET FILE="alun1999.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun1999.sav". GET FILE="alun2000.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2000.sav". GET FILE="alun2001.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2001.sav". GET FILE="alun2002.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2002.sav". GET FILE="alun2003.sav". SORT CASES BY idaluno. SAVE OUTPUT="alun2003.sav". MATCH FILES FILE="alun1999.sav" /FILE="alun2000.sav" /FILE="alun2001.sav" /FILE="alun2002.sav" /FILE="alun2003.sav" /BY idaluno. SAVE OUTPUT="aluno.sav".
39
Exemplo de programa STATA para fazer a união desses arquivos. É importante
destacar que os arquivo devem ser ordenados previamente pela variável
idaluno. A sintaxe do programa STATA apresenta o inconveniente de limitar a
união de apenas dois arquivos por instrução, portanto arquivos temporários
precisando ser gerados.
clear use "alun1999.dta" su sort idaluno save temp1 clear use "alun2000.dta" su sort idaluno merge idaluno using temp1 save temp2 clear use "alun2001.dta" su sort idaluno merge idaluno using temp2 save temp3 clear use "alun2002.dta" su sort idaluno merge idaluno using temp3 save temp4 clear use "alun2003.dta" su sort idaluno merge idaluno using temp4 save aluno
Agora, é apresentado um exemplo de programa SAS para fazer a união do
arquivo de alunos e de escolas. Para tanto, o diagrama a seguir demonstra o
relacionamento entre as entidades. Trata-se de um relacionamento UM-PARA-
40
MUITOS, ou seja, uma escola pode ter muitos alunos. É importante destacar
que os arquivos devem ser ordenados previamente pela variável IdEscola. No
caso das bases de dados dos alunos, ao contrário do que ocorre nas bases de
dados dos professores, já existe a variável IdEscola originalmente presente na
tabela MS Access Cadastro Geral do Aluno. Existem também as variáveis
a9idesc, a0idesc, a1idesc, a2idesc e a3idesc, mas são cópias da IdEscola.
Portanto, não é necessário renomear as variáveis para fazer a união com a
base de dados escola. Podemos concluir que o aluno sempre pertencerá a
uma mesma escola durante o período da pesquisa.
proc sort data=esco1999; by idescola; run; proc sort data=alun1999; by idescola; run; /* uniao de alunos com escolas para 1999 */ data ales1999; /* base alunos e escolas em 1999 */ merge alun1999 esco1999; by idescola; run; proc sort data=esco2000; by idescola; run; proc sort data=alun2000; by idescola; run; /* uniao de alunos com escolas para 2000 */ data ales2000; /* base alunos e escolas em 2000 */ merge alun2000 esco2000; by idescola; run;
Escola: IdEscola
Aluno: IdAluno IdEscola
41
proc sort data=esco2001; by idescola; run; proc sort data=aluno2001; by idescola; run; /* uniao de alunos com escolas para 2001 */ data ales2001; /* base alunos e escolas em 2001 */ merge alun2001 esco2001; by idescola; run; proc sort data=esco2002; by idescola; run; proc sort data=alun2002; by idescola; run; /* uniao de alunos com escolas para 2002 */ data ales2002; /* base alunos e escolas em 2002 */ merge alun2002 esco2002; by idescola; run; proc sort data=esco2003; by idescola; run; proc sort data=alun2003; by idescola; run; /* uniao de alunos com escolas para 2003 */ data ales2003; /* base alunos e escolas em 2003 */ merge alun2003 esco2003; by idescola; run;
42
Segue a sintaxe para o mesmo procedimento em SQL:
create table ales1999 as select * from aluno1999, esco1999 where aluno1999.idescola = esco1999.idescola; create table ales2000 as select * from aluno2000, esco2000 where aluno2000.idescola = esco2000.idescola; create table ales2001 as select * from aluno2001, esco2001 where aluno2001.idescola = esco2001.idescola; create table ales2002 as select * from aluno2002, esco2002 where aluno2002.idescola = esco2002.idescola; create table ales2002 as select * from aluno2003, esco2003 where aluno2003.idescola = esco2003.idescola;
De forma semelhante ao que foi feito nos arquivos de professores, existem
variáveis nas bases de dados dos alunos que indicam a existência do registro
na base original (a variável apresenta valor 1):
• cagealun: cadastro geral do aluno.
• qalu1999: questionário do aluno em 1999.
• qalu2000: questionário do aluno em 2000.
• qalu2001: questionário do aluno em 2001.
• qalu2002: questionário do aluno em 2002.
• qalu2003: questionário do aluno em 2003.
• pama0499: prova de matemática do aluno realizada em abril de 1999.
• pama1199: prova de matemática do aluno realizada em novembro de 1999.
• pama2000: prova de matemática do aluno realizada em 2000.
• pama2001: prova de matemática do aluno realizada em 2001.
• pama2002: prova de matemática do aluno realizada em 2002.
• pama2003: prova de matemática do aluno realizada em 2003.
• papo0499: prova de português do aluno realizada em abril de 1999.
43
• papo1199: prova de português do aluno realizada em novembro de 1999.
• papo2000: prova de português do aluno realizada em 2000.
• papo2001: prova de português do aluno realizada em 2001.
• papo2002: prova de português do aluno realizada em 2002.
• papo2003: prova de português do aluno realizada em 2003.
• falu1999: ficha do aluno em 1999.
• falu2000: ficha do aluno em 2000.
• falu2001: ficha do aluno em 2001.
• qpai2001: questionário com o pai do aluno em 2001.
• falu2002: ficha do aluno em 2002.
• falu2003: ficha do aluno em 2003.
Tais variáveis podem ser usadas como filtros após a união das bases de
dados.
44
RELACIONAMENTO PROFESSOR-DOCENTE
Tais arquivos estabelecem o relacionamento entre a entidade Professor e a
entidade Aluno, ou seja, indicam quais professores lecionaram para quais
alunos. Isso é possível a partir da indicação da identificação do professor e do
conjunto escola, turno, turma e série para o qual leciona. Esse relacionamento é um relacionamento MUITOS-PARA-MUITOS. Portanto são necessárias
tabelas que estabeleçam tal relacionamento.
Arquivos:
• pdma0499: registros dos professores docentes da disciplina de matemática
em abril de 1999.
• pdpo0499: registros dos professores docentes da disciplina de português em
abril de 1999.
• pdma1199: registros dos professores docentes da disciplina de matemática
em novembro de 1999.
• pdpo1199: registros dos professores docentes da disciplina de português em
novembro de 1999.
• pdma2000: registros dos professores docentes da disciplina de matemática
em 2000.
• pdpo2000: registros dos professores docentes da disciplina de português em
2000.
• pdma2001: registros dos professores docentes da disciplina de matemática
em 2001.
• pdpo2001: registros dos professores docentes da disciplina de português em
2001.
• pdma2002: registros dos professores docentes da disciplina de matemática
em 2002.
• pdpo2002: registros dos professores docentes da disciplina de português em
2002.
45
• pdma2003: registros dos professores docentes da disciplina de matemática
em 2003.
• pdpo2003: registros dos professores docentes da disciplina de português em
2003.
Chave primária: IdProfes, IdEscola, turno, turma, serie (através da
concatenação das variáveis IdEscola, turno, turma, serie foi criada a variável
“chave” como alternativa para o usuário).
Para unir as bases Professor e Aluno, é necessário utilizar a tabela de
relacionamento Professor-Docente. Primeiro, a base de dados Aluno deve ser
combinada a base de dados Professor-Docente através das variáveis IdEscola,
turno, turma, serie (ou pela variável “chave”). Segundo, a base de dados
resultante da primeira etapa deve ser unida a base Professor através da
variável IdProfes.
A seguir, é apresentado um exemplo de programa que faz a união das bases
de dados professores e alunos utilizando a base professor-docente.
Professor Docente: IdProfes Escola Turno Turma Série (ou Chave)
Aluno: IdAluno Escola Turno Turma Série (ou Chave)
Professor: IdProfes
46
data alun2000; set alun2000; rename turno = a0turno turma = a0turma serie = a0serie; /* chave = a0chave */ run; data pdma2000; set pdma2000; rename turno = pturno turma = pturma serie = pserie; /* chave = pchave */ run; /* uniao da base aluno com professor-docente da disciplina de matemática em 2000 */ data temp; merge alun2000 pdma2000; by idescola turno turma serie; /* by chave */ if pdma2000=1; run; /* uniao com a base professor, resultando na base final de professores com respectivos alunos da disciplina de matemática em 2000 */ data pama2000; merge temp prof2000; by idprofes; run; data pdpo2000; set pdpo2000; rename turno = pturno turma = pturma serie = pserie; /* chave = pchave */ run; /* uniao da base aluno com professor-docente da disciplina de português em 2000 */ data temp; merge alun2000 pdpo2000; by idescola turno turma serie;
47
/* by chave */ if pdpo2000=1; run; /* uniao com a base professor, resultando na base final de professores com respectivos alunos da disciplina de português em 2000 */ data papo2000; /* base professor aluno (português 2000) */ merge temp prof2000; by idprofes; run;
Existem também variáveis nas bases de dados dos alunos que indicam a
existência do registro na base original MS Access (a variável apresenta valor
1):
• pdma0499: professor-docente da disciplina de matemática em abril de 1999.
• ppma0499: prova do professor-docente da disciplina de matemática em abril
de 1999.
• pdma1199: professor-docente da disciplina de matemática em novembro de
1999.
• ppma1199: prova do professor-docente da disciplina de matemática em
novembro de 1999.
• pdma2000: professor-docente da disciplina de matemática em 2000.
• ppma2000: prova do professor-docente da disciplina de matemática em
2000.
• pdma2001: professor-docente da disciplina de matemática em 2001.
• pdma2002: professor-docente da disciplina de matemática em 2002.
• pdma2003: professor-docente da disciplina de matemática em 2003.
• pdpo0499: professor-docente da disciplina de português em abril de 1999.
• pppo0499: prova do professor-docente da disciplina de português em abril
de 1999.
• pdpo1199: professor-docente da disciplina de português em novembro de
1999.
48
• pppo1199: prova do professor-docente da disciplina de português em
novembro de 1999.
• pdpo2000: professor-docente da disciplina de português em 2000.
• pppo2000: prova do professor-docente da disciplina de português em 2000.
• pdpo2001: professor-docente da disciplina de português em 2001.
• pdpo2002: professor-docente da disciplina de português em 2002.
• pdpo2003: professor-docente da disciplina de português em 2003.
Tais variáveis podem ser usadas como filtros após a união das bases de
dados.
49
FORMATAÇÃO DAS VARIÁVEIS
Anexas as bases de dados, seguem programas com o código SAS e SPSS
para formatação dos labels das variáveis. A seguir, é exemplificado o
procedimento em SAS. O programa com a formatação dos labels em SAS deve
ser executado todas as vezes em que se for trabalhar com as bases de dados
pois tais labels não ficam associados ao arquivo de dados. Tal procedimento
não é necessário no SPSS cujas bases de dados já mantêm agregados os
respectivos labels.
proc format; /* formatação das variáveis referentes ao arquivo escola1999 */ value f1088fmt /* iduf */ 11 = "Rondônia" 15 = "Pará" 26 = "Pernambuco" 28 = "Sergipe" 50 = "Mato Grosso do Sul" 52 = "Goiás"; value f1089fmt /* CAD_ESCO */ 1 = "Presente"; value f1090fmt /* pde */ 1 = "Sim" 0 = "Não"; /* continua aqui os demais “formats” da base de dados */ run; data esco1999; set esco1999; format iduf f1088fmt. CAD_ESCO f1089fmt. pde f1090fmt.; run; /* de forma alternativa, a formatação das variáveis pode ser feita no momento de solicitar as tabulações */ proc freq data=esco1999; tables iduf CAD_ESCO pde; format iduf f1088fmt. CAD_ESCO f1089fmt. pde f1090fmt.; run;
50
De forma análoga, segue o procedimento em sintaxe SPSS equivalente para a
base de dados esco1999.
value labels iduf 11 'Rondônia' 15 'Pará' 26 'Pernambuco' 28 'Sergipe' 50 'Mato Grosso do Sul' 52 'Goiás'/ CAD_ESCO 1 'Presente'/ pde 1 'Sim' 0 'Não'. freq var = iduf CAD_ESCO pde.
51
RÓTULOS DAS VARIÁVEIS
Além dos programas SAS e SPSS para formatação dos valores da variáveis,
foram disponibilizados também os programas SAS e SPSS com a sintaxe para
a atribuição dos rótulos das variáveis. Tais rótulos seriam as descrições das
variáveis de forma bem mais compreensível do que os nomes curtos usados
nos nomes das mesmas.
Parte do programa SAS para atribuição dos rótulos das variáveis da base de
dados esco1999:
data esco1999; set esco1999; /* atribuição dos rótulos das variáveis */ label iduf = "Identificação da U.F." idescola = "Número de identificação da escola" nescola = "Nome da escola" CAD_ESCO = "Presença da escola na seção da pesquisa referente ao Roteiro Escola e Questionário do Diretor de 1999" pde = "Indicação de participação no ou não no programa PDE" /* continua aqui o programa */ /* a instrução label deve ser encerrada com o símbolo de ; */ run;
Parte do programa equivalente ao apresentado anteriormente escrito em SPSS
para atribuição dos rótulos das variáveis da base de dados esco1999:
variable labels iduf 'Identificação da U.F.' idescola 'Número de identificação da escola' nescola 'Nome da escola' CAD_ESCO 'Presença da escola na seção da pesquisa referente ao Roteiro Escola e Questionário do Diretor de 1999' pde 'Indicação de participação no ou não no programa PDE'. É importante destacar que as bases de dados em formato SAS já foram
fornecidas com os rótulos das variáveis atribuídos.
52
MÁSCARAS PARA ENTRADAS DE DADOS DAS FICHAS DOS ALUNOS 2002 E 2003
Para a digitação dos dados coletados na pesquisa de campo sobre as fichas
escolares dos alunos em 2002 e 2003, foram desenvolvidos programas na
plataforma MS Access que permitissem evitar inconsistências.
Foram criados formulários para entrada de dados das fichas dos alunos da 7ª
série em 2002, dos alunos da 8ª série em 2003 e dos alunos da 7ª série em
2003 – REP7.
Foram criados também formulários para entrada de dados da ficha dos
professores da 7ª série em 2002, dos professores da 8ª série em 2003 e dos
professores da 7ª série em 2003 – REP7.
Segue a tela para a digitação dos dados da ficha do aluno da 7ª série em 2002:
55
Segue a tela para a digitação dos dados da ficha do professor da 8ª série em
2003:
Também foi realizada em campo uma pesquisa procurando reconstituir o
histórico escolar dos alunos que estavam na pesquisa “Avaliação de
Desempenho: Fatores Associados” em 1999. Para facilitar a entrada dos dados
desses alunos, também foi criado um formulário procurando evitar as
inconsistências durante o processo de digitação. Destaque para o registro do
tempo total de permanência na escola e para o número total de repetências do
aluno.
57
BASE DE MICRODADOS DOS ALUNOS DA 7ª SÉRIE/2003 – REP7
De forma semelhante aos microdados a pesquisa “Avaliação de Desempenho:
Fatores Associados” para os anos 1999/2003, foram criadas entidades
baseado no modelo relacional para representar ESCOLA, PROFESSOR e
ALUNO.
A entidade ESCOLA é representada pela tabela esco2003, a mesma que
compõem os microdados da pesquisa “Avaliação de Desempenho: Fatores
Associados".
Chave primária: IdEscola
Relacionamento UM-PARA-MUITOS com a entidade ALUNO
Relacionamento UM-PARA-MUITOS com a entidade PROFESSOR
Para unir os diversos arquivos formando apenas um arquivo escola basta
utilizar o campo IdEscola comum a todos arquivos de escolas.
A entidade PROFESSOR é representada pela tabela prof2003r. A criação de
uma tabela separada para os professores dos alunos da 7 série repetente em
2003 é justificada pois estes professores não necessariamente correspondem
aos professores presentes na tabela prof2003 que lecionaram para a 8 série
em 2003:
Chave primária em cada um dos arquivos: IdProfes
Chave estrangeira em cada um dos arquivos: IdEscola
Infelizmente não é possível unir este arquivo de professores aos demais
arquivos de professores dos outros anos da pesquisa “Avaliação de
Desempenho: Fatores Associados” pois a identificação do professor (IdProfes)
não é único.
58
A entidade ALUNO é representada pela tabela alun2003r. Esta tabela tem os
dados dos alunos da 7ª série repetente:
Chave primária em cada um dos arquivos: IdAluno
Chave estrangeira em cada um dos arquivos: IdEscola, turno, turma, serie
(através da concatenação de tais variáveis foi criada a variável “chave”).
Para unir os diversos arquivos formando apenas um arquivo aluno basta utilizar
o campo idaluno comum a todos arquivos de alunos. Entretanto, vale ressaltar
que existem duplicações de identificações de alunos, ou seja, existem alunos
com mais de um número de identificação. Estes casos são justificados quando
alunos mudam de escola e recebem uma nova identificação na escola destino.
Esta escola destino também faz parte da pesquisa “Avaliação de Desempenho:
Fatores Associados”. Ou ainda, alunos que não mudaram de escola, foram
reprovados na 7 série, mas, nessa pesquisa, receberam um novo número de
identificação na 7 série repetente.
Agora, é apresentado um exemplo de programa SAS para fazer a união do
arquivo de alunos e de escolas:
proc sort data=esco2003; by idescola; run; proc sort data=alun2003r; by idescola; run; /* uniao de alunos da 7 repetente com escolas para 2003 */ data ales2003r; /* base alunos e escolas em 2003 */ merge alun2003r esco2003; by idescola; run;
59
SEBE
O objetivo do trabalho com a base de dados do SEBE da Prefeitura Municipal
do Recife/PE foi identificar alunos que recebessem o bolsa escola e tentar
verificar algum tipo de evolução na formação desse aluno na pesquisa
“Avaliação de Desempenho: Fatores Associados”.
A base de dados fornecida pela prefeitura de Recife corresponde àqueles que
fizeram o cadastro solicitando o Bolsa Escola. O formato disponibilizado foi em
Interbase 6 ou Firebird 1.5. Ambos totalmente compatíveis, sendo o primeiro
pertencente a empresa Borland Corporation e o segundo mantido pela
comunidade de software livre. A base de dados dos pagamentos do bolsa
escola não nos foi fornecida.
A seguir, são apresentadas algumas telas, listando as tabelas do sistema.
Destaque para a tabela TBREQUERENTE que mantém os dados dos pais e
responsáveis que solicitaram o bolsa escola para seus filhos e dependentes.
60
Na estrutura da tabela TBREQUERENTE, mostrada a seguir, existe a
identificação com código, nome, endereço, etc. Destaque ainda para os
campos crequetipo e cstatucodi. O campo crequetipo indica o tipo de
requerimento cujos valores seriam M para Bolsa Escola Municipal e F para
Bolsa Escola Federal. O campo cstatucodi indica um código do status do
requerimento.
A combinação dos valores desses campos indica se os dependentes desse
requerente recebem ou não algum tipo de ajuda. Esta foi a maneira encontrada
para conseguirmos algum tipo de informação sobre pagamento apenas tendo
recebido dados sobre cadastro. Todos aqueles que são do tipo de
requerimento “Bolsa Escola Municipal”, ou seja, crequetipo=M, recebem o
bolsa escola municipal. Aqueles que foram classificados para o “Bolsa Escola
Federal” (crequetipo=F) e que estão com o status valor “15” (cstatucodi=15)
recebem o bolsa escola federal.
Segue a tela com a identificação de alguns campos da tabela
TBREQUERENTE:
61
Outra tabela importante é a TBDEPENDENTE que armazena os dados dos
dependentes. Para tais dependentes, seus respectivos pais e responsáveis
solicitaram o bolsa escola, se recebem ou não, podemos determinar pelas
variáveis da tabela de requerentes apresentadas anteriormente.
Os principais campos dessa tabela TBDEPENDENTE são:
as variáveis de identificação do requerente (pai ou responsável)
CREQUECODI;
as variáveis de identificação do próprio dependente como código, nome,
sexo, data de nascimento, etc;
as variáveis de identificação da escola em que estuda.
Os campos nome do aluno e data de nascimento foram trabalhadas com na
pesquisa “Avaliação de Desempenho: Fatores Associados”, procurando
identificar alunos que estivessem presentes nas duas bases de dados. Foram
utilizadas técnicas básicas de “record matching”. Entretanto, técnicas mais
avançadas podem ser abordadas associando probabilidades no casamento de
padrões de nomes, sexo e data de nascimento, considerando ou não a
ocorrência de missing nesses valores.
63
Durante a produção desse trabalho de tentar localizar os mesmos alunos nas
duas bases de dados, foi constatada a existência de grande quantidade de
dados de alunos duplicados na base de dados da pesquisa “Avaliação de
Desempenho: Fatores Associados”, ou seja, alunos com mais de um cadastro
possuindo mais de um número de identificação e portanto representando
históricos diferentes na evolução da pesquisa.
Trata-se de alunos que saíram de uma escola e que foram para outra. Esta
outra escola também fazia parte da pesquisa “Avaliação de Desempenho:
Fatores Associados”. O aluno deveria ter recebido o mesmo número de
identificação que tinha na escola anterior, mas não foi o caso. Para o
pesquisador, tratariam de dois alunos distintos, mas, de fato, não foi o caso.
O banco de dados da pesquisa “Avaliação de Desempenho: Fatores
Associados” será apresentado na versão SAS e SPSS, e acompanha este
banco de dados o Dicionário de Dados da base de dados.
Os arquivos com toda a documentação – base de dados em versão SAS e
SPSS –, format e os labels, apresentados em mídia CD, é parte integrante
deste relatório.
64
1.3 – DISSEMINAÇÃO DA BASE DE DADOS DA PESQUISA LONGITUDINAL PARA A COMUNIDADE
CIENTÍFICA E EDUCACIONAL
APRESENTAÇÃO
De início, vale ressaltar que o banco de dados longitudinal (1999 a 2003), da
pesquisa “Avaliação de Desempenho: Fatores Associados” realizada por meio
de uma parceria entre o INEP (Instituto de Pesquisas Educacionais Anísio
Teixeira) e o CEDEPLAR (Centro de Desenvolvimento e Planejamento
Regional e Urbano) foi alvo de seminários internos do CEDEPLAR, para
detectar possíveis distorções e apresentar idéias para aprimorar as análises,
por meio deste banco, já realizadas.
Para a sociedade, em especial, o INEP e a sociedade acadêmica, estes dados
foram primeiramente apresentados no Seminário Nacional “Qualidade na
Educação: garantia de equidade e aprendizagem na escola”, realizado em
Brasília-DF, nos dias 4 e 5 de novembro de 2004, promovido pelo INEP/MEC.
Este seminário agregou públicos diversos como, educadores, sociólogos,
economistas, estatísticos e demógrafos, dentre outros.
Assim, pode-se dizer que informações da pesquisa, desde seu início, foram
mostradas neste seminário. Informações sobre o plano amostral, a coleta de
dados, a verificação da consistência dos mesmos foram contempladas por um
público acadêmico bastante diverso, mas envolvido com a procura por uma
maior qualidade na educação.
Análises preliminares, tanto as descritivas quanto as mais complexas -
processos de calibração de itens, equalização das habilidades e estimação de
modelos de valor adicionado - também foram apresentadas. Foi realizada uma
comparação entre a estimação das habilidades dos alunos por meio da Teoria
Clássica e da Teoria da Resposta ao Item (TRI), utilizando-se de estatísticas
65
descritivas e dos resultados dos modelos estimados, mostrando a vantagem
em se adotar os escores equalizados por meio da TRI, quando se pretende
determinar os fatores associados à qualidade da educação.
A apresentação foi realizada em 4 de novembro pelo prof. Eduardo Luiz
Gonçalves Rios-Neto. Ela estava incluída no Módulo II do seminário, intitulado
“Informações Educacionais: inclusão social e a qualidade na educação”, tendo
como coordenadora da mesa Oroslinda Taranto Goulart, diretora de tratamento
e disseminação de informações educacionais do INEP/MEC.
Análises com a utilização do banco de dados longitudinal “Avaliação de
desempenho e fatores associados” foram ainda apresentadas em dois outros
seminários. Um deles, “II Workshop Demografia e Economia da Educação”,
aconteceu em Belo Horizonte nos dias 29 e 30 de novembro de 2004.
Neste seminário estavam presentes, em especial, os professores,
pesquisadores e estagiários do CEDEPLAR, envolvidos com projetos na área
de Educação, e alguns membros da equipe do INEP e técnicos da Secretaria
Estadual de Educação do Estado de Minas Gerais. O seminário em Belo
Horizonte teve caráter de seminário interno, como objetivo de detectar
possíveis distorções e apresentar idéias para aprimorar as análises já
realizadas. Os resultados mostrados neste seminário contemplam informações
que vão desde a coleta dos dados. Assim, foram novamente citados os
arquivos contidos nesta base, assim como as variáveis que neles podem ser
encontradas. As informações sobre a coleta de dados foram apresentadas por
Agesilau Neiva Almada e as demais informações sobre o banco de dados,
assim como as análises estatísticas por Danielle Ramos de Miranda Pereira,
doutoranda em Demografia pelo CEDEPLAR.
A parte introdutória foi seguida pelas análises descritivas para a disciplina de
matemática, comparando-se resultados obtidos por meio de escores clássicos
e equalizados. O intuito desta comparação era o de mostrar a vantagem em se
utilizar os escores equalizados, uma vez que estes se encontram numa mesma
escala, sendo, portanto, diretamente comparáveis.
Assim sendo, os escores clássicos e equalizados foram comparados,
inicialmente, com a utilização de estatísticas descritivas e por meio de gráficos
66
das médias por períodos, dos alunos que participaram de todas as rodadas da
pesquisa (trajetória completa) e daqueles que não completaram a trajetória.
Além disto, para a comparação entre os resultados obtidos com a adoção
desses dois escores foram estimados modelos de valor agregado,
confirmando, mais uma vez, a vantagem em se utilizar escores equalizados,
em vez de simplesmente calcular o escore, somando-se os itens respondidos
corretamente, como é o caso do escore clássico.
Numa outra forma de abordagem, foram apresentados resultados preliminares
da estimação de modelos hierárquicos longitudinais com a utilização da
amostra total, incluindo alunos com trajetória completa, ou não. Estes modelos,
apesar de preliminares e de não apresentarem variáveis preditoras no nível da
escola, já conseguiam mostrar a importância de variáveis como a repetência no
rendimento do aluno na disciplina de matemática.
No ano de 2005, análises com a utilização desses dados longitudinais foram
apresentadas em 28 de março em Brasília, no seminário “Seminário
Demografia e Economia da Educação”, sob a apresentação intitulada “Fatores
associados e o aprendizado em matemática e em português: uma perspectiva
longitudinal”. Vale ressaltar que, neste último seminário, foram apresentados
também resultados para a disciplina de português.
Esta apresentação começa com uma introdução sobre as variáveis
encontradas no banco de dados. Ainda, na parte introdutória, são apresentados
esquemas longitudinais, tanto para a disciplina de matemática quanto para a de
português, que mostram o número de alunos em cada uma das rodadas,
considerando o momento da entrada e da saída do aluno na pesquisa.
Gráficos das médias dos escores equalizados para os alunos com trajetória
completa e incompleta foram analisados para as disciplinas de matemática e
de português. O gráfico de matemática, independente do aluno ter completado
ou não a trajetória, mostrou estruturas de curvas mais próximas à estrutura de
uma curva de aprendizagem padrão, caracterizada por ganhos decrescentes e
tendendo à estabilidade do rendimento no final do processo.
Como foi detectado que o banco de dados ainda apresenta erros na variável
identificadora do aluno, optou-se por estimar modelos hierárquicos
67
longitudinais, considerando os alunos de trajetória completa, ou seja, aqueles
que estiveram presentes em todas as seis rodadas da pesquisa, de abril do
ano de 1999 a novembro do ano de 2003.
Então, com o principal objetivo de verificar os fatores associados ao rendimento
escolar em português e matemática foram estimados modelos hierárquicos
para estas duas disciplinas separadamente. Em especial, variáveis como sexo,
fazer lição, não repetir de ano, escolaridade da mãe, tamanho da turma e
laboratório de informática, mostraram-se associadas ao rendimento do aluno
em matemática ou português.
Foram ainda mostrados outros cálculos, como o de rendimento médio por sexo.
Para calcular o rendimento médio por sexo foi simulada uma situação em que o
(a) aluno(a) fazia lição e não repetia de ano, para a disciplina de matemática.
No caso de português, considerou-se ainda que a mãe apresentava pelo
menos o ensino fundamental completo. Para o terceiro nível, no caso de
matemática, a suposição era a de que o (a) aluno (a) estudava em uma escola
em que o tamanho médio das turmas era de 35. Enquanto para português,
supunha-se que os alunos estudavam em escola com laboratório de
informática. Assim sendo, os rendimentos por série (ou período) foram
calculados e “plotados” para matemática e português, por sexo. Por meio
desses gráficos, foi possível constatar o diferencial de rendimento médio em
matemática e em português entre homens e mulheres. Para maiores detalhes
sobre esta apresentação, veja nos relatórios da Ação 1.3, o relatório sobre a
estimação de modelos hierárquicos para matemática e português.
68
AÇÃO 1.2 – IMPLEMENTAÇÃO DA PESQUISA DE CAMPO
APRESENTAÇÃO
Esta ação compreende os trabalhos desenvolvidos para a implementação da
pesquisa no campo e o processo de geração do banco de dados da 7ª
série/2002 – fichas escolares, 8ª série/2003 – provas, questionários e fichas
escolares, o banco de dados da REP7/2003, e também o banco de dados da
Ficha Histórico Escolar.
Com o intuito de resgatar parte dos alunos que se perderam durante a
pesquisa, optou-se, em 2003, por aplicar provas e questionários para uma série
adicional – 7ª série – aqui chamada de REP7. Este banco de dados está
separado do banco de dados longitudinal e os alunos que, em algum momento,
passaram pela pesquisa “Avaliação de Desempenho: Fatores Associados”
estão devidamente identificados neste banco de dados.
Aproveitando a estrutura montada para coletar as fichas escolares da 7ª, 8ª e
REP7, optamos por criar um instrumento que permitiu levantar a trajetória
escolar dos alunos que compunham a amostra inicial, ou seja, que em 1999
estavam cursando a 4ª série e que responderam às provas e questionários.
Esta ficha foi por nós chamada de Ficha Histórico Escolar e permitiu assim
coletar informações dos alunos, como por exemplo ano de entrada e sua
trajetória dentro da escola, com os seus respectivos resultados finais. Esta
ficha permitiu criar um banco de dados independente do banco de dados
longitudinal e vai permitir também, futuramente, através do cruzamento com o
69
banco de dados da pesquisa “Avaliação de Desempenho: Fatores Associados”,
análises outras sobre o desempenho escolar destes alunos.
Para que os trabalhos de campo e formação do banco de dados pudessem
seguir o mesmo padrão dos anos anteriores e também para que pudéssemos
cumprir os prazos estabelecidos, foram mantidas as empresas que já vinham
trabalhando com a pesquisa “Avaliação de Desempenho: Fatores Associados”
nos anteriores, uma vez que elas já tinham toda uma estrutura de campo e
geração de dados formada.
Assim sendo, além do CEDEPLAR, as empresas envolvidas neste processo
foram:
SOLUÇÃO – APOIO A DECISÕES CONSULTORIA LTDA.:
Elaboração da ficha escolar aluno e professor referente 7ª série, 8ª série
e REP7.
Coordenação e execução do campo para coleta da ficha escolar da 7ª
série, 8ª série, REP7 e Ficha Histórico Escolar.
INTERCONECT DO BRASIL LTDA.:
Processamento dos dados de provas e questionários para a 8ª série e
REP7.
CAFÉ SOFTWARE S/C LTDA.:
Gerenciamento do banco de dados da 7ª série e 8ª série – provas,
questionários e fichas escolares.
Gerenciamento do banco de dados da REP7 – fichas escolares.
70
CEDEPLAR/FACE/UFMG
Revisão das fichas escolares.
Acompanhamento e supervisão dos trabalhos realizados no campo.
Elaboração da Ficha Histórico Escolar.
Processamento dos dados das fichas escolares para a 7ª série/2002, 8ª
série/2003, REP7/2003 e Ficha Histórico Escolar.
Gerenciamento do banco de dados da Ficha Histórico Escolar.
Coordenação dos trabalhos de gerenciamento do banco de dados da 7ª
série/2002, 8ª série/2003 e REP7/2003.
A ação 1.2. – Implementação da Pesquisa de campo está dividida em 05
produtos:
1.1. – Elaboração da ficha escolar do aluno referente a 2002;
1.2. – Aplicação da ficha escolar do aluno referente a 2002;
1.3. – Elaboração da ficha escolar do aluno referente a 2003;
1.4. – Aplicação da ficha escolar do aluno referente a 2003;
1.5. – Processamento e geração do Banco de Dados 8ª série (2003) e 7ª
série (2003).
71
1.1 – ELABORAÇÃO DA FICHA ESCOLAR DO ALUNO E DO PROFESSOR REFERENTE A 2002.
APRESENTAÇÃO
Para o ano de 2002, que abrange os alunos que cursaram a 7ª série, foram
elaborados 04 instrumentos para que pudessem ser coletadas as informações
necessárias à formação do banco de dados longitudinal da pesquisa “Avaliação
de Desempenho: Fatores Associados”.
A fim de assegurar a comparabilidade entre as informações coletadas a cada
ano para a mesma amostra de escolas, houve ligeiras modificações nos
instrumentos, mais especificamente no lay-out que já vinha sendo aplicado, e
que são os seguintes1:
Ficha Escolar – Dados do aluno: resultado final, média e faltas em
Português e Matemática;
Ficha em Branco - Aluno: para acrescentar alunos que ainda não
constam da base de dados da pesquisa (missing) ou seja, alunos que
não fizeram a prova, mas, que pertencem a 7ª série e tiveram resultado
final;
Ficha do Professor: nome e faltas dos professores de Português e
Matemática e suas respectivas turmas;
Boletim de Ocorrência: formulário para registro de eventos significativos
na coleta.
1 Vide cópia dos instrumentos em anexo.
72
CRONOGRAMA DE ATIVIDADES
DATA ATIVIDADES mar/04 abr/04
Estudos de lay-out e alterações nas Fichas Escolares 01 a 31 Elaboração de máscara para impressão dos instrumentos 29 a 31 1 a 12 Impressão das Fichas Escolares 05 a 08 Envio das Fichas Escolares aos coordenadores de campo 26
74
Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: 7 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 7261 ADEMILSON VIEIRA DA 07/04/1985 T A 202419 ANDREZA FERNANDA DA 14/06/1987 T A 331721 ANTONIO CESAR S DO 09/12/1986 T A 202421 DADIANE FONSECA DA 18/02/1988 T A 331731 DANIEL GOES DE JESUS 18/12/1983 T A 58644 EDJAN DA SILVA OLIVEIRA 25/10/1990 T A 202423 EDUARDO MIRANDA DE 03/02/1986 T A 501365 EDVALDA DOS SANTOS 09/04/1984 T A 331733 GRACIELE DOS SANTOS 15/07/1983 T A 331735 JAQUELINE DOS SANTOS AL 13/08/1986 T A 7245 JOEDNA DA SILVA OLIVEIRA 10/12/1988 T A 7271 JOSE MESSIAS CORNELIO AS 04/05/1987 T A 7246 KARINA DOS SANTOS LIMA 25/03/1987 T A 331736 MARIA RITA DOS SANTOS 22/05/1984 T A 331737 PRISCILA DOS SANTOS PER 08/05/1984 T A 202428 RAFAELA NASCIMENTO 02/05/1988 T A 202430 ROSEELAN SANTOS CARDO 03/01/1987 T A 202432 SILVANI SILVA GOES 23/09/1984 T A 7254 SIMONE DOS SANTOS 16/07/1988 T A 331738 SIMONE SANTOS COSTA 12/05/1985 T A 202433 SUELI DE JESUS SANTOS 12/07/1984 T A 331739 TIAGO DE JESUS RODRIGU 22/01/1988 T A 58650 VANESSA MENEZES DA 26/07/1989 T A 58660 WALLAS SANTOS 12/08/1984 T A 7259 WEVERTON DOS SANTOS 31/03/1989 T A
75
Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS
dd/mm/aa Port Mat Port Mat1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Aplicador_______________________________________
FICHA 7ª SÉRIE - 2002
Nome da Escola:
No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.
FinalFaltas
76
a escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: 7 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até 1793 GIOVALDO FERREIRA Masculino T A Matemática 1945 VALDIVIA DALLA DEZ Feminino t a Português
77
Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva
Gerais_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Professor_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Alunos_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Nome do Aplicador _________________________________
Boletim de Ocorrências - 7ª Série - 2002
78
1.2 – APLICAÇÃO DA FICHA ESCOLAR DO ALUNO E FICHA DO PROFESSOR REFERENTE A 2002
APRESENTAÇÃO
Dando continuidade à pesquisa “Avaliação de Desempenho: Fatores
Associados”, foram aplicadas as Fichas Escolares em todas as escolas da
amostra.
A aplicação da Ficha Escolar tem por objetivo acompanhar o desempenho
escolar do aluno, ano a ano, a fim de agregar essa informação à base de
dados de avaliação, construída a partir das respostas aos instrumentos da
pesquisa.
Entretanto, não houve coleta desses dados para a turma de 7ª série, que
respondeu às provas e questionários em 2002. Somente no início de 2004 é
que foi possível registrar as notas escolares dos alunos dessa etapa da
pesquisa.
Este relatório trata do trabalho de campo realizado para colher as informações
escolares dos alunos que estavam matriculados na 7ª série, em 2002, nas
escolas da amostra, tendo feito ou não as provas e respondido aos
questionários.
A análise do desempenho escolar dos alunos que não fizeram as provas da
pesquisa pode confirmar ou afastar a hipótese de algum viés dos resultados da
pesquisa. Se as médias finais escolares desses alunos faltosos apresentarem
uma discrepância significativa em relação às médias finais dos alunos que
fizeram as provas, pode-se supor um viés, uma indicação de que as médias
obtidas nas provas da pesquisa seriam consideravelmente diferentes, se esses
alunos tivessem comparecido à escola no dia da aplicação. Inversamente, se
as médias escolares dos alunos faltosos não apresentarem uma discrepância
79
significativa em relação às médias escolares dos alunos que fizeram as provas,
pode-se afastar essa hipótese.
EQUIPE RESPONSÁVEL
UF COORDENAÇÃO ESTADUAL SUPERVISÃO ESTADUALRO Lúcia Miranda Sulamita Belarmino dos SantosPA Cândida Tavares Marília Dirce GomesPE Maria Epifânia Valença Maria Veralúcia dos Anjos LopesSE Ana Galvão Luciana Galvão MenezesMS Nelice Pereira Sales Risoleide Maria CavalcanteGO Wânia de M. Bernardes Icléia Maria Pereira Neto
NAC. Lia Rosenberg
A mesma equipe que cuidou da supervisão do campo na aplicação dos testes
objetivos foi responsável por esta coleta. Praticamente a mesma equipe
coordenou todos os levantamentos da pesquisa longitudinal, o que contribuiu
para a padronização dos procedimentos e uma constante evolução na
identificação e revisão de estratégias.
INSTRUMENTOS UTILIZADOS
Para coletar as informações dos alunos que realizaram a 7ª série no ano de
2002, foram utilizados os seguintes instrumentos: Ficha Escolar – Dados do
Aluno, Ficha em Branco – Aluno, Ficha do Professor e o Boletim de Ocorrência.
PROCEDIMENTOS
Como nos anos anteriores, o trabalho de campo dividiu-se em 3 etapas
principais: treinamento das supervisoras, treinamento dos aplicadores e
aplicação dos instrumentos.
80
1. Treinamento das supervisoras
A reunião de treinamento foi conduzida pela coordenadora da pesquisa, que
passou aos presentes as novas informações sobre a abrangência, metodologia
e ainda os materiais necessários ao trabalho de campo.
Uma vez que todas participam da pesquisa há alguns anos – muitas delas,
desde seu início – a ênfase recaiu sobre o novo instrumento, aquele que
acompanha a trajetória escolar dos alunos da base de dados longitudinal –
Ficha Histórico Escolar.
2. Treinamento dos Aplicadores
Coube a essas supervisoras repassar as orientações recebidas em São Paulo
aos aplicadores do estado sob sua responsabilidade, o que é feito com o apoio
da coordenadora estadual, uma técnica ligada à Secretaria da Educação, com
acesso aos diretores das escolas e aos dirigentes dos órgãos centrais.
Como nos anos anteriores, esses treinamentos ocorreram simultaneamente,
nas capitais dos 6 Estados participantes da pesquisa – Goiás, Mato Grosso do
Sul, Pará, Pernambuco, Rondônia e Sergipe.
Em cada um desses encontros, foi realizada uma leitura comentada do Manual
da Aplicação2, seguida da análise detalhada das fichas a serem preenchidas
nas escolas, com destaque para a Ficha Histórico Escolar. Algumas
simulações do preenchimento dessas fichas permitiram antecipar possíveis
problemas e encaminhar as respectivas soluções. Houve mais um momento
para questionamentos e esclarecimentos de dúvidas. Finalmente, os materiais
foram entregues a cada dupla de aplicadores, que ficou responsável por um
determinado conjunto de escolas.
Foi solicitado o maior empenho possível na localização de todos os dados.
Todos os possíveis caminhos para encontrar as informações foram
detalhadamente descritos, bem como os entraves que poderiam vir a surgir.
O treinamento transcorreu sem problemas, com a participação de todos os
aplicadores, muitos dos quais já haviam trabalhado em anos anteriores, o que
facilitou muito o trabalho. 2 ver em anexo o manual utilizado
81
3. Aplicação dos Instrumentos
Uma semana antes do início do campo, todas as escolas foram devidamente
avisadas pela Secretaria de Educação do trabalho que seria realizado e quais
os documentos necessários para preenchimento das Fichas.
Todas as escolas receberam bem os aplicadores e cooperaram no que foi
possível. Mas há muitas diferenças entre elas: desde escolas que, mesmo sem
ter todas as informações, apresentam organização na forma de registro até
aquelas que são carentes de tudo. Muitas escolas já estão com o serviço de
secretaria escolar informatizados e isso facilitou muito o trabalho dos
pesquisadores. Em algumas poucas, não foi possível completar os
instrumentos.
Houve um grande esforço para garantir a identificação e a localização dos
alunos que compõem a base de dados. Os pesquisadores encontraram muitos
obstáculos, pois as escolas, em sua imensa maioria, não dispõem de uma boa
organização de registros históricos.
Algumas dúvidas surgiram, sobretudo na coleta da Ficha Histórico Escolar.
Porém, a presença da Supervisora e da Coordenadora, que em nenhum
momento perderam contato com as duplas de aplicadores, foi suficiente para
sanar as dúvidas existentes.
82
PRINCIPAIS OCORRÊNCIAS
Um trabalho dessa envergadura, que leva os pesquisadores à intimidade
administrativa de cerca de 170 escolas, é marcado por uma ampla gama de
eventos e situações envolvendo os participantes. Em benefício do rigor da
pesquisa, todos esses acontecimentos são registrados pelo aplicador em seu
Boletim de Ocorrência. A título de ilustração, seguem-se as mais
freqüentemente citadas pelas supervisoras em seus relatórios da aplicação.
Quase sempre as escolas demonstram uma certa resistência para
informar a freqüência do professor e não permitem a consulta nos livros
de freqüência dos mesmos. As informações sobre faltas foram
conseguidas através do diretor, do administrador, do serviço técnico ou
da secretaria, em alguns casos de forma verbal. Outros dados sobre
movimentação e substituição foram facilmente obtidos.
Os documentos consultados para o preenchimento dos instrumentos da
pesquisa foram o diário de classe, a ficha individual do aluno, o relatório
final e o mapa de matrícula.
Como sempre, a maioria dos diretores foi receptiva, encaminhando os
pesquisadores às equipes das secretarias. Entretanto, tornou-se muito
difícil a coleta em muitas escolas, no que se refere à Ficha Histórico
Escolar. Alguns arquivos são verdadeiros depósitos das fichas
individuais dos alunos, não só desorganizados, mas também, em
péssimas condições de higiene. Foi necessária a compra de máscaras
para os pesquisadores, a fim de protegê-los contra o mofo existente nos
documentos e ambientes.
83
RESUMO QUANTITATIVO
UF ESCOLAS TURMAS ALUNOS PROFsRO 13 44 1220 103PA 34 93 2958 193PE 38 104 3373 222SE 15 35 1052 71MS 35 75 2315 158GO 35 102 3075 218
TOTAL 170 453 13993 965
7ª SÉRIE/2002
CRONOGRAMA DE ATIVIDADES
abr/04 mai/04Treinamento das supervisoras 29Treinamento dos Aplicadores 3 a 5Início Aplicação 5Final da Aplicação 28
ATIVIDADES DATA
85
Aplicação da Ficha Escolar
Materiais do Aplicador 1. Ficha Escolar − Aluno 2. Ficha em Branco
3. Ficha Escolar − Professor 4. Boletim de Ocorrências 5. Lápis, Borracha e Régua
Ficha Escolar − Aluno Esta ficha traz os nomes dos alunos que fizeram prova em Outubro e Novembro de 2002. Você deve anotar as informações de todos eles, mesmo que estejam em outro turno ou turma da escola.
Ficha em Branco Você vai encontrar alguns alunos matriculados nestas escolas e que não constam da Ficha Escolar − Aluno. Provavelmente, eles faltaram no dia da prova. Precisamos dos dados desses alunos também. Você vai copiá-los na Ficha em Branco. Use letra de forma para podermos inserir o nome do aluno no Banco de Dados. Não basta escrever: é preciso que outra pessoa consiga ler o que você escreveu.
Complete as informações sobre a Escola − Nome e Código − com letra clara e legível.
Informações que serão coletadas Nome do Aluno: quando estiver impresso, verifique se está corretamente grafado. Se não, anote a correção na coluna de Observações. Na Ficha em Branco, escreva cuidadosamente, em letra de forma. Data de Nascimento: no caso dos alunos que constam do nosso Banco de Dados, você só vai conferir se a data está correta. Se não estiver, deixe esta coluna como está e anote a data certa na coluna de Observações (última à direita). Na Ficha em Branco, você vai marcar a data. Média em Língua Portuguesa e Média de Matemática.: anote a média final de cada aluno. Se a escola utilizar uma medida diferente da escala de 0 a 10, registre no seu BOLETIM DE OCORRÊNCIAS a correspondência entre essa medida e a escala de 0 a 10. Exemplo: conceitos A a E, na escala de 0 a 10, A corresponde a 1 e 2, B a 3 e 4 etc. Caso a escola não empregue nenhum sistema de quantificação do resultado do aluno, escreva o que estiver anotado na escola e faça uma observação no BOLETIM DE OCORRÊNCIAS. Resultado Final: Aprovado, Reprovado, Transferido, Evadido. Faltas em Língua Portuguesa e Matemática.: anote o total de faltas do aluno em 2001. Preste redobrada atenção a este registro, pois este dado é muito importante para a pesquisa!
86
OBS: escreva tudo que se refere a este aluno, como correção da grafia do nome, mudança de turma ou turno, erro na data de nascimento, falta de informações nos documentos consultados. Lembre-se que as observações gerais sobre a turma (número de professores durante o ano, suspensão de aulas por problemas diversos etc.) ou sobre a escola devem ser registradas no BOLETIM DE OCORRÊNCIAS. Aqui, coloque apenas observações sobre um determinado aluno.
Ficha Escolar − Professor A ficha traz impressos o nome e código da escola, bem como os nomes dos professores que constam do nosso cadastro. Agora, queremos identificar todas as turmas (e turnos) de cada um. Procure o nome do professor na lista da escola, confira a disciplina que leciona, o turno e as turmas deste turno. Veja o modelo abaixo:
Nome do Professor Disciplina Turno Turmas Renata Alves Português M A;B;C
Renata Alves Português T D
Antônio Araújo Matemática M A;B;C
Wanda Lopes Matemática T D
Se possível, anote quantas aulas este professor perdeu em cada uma de suas turmas. Caso você encontre apenas uma informação geral do total de faltas, registre na coluna OBS. Não deixe de registrar esta informação, ela é preciosa! Precisamos saber também durante quantos meses os alunos destas turmas foram expostos à influência deste professor. Se for possível obter apenas uma data aproximada do início e término da regência dele em cada turma, anote assim mesmo. Não é preciso ser exata, mas procure fornecer alguma idéia de tempo.
Boletim de Ocorrências Código da Escola : Preencha com bastante atenção! Gerais: Anote aqui ocorrências relevantes para a pesquisa, mas que não se referem a um aluno ou professor em particular. Qualquer eventualidade ou sugestão para facilitar o trabalho nas próximas vezes, deve ser registrada neste lugar. Professor: Anote as ocorrências sobre determinado(s) professor(es). Alunos: Anote apenas ocorrências que não constam da Ficha do Aluno. Nome do Aplicador: Não deixe de colocar seu nome em letra legível!
Procedimentos Recomenda-se trabalhar em duplas, um(a) consulta os documentos da escola e dita para a outro(a), que faz o registro nas Fichas correspondentes. É
87
importante escolher a melhor letra para essa atividade. Letras ruins dificultam muito o trabalho dos pesquisadores!
Apresentem-se ao diretor, peçam autorização para consultar os diários de classe ou documento semelhante, relativos às 7as. séries de 2002, em que constem data de nascimento, notas, faltas e resultado final dos alunos. Procurem saber onde vocês podem encontrar o nome completo dos professores de cada uma dessas turmas.
Solicitem na secretaria da escola as atas ou diários de classe das turmas de 7a. série, períodos diurnos, de 2002.
Preencham a FICHA DO ALUNO com letra legível; lembrem de conferir os dados antes de passar para o próximo nome.
Utilize uma régua ou tira de papel colorido para auxiliar na leitura e no registro dos dados, evitando confusões entre as linhas.
Completem a FICHA EM BRANCO. Siga os mesmos procedimentos para preencher a FICHA DO
PROFESSOR.
Anote qualquer eventualidade no BOLETIM DE OCORRÊNCIAS.
Passo a Passo reúna os documentos de uma das turmas, por exemplo, a 7ª série A da
manhã. localize os alunos que constam da FICHA DO ALUNO e copie os dados
de cada um nas respectivas colunas. verifique quais os alunos dessa FICHA cujos dados não foram localizados
na 7ª série A da manhã. Procure localizá-los nas outras 7as. séries. complete as informações com os alunos que não constam da FICHA,
utilizando a FICHA EM BRANCO. complete as informações constantes da FICHA DO PROFESSOR. coloque seu nome em todos os instrumentos e entregue-os à Supervisão.
88
1.3 – ELABORAÇÃO DA FICHA ESCOLAR DO ALUNO E DO PROFESSOR REFERENTE A 2003
APRESENTAÇÃO
Para o ano de 2003, que abrange os alunos que cursaram a 8ª série, foram
elaborados 04 instrumentos para que pudessem ser coletadas as informações
necessárias à formação do banco de dados longitudinal da pesquisa “Avaliação
de Desempenho: Fatores Associados”.
Com o intuito de resgatar informações de parte dos alunos que foram
excluídos, em algum momento da amostra, e que deixaram de ser
acompanhados na pesquisa por algum motivo - repetência, abandono/evasão
ou transferência - ainda para neste ano, foram coletadas também informações
sobre os alunos que estavam na 7ª série, seguindo assim o mesmo critério
adotado na aplicação das provas e questionários em novembro de 2003, ou
seja, conseguir levantar informações dos alunos que, em algum momento
repetiram de ano e se perderam dentro da pesquisa.
Afim de assegurar a comparabilidade entre as informações coletadas a cada
ano para a mesma amostra de escolas, houve ligeiras modificações nos
instrumentos, mais especificamente no lay-out, tanto para a 8ª série, quanto
para a REP7, que já vinham sendo aplicados, e que são os seguintes3:
Ficha Escolar – Dados do Aluno: resultado final, média e faltas em
Português e Matemática;
Ficha em Branco - Aluno: para acrescentar alunos que ainda não
constam da base de dados da pesquisa (missing) ou seja, alunos que
3 Vide cópia dos instrumentos em anexo.
89
não fizeram a prova, mas que pertencem à 7ª série e tiveram resultado
final;
Ficha do Professor: nome e faltas dos professores de português e
matemática e suas respectivas turmas;
Boletim de Ocorrência: formulário para registro de eventos significativos
na coleta.
Além desses instrumentos, foi criada também uma ficha para registrar o
percurso escolar de cada um dos alunos da amostra inicial – e somente
desses, ou seja, a trajetória escolar de todos os alunos que em 1999 – 4ª
série, estavam na pesquisa:
Ficha Histórico Escolar - Aluno: ano de entrada na escola, série
correspondente, resultado final, origem e destino das transferências
de alunos.
Para preenchê-lo, os aplicadores tiveram que buscar, em cada escola, os
alunos listados no instrumento, coletar sua situação/resultado final e registrar,
no caso dos transferidos e dos recebidos por transferência, a origem, a série e
o ano em que se deu a mudança de escola.
CRONOGRAMA DE ATIVIDADES
DATA ATIVIDADES mar/04 abr/04
Estudos de lay-out e alterações nas Fichas Escolares e Histórico Escolar 01 a 31 Elaboração de máscara para impressão dos instrumentos 29 a 31 1 a 12 Recebimento da Base de Dados - 8ª série e REP7/2003 19 Impressão das Fichas Escolares e Ficha Histórico Escolar 19 a 26 Envio das Fichas Escolares aos coordenadores de campo 26
91
Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: 8 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 7261 ADEMILSON VIEIRA DA 07/04/1985 T A 202419 ANDREZA FERNANDA DA 14/06/1987 T A 331721 ANTONIO CESAR S DO 09/12/1986 T A 202421 DADIANE FONSECA DA 18/02/1988 T A 331731 DANIEL GOES DE JESUS 18/12/1983 T A 58644 EDJAN DA SILVA OLIVEIRA 25/10/1990 T A 202423 EDUARDO MIRANDA DE 03/02/1986 T A 501365 EDVALDA DOS SANTOS 09/04/1984 T A 501366 GEANE DOS SANTOS 03/10/1988 T A 331733 GRACIELE DOS SANTOS 15/07/1983 T A 501367 IRAN GOMES DO BOMFIM 16/11/1988 T A 7245 JOEDNA DA SILVA OLIVEIRA 10/12/1988 T A 7246 KARINA DOS SANTOS LIMA 25/03/1987 T A 331736 MARIA RITA DOS SANTOS 22/05/1984 T A 202428 RAFAELA NASCIMENTO 02/05/1988 T A 202430 ROSECLAN SANTOS 03/01/1987 T A 501368 SHEYLA STEFANIA SANTOS 06/09/1976 T A 202432 SILVANI SILVA GOES 23/09/1984 T A 7254 SIMONE DOS SANTOS 16/07/1988 T A 331738 SIMONE SANTOS COSTA 12/05/1985 T A 202433 SUELI DE JESUS SANTOS 12/07/1984 T A 58650 VANESSA MENEZES DA 26/07/1989 T A 58660 WALLAS SANTOS 12/08/1984 T A 7259 WEVERTON DOS SANTOS 31/03/1989 T A
92
Código da escola: 28018605 Nome da escola: E.P.G. Alencar Cardoso Série: Rep 7 Identific Nome do aluno Data Turno Turma Média Final Result Faltas Obs nasc Port Mat Final Port Mat 70010928 ADRIANO SANTOS DE JESU 05/12/1988 T A 70010929 AMANDA MIRIAM RODRIGU 15/01/1990 T A 70010930 ERONIDES FERREIRA MACE 02/11/1983 T A 70010931 FELIPE AMANCIO DOS SAN 09/02/1988 T A 70010932 GRASILENE SANTOS SILVA 18/04/1989 T A 70010933 GRAZIELLA SANTOS SILVA 28/09/1987 T A 70010934 IRIS GOMES DOS SANTOS 19/07/1987 T A 70010966 ISRAEL SANTOS FABIANO 17/09/1989 T A 70010967 JUVINO PERREIRA DA SILV 27/10/1988 T A 70010935 LEILA THIARA ALVES SANT 03/02/1989 T A 70010936 LEONCIO DOS SANTOS 01/04/1987 T A 70010937 MARTA DOS SANTOS 08/01/1989 T A 70010938 NADJA BOMFIM SATANA 02/10/1984 T A 70010939 PRISCILA REGINA GOIS SA 10/05/1989 T A 70010940 TIAGO DE JESUS RODRIGU 22/01/1988
93
Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS
dd/mm/aa Port Mat Port Mat1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Aplicador_______________________________________
FICHA 8ª SÉRIE - 2003
Nome da Escola:
No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.
FinalFaltas
94
Cód. 11002522 E.P.S.G. Prof. Eduardo Lima e SilvaNasc. OBS
dd/mm/aa Port Mat Port Mat1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Aplicador_______________________________________
FICHA REP7 - 2003
Nome da Escola:
No. Nome do Aluno (letra de forma legível) Turno TurmaMédia Final Result.
FinalFaltas
95
Código da escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: 8 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até P0318 GLERVIANI ARAUJO DE SOUS Feminino T A Português
96
Código da escola: 28018699 Nome da escola: E.P.G. Jornalista Orlando Dantas Série: REP7 Identific Nome do professor Sexo Turno Turma Disciplina Faltas Prof desta Observação turma Desde Até P0459 GIOVALDO FERREIRA Masculino T A Matemática
97
Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva
Gerais_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Professor_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Alunos_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Nome do Aplicador _________________________________
Boletim de Ocorrências - 8ª Série - 2003
98
Código da Escola: 11000473Nome da Escola: E.P.G. Antônio Ferreira da Silva
Gerais_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Professor_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Alunos_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
_______________________________________________________________________________
Nome do Aplicador _________________________________
Boletim de Ocorrências - REP7 - 2003
99
ID E NOME DA ESCOLAID E NOME DO ALUNOTURMA E TURNO
Entrou nesta escola ANO 1 ANO 2 ANO 3 ANO 4 ANO 5 ANO 6 ANO 7 ANO 8 ANO 9 ANO 10 ANO 11 ANO 12
AnoSérieRESULTADO FINALA = AprovadoR = ReprovadoE = EvadidoT = Transferido (preencher o campo "para qual escola?")AT = Aprovado e Transferido (preencher o campo "para qual escola?")
RT = Reprovado e Transferido (preencher o campo "para qual escola?")
ET = Evadiu (abandonou) e depois pediu transferência (preencher o campo "para qual escola?")
- Para qual escola?
- Retornou de qual escola? (caso o aluno tenha retornado a esta escola, registrar o ano de retorno e nome da escola de onde veio)
OBSERVAÇÕES:
FICHA HISTÓRICO ESCOLAR - ALUNO - PRODUTO BCOORTE 4ª SÉRIE/NOV-1999
100
1.4 – APLICAÇÃO DA FICHA ESCOLAR DO ALUNO E FICHA DO PROFESSOR REFERENTE A 2003
APRESENTAÇÃO
Dando continuidade à pesquisa “Avaliação de Desempenho: Fatores
Associados”, foram aplicadas as Fichas Escolares em todas as escolas da
amostra.
A aplicação da Ficha Escolar tem por objetivo acompanhar o desempenho
escolar do aluno, ano a ano, a fim de agregar essa informação à base de
dados de avaliação, construída a partir das respostas aos instrumentos da
pesquisa.
A análise do desempenho escolar dos alunos que não fizeram as provas da
pesquisa pode confirmar ou afastar a hipótese de algum viés dos resultados da
pesquisa. Se as médias finais escolares desses alunos faltosos apresentarem
uma discrepância significativa em relação às médias finais dos alunos que
fizeram as provas, pode-se supor um viés, uma indicação de que as médias
obtidas nas provas da pesquisa seriam consideravelmente diferentes, se esses
alunos tivessem comparecido à escola no dia da aplicação. Inversamente, se
as médias escolares dos alunos faltosos não apresentarem uma discrepância
significativa em relação às médias escolares dos alunos que fizeram as provas,
pode-se afastar essa hipótese.
Neste ano, a pedido do INEP, além da coleta das informações sobre os alunos
das 8ªs. séries, como definia o desenho inicial da pesquisa, foram levantadas
também informações sobre os alunos na 7ª série, onde se poderiam encontrar
muitos dos alunos que haviam respondido à pesquisa em séries anteriores
(desde a 4ª, em 1999) e depois deixado de responder por haver repetido uma
das séries seguintes.
101
Se um aluno que estivesse na 4ª.série, em 1999, respondesse à pesquisa, e
repetisse de ano, nunca mais apareceria no banco de dados. Com esta coleta
adicional, havia uma possibilidade de reencontrar alguns repetentes, de
qualquer série, desde que tivessem tido somente uma repetência.
Este relatório trata do trabalho de campo realizado para colher as informações
escolares dos alunos que estavam matriculados na 7ª e na 8ª séries em 2003,
nas escolas da amostra, e que tivessem ou não feito as provas e respondido
aos questionários da pesquisa.
Para evitar confusão com os alunos que estavam na 7ª série em 2002, as
fichas dos alunos matriculados na 7ª série em 2003 foram marcadas com o
código REP7.
EQUIPE RESPONSÁVEL
UF COORDENAÇÃO ESTADUAL SUPERVISÃO ESTADUALRO Lúcia Miranda Sulamita Belarmino dos SantosPA Cândida Tavares Marília Dirce GomesPE Maria Epifânia Valença Maria Veralúcia dos Anjos LopesSE Ana Galvão Luciana Galvão MenezesMS Nelice Pereira Sales Risoleide Maria CavalcanteGO Wânia de M. Bernardes Icléia Maria Pereira Neto
NAC. Lia Rosenberg
A mesma equipe que cuidou da supervisão do campo na aplicação dos testes
objetivos foi responsável por esta coleta. Praticamente a mesma equipe
coordenou todos os levantamentos da pesquisa longitudinal, o que contribuiu
para a padronização dos procedimentos e uma constante evolução na
identificação e revisão de estratégias.
102
INSTRUMENTOS UTILIZADOS
Para coletar as informações dos alunos que realizaram a 8ª série no ano de
2003 e também dos alunos que estavam na 7ª série em 2003, que chamamos
de REP7, foram utilizados os seguintes instrumentos: Ficha Escolar – Dados
do Aluno, Ficha em Branco – Aluno, Ficha do Professor e o Boletim de
Ocorrência.
Além das fichas escolares para a 8ª série e a REP7 em 2003, foram coletadas
as fichas Histórico Escolar para todos os alunos que em 1999 estavam
cursando a 4ª série – ano inicial da pesquisa.
PROCEDIMENTOS
Como nos anos anteriores, o trabalho de campo dividiu-se em 3 etapas
principais: treinamento das supervisoras, treinamento dos aplicadores e
aplicação dos instrumentos.
1. Treinamento das Supervisoras
A reunião de treinamento foi conduzida pela coordenadora da pesquisa, que
passou aos presentes as novas informações sobre a abrangência, metodologia
e ainda os materiais necessários ao trabalho de campo.
Uma vez que todas participam da pesquisa há alguns anos – muitas delas,
desde seu início – a ênfase recaiu sobre o novo instrumento, aquele que
acompanha a trajetória escolar dos alunos da base de dados longitudinal.
2. Treinamento dos Aplicadores
Coube a essas supervisoras repassar as orientações recebidas em São Paulo
aos aplicadores do estado sob sua responsabilidade, o que é feito com o apoio
103
da coordenadora estadual, uma técnica ligada à Secretaria da Educação, com
acesso aos diretores das escolas e aos dirigentes dos órgãos centrais.
Como nos anos anteriores, esses treinamentos ocorreram simultaneamente
nas capitais dos 6 estados participantes da pesquisa – Goiás, Mato Grosso do
Sul, Pará, Pernambuco, Rondônia e Sergipe.
Em cada um desses encontros, foi realizada uma leitura comentada do Manual
da Aplicação4, seguida da análise detalhada das fichas a serem preenchidas
nas escolas, com destaque para a Ficha Histórico Escolar. Algumas
simulações do preenchimento dessas fichas permitiram antecipar possíveis
problemas e encaminhar as respectivas soluções. Houve mais um momento
para questionamentos e esclarecimentos de dúvidas. Finalmente, os materiais
foram entregues a cada dupla de aplicadores, que ficou responsável por um
determinado conjunto de escolas.
Foi solicitado o maior empenho possível na localização de todos os dados.
Todos os possíveis caminhos para encontrar as informações foram
detalhadamente descritos, bem como os entraves que poderiam vir a surgir.
O treinamento transcorreu sem problemas, com a participação de todos os
aplicadores, muitos dos quais já haviam trabalhado em anos anteriores, o que
facilitou muito o trabalho.
3. Aplicação dos Instrumentos
Uma semana antes do início do campo, todas as escolas foram devidamente
avisadas pela Secretaria de Educação do trabalho que seria realizado e quais
os documentos necessários para preenchimento das Fichas.
Todas as escolas receberam bem os aplicadores e cooperaram no que foi
possível. Mas há muitas diferenças entre elas: desde escolas que, mesmo sem
ter todas as informações, apresentam organização na forma de registro até
aquelas que são carentes de tudo. Muitas escolas já estão com o serviço de
Secretaria escolar informatizados e isso facilitou muito o trabalho dos
4 ver em anexo o manual utilizado
104
pesquisadores. Em algumas poucas, não foi possível completar os
instrumentos.
Houve um grande esforço para garantir a identificação e a localização dos
alunos que compõem a base de dados. Os pesquisadores encontraram muitos
obstáculos, pois as escolas, em sua imensa maioria, não dispõem de uma boa
organização de registros históricos.
Algumas dúvidas surgiram, sobretudo na coleta da Trajetória Escolar. Porém, a
presença da Supervisora e da Coordenadora, que em nenhum momento
perderam contato com as duplas de aplicadores, foi suficiente para sanar as
dúvidas existentes.
PRINCIPAIS OCORRÊNCIAS
Um trabalho dessa envergadura, que leva os pesquisadores à intimidade
administrativa de cerca de 170 escolas, é marcado por uma ampla gama de
eventos e situações envolvendo os participantes. Em benefício do rigor da
pesquisa, todos esses acontecimentos são registrados pelo aplicador em seu
Boletim de Ocorrência. As mais freqüentes dizem respeito à receptividade e
organização das escolas, dois fatores fundamentais para o desenvolvimento da
pesquisa e que apresentam grande variabilidade.
105
RESUMO QUANTITATIVO
UF ESCOLAS TURMAS ALUNOS PROFsRO 13 37 989 76PA 34 78 2506 176PE 38 91 2799 188SE 14 31 988 38MS 35 74 2023 136GO 33 81 2648 163
TOTAL 167 392 11953 777
8ª SÉRIE/2003
UF ESCOLAS TURMAS ALUNOS PROFsRO 13 44 1108 91PA 34 100 3021 210PE 38 94 3088 188SE 14 32 925 48MS 35 84 2389 163GO 34 104 3197 204
TOTAL 168 458 13728 904
REP7/2003
UF ESCOLAS TURMAS ALUNOSRO 14 47 1111PA 31 88 2444PE 34 95 2446SE 16 43 984MS 35 80 2023GO 32 75 1912
TOTAL 162 428 10920
FICHA HISTÓRICO ESCOLAR
106
CRONOGRAMA DE ATIVIDADES
abr/04 mai/04Treinamento das supervisoras 29Treinamento dos Aplicadores 3 a 5Início Aplicação 5Final da Aplicação 28
ATIVIDADES DATA
108
Aplicação da Ficha Escolar – 7ª e 8ª Série
Materiais do Aplicador 6. Ficha Escolar − Aluno 7. Ficha em Branco
8. Ficha Escolar − Professor 9. Boletim de Ocorrências 10. Lápis, Borracha e Régua
Ficha Escolar − Aluno Esta ficha traz os nomes dos alunos que fizeram prova em Novembro de 2003. Você deve anotar as informações (média final em Língua Portuguesa e Matemática, quantidade de faltas etc.) de todos eles, mesmo que estejam em outro turno ou turma da escola.
Ficha em Branco Você vai encontrar alguns alunos matriculados nestas escolas e que não constam da Ficha Escolar − Aluno. Provavelmente, eles faltaram no dia da prova. Precisamos dos dados desses alunos também. Você vai copiá-los na Ficha em Branco. Use letra de forma para podermos inserir o nome do aluno no Banco de Dados. Não basta escrever: é preciso que outra pessoa consiga ler o que você escreveu para o processamento dos dados.
Preencha as informações sobre a Escola − Nome e Código − com letra clara e legível.
Informações que serão coletadas Nome do Aluno: quando estiver impresso, verifique se está corretamente grafado. Se não, anote a correção na coluna de Observações. Na Ficha em Branco, escreva cuidadosamente, em letra de forma. Data de Nascimento: no caso dos alunos que constam em nosso Banco de Dados, você só vai conferir se a data está correta. Se não estiver, deixe esta coluna como está e anote a data certa na coluna de Observações (última à direita). Na Ficha em Branco, você vai marcar a data, usando dois dígitos para cada registro: dia, mês, ano (ex: 07/03/1984). Média em Língua Portuguesa e Média de Matemática.: anote a média final de cada aluno. Se a escola utilizar uma medida diferente da escala de 0 a 10, registre no seu BOLETIM DE OCORRÊNCIAS a correspondência entre essa medida e a escala de 0 a 10. Exemplo: conceitos A a E, na escala de 0 a 10, A corresponde a 1 e 2, B a 3 e 4 etc. Caso a escola não empregue nenhum sistema de quantificação do resultado do aluno, escreva o que estiver anotado na escola e faça uma observação no BOLETIM DE OCORRÊNCIAS.
109
Resultado Final: Aprovado, Reprovado, Transferido, Evadido. Faltas em Língua Portuguesa e Matemática.: anote o total de faltas do aluno em 2001. Preste redobrada atenção a este registro, pois este dado é muito importante para a pesquisa! OBS: escreva tudo que se refere a este aluno, como correção da grafia do nome, mudança de turma ou turno, erro na data de nascimento, falta de informações nos documentos consultados. Lembre-se que as observações gerais sobre a turma (número de professores durante o ano, suspensão de aulas por problemas diversos etc.) ou sobre a escola devem ser registradas no BOLETIM DE OCORRÊNCIAS. Aqui, coloque apenas observações sobre um determinado aluno.
Ficha Escolar − Professor A ficha traz impressos o nome e código da escola, bem como os nomes dos professores que constam do nosso cadastro. Agora, queremos identificar todas as turmas (e turnos) de cada um. Procure o nome do professor na lista da escola, confira a disciplina que leciona, o turno e as turmas deste turno. Veja o modelo abaixo:
Nome do Professor Disciplina Turno Turmas Renata Alves Português M A;B;C
Renata Alves Português T D
Antônio Araújo Matemática M A;B;C
Wanda Lopes Matemática T D
Se possível, anote quantas aulas este professor perdeu em cada uma de suas turmas. Caso você encontre apenas uma informação geral do total de faltas, registre na coluna OBS. Não deixe de registrar esta informação, ela é preciosa! Precisamos saber também durante quantos meses os alunos destas turmas foram expostos à influência deste professor. Se for possível obter apenas uma data aproximada do início e término da regência dele em cada turma, anote assim mesmo. Não é preciso ser exata, mas procure fornecer alguma idéia de tempo.
Boletim de Ocorrências Código da Escola : Preencha com bastante atenção! Gerais: Anote aqui ocorrências relevantes para a pesquisa, mas que não se referem a um aluno ou professor em particular. Qualquer eventualidade ou sugestão para facilitar o trabalho nas próximas vezes, deve ser registrada neste lugar. Professor: Anote as ocorrências sobre determinado(s) professor(es). Alunos: Anote apenas ocorrências que não constam da Ficha do Aluno. Nome do Aplicador: Não deixe de colocar seu nome em letra legível!
110
Procedimentos Recomenda-se trabalhar em duplas, um(a) consulta os documentos da escola e dita para a outro(a), que faz o registro nas Fichas correspondentes. É importante escolher a melhor letra para essa atividade. Letras ruins dificultam muito o trabalho dos pesquisadores!
Apresentem-se ao diretor, peçam autorização para consultar os diários de classe ou documento semelhante, relativos às 7as. séries de 2002, em que constem data de nascimento, notas, faltas e resultado final dos alunos. Procurem saber onde vocês podem encontrar o nome completo dos professores de cada uma dessas turmas.
Solicitem na secretaria da escola as atas ou diários de classe das turmas de 7a. série, períodos diurnos, de 2002.
Preencham a FICHA DO ALUNO com letra legível; lembrem de conferir os dados antes de passar para o próximo nome.
Utilize uma régua ou tira de papel colorido para auxiliar na leitura e no registro dos dados, evitando confusões entre as linhas.
Completem a FICHA EM BRANCO. Siga os mesmos procedimentos para preencher a FICHA DO
PROFESSOR.
Anote qualquer eventualidade no BOLETIM DE OCORRÊNCIAS.
Passo a Passo reúna os documentos de uma das turmas, por exemplo, a 7ª série A da manhã. localize os alunos que constam da FICHA DO ALUNO e copie os dados de
cada um nas respectivas colunas. verifique quais os alunos dessa FICHA cujos dados não foram localizados na 7ª
série A da manhã. Procure localizá-los nas outras 7as. séries. complete as informações com os alunos que não constam da FICHA, utilizando
a FICHA EM BRANCO. complete as informações constantes da FICHA DO PROFESSOR. coloque seu nome em todos os instrumentos e entregue-os à Supervisão.
111
1.5 – PROCESSAMENTO E GERAÇÃO DO BANCO DE DADOS 8ª SÉRIE (2003) E 7ª SÉRIE (2003)
APRESENTAÇÃO
O banco de dados, em 2004, foi alimentado em dois momentos:
1) Provas e questionários dos alunos que em 2003 estavam na 8ª série e na 7ª
série – esta última nomeada como REP7 para diferenciar da 7ª série da base
longitudinal referente ao ano de 2002, e questionários de professores e
diretores e roteiro escola para as duas séries.
2) Fichas escolares dos alunos da 7ª série/2002, 8ª série/2003 e REP7/2003 e
ficha professor para as três séries.
No primeiro momento, os trabalhos de entrada de dados e digitalização dos
instrumentos de coleta – provas e questionários – foram realizados pela
empresa INTERCONECT DO BRASIL LTDA.
Com relação à entrada de dados das fichas escolares, o trabalho foi realizado
pelo CEDEPLAR/FACE/UFMG.
O processo de gerenciamento – análises de consistências e integração dos
dados – do banco de dados, referente aos dois momentos foi feito pela
empresa CAFÉ SOFTWARE S/C LTDA.
Com o intuito de resgatar informações dos alunos que se perderam durante a
pesquisa, ou seja, dos alunos que foram excluídos da pesquisa por algum
motivo, como, por exemplo, repetência, abandono/evasão, mudança para outra
escola que não pertencia à amostra ou por outro motivo qualquer, foi criada a
Ficha Histórico Escolar que permitiu assim recuperar a trajetória escolar dos
alunos que em 1999 estavam na 4ª série, e que fizeram parte da amostra inicial
da pesquisa, e a sua situação escolar até 2003. Essas informações formaram
um banco de dados à parte e que possibilitará, com o cruzamento do banco de
dados longitudinal, analisar a trajetória escolar desses alunos e analisar
também o seu desempenho escolar.
112
PROCESSAMENTO DE DADOS DOS INSTRUMENTOS PROVAS E QUESTIONÁRIOS DA 8ª SÉRIE/2003
E DA 7ª SÉRIE/2003
APRESENTAÇÃO
Para o processamento das informações contidas nos instrumentos de coleta –
provas e questionários – as atividades foram realizadas em seis processos:
1) Processo de recepção e conferência do material;
2) Desenvolvimento de programa para entrada dos dados;
3) Processo de digitação do material;
4) Processo de digitalização do material;
5) Processo de análise dos dados digitados contra os dados digitalizados;
6) Processo de correção.
O processo de recepção e conferência do material consistiu em receber a
totalidade do material que chegou da crítica visual, efetuando a checagem das
informações contidas nas caixas com o seu conteúdo. Na incompatibilidade de
informações, o material com problema era encaminhado para uma solução
imediata.
O desenvolvimento do programa para a entrada dos dados consistiu na
elaboração de um programa específico para este processo, onde foram
respeitados todos os parâmetros estabelecidos, e sempre com a missão de
traduzir para a base de dados, com fidelidade, as informações colocadas no
papel. O programa desenvolvido possibilitou a dupla digitação dos dados,
aumentando assim o grau de confiabilidade destes.
113
O processo de digitação do material consistiu na distribuição dos originais aos
digitadores que, utilizando o programa desenvolvido, fizeram a extração dos
dados. Com o controle do programa, era vedado ao digitador efetuar as duas
digitações de um mesmo instrumento, garantindo que se um digitador tivesse
uma interpretação errada de um dado, o erro não se repetia com um segundo
digitador.
O processo de digitalização do material consistiu no processamento dos
instrumentos em papel para um meio digital. Este processo ocorreu em
paralelo com a digitação, sendo feito ao término da mesma. Para este processo
foram utilizados equipamentos de última geração com capacidade de
digitalização dos documentos em ambos os lados da folha com uma única
passagem, garantindo a organização do material.
O processo de análise dos dados digitados com os dados digitalizados
consistiu na confrontação da base de dados obtidos da digitação, com os
dados obtidos da digitalização, localizando qualquer inconsistência, e gerando
relatórios para que se efetuassem as correções necessárias.
O processo de correção consistiu no retorno aos originais para sanar qualquer
dúvida ou inconsistência localizada no processo anterior, para ao final poder
gerar uma base de dados, a que chamamos de base de dados final, e
enviarmos para a empresa Café Software – responsável pelo gerenciamento
do banco de dados – para assim, efetuar o trabalho de processamento dos
resultados.
114
PROCESSAMENTO DE DADOS DAS FICHAS ESCOLARES DA 7ª SÉRIE/2002, 8ª SÉRIE/2003 E A 7ª
SÉRIE/2003 – REP7
APRESENTAÇÃO
O processamento das informações contidas nas fichas escolares da 7ª
série/2002, 8ª série/2003 e 7ª série/2003 – REP7 compreendeu as seguintes
etapas:
Elaboração de máscara para entrada de dados;
Teste da máscara para entrada de dados;
Acertos na máscara para procedimento de entrada de dados;
Recebimento e conferência do material – fichas escolares – enviadas
pelo campo;
Separação de todo o material por instrumentos Fichas Escolares
/Série/Estado/Escola;
Digitação dos dados coletados;
Checagem dos serviços de digitação;
Conclusão e formação do banco de dados das Fichas Escolares.
A partir do banco de dados da 7ª série e do banco de dados da 8ª série,
enviados pela INTERCONECT DO BRASIL LTDA., efetuamos uma máscara
para definir as informações que seriam processadas.
Após definirmos o desenho final da máscara, iniciamos os testes necessários
para comprovação da eficiência da máscara no processamento das
informações. Os erros apresentados foram acertados e o desenho final da
máscara foi definido. Afim de minimizar os erros na digitação e facilitar todo o
115
processo de digitação, o desenho da máscara foi definido como sendo o mais
próximo possível dos instrumentos de coletas
À medida que as fichas escolares foram retornando do campo, todo o material
era conferido e separado por ano/série, por estado e, finalmente, por escola.
Os problemas verificados nesta conferência visual eram reportados ao campo
para a sua imediata solução.
Após todo recebimento do material e sua respectiva conferência e separação,
iniciaram os trabalhos de entrada de dados.
Após a entrada de dados, foi feita uma checagem dos dados no intuito de
solucionar os possíveis erros.
Checagem efetuada e problemas sanados, o banco assim constituído foi
enviado para a CAFÉ SOFTWARE S/C LTDA., para que fosse feito o trabalho
de análise de consistência e a sua integração ao banco de dados longitudinal.
CRONOGRAMA DE ATIVIDADES
mai/04 jun/04 jul/04 ago/04 set/04 out/04Elaboração de máscara para entrada de dados
05 a 16Teste da máscara para entrada de dados
19 a 30Acertos nas máscaras para procedimento de entrada de dados 02 a 13Recebimento e conferência do material – fichas escolares – enviadas pelo campo 02 a 13Separação de todo o material por instrumentos Fichas Escolares /Série/Estado/Escola 16 a 30Digitação dos dados coletados 01 a 31 01 a 29Checagem e acertos dos serviços de digitação 11 a 29 15 a 30Conclusão e formação do banco de dados das Fichas Escolares 3Remessa do banco de dados para análise de consistência 6
ATIVIDADESDATA
116
GERENCIAMENTO DO BANCO DE DADOS DA
8ª SÉRIE – 2003
APRESENTAÇÃO
A Café Software foi responsável pelo gerenciamento do banco de dados da 8a
série. Este trabalho foi realizado de março a novembro de 2004 e consistiu na
preparação de dados para a utilização geral e também para o objetivo
específico de análise estatística de microdados no projeto pesquisa Avaliação
de Desempenho: Fatores Associados. O gerenciamento do banco de dados é
composto por carga, consistência, adequação, filtragem, integração e
tratamento dos dados “brutos”, provenientes da digitação dos instrumentos
coletados, respeitando a integridade referencial da base já existente. O
resultado do trabalho é a base de dados (formato Microsoft Access) com os
dados de todos os anos integrados, consistentes e documentados.
GERAÇÃO DO BANCO DE DADOS DA 8ª SÉRIE
A Geração do Banco de dados da 8a série consistiu na preparação de dados
através de procedimentos técnicos executados por Queries SQL. Nestes
procedimentos, os dados recebidos, provenientes da digitação e digitalização
dos instrumentos aplicados no campo, foram inseridos criteriosamente no
modelo E-R (Entidade Relacionamento) adotado para a pesquisa e
posteriormente integrados à base de dados dos anos anteriores. Assim, após
todo o check de consistências e integração, a base de dados estava pronta
para a utilização geral e também para o objetivo específico de análise
estatística de microdados no projeto pesquisa e demais análises.
117
Escopo das Tarefas
• Cadastro de alunos(CAD_ALUNO)
o Origem: Prova e Questionário do Aluno
o Procedimentos
Seleção e formatação da data de nascimento
Verificação da informação do sexo
Check alunos duplicados/homônimos
Consistências com as tabelas relacionadas*
Geração de relatório de inconsistência (caso necessário)
Carga de Dados no modelo ER
* Mais informações no item “Consistências”
• Cadastro de Professores (CAD_PROFESSOR)
o Origem: Questionário e Cadastro Professor
o Procedimentos:
Adequação à estrutura da base de dados
Check professores duplicados/homônimos
Geração de relatório de inconsistências (caso necessário)
Consistência com as tabelas relacionadas*
Carga dos dados de escola, turno, turma, disciplina e série
• Questionário do Professor(QUEST_PROFESSOR)
o Origem: Questionários dos professores
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
118
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Prova do Alunos (PROVA_ALUNO)
o Origem: Provas dos Alunos
o Procedimentos:
Estabelecimento a integridade referencial entre cadastro
de aluno, provas de Português e Matemática, questionário
e ficha do aluno
Geração de escores (acertos, erros, nulos e brancos),
segundo o gabarito da 8a série e obedecendo a estrutura
existente
Check de duplicidade
Check de turmas pequenas
Consistência entre alunos e professores, observando que o
aluno será confrontado com o professor, ou seja, existindo
alunos(turmas), seus professores devem existir
Geração de relatório de inconsistências
Carga de Dados
• Questionário do Aluno(QUEST_ALUNO)
o Origem: Questionários dos Alunos
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
119
• Questionário do Diretor(QUEST_DIRETOR)
o Origem: Questionários dos Diretores
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Questionário do Roteiro Escola (QUEST_ROTEIRO_ESCOLA)
o Origem: Questionários das Escolas
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Professor Função Docente(PROF_FUNCAO_DOC)
o Origem: PROVA_ALUNO e CAD_PROFESSOR
o Procedimentos:
Estabelecimento da integridade referencial entre as
entidades
Consistência entre alunos e professores, observando que o
aluno será confrontado com o professor, ou seja, existindo
alunos (turmas) seus professores devem existir
Geração de relatório de inconsistências (caso necessário)
120
Carga de Dados, seguindo os procedimentos acima,
através da Prova_Aluno
• Aluno Professor Função Docente (PROF_FUNC_DOC_ALU)
o Origem: PROVA_ALUNO e PROF_FUNCAO_DOC
o Gerar entidade relacional entre PROVA_ALUNO e
PROF_FUNCAO_DOC, respeitando as regras de integridade
referencial
Não pode haver inconsistências
o Carga de dados
• Integração
o Integração do Banco de Dados da 8a série com o banco de dados
dos anos anteriores, respeitando todas as regras de integridade
referencial existentes e o modelo E-R.
• Documentação
o Documentação completa do banco de dados resultante,
juntamente com a notificação de todas as alterações realizadas.
Criação do dicionário de dados, contendo descrições de todos os
campos de cada uma das tabelas integrantes, domínios de
validade, especificação de relacionamentos e diagramas.
CONSISTÊNCIAS
A fim de possibilitar melhor entendimento sobre as consistências,
descreveremos abaixo as principais consistências realizadas e ao que elas
dizem respeito (a qual pergunta devem responder).
121
CAD_ESCOLA CAD_GERAL_ALUNO
Pergunta: Existe escola sem aluno?
CAD_ESCOLA PROF_FUNCAO_DOC
Pergunta: Existe escola sem professor?
QUEST_DIRETOR CAD_ESCOLA
Pergunta: Existe Questionário Diretor sem escola?
CAD_ESCOLA QUEST_DIRETOR
Pergunta: Existem escolas sem Questionário Diretor?
QUEST_ROTEIRO_ESCOLA CAD_ESCOLA
Pergunta: Existe Questionário Roteiro Escola sem escola?
CAD_ESCOLA QUEST_ROTEIRO_ESCOLA
Pergunta: Existem escolas sem Questionário Roteiro Escola?
PROF_FUNCAO_DOC CAD_ESCOLA
Pergunta: Existem professores sem escola?
QUEST_PROFESSOR CAD_GERAL_PROFESSOR
Pergunta: Existe Questionário Professor sem professor?
122
CAD_GERAL_PROFESSOR QUEST_PROFESSOR
Pergunta: Existem professores com mais de um Questionário Professor na mesma data e mesma escola?
PROVA_PROFESSOR CAD_GERAL_PROFESSOR
Pergunta: Existe Prova Professor sem professor?
CAD_GERAL_PROFESSOR PROVA_PROFESSOR
Pergunta: Existem professores com mais de uma Prova Professor na mesma disciplina e mesma data?
QUEST_ALUNO CAD_GERAL_ALUNO
Pergunta: Existe Questionário Aluno sem aluno?
CAD_GERAL_ALUNO QUEST_ALUNO
Pergunta: Existe aluno com mais de um questionário na mesma data?
CAD_GERAL_ALUNO CAD_ESCOLA
Pergunta: Existem alunos sem escola?
PROVA_ALUNO CAD_GERAL_ALUNO
Pergunta: Existe prova aluno sem aluno?
CAD_GERAL_ALUNO PROVA_ALUNO
Pergunta: Existe aluno com mais de uma prova na mesma disciplina e mesma data?
123
PROF_FUNCAO_DOC PROVA_ALUNO
Pergunta: Existe professor sem aluno?
CAD_ESCOLA QUEST_ALUNO
Pergunta: Existem escolas sem Questionário Aluno?
CAD_ESCOLA QUEST_PROFESSOR
Pergunta: Existem escolas sem Questionário Professor?
Estas consistências são essenciais para o produto final, sendo feitas durante
todo o processo. Quando algum dado estava incorreto ou ausente, a Cafe
Software recorreu ao responsável (CEDEPLAR) para a coleta ou confirmação
das informações. Exemplos de problemas encontrados através das
consistências:
Turmas sem professores
Professores sem turma
Provas e questionários sem aluno (sem dono)
Aluno sem escola
Escola sem aluno
Alunos duplicados
Provas duplicadas
124
GERENCIAMENTO DO BANCO DE DADOS DA
7ª SÉRIE – 2003 – REP7
APRESENTAÇÃO
A Café Software foi responsável pelo gerenciamento do banco de dados da 7a
série/2003 – REP7. Este trabalho foi realizado de abril a novembro de 2004 e
consistiu na preparação de dados para a utilização geral e também para o
objetivo específico de análise estatística de microdados no projeto pesquisa
Avaliação de Desempenho: Fatores Associados. O gerenciamento do banco de
dados é composto por carga, consistência, adequação, filtragem, integração e
tratamento dos dados “brutos”, provenientes da digitação dos instrumentos
coletados, respeitando a integridade referencial da base já existente. O
resultado do trabalho é a base de dados (formato Microsoft Access) com os
dados de todos os anos integrados, consistentes e documentados.
GERAÇÃO DO BANCO DE DADOS DA 7ª SÉRIE (REPETENTES)
A Geração do Banco de dados da 7a série/2003 – REP7 consistiu na
preparação de dados através de procedimentos técnicos executados por
Queries SQL. Nestes procedimentos, os dados recebidos, provenientes da
digitação e digitalização dos instrumentos aplicados no campo, foram inseridos
criteriosamente no modelo E-R (Entidade Relacionamento) adotado para a
Pesquisa e posteriormente integrados à base de dados dos anos anteriores.
Assim, após todo o check de consistências, a base de dados estava pronta
para a utilização geral e também para o objetivo específico de análise
estatística de microdados no projeto pesquisa e demais análises.
125
Escopo das Tarefas
• Cadastro de alunos(CAD_ALUNO)
o Origem: Prova e Questionário do Aluno
o Procedimentos
Seleção e formatação da data de nascimento
Verificação da informação do sexo
Check alunos duplicados/homônimos
Consistências com as tabelas relacionadas*
Geração de relatório de inconsistência (caso necessário)
Carga de Dados no modelo ER
* Mais informações no item “Consistências”
• Cadastro de Professores (CAD_PROFESSOR)
o Origem: Questionário e Cadastro Professor
o Procedimentos:
Adequação a estrutura da base de dados
Check professores duplicados/homônimos
Geração de relatório de inconsistências (caso necessário)
Consistência com as tabelas relacionadas*
Carga dos dados de escola, turno, turma, disciplina e série
• Questionário do Professor(QUEST_PROFESSOR)
o Origem: Questionários dos professores
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
126
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Prova do Alunos (PROVA_ALUNO)
o Origem: Provas dos Alunos
o Procedimentos:
Estabelecimento a integridade referencial entre cadastro
de aluno, provas de Português e Matemática, questionário
e ficha do aluno
Geração de escores (acertos, erros, nulos e brancos),
segundo o gabarito da 7a série e obedecendo a estrutura
existente
Check de duplicidade
Check de turmas pequenas
Consistência entre alunos e professores, observando que o
aluno será confrontado com o professor, ou seja, existindo
alunos(turmas) seus professores devem existir
Geração de relatório de inconsistências
Carga de Dados
• Questionário do Aluno(QUEST_ALUNO)
o Origem: Questionários dos Alunos
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
127
• Questionário do Diretor(QUEST_DIRETOR)
o Origem: Questionários dos Diretores
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Questionário do Roteiro Escola (QUEST_ROTEIRO_ESCOLA)
o Origem: Questionários das Escolas
o Procedimentos:
Verificação das respostas de questões relacionadas,
conforme instrumentos de avaliação
Geração de relatório de inconsistências
“Limpeza” conforme orientação do CEDEPLAR
Verificação de duplicidade
Consistência com as tabelas relacionadas*
• Professor Função Docente(PROF_FUNCAO_DOC)
o Origem: PROVA_ALUNO e CAD_PROFESSOR
o Procedimentos:
Estabelecimento da integridade referencial entre as
entidades
Consistência entre alunos e professores, observando que o
aluno será confrontado com o professor, ou seja, existindo
alunos (turmas) seus professores devem existir
128
Geração de relatório de inconsistências (caso necessário)
Carga de Dados, seguindo os procedimentos acima,
através da Prova_Aluno
• Aluno Professor Função Docente (PROF_FUNC_DOC_ALU)
o Origem: PROVA_ALUNO e PROF_FUNCAO_DOC
o Gerar entidade relacional entre PROVA_ALUNO e
PROF_FUNCAO_DOC, respeitando as regras de integridade
referencial
Não pode haver inconsistências
o Carga de dados
• Documentação
o Documentação completa do banco de dados resultante. Criação
do dicionário de dados, contendo descrições de todos os campos
de cada uma das tabelas integrantes, domínios de validade,
especificação de relacionamentos e diagramas.
CONSISTÊNCIAS
A fim de possibilitar melhor entendimento sobre as consistências,
descreveremos abaixo as principais consistências realizadas e ao que elas
dizem respeito (a qual pergunta devem responder).
CAD_ESCOLA CAD_GERAL_ALUNO
Pergunta: Existe escola sem aluno?
CAD_ESCOLA PROF_FUNCAO_DOC
Pergunta: Existe escola sem professor?
129
QUEST_DIRETOR CAD_ESCOLA
Pergunta: Existe Questionário Diretor sem escola?
CAD_ESCOLA QUEST_DIRETOR
Pergunta: Existem escolas sem Questionário Diretor?
QUEST_ROTEIRO_ESCOLA CAD_ESCOLA
Pergunta: Existe Questionário Roteiro Escola sem escola?
CAD_ESCOLA QUEST_ROTEIRO_ESCOLA
Pergunta: Existem escolas sem Questionário Roteiro Escola?
PROF_FUNCAO_DOC CAD_ESCOLA
Pergunta: Existem professores sem escola?
QUEST_PROFESSOR CAD_GERAL_PROFESSOR
Pergunta: Existe Questionário Professor sem professor?
CAD_GERAL_PROFESSOR QUEST_PROFESSOR
Pergunta: Existem professores com mais de um Questionário Professor na mesma data e mesma escola?
PROVA_PROFESSOR CAD_GERAL_PROFESSOR
Pergunta: Existe Prova Professor sem professor?
130
CAD_GERAL_PROFESSOR PROVA_PROFESSOR
Pergunta: Existem professores com mais de uma Prova Professor na mesma disciplina e mesma data?
QUEST_ALUNO CAD_GERAL_ALUNO
Pergunta: Existe Questionário Aluno sem aluno?
CAD_GERAL_ALUNO QUEST_ALUNO
Pergunta: Existe aluno com mais de um questionário na mesma data?
CAD_GERAL_ALUNO CAD_ESCOLA
Pergunta: Existem alunos sem escola?
PROVA_ALUNO CAD_GERAL_ALUNO
Pergunta: Existe prova aluno sem aluno?
CAD_GERAL_ALUNO PROVA_ALUNO
Pergunta: Existe aluno com mais de uma prova na mesma disciplina e mesma data?
PROF_FUNCAO_DOC PROVA_ALUNO
Pergunta: Existe professor sem aluno?
CAD_ESCOLA QUEST_ALUNO
Pergunta: Existem escolas sem Questionário Aluno?
131
CAD_ESCOLA QUEST_PROFESSOR
Pergunta: Existem escolas sem Questionário Professor?
Estas consistências são essenciais para o produto final, sendo feitas durante
todo o processo. Quando algum dado está incorreto ou ausente, a Cafe
Software recorreu ao responsável (CEDEPLAR) para a coleta ou confirmação
das informações. Exemplos de problemas encontrado através das
consistências:
Turmas sem professores
Professores sem turma
Provas e questionários sem aluno
Aluno sem escola
Escola sem aluno
Alunos duplicados
Provas duplicadas
132
PROCESSAMENTO DE DADOS DAS FICHAS HISTÓRICO ESCOLAR – ALUNOS 1999
APRESENTAÇÃO
Aproveitando a realização do campo para coleta das fichas escolares, decidiu-se
criar a Ficha Histórico Escolar com o objetivo de levantar a trajetória escolar dos
alunos que iniciaram a amostra da pesquisa “Avaliação de Desempenho: Fatores
Associados”.
Assim sendo, foi criada uma ficha que continha campos que era possíveis de serem
preenchidos com todos os dados que traduzissem a vida escolar do aluno dentro da
escola – ano de entrada, série e a situação do aluno em cada ano e série.
O processo de digitação dos dados da Ficha Histórico Escolar ocorreu
paralelamente à entrada de dados das fichas escolares da 7ª série, 8ª série e REP7.
A digitação destes dados foi precedida de uma conferência e separação de todo o
material por estado e escola.
Passada a etapa de digitação, foi feita uma checagem por amostragem dos dados
processados e também foi feita uma limpeza de todo o banco para que ele pudesse
ficar no formato desejado para as análises.
O banco de dados da Ficha Histórico é um banco independente e poderá ser
utilizado também, através do cruzamento de dados, com o banco de dados
longitudinal para análises futuras.
133
CRONOGRAMA DE ATIVIDADES
mai/04 jun/04 jul/04 ago/04 set/04 out/04Elaboração de máscara para entrada de dados
05 a 16Teste da máscara para entrada de dados
19 a 30Acertos nas máscaras para procedimento de entrada de dados 02 a 13Recebimento e conferência do material – fichas escolares – enviadas pelo campo 02 a 13Separação de todo o material por instrumentos Fichas Escolares /Série/Estado/Escola 16 a 30Digitação dos dados coletados 01 a 31 01 a 29Checagem e acertos dos serviços de digitação 11 a 29 15 a 30Conclusão e formação do banco de dados das Fichas Escolares 3
ATIVIDADESDATA
134
AÇÃO 1.3. – ESTIMATIVAS DE FATORES DETERMINANTES DO RENDIMENTO ESCOLAR NO
ENSINO FUNDAMENTAL
APRESENTAÇÃO
Esta seção está dividida em três principais tópicos. Para o primeiro tópico,
Análise descritiva da base de dados longitudinal (quarta a oitava séries), são
apresentados três relatórios: 1) Análises estatísticas descritivas dos escores
clássicos para as disciplinas de matemática e de português; 2) Análises
estatísticas descritivas dos escores equalizados para as disciplinas de
matemática e português e 3) Análise de trajetórias, segundo os escores
clássicos e equalizados em matemática e português.
Nos dois primeiros relatórios podem ser encontradas análises descritivas dos
escores clássicos e equalizados por estado e por turno, separadamente para
cada disciplina. O principal objetivo desses relatórios é mostrar a diferença nos
resultados descritivos quando se utilizam escores clássicos e escores
equalizados. Esta diferença foi também evidenciada no relatório de Análises de
Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de
uma curva de aprendizagem, quando se utilizam os escores equalizados, ou
seja, aqueles estimados e equalizados de acordo com a Teoria da Resposta ao
Item (TRI).
No segundo tópico, “Análise final dos determinantes do rendimento escolar,
com base nos dados longitudinais (quarta a oitava séries)”, constam dois
relatórios: 1) Qualidade dos itens e processos de equalização para as provas
135
de português e matemática, de acordo com a Teoria da Resposta ao Item e 2)
Estimação de modelos hierárquicos longitudinais nas disciplinas de matemática
e de português.
No relatório sobre estimação (calibração) e equalização de acordo com a
Teoria da Resposta ao Item, inicialmente, apresenta-se uma introdução sobre
a TRI, incluindo além da especificação teórica do modelo, critérios, em geral,
utilizados para a determinação da qualidade dos itens. Complementando esta
introdução, é mostrado um resumo teórico sobre processos de equalização de
acordo com a TRI. A seguir, são interpretados os resultados da estimação e da
qualidade dos itens para as disciplinas de matemática e português, assim como
foram também descritos os processos de equalização para as provas das
referidas disciplinas.
De posse da variável dependente escore equalizado, estimada de acordo com
a TRI, passou-se então ao processo de estimação de modelos hierárquicos
longitudinais para as disciplinas de português e matemática, separadamente.
Para a estimação desses modelos, optou-se por trabalhar com os alunos de
trajetória completa, ou seja, alunos que estiveram presentes ao longo de todas
as seis rodadas realizadas pela pesquisa.
Esta opção foi escolhida em virtude da grande quantidade de valores em
branco (missings) presentes nas variáveis preditoras, mas, principalmente, pelo
fato do banco de dados, ainda, apresentar erros na variável identificadora do
aluno. Desta forma, tentou-se minimizar problemas de identificadores
diferentes para o mesmo aluno ao longo da pesquisa, uma vez que todos os
alunos considerados participaram de todas as rodadas e, portanto,
apresentavam o mesmo identificador ao longo da pesquisa. Contudo, este
relatório apresenta um apêndice, contendo resultados de modelos estimados
com alunos que participaram de pelo menos duas rodadas da pesquisa.
No terceiro tópico, “Avaliação do impacto da bolsa escola e renda mínima
sobre o rendimento escolar”, é encontrado um relatório com análises
descritivas, sugerindo qual o tipo de relação entre o impacto do programa bolsa
escola e o rendimento escolar.
136
Para este tópico foi utilizado o banco de dados CADASTRO do bolsa escola
municipal fornecido pela Prefeitura Municipal do Recife/PE, conforme acordo
efetuado em 2003. Porém, com a mudança do governo municipal que
aconteceu neste ano, os arquivos complementares que seriam enviados pela
Prefeitura Municipal do Recife/PE não o foram, acabando por restringir um
pouco o aprofundamento das análises.
Faz parte também desta Ação 1.3 o anexo contendo a dissertação “Fatores
Associados ao Rendimento Escolar de Alunos da 5ª série (2000) – uma
abordagem do valor adicionado e da heterogeneidade”, de autoria de Gláucia
Alves Macedo, defendida no Programa de Pós-Graduação em Demografia do
CEDEPLAR/FACE/UFM em março/2004. Este anexo pode ser encontrado no
final do relatório. Uma versão pré-defesa já havia sido enviada ao INEP
juntamente com o relatório de atividades apresentado em fevereiro/2004. A
versão definitiva desta dissertação agora apresentada, em anexo, é a primeira
publicação efetuada, utilizando o banco de dados da pesquisa “Avaliação de
Desempenho: Fatores Associados”.
137
1.1. – ANÁLISE DESCRITIVA DA BASE DE DADOS LONGITUDINAL (4ª a 8ª SÉRIE)
APRESENTAÇÃO
Este tópico engloba as análises descritivas dos escores clássicos e
equalizados por estado e por turno, separadamente para cada disciplina.
Por meio dos dois primeiros relatórios desta ação – Análises descritivas dos
escores clássicos para as disciplinas de matemática e de português e Análises
descritivas dos escores equalizados para as disciplinas de matemática e
português – é possível verificar a diferença nos resultados descritivos, quando
se utiliza escores clássicos e escores equalizados.
Esta diferença foi também evidenciada no relatório seguinte – Análises de
Trajetórias, que mostra curvas com estrutura bem mais próxima à do padrão de
uma curva de aprendizagem, quando se utilizam os escores equalizados, ou
seja, aqueles estimados numa mesma escala, de acordo com a Teoria da
Resposta ao Item (TRI).
138
ANÁLISES DESCRITIVAS DOS ESCORES CLÁSSICOS PARA AS DISCIPLINAS DE MATEMÁTICA E DE
PORTUGUÊS
APRESENTAÇÃO
Este relatório apresenta uma análise descritiva do rendimento ou escore
clássico (EC) do aluno para as disciplinas de matemática e português, segundo
o estado da federação - Rondônia, Pará, Pernambuco, Sergipe, Goiás e Mato
Grosso do Sul - e o turno em que o aluno estuda – manhã, intermediário e
tarde. O escore clássico é calculado por meio da soma do número de questões
que o aluno respondeu corretamente. Os dados utilizados referem-se ao
período de abril de 1999 a novembro de 2003, ressaltando que, no ano de
1999, a pesquisa teve duas rodadas realizadas, uma em abril e outra em
novembro deste ano. A partir de 2000, as provas foram sempre aplicadas no
mês de novembro até o término da pesquisa em novembro de 2003.
Depois de calculado, o escore clássico passou pela seguinte transformação:
50)10( +×= nEC
em que n é o número de questões que o aluno respondeu corretamente.
Como a prova de abril de 1999 contém apenas 36 itens, seu escore não
poderia ser diretamente comparável aos outros dos outros anos, de forma que
foi necessário que os escores clássicos passassem pela seguinte
transformação:
139
50104036
+⎭⎬⎫
⎩⎨⎧
×⎥⎦
⎤⎢⎣
⎡×⎟⎠⎞
⎜⎝⎛=
nEC
Considerando que as provas de novembro de 1999 a novembro de 2003
contêm 40 questões, o valor máximo obtido pelo aluno pode variar de um valor
mínimo de 50, para um aluno que não acertou nenhuma questão, até um valor
máximo de 450, relativo a um aluno que respondeu corretamente toda a prova.
Para a prova de abril de 1999, os valores mínimo e máximo correspondem a 50
e 410, respectivamente. Será adotado neste relatório, para efeito comparativo,
o valor de 250 como média, pois corresponde à média entre o valor mínimo e
máximo nos períodos de novembro de1999 a novembro de 2003.
A seguir são mostrados as tabelas e os gráficos com os resultados obtidos,
primeiramente, para as provas de matemática e, posteriormente, para as
provas de português:
Tabela 1- Média e desvio padrão do escore clássico em matemática por estado e data de
realização da prova Ano
Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 254,39 254,46 265,66 244,22 243,64 241,40
(69,94) (72,47) (64,69) (52,07) (59,81) (51,31)
PA 266,22 259,77 261,06 242,14 240,58 247,03 (67,28) (67,46) (65,33) (50,62) (55,99) (51,13)
PE 250,17 239,75 253,81 232,18 229,94 239,71 (72,72) (73,11) (66,31) (52,29) (58,82) (56,02)
SE 269,54 262,90 273,30 249,48 245,08 251,63 (70,18) (72,60) (67,02) (51,99) (58,48) (54,16)
MS 289,35 280,88 288,15 264,15 270,46 276,00 (76,72) (76,10) (68,24) (57,83) (64,30) (54,99)
GO 293,19 295,78 294,94 260,77 265,37 265,75 (71,06) (71,17) (66,80) (53,05) (62,28) (53,95) Fonte: Cedeplar/ Inep (2005).
140
Gráfico 1: Média dos escores clássicos das provas de matemática
abr-99
nov-99
nov-00
nov-01nov-02
nov-03
abr-99nov-99 nov-00
nov-01
nov-02 nov-03
220
230
240
250
260
270
280
290
300
Período
Esco
re M
édio
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005).
A tabela 1 mostra o escore clássico médio e o desvio padrão por estado e o
gráfico 1 facilita o acompanhamento da evolução destes escores clássicos em
matemática entre abril de 1999 a novembro de 2003. Observando esses dados,
nota-se uma pequena tendência de decrescimento do escore médio na prova
de matemática a partir de 2000 para todos os estados. As menores médias
foram observadas no estado de Pernambuco, enquanto os estados de Goiás e
Mato Grosso do Sul apresentaram os maiores escores médios, sendo que o
estado do Mato Grosso do Sul chega a ultrapassar a melhor posição de Goiás
a partir de novembro de 2001.
141
Tabela 2 Escore clássico médio e desvio padrão em matemática por turno
Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 267,83 260,22 268,28 249,02 256,90 261,95
(72,53) (74,49) (66,63) (54,03) (63,30) (55,17)
Intermediário 262,21 254,58 259,54 238,46 239,30 253,82 (71,44) (67,31) (66,01) (47,30) (53,45) (48,42)
Tarde 276,20 273,47 275,02 247,82 244,57 248,17 (74,25) (74,87) (69,28) (54,88) (61,05) (55,31) Fonte: Cedeplar/ Inep (2005)
Gráfico 2: Média dos escores clássicos da provas de matemática por turno
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03abr-99
nov-99
nov-00
nov-01 nov-02
nov-03
abr-99
nov-99nov-00
nov-01
nov-02
nov-03
235
240
245
250
255
260
265
270
275
280
Período
Esco
re M
édio
Manhã Intermediário Tarde Fonte: Cedeplar/ Inep (2005)
Pela análise da tabela 2 e do gráfico 2, nota-se que existe um decrescimento
do rendimento médio de matemática em todos os turnos a partir de 2000 com
pequeno acréscimo em 2003. O escore clássico médio do turno tarde foi o
maior entre abril de 1999 e novembro de 2000, mas em novembro de 2001 há
uma inversão de tendência e o turno da manhã alcança e ultrapassa o turno
da tarde.
142
O turno intermediário permanece abaixo dos outros dois turnos entre 1999 e
2002, sendo que em novembro de 2003 ele chega a ultrapassar o turno da
tarde. Assim, é possível notar que nos dados da Tabela 2 e no gráfico 2 em
Abril de 1999, a ordem quanto aos escores clássicos médios era turno da
tarde, manhã e intermediário e em novembro de 2003 houve uma inversão de
posição entre os três turnos, configurando uma nova ordem para os turnos
quanto ao seu escore clássico médio: destaca-se o turno da manhã, seguindo
pelos turnos intermediário e tarde.
As tabelas 3 e 4 e os gráficos 3 e 4 mostram, respectivamente, o percentual de
alunos, por estado e turno, que obtiveram um escore médio superior a 250.
Tabela 3
Percentual de alunos com rendimento em matemática igual ou superior a 250 por estado Ano
Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 733 554 1042 735 498 397 % 54,38 51,20 59,58 47,09 44,62 45,79
PA 1725 1365 2025 1556 1108 1075 % 62,21 57,28 60,12 46,19 44,46 50,83
PE 1309 1074 1954 1402 1028 1020 % 49,16 44,75 52,84 39,02 36,40 44,85
SE 813 540 910 603 432 423 % 63,81 57,88 65,23 52,43 47,68 52,88
MS 1583 1329 1688 1478 1309 1195 % 71,02 65,82 72,45 60,75 62,66 70,75
GO 1795 1413 2266 1938 1682 1534 % 76,25 75,60 76,71 61,06 60,85 65,11
Fonte: Cedeplar/ Inep (2005).
143
Gráfico 3: Percentual de alunos com rendimento em matemática igual ou superior a 250 por estado
abr-99
nov-99
nov-00
nov-01nov-02
nov-03
abr-99 nov-99 nov-00
nov-01 nov-02
nov-03
30
40
50
60
70
80
90
100
Período
Perc
entu
al
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005).
Pela tabela e gráfico 3 pode-se notar que o estado de Pernambuco encontra-
se em pior situação em quase todos os anos, apresentando o menor percentual
de alunos com rendimento superior a 250. Por outro lado, os estados de Goiás
e Mato Grosso do Sul apresentam os melhores resultados para todos os anos.
Sergipe, Pará e Rondônia permanecem em uma situação intermediária, sendo
que em 2003 Rondônia tem um percentual de alunos com rendimento superior
a 250, situação próxima à de Pernambuco.
Tabela 4
Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno Ano
Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 3980 3204 3727 3158 2723 2759
% 61,28 56,27 62,13 51,29 54,29 61,18
Intermediário 471 337 535 260 180 156 % 58,88 53,58 57,78 43,48 45,11 58,43
Tarde 3507 2734 5623 4294 3154 2729 % 65,60 62,66 65,62 50,37 46,55 51,26
Fonte: Cedeplar/ Inep (2005).
144
Gráfico 4: Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno
abr-99
nov-99
nov-00
nov-01nov-02
nov-03abr-99
nov-99
nov-00
nov-01nov-02
nov-03
abr-99nov-99
nov-00
nov-01
nov-02
nov-03
30
40
50
60
70
80
90
100
Período
Perc
entu
al
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005).
A tabela e gráfico 4 apresentam o percentual de alunos com escore clássico
superior a 250 por turno para a disciplina de matemática. Entre 1999 e 2000, o
percentual de alunos variou pouco em todos os turnos, sendo que o turno da
tarde apresenta os melhores resultados, seguido do turno da manhã e do
intermediário. Em 2001, o percentual dos três turnos sofre uma queda, mas em
2002 e 2003 se recuperam em parte. Em 2003, configura-se uma nova posição
para os turnos com maior porcentagem de alunos com escore clássico superior
a 250, com o turno da manhã superando o escore clássico médio dos turnos
intermediário e tarde.
Com o intuito de facilitar a análise do comportamento do rendimento médio dos
alunos em matemática, foram construídos, ainda, os seguintes gráficos em
formato boxplot.
145
Gráfico 5: Rendimento em matemática por estado em abril de 1999
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Analisando-se o gráfico 5, que se refere aos rendimentos dos alunos na prova
de matemática em abril de 1999, e tendo em vista que o rendimento
considerado razoável, para efeito de comparação, estaria em torno de 250,
percebe-se que as medianas dos rendimentos da maioria dos estados
encontram-se acima desse valor, exceto para o estado de Pernambuco, cujo
rendimento apresenta-se abaixo, porém próximo desse valor (239). O estado
com melhores resultados é Goiás. Isto se justifica uma vez que este estado
apresenta a maior mediana (306) dentre os demais estados.
A grosso modo, pode-se afirmar que cerca de 75% dos alunos deste estado
apresentaram nota superior a 250. Estados como, Pará, Sergipe e Rondônia
apresentam um resultado intermediário, estando os três com mediana igual ou
superior a 250, mas próximos desta média. O estado do Mato Grosso do Sul é
o que mais se aproxima dos resultados apresentados por Goiás, com uma
mediana próxima de 300 (294), bem acima de 250.
146
Gráfico 6: Rendimento em matemática por estado em novembro de 1999
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela análise do gráfico 6, observam-se as medianas dos rendimentos em
matemática, por estado, em novembro de 1999. Os rendimentos mais baixos
ainda se encontram em Pernambuco, no qual cerca de 50% dos alunos
possuem rendimento em matemática inferior a 230, e mais de 25% deles estão
situados num rendimento inferior a 180, o que não ocorre nos outros estados
analisados. As medianas relativas aos estados de Rondônia, Pará, Sergipe,
apresentam-se próximas, com valores os seguintes 250, 260 e 270 ,
respectivamente. De abril a novembro de 1999, nota-se uma queda nas
medianas de quase todos os estados, exceto para Rondônia, que manteve a
mesma mediana. O estado de Pernambuco configura ter a menor mediana
relativa à prova de matemática. Já o estado onde se verifica a melhor situação
em termos de rendimentos é Goiás, haja vista que apresenta maior mediana,
por volta de 300, o que implica que mais de 50% dos alunos apresentaram
rendimentos superiores a 300. Isto reflete um bom resultado, na medida em
147
que se adotou, como critério comparativo, uma média para o rendimento de
250, indicando um resultado próximo ao que pode se considerado razoável.
Outra constatação, no que se refere ao melhor desempenho de Goiás, é um
percentual de 75% de alunos com rendimentos superiores a 250, assim como
apresentado em abril de 1999.
Gráfico 7: Rendimento em matemática por estado em 2000
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela observação do gráfico 7, verifica-se que os resultados das medianas dos
estados não se modificaram expressivamente, porém pode-se destacar
tendência de mudanças para melhores rendimentos em especial no caso do
Estado do Mato Grosso do Sul.
Nota-se que os piores rendimentos em 2000 continuam em Pernambuco, onde
50% dos alunos possuem rendimentos em matemática abaixo de 250.
Rondônia e Pará, também continuam equivalentes em termos de rendimentos
148
médios, ambos apresentando cerca de 50% dos alunos com rendimentos
inferiores a 260. O estado de Sergipe também está numa situação parecida,
haja vista que apresenta 50% dos alunos com rendimento abaixo de 270. O
estado de Mato Grosso do Sul apresentou uma pequena melhora da sua
mediana entre novembro de 1999 e 2000, aumentando de 280 para 290,
aproximando-se cada vez mais do estado de Goiás. Por sua vez, o estado de
Goiás confirmou, no ano de 2000, o melhor desempenho, antes apresentado
em novembro de 1999, visto que apresentou maior mediana (300), de forma
que 50% dos alunos ficaram com rendimento médio superior a 300. Além
disso, nota-se que Goiás manteve o percentual de 75% dos alunos com
rendimento superior a 250.
Gráfico 8: Rendimento em matemática por estado em 2001
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
149
Pelo gráfico 8, que corresponde aos rendimentos de matemática por estado do
ano de 2001, pode-se notar que os resultados para este ano diferem em
relação aos períodos anteriores. Percebe-se que as medianas dos estados
estão mais próximas. Porém, o resultado para cada estado piorou, visto que
houve uma queda dos rendimentos dos alunos no que se refere às medianas.
Os piores resultados continuam sendo os de Pernambuco, uma vez que sua
mediana ainda é a menor (230). Já os estados de Pará e Rondônia
apresentaram rendimentos bem semelhantes em relação às suas medianas.
No estado de Sergipe também houve queda de rendimento, agora
apresentando mais de 50% dos alunos abaixo de 250. Do mesmo modo, é
visível a mudança de comportamento entre os estados de Goiás e Mato Grosso
do Sul em relação a 2000. Pode-se dizer que estes estados agora se
encontram “empatados” como estados que apresentam os melhores
resultados, sendo que suas medianas reduziram-se significativamente (de 300
e 290, respectivamente, em 2000, chegando a 260 em 2001).
Gráfico 9: Rendimento em matemática por estado em 2002
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
150
No gráfico 9, observa-se os rendimentos de matemática por estado no ano de
2002. Percebe-se uma melhora no quadro de Mato Grosso do Sul em relação
aos outros estados. Isto pode ser comprovado pelo aumento do valor de sua
mediana (270) e de sua nota máxima, ultrapassando Goiás nesses quesitos e
sendo o único estado que obteve melhora de rendimento. Os outros estados
demonstraram comportamento semelhante ao ano de 2001, com pequena
queda para os estados de Sergipe e Pernambuco, sendo que Pernambuco
continua sendo o estado com os piores resultados.
Gráfico 10: Rendimento em matemática por estado em 2003
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela análise do gráfico 10, que mostra os rendimentos de matemática por
estado em 2003, pode-se analisar que o estado de Pernambuco apresenta,
agora mais claramente, uma tendência de melhora com relação aos outros
períodos analisados, chegando a se equiparar ao estado de Rondônia. Isto
pode ser visualizado pelos valores das medianas, 240, para os dois estados.
151
Este resultado pode não ser considerado positivo, uma vez que Rondônia em
abril de 1999 apresentava uma mediana próxima a 250.
Assim, o que teria acontecido seria uma piora nos resultados de Rondônia, de
forma que no fim do processo este estado teve seus resultados ainda mais
próximos aos de Pernambuco. Entretanto, comparando-se os resultados de
abril de 1999 e novembro de 2003, o que houve foi uma queda no rendimento
médio de todos os estados, com exceção de Pernambuco que apresentou
praticamente a mesma mediana. Portanto, pode-se dizer que considerando a
primeira e a última rodada da pesquisa, o estado de Pernambuco manteve os
mesmos resultados, enquanto todos os outros estados apresentaram queda
em seus rendimentos médios.
É importante ressaltar que entre as rodadas a posição dos estados muda com
o tempo. Observa-se, em especial, a partir de 2001, com exceção do ano de
2002, o estado de Mato Grosso do Sul continua a apresentar melhor
desempenho com relação a todos os estados, com exceção de Goiás. O
estado de Mato Grosso do Sul chega a ultrapassar Goiás em 2002, mas em
2003, os dois estados voltam a apresentar resultados semelhantes, com
medianas iguais a 270. Os estados Pará e Sergipe estão em situação
intermediária, apresentando medianas iguais a 250.
Em resumo, pode-se dizer que comparando o início e o final do processo,
todos os estados apresentaram queda em seus rendimentos médios, com
exceção de Pernambuco, que apesar disso, sempre apresentou os piores
rendimentos. Entretanto em 2003, Pernambuco não foi o único responsável
pelos piores rendimentos, pois Rondônia apresentou resultados semelhantes.
Pará e Sergipe continuaram em posição intermediária, enquanto Goiás passa a
dividir os melhores rendimentos com o estado do Mato Grosso do Sul.
152
Gráfico 11: Rendimento em matemática por turno em abril de 1999
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela análise do gráfico 11, observa-se os rendimentos de matemática por
turno, em abril de 1999. Percebe-se que a variabilidade entre os rendimentos
por turno é bem parecida, embora o melhor turno pareça ser o da tarde, que
apresenta 50% dos alunos com rendimento superior a 280. O turno da manhã
vem logo em seguida, com mediana igual a 270 e o turno intermediário com
260.
153
Gráfico 12: Rendimento em matemática por turno em novembro de 1999
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Observando o gráfico de novembro de 1999 acima, relativo aos rendimentos de
matemática, e comparando-o ao de abril de 1999, percebe-se que não ocorreu
mudança expressiva entre os turnos. Todavia, verifica-se que o rendimento
teve uma sensível piora no sentido de que as medianas decresceram em 10
pontos para os três turnos. A posição continuou a mesma, sendo o turno da
tarde o melhor em termos de rendimento, com mais de 50% dos alunos
possuindo rendimento superior a 270, seguido do turno matutino que
apresentou uma mediana igual a 260. Já o turno intermediário apresentou um
comportamento parecido ao demonstrado em abril havendo, entretanto, uma
diminuição de sua mediana de 260 para 250.
154
Gráfico 13: Rendimento em matemática por turno em novembro de 2000
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
No gráfico 13 acima, que expõe os resultados referentes aos rendimentos de
matemática em novembro de 2000, nota-se que houve uma melhora em todos
os turnos, que voltaram ao patamar de abril de 1999. A ordem continuou a
mesma, sendo que a mediana do turno da tarde, que apresenta os melhores
resultados em termos de rendimento, voltou a ser 280. O turno da manhã
voltou a ter mediana igual a 270 e o turno intermediário voltou a apresentar
mediana igual a 260.
155
Gráfico 14: Rendimento de matemática por turno em novembro de 2001
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
O gráfico 14 retrata os rendimentos de matemática em novembro de 2001, por
turno. Esse ano, assim como visto na exposição dos rendimentos por estado,
apresenta diferenças de resultados quando comparado aos anos de 1999 e
2000. Além disso, verifica-se que a mediana apresentou uma redução para
todos os turnos. O turno da manhã “empata” com o turno da tarde em termos
de melhores rendimentos e os dois apresentam mediana igual a 250, ou seja,
50% dos alunos, do turno da manhã e da tarde, estão com rendimentos acima
de 250. O turno intermediário continua apresentando as piores médias, tendo
sua mediana em 240. Também é notável, nesse ano, que os rendimentos se
mostraram mais próximos entre os turnos.
156
Gráfico 15: Rendimento de matemática por turno em novembro de 2002
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela análise do gráfico 15, referente aos rendimentos de matemática por turno
no ano de 2002, verifica-se que o turno intermediário não obteve variação,
apresentando semelhante mediana e, portanto, apresentando rendimento
próximo ao ano anterior. Um ponto a ser ressaltado é que, no turno da tarde, a
mediana diminuiu de 250 para 240, igualando-se ao turno intermediário.
O turno da manhã manteve a mediana de 250, e por esse motivo é o turno que
apresenta os melhores resultados em termos de rendimento. A nova ordem é o
turno da manhã com os melhores rendimentos médios, seguido dos turnos da
tarde e intermediário, que se encontram praticamente na mesma posição.
157
Gráfico 16: Rendimento de matemática por turno em novembro de 2003
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
O gráfico 16 retrata os rendimentos da prova de matemática, por turno, em
novembro de 2003. Pela análise das medianas, pode-se dizer que o
rendimento subiu em relação ao ano anterior, uma vez que para os turnos da
manhã e da tarde a mediana aumentou em 10 pontos e para o turno
intermediário, em 20 pontos. Apesar desse aumento ocorrido no turno da tarde,
ele apresentou os piores resultados em relação aos outros turnos, de forma
que um percentual de 50% dos alunos da tarde têm rendimento inferior a 250.
Já os turnos da manhã e intermediário estão “empatados” com relação aos
melhores resultados, apresentando mediana igual a 260.
Comparando-se a situação entre o primeiro (abril de 1999) e o último período
da pesquisa (novembro de 2003) , observa-se, além de uma queda nos níveis
de rendimentos médios nos turnos da manhã e da tarde, respectivamente 10 e
30 pontos, houve uma inversão de posição. Em abril de 1999, o turno da tarde
apresentava os melhores rendimentos, seguido pelos turnos da manhã e
158
intermediário, enquanto que em novembro de 2003, esta ordem foi alterada, de
forma que os turnos da manhã e intermediário passaram para a primeira
posição, deixando o turno da tarde em segundo lugar.
As tabelas e os gráficos a seguir, referem-se aos resultados obtidos para as
provas de português:
Tabela 5 Escore clássico médio e desvio padrão em português por estado
Ano Estados Abr/1999 Nov/1999 2000 2001 2002 2003
RO 278,69 249,40 277,71 287,43 268,83 263,79 (74,33) (75,75) (73,19) (79,09) (75,01) (87,69)
PA 294,20 255,26 275,19 298,04 265,70 274,36 (70,14) (72,20) (74,04) (74,88) (70,65) (77,72)
PE 269,31 236,30 262,77 276,44 249,37 261,55 (76,86) (75,78) (75,46) (80,54) (72,93) (83,65)
SE 285,97 259,20 288,28 297,27 268,07 276,76 (75,86) (76,73) (73,79) (79,77) (75,50) (83,41)
MS 292,77 270,42 294,92 306,99 303,81 324,97 (73,53) (78,24) (76,05) (80,07) (73,32) (74,63)
GO 311,57 276,35 297,07 309,98 289,60 299,60 (69,60) (77,52) (73,63) (76,39) (71,74) (79,37) Fonte: Cedeplar/ Inep (2005)
159
Gráfico 17: Média dos escores clássicos das provas de português
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
230
240
250
260
270
280
290
300
310
320
330
Período
Esco
re M
édio
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005)
Por meio da tabela 5 e do gráfico 17, que mostram a média dos escores
clássicos por estado, pode-se observar que todos os estados apresentam
tendência crescente até 2001, com exceção de novembro de 1999. Em 2002,
há uma queda e, em 2003, uma pequena recuperação, com exceção de
Rondônia, quanto à recuperação em 2003. Os estado do Mato Grosso do Sul
e de Goiás apresentam os melhores resultados e Pernambuco, os piores para
todos os anos. Os estados de Rondônia, Pará e Sergipe se mantêm em uma
posição intermediária.
160
Tabela 6 Escore clássico médio e desvio padrão em português por turno
Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 285,69 254,90 277,48 299,83 282,33 296,14
(75,60) (77,25) (75,41) (76,84) (73,56) (81,13)
Intermediário 286,11 250,62 266,75 291,83 265,83 299,28 (70,71) (71,18) (76,33) (75,22) (68,29) (73,96)
Tarde 294,47 261,42 284,68 293,13 268,94 275,15 (73,30) (77,69) (75,40) (80,94) (76,13) (84,48) Fonte: Cedeplar/ Inep (2005)
Gráfico 18: Média dos escores clássicos da provas de matemática por turno
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
240
250
260
270
280
290
300
310
Período
Esco
re M
édio
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005)
A tabela 6 e o gráfico 18 mostram os resultados dos escores clássicos médios
por turno. Por meio desta tabela e deste gráfico, observa-se uma tendência
crescente até o ano de 2001, com exceção de novembro de 1999. Em 2002, há
uma queda e, em 2003, uma recuperação para todos os turnos, assim como
ocorreu para os estados.
161
Em abril de 1999, o turno da tarde estava em melhor posição, seguido pelos
turnos da manhã e intermediário. Porém, em 2003, há uma inversão dessas
posições, ficando o turno intermediário com a melhor média, seguido do turno
da manhã e da tarde.
As tabelas 7 e 8 e os gráficos 19 e 20 mostram, respectivamente, o percentual
de alunos, por estado e turno, que obtiveram um escore médio na disciplina de
português superior a 250.
Observando a tabela 7 e o gráfico 19, vê-se que Pernambuco apresenta o pior
percentual para todos os anos, enquanto Mato Grosso do Sul e Goiás têm os
melhores percentuais. Entre novembro de 1999 e 2001, todos os estados
apresentam tendência de crescimento, mas, em 2002, há uma queda
considerável com pequena recuperação em 2003, exceto para Rondônia.
Tabela 7 Percentual de alunos com rendimento em português igual ou superior a 250 por estado
Ano Estados Abr/1999 Nov/1999 2000 2001 2002 2003
RO 889 514 1164 1058 642 511 % 66,10 48,22 66,55 68,39 58,90 58,67
PA 2092 1301 2210 2533 1446 1336 % 75,58 54,64 65,60 74,90 58,42 63,32
PE 1610 1017 2142 2238 1357 1249 % 60,34 42,71 58,14 63,01 48,09 55,00
SE 901 499 999 842 535 507 % 70,83 55,69 72,29 73,54 59,31 63,69
MS 1624 1192 1723 1825 1580 1411 % 72,86 59,66 73,85 75,29 75,74 83,84
GO 1914 1184 2226 2508 1972 1751 % 81,73 63,66 75,56 79,09 71,17 74,38
Fonte: Cedeplar/ Inep (2005)
162
Gráfico 19: Percentual de alunos com rendimento em português igual ou superior a 250 por estado
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03
abr-99
nov-99
nov-00
nov-01
nov-02nov-03
30
40
50
60
70
80
90
100
Período
Perc
entu
al
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005)
Na tabela 8 e no gráfico 20, tem-se o percentual de alunos com escore clássico
superior a 250 por turno. Pode-se dizer que todos os turnos apresentam
tendência crescente entre novembro de 1999 e 2001, uma queda em 2002 e,
uma leve recuperação em 2003.
O turno da manhã manteve-se em posição intermediária, exceto para 2001 e
2002. Entretanto, os turnos da tarde e intermediário apresentaram uma
inversão em suas posições entre 1999 e 2003, começando o turno da tarde em
posição superior e terminando em posição inferior ao turno intermediário.
163
Tabela 8 Percentual de alunos com rendimento em português igual ou superior a 250 por turno
Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 4534 2988 3921 4587 3352 3239
% 69,80 53,03 65,73 74,91 66,95 72,44
Intermediário 568 339 571 432 236 197 % 71,72 53,98 61,66 72,36 59,30 74,34
Tarde 3928 2380 5972 5985 3944 3329 % 73,61 55,11 69,67 70,40 58,51 62,24
Fonte: Cedeplar/ Inep (2005)
Gráfico 20: Percentual de alunos com rendimento em português igual ou superior a 250 por turno
abr-99
nov-99
nov-00
nov-01
nov-02
nov-03abr-99
nov-99
nov-00
nov-01
nov-02
nov-03abr-99
nov-99
nov-00 nov-01
nov-02
nov-03
30
40
50
60
70
80
90
100
Período
Perc
entu
al
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005)
Com o intuito de facilitar a análise do comportamento do rendimento médio dos
alunos em português, foram construídos, ainda, os gráficos 21 a 32 em formato
boxplot.
164
Gráfico 21: Rendimento em português por estado em abril de 1999
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep 1999-2003
O gráfico 21, que se refere aos rendimentos dos alunos na prova de português
em abril de 1999, mostra que em todos os estados, um percentual de 50% dos
alunos apresentaram rendimentos superiores a 250. Pernambuco é o estado
que apresenta o pior resultado, com uma mediana de 260. Em seguida, vem o
estado de Rondônia com mediana igual a 280. Os estados de Sergipe e Mato
Grosso do Sul estão em situação intermediária, apresentando medianas iguais
a 290.
Pará e Goiás apresentam os melhores resultados em termos de rendimentos,
com medianas iguais a 300 e 310, respectivamente, contando, ainda, com um
percentual de 75% de seus alunos, apresentando rendimentos superiores a
250.
165
Gráfico 22: Rendimento em português por estado em novembro de 1999
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Por meio do gráfico 22, observa-se as medianas dos rendimentos em
português, por estado, em novembro de 1999. Esse gráfico apresenta
resultados interessantes, se comparado aos resultados de abril de 1999, pois
nota-se uma queda considerável em todas as medianas. Pernambuco continua
apresentado os piores rendimentos (mediana 230). Em seguida, estão os
estados de Rondônia (240), Pará (250), Sergipe (260), Mato Grosso do Sul
(270) e Goiás (280). Somente Rondônia e Pernambuco ficaram abaixo da
média considerada razoável, 250.
O estado do Pará que estava próximo a Goiás, sede lugar para Mato Grosso
do Sul e passa a ter uma mediana de 250, ficando em situação intermediária à
posição dos estados de Rondônia e Sergipe
166
Gráfico 23: Rendimento em português por estado em novembro de 2000
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Através da observação do gráfico 23, verifica-se que os resultados das
medianas dos estados se modificaram positivamente. Todos os estados
melhoraram de 30 a 40 pontos na mediana entre 1999 e 2000. Os piores
rendimentos em 2000 continuam em Pernambuco, com uma mediana de 260, e
que apesar de ser a mais baixa, volta ao patamar de abril de 1999. Rondônia e
Pará apresentam resultados equivalentes em termos de rendimentos médios,
280, assim como Mato Grosso e Sergipe, 300. O estado com melhor
desempenho continua sendo Goiás, recuperando a mediana apresentada em
abril de 1999 (310).
167
Gráfico 24: Rendimento em português por estado em novembro de 2001
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
No gráfico 24, que corresponde aos rendimentos de português por estado do
ano de 2001, pode-se notar que os resultados para o ano de 2001 seguem a
mesma tendência positiva dos períodos anteriores, apesar das medianas terem
crescido menos que em 2000, aumentando de 10 a 20 pontos. Os piores
resultados continuam sendo os de Pernambuco, porém sua mediana aumentou
em 20 pontos, passando de 260, em 2000, para 280, em 2001.
Os estados de Mato Grosso do Sul e Goiás apresentam os melhores
resultados, com mediana de 320 e um percentual de 75% dos alunos com
rendimento superior a 250. No ano anterior, somente o estado de Goiás havia
apresentado tal resultado. Pode-se dizer que os estados de Rondônia, Pará e
Sergipe, também, apresentam bons resultados em 2001, com medianas de
290, 300 e 310, respectivamente.
168
Gráfico 25: Rendimento em português por estado em novembro de 2002
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
No gráfico 25, observa-se os rendimentos de português por estado no ano de
2002. De 2001 para 2002 todos os estados pioraram sua situação, todas as
medianas apresentaram quedas. Pará e Pernambuco tiveram os piores
resultados, tendo uma diminuição de 40 pontos na mediana. O pior estado
continua sendo Pernambuco que apresenta uma mediana de 240 pontos. Mato
Grosso do Sul ultrapassou os resultados apresentados por Goiás e passa a ser
o estado que apresenta os melhores resultados, inclusive com 75% dos seus
alunos apresentando escore clássico acima de 250. Pará, Sergipe e Rondônia
tiveram uma queda em suas medianas, mas permanecem com resultados
acima de 250.
169
Gráfico 26: Rendimento em português por estado em novembro de 2003
Estado
GOMSSEPEPARO
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Pela análise do gráfico 26, que mostra os rendimentos de português para cada
estado em 2003, nota-se que todos os estados apresentam uma melhora com
relação ao ano de 2002. O estado que mais se destacou foi o de Mato Grosso
de Sul que teve o melhor resultado em comparação aos outros anos e aos
demais estados, atingindo uma mediana de 340 e com 75% dos alunos com
rendimento igual ou superior a 280. Pernambuco continua com o pior resultado
em relação aos demais estados nos anos anteriores, mas sua mediana
aumentou em 20, quando comparada a do ano anterior.
Os estados de Rondônia, Pará e Sergipe obtiveram uma melhora com relação
a 2002, entretanto esses resultados não superam aqueles encontrados em
2001.
170
Comparando os gráficos referentes à primeira e à última rodada da pesquisa,
para a disciplina de português, observa-se que Pernambuco manteve-se com
os piores resultados, quando comparado aos dos demais estados, entretanto
permaneceu com a mesma mediana (260). É interessante ressaltar os
resultados do estado do Pará, que passou do segundo melhor rendimento em
abril de 1999 (300), para o terceiro pior desempenho, ultrapassando apenas
Pernambuco e Rondônia em 2003. Por outro lado, é importante notar a
melhora observada em relação aos resultados do Mato Grosso do Sul, que
passou da terceira posição em abril de 1999 (com mediana de 290) para o
melhor desempenho em 2003 (com mediana de 340), chegando, no ano de
2003, a se distanciar de forma considerável até mesmo do estado de Goiás.
Os gráficos 27 a 32 mostram os rendimentos das provas de português por
turno.
Gráfico 27: Rendimento em português por turno em abril de 1999
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
171
No gráfico 27, observa-se os rendimentos de português por turno para abril de
1999. Pode-se dizer que não há variação significativa entre os rendimentos dos
alunos por turno neste período, uma vez que as medianas são iguais para os
três turnos (290), que também apresentam variabilidades próximas.
Gráfico 28: Rendimento em português por turno em novembro de 1999
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Observando o gráfico 28, que mostra os resultados, para novembro de 1999,
relativos aos rendimentos de português, percebe-se que houve uma queda na
mediana dos três turnos quando comparado aos resultados de abril de 1999. O
turno da tarde apresenta o melhor resultado com mediana igual a 260 e os
turnos intermediário e manhã obtiveram medianas iguais a 250.
172
Gráfico 29: Rendimento em português por turno em novembro de 2000
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
O gráfico 29 destaca os resultados referentes aos rendimentos de português
em novembro de 2000. Nota-se que houve um aumento nas medianas dos
três turnos, quando comparadas às do período anterior. O turno da tarde teve o
melhor resultado com uma mediana de 290, seguido pelo turno da manhã (280)
e pelo turno intermediário (270). Entretanto, esses resultados não configuram
uma plena recuperação, se comparados aos resultados de abril de 1999,
quando todos os turnos apresentavam mediana igual a 290.
173
Gráfico 30: Rendimento em português por turno em novembro de 2001
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
O gráfico 30 retrata os rendimentos de português, em novembro de 2001, por
turno. Assim como em 2000, houve melhora das medianas para todos os
turnos. Manhã e intermediário foram os turnos que mais cresceram, 30 pontos,
enquanto o turno da tarde cresceu somente 10 pontos. O turno da manhã
ultrapassou o turno da tarde e apresenta os melhores resultados, enquanto os
turnos da tarde e intermediário estão “empatados”, com uma mediana de 300.
174
Gráfico 31: Rendimento em português por turno em novembro de 2002
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
Analisando o gráfico 31, que se refere aos rendimentos de português, por turno
em 2002, verifica-se que houve uma queda do rendimento para todos os
turnos. O turno da manhã continuou apresentando os melhores resultados
assim como em 2001 e os turnos da tarde e intermediário continuaram em
posições semelhantes.
175
Gráfico 32: Rendimento em português por turno em novembro de 2003
Turno
TardeIntermediárioManhã
Esco
re C
láss
ico
500
400
300
200
100
0
Fonte: Cedeplar/ Inep (2005)
O gráfico 32 mostra os rendimentos da prova de português, por turno, em
novembro de 2003. O que houve neste ano é que o turno da tarde, que nos
anos anteriores, chegou, em geral, a apresentar os melhores resultados,
aparece com os piores resultados. O turno intermediário ultrapassou o turno da
manhã, apresentando os melhores resultados. Nesse ano, todos os turnos
apresentaram melhora mas em menor escala do que em 2001.
Em resumo, os resultados por turno são os mesmos no início do processo. No
meio da pesquisa, o turno da tarde, em geral, apresenta os melhores
rendimentos. Entretanto, no final do processo o turno da tarde passa a
apresentar um rendimento inferior até mesmo ao turno intermediário.
176
ANÁLISES DESCRITIVAS DOS ESCORES EQUALIZADOS PARA AS DISCIPLINAS DE
MATEMÁTICA E DE PORTUGUÊS
APRESENTAÇÃO
No relatório anterior, foram apresentadas análises descritivas dos escores
clássicos de matemática e português por estado e turno. Entretanto, a
comparação entre os escores clássicos, não deve ser feita diretamente, uma
vez que os resultados não se encontram em uma mesma escala. Sendo assim,
o principal objetivo destas análises foi o de verificar a diferença entre os
resultados obtidos com os escores clássicos e aqueles obtidos com os escores
equalizados, aqueles que se encontram em uma mesma escala, podendo ser
diretamente comparados.
Neste relatório será analisado o escore equalizado de matemática e de
português, respectivamente, em uma abordagem comparativa por estado e
turno. Após a equalização dos dados, necessária para que os rendimentos dos
alunos pudessem ser diretamente comparados, foi feita uma modificação nos
resultados de acordo com a seguinte fórmula:
Escore padronizado= (escore equalizado x 10) + 50
Dessa forma, os escores equalizados, até então normalmente distribuídos com
média zero e desvio padrão um, passaram a apresentar uma distribuição
normal, com média 50 e desvio-padrão 10. Tal transformação foi feita com o
objetivo de facilitar a apresentação dos resultados, não sendo motivada por
177
qualquer critério teórico precedente. O mesmo ocorre com o valor de referência
50, adotado arbitrariamente com o objetivo unicamente comparativo.
Os resultados apresentados dizem respeito aos escores obtidos pelos alunos
de 4a a 8a série, nas provas aplicadas no trabalho de campo entre 1999 e 2003,
sendo que no ano de 1999 foram realizadas duas rodadas, uma em abril e
outra em novembro.
De início, são apresentados os resultados para a disciplina de matemática. Na
tabela e no gráfico 1, tem-se a média dos escores equalizados e o desvio
padrão. É possível notar que o estado de Pernambuco apresenta o pior
rendimento médio em matemática, considerando todo o período da pesquisa,
além de contar com a maior variabilidade dos escores em praticamente todos
os anos. Ao contrário, os estado do Mato Grosso do Sul e Goiás se alternaram
na posição de melhor escore médio. Para todos os estados, verifica-se uma
tendência crescente do escore médio, assim como da variabilidade das notas.
Por estar em uma escala comparável, o escore equalizado médio deve crescer
ao longo do tempo, de forma a refletir os ganhos de aprendizagem do aluno
com o passar dos anos. Com exceção da queda de desempenho notada em
Rondônia, Pernambuco, Pará e Sergipe no ano de 2003, esse crescimento
pode ser verificado em todos os momentos da pesquisa, em todos os estados
participantes. Contudo, isto não chega a constituir uma preocupação, uma vez
que considerando a estrutura padrão de uma curva de aprendizagem, pode-se
esperar uma tendência à estabilidade no final do processo.
178
Tabela 1 Escore equalizado médio e desvio padrão em matemática por estado e período Ano
Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 48,53 50,82 55,61 60,07 61,08 59,21
(8,77) (8,39) (7,57) (7,72) (9,08) (10,35)
PA 49,64 51,73 54,98 60,03 60,95 59,88 (8,07) (7,73) (7,80) (7,34) (8,61) (10,47)
PE 47,53 49,16 54,23 58,37 59,04 58,69 (8,84) (8,70) (8,04) (7,82) (9,30) (11,25)
SE 50,56 51,67 56,39 60,50 61,52 60,93 (8,88) (8,64) (8,01) (7,97) (9,09) (11,07)
MS 51,46 53,79 58,11 62,89 65,09 66,66 (9,10) (8,82) (8,06) (8,07) (9,00) (10,52)
GO 53,24 55,48 59,03 62,73 64,50 64,23 (8,85) (8,16) (7,84) (7,44) (8,94) (10,76)
Fonte: Cedeplar/ Inep (2005).
Grafico1: Média dos escores equalizados das provas de matemática por período e estado
abr/99
nov/99
nov/00
nov/01nov/02 nov/03
40
45
50
55
60
65
70
Período
Esco
re m
édio
Rondônia Pará Pernambuco Sergipe Mato Grosso do Sul Góias
Fonte: Cedeplar/ Inep (2005).
179
A mesma tendência crescente pode ser vista na análise por turno. Nas
primeiras rodadas da pesquisa, o turno da tarde se destaca como o de maior
rendimento, apresentando também a maior variabilidade dos escores.
Entretanto, a partir do ano 2001 esta colocação é tomada pelo turno da manhã,
que apresenta a maior taxa de crescimento de 2001 para 2002 e a mesma taxa
que o turno intermediário de 2002 para 2003. Todos os turnos apresentaram
taxas crescentes de crescimento dos escores até 2001, sendo que a partir de
então há uma queda desta taxa para todos.
Somente para o turno da tarde nota-se um decréscimo no escore de 2002 para
2003. O turno intermediário também ultrapassa o turno da tarde a partir do ano
2002. É importante ressaltar que, apesar de não se esperar que haja
diminuição dos escores ao longo do tempo, a estrutura padrão da curva de
aprendizagem se traduz em retornos marginais decrescentes de rendimento,
tendendo à estabilidade no final do processo. Assim, os escores deveriam
crescer continuamente, mas a taxas decrescentes, tendendo a se estabilizarem
no final do processo.
Tabela 2
Escore equalizado médio e desvio padrão em matemática por turno e período Ano
Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 49,78 51,49 55,95 60,98 63,12 63,41
(8,86) (8,66) (7,95) (7,78) (9,30) (11,00)
Intermediário 49,06 51,10 54,69 59,77 61,10 61,39 (8,47) (7,72) (7,93) (6,81) (8,17) (9,89)
Tarde 50,78 53,04 56,61 60,55 61,36 60,43 (9,07) (8,70) (8,21) (8,00) (9,26) (11,19) Fonte: Cedeplar/ Inep (2005).
180
Gráfico 2: Média dos escores equalizados de matematica por período e turno
abr/99
nov/99
nov/00
nov/01nov/02 nov/03
40
50
60
70
Período
Esco
re m
édio
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005).
A melhora no desempenho dos alunos pode ser vista também através da
tabela 3, que mostra o percentual de alunos cujo escore é igual ou superior a
50, critério explicado anteriormente. É possível notar a mesma troca de
posições verificada através da média por estado, em que Goiás e Mato Grosso
do Sul se alternavam na posição de melhor desempenho. Ao final da pesquisa,
ambos os estados possuíam mais de 90% dos alunos com escore acima da
média. No estado do Pará, ocorre uma acentuada queda na proporção dos
alunos com desempenho igual ou superior a 50 entre 2001 e 2003. Essa queda
é acompanhada por Rondônia e Pernambuco, entretanto, se dá a uma taxa
maior nesse último estado.
181
Tabela 3 Percentual de alunos com escore em matemática igual ou superior a 50 por estado e
período Ano
Estados Abr/1999 Nov/1999 2000 2001 2002 2003 RO 595 595 1363 1409 974 694 % 55,00 54,00 77,00 90,00 87,00 80,00
PA 1463 1463 2585 3077 2193 1719 % 61,00 61,00 76,00 91,00 88,00 81,00
PE 1129 1129 2629 3085 2271 1716 % 47,00 47,00 71,00 85,00 80,00 75,00
SE 555 555 1115 1029 789 662 % 59,00 59,00 79,00 89,00 87,00 82,00
MS 1367 1367 1978 2305 1956 1583 % 67,00 67,00 84,00 94,00 93,00 93,00
GO 1437 1437 2611 3015 2550 2124 % 77,00 76,00 88,00 94,00 92,00 90,00
Fonte: Cedeplar/ Inep (2005).
Gráfico 3: Percentual dos alunos com escore igual ou superior a 50 na prova de matemática por período e estado
abr/99 nov/99
nov/00
nov/01
nov/02
nov/03
30%
40%
50%
60%
70%
80%
90%
100%
Período
Perc
entu
al
Rondônia Pará Pernambuco Sergipe Mato Grosso do Sul Góias
Fonte: Cedeplar/ Inep (2005).
182
A análise por turno, apresentada na tabela e no gráfico 4, mostra um
comportamento dos escores semelhante ao percebido na abordagem por
estados. Há uma queda no período inicial e um posterior crescimento da
proporção dos alunos com escore igual ou superior a 50, seguido de nova
queda neste percentual a partir do ano 2001. Inicialmente, o melhor
desempenho é encontrado entre os alunos do turno da tarde, cerca de 65%
dos alunos que freqüentam a escola no turno da tarde obtiveram desempenho
satisfatório. A partir de 2001, esta posição de destaque passa para o turno da
manhã. Além disso, entre 2000 e 2001, a taxa de crescimento dos escores
observada no turno da manhã é consideravelmente maior que a do turno da
tarde.
Tabela 4 Percentual de alunos com rendimento em matemática igual ou superior a 250 por turno
Ano Turno Abr/1999 Nov/1999 2000 2001 2002 2003 Manhã 3335 3335 4738 5682 4490 3964
% 58,00 58,00 78,00 92,00 89,00 87,00
Intermediário 358 358 680 544 357 233 % 56,00 56,00 73,00 90,00 89,00 87,00
Tarde 2853 2853 6863 7694 5886 4301 % 65,00 65,00 80,00 90,00 86,00 80,00
Fonte: Cedeplar/ Inep (2005).
183
Gráfico 4: Percentual de alunos com escore equalizado igual ou superior a 50 na prova de matemática por período e turno
abr/99 nov/99
nov/00
nov/01 nov/02nov/03
30%
40%
50%
60%
70%
80%
90%
100%
Período
Perc
entu
al
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005).
Com o objetivo de verificar o comportamento ao longo do tempo dos escores
obtidos pelos alunos, e o desempenho em conjunto dos mesmos, a análise
segue com a utilização de gráficos no formato boxplot.
Como é possível observar no gráfico 5, o estado com pior desempenho é
novamente Pernambuco, com mediana igual a 46, resultado abaixo da média
adotada como referência. É interessante observar que, nesta rodada inicial, os
estados não se distinguem muito entre si, com exceção do caso de
Pernambuco e Goiás (com mediana de aproximadamente 54 pontos). Desta
forma, as medianas estão próximas a 50 e os escores apresentam
variabilidades parecidas.
184
Gráfico 5: Rendimento em matemática por estado em abril de 1999
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
Em novembro de 1999, ocorre um aumento geral nos escores dos alunos, de
forma que somente o estado de Pernambuco permanece com a mediana
abaixo de 50 (48,43). Mato Grosso do Sul e Goiás se destacam, sendo que um
quarto dos alunos e Goiás passam a apresentar escore superior a 60 (62,78).
Os estados permanecem parecidos quanto à variabilidade dos escores, com
exceção do Mato Grosso do Sul, que aumenta significativamente a
heterogeneidade quanto ao desempenho dos alunos.
185
Gráfico 6: Rendimento em matemática por estado em novembro de 1999
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
O crescimento dos escores em 2000 é ainda maior que o ocorrido no período
anterior. Nos estados que vinham apresentando desempenho inferior, essa
melhora fez com que eles se aproximassem dos resultados obtidos pelos
demais. Rondônia e Pernambuco apresentaram uma melhora considerável,
com o aumento de suas medianas para aproximadamente 54 pontos (54,65 e
54,20). Esta mudança os aproxima do quadro visto no Pará (54,52) e Sergipe
(55,58), até então superiores a eles.
No estado de Goiás, a mediana ultrapassa 60 (60,72). Seguindo a mesma
tendência de Goiás, o estado do Mato Grosso do Sul teve um aumento de
aproximadamente 4 pontos (57,92), mas ainda se mantém com o segundo
melhor resultado. Ademais, este estado apresentou uma diminuição na
heterogeneidade de desempenho em relação ao período anterior.
186
Gráfico 7: Rendimento em matemática por estado em novembro de 2000
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
Em 2001, os escores voltam a aumentar, crescendo, em geral, a uma taxa
superior às anteriores. Uma porcentagem inferior a 10% dos alunos, possui
rendimento menor que 50 no estado de Goiás, onde também é possível notar
uma pequena variabilidade dos escores, o que indica que os alunos deste
estado são mais homogêneos quanto a um bom desempenho. Mato Grosso do
Sul, apesar de também possuir rendimentos altos, é recorrentemente o estado
de maior variabilidade, sendo que seus alunos apresentam grande amplitude
em termos de rendimento. Assim, pode-se dizer que alguns desses alunos não
compartilham da maior eficiência notada no estado.
187
Gráfico 8: Rendimento em matemática por estado em novembro de 2001
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
As medianas dos escores mantiveram-se relativamente estáveis, sofrendo
acréscimo muito pequeno entre 2001 e 2002. Esta foi a primeira rodada em
que os escores não apresentaram uma tendência positiva clara. A única
mudança mais expressiva foi o aumento verificado nos estados de maior
desempenho, Mato Grosso do Sul (65,20) e Goiás (64,50). A situação de
Pernambuco torna-se novamente mais distinta daquela encontrada nos outros
estados, porque os escores de seus alunos permaneceram praticamente
estagnados (59,76), enquanto os rendimentos nos demais estados
aumentaram, ainda que pouco, aprofundando o hiato que já existia, mas que se
mostrava menor no ano anterior.
188
Gráfico 9: Rendimento em matemática por estado em novembro de 2002
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
100
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
No ano de 2003, cessa a tendência positiva de crescimento dos escores e os
rendimentos sofrem uma forte queda, exceto no Mato Grosso do Sul (67,30). O
valor das medianas decresce, assim como a proporção de alunos com escore
acima de 50.
Nesta rodada da pesquisa, vale ressaltar o diferencial ocorrido entre os estados
de melhor desempenho, Mato Grosso do Sul (67,30) e Goiás (64,57). Apesar
de o estado goiano vir apresentando escores superiores, a diferença em
relação ao segundo colocado era pequena, e por vezes quase inexistente,
como foi o caso do ano anterior. Entretanto, em 2003, o desempenho dos
alunos do estado do Mato Grosso do Sul foi o único a melhorar, enquanto os
rendimentos dos alunos goianos decresceram, ainda que a uma taxa mais
suave que a percebida nos demais estados.
189
Gráfico 10: Rendimento em matemática por estado em novembro de 2003
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
100
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
Na análise por turno, no período de abril de 1999, a única mediana com valor
inferior a 50 é a do turno intermediário (49,05). Nesta etapa, os turnos
apresentam-se pouco diferenciados entre si e os escores possuem
variabilidade semelhante. Ainda assim, o turno da tarde apresenta o melhor
desempenho (52,36), enquanto o turno da manhã possui cerca de 50%
(50,66%) dos alunos com escore abaixo de 50.
É possível perceber ainda que nos turnos da tarde e da manhã há uma maior
variabilidade dos escores dos alunos cuja pontuação é inferior a mediana de,
respectivamente, 50,6 e 52,3. Isso permite concluir que o desempenho dos
alunos com escore inferior a 50 é mais heterogêneo, podendo conter
rendimentos significativamente baixos, a despeito do melhor posicionamento
destes dois turnos. O intermediário, ao contrario, apesar de ser o pior entre os
três turnos, é o mais homogêneo deles.
190
Gráfico 11: Rendimento em matemática por turno em abril de 1999
Turno
TardeIntermediarioManhã
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
Assim, como na análise por estado, ao controlar os escores por turno, verifica-
se a mesma tendência de crescimento. Isso pode ser percebido pelo aumento
do valor das medianas – manhã (53,42), intermediário (52,41) e tarde (54,17),
no período de novembro de 1999. Nesta etapa, os turnos da manhã e da tarde
apresentam resultados muito semelhantes, sendo a maior variabilidade dos
escores do turno da tarde a principal diferença entre eles.
Entretanto, no turno da manhã, é notável a diferença de variabilidade entre os
escores dos alunos que se encontram abaixo e acima da mediana (53,42). No
primeiro caso, os escores apresentam grande heterogeneidade, enquanto os
alunos de desempenho superior são mais homogêneos quanto ao rendimento.
O mesmo ocorre no turno intermediário, que apresenta grande diferença de
variabilidade nos escores dos alunos localizados abaixo e acima da mediana
(52,41).
191
Gráfico 12: Rendimento em matemática por turno em novembro de 1999
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
Conforme é possível notar no gráfico 13, o desempenho entre os turnos torna-
se mais equiparado no ano 2000. Há crescimento dos escores em todos os
turnos, mas este se dá a uma taxa mais acentuada no turno intermediário,
reduzindo o hiato existente entre este horário e os demais. Ao contrário do que
foi dito na análise do período anterior, aqui a variabilidade dos escores se
inverte, sendo visivelmente maior entre os alunos cujo rendimento é superior à
mediana, principalmente no turno da manhã.
192
Gráfico 13: Rendimento em matemática por turno em novembro de 2000
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005).
Em 2001, ocorre um grande aumento nos escores de todos os turnos, o maior
até aqui. Este aumento ocorre a uma taxa maior para os turnos intermediário e
matutino do que para o turno vespertino, de forma que o desempenho entre
eles torna-se mais próximo – manhã (61,76), intermediário (61,11) e tarde
(61,39).
É relevante ressaltar que, nesta rodada da pesquisa, o desempenho dos
alunos do turno da manhã supera o dos alunos do turno da tarde, até aqui em
melhor posição. Entretanto, como em todos os turnos a mediana possui valores
pouco acima de 60, isto parece indicar não haver diferença significativa entre
os turnos, neste período. Por fim, a variabilidade volta a ser maior entre os
alunos com rendimentos abaixo da mediana nos três turnos.
193
Gráfico 14: Rendimento em matemática por turno em novembro de 2001
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
Em 2002, os escores dos alunos do turno da manhã apresentam um maior
aumento (passando de 61,76 para 63,33), enquanto os rendimentos dos alunos
dos turnos vespertino e intermediário têm aumentos provavelmente não
significativos. Isso faz com que o hiato entre o turno vespertino e matutino se
aprofunde, seguindo o processo iniciado no ano anterior.
194
Gráfico 15: Rendimento em matemática por turno em novembro de 2002
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
100
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
A última rodada da pesquisa não apresenta uma tendência clara para o
comportamento dos escores, sendo que cada turno segue uma trajetória
distinta. Em especial, o turno matutino, apresenta uma pequena elevação em
sua mediana (63,53). Estes movimentos, no entanto, são marginais e parecem
não representar mudanças significativas, sendo possível considerar constante
o desempenho dos alunos do turno matutino entre 2002 e 2003. O mesmo
pode-se dizer com relação aos rendimentos do turno intermediário.
Dessa forma, para estes dois turnos é possível notar uma estabilidade no final
da pesquisa, o que é coerente com a hipótese de retornos decrescentes de
rendimento ao longo do tempo, tendendo à estabilidade no final do processo.
Entretanto, isso não ocorre no turno da tarde. Entre 2002 e 2003, ocorre uma
queda nos rendimentos dos alunos do turno vespertino, de forma que este
passa a figurar em uma colocação inferior até mesmo à do turno intermediário.
195
Gráfico 16: Rendimento em matemática por turno em novembro de 2003
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
100
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005).
Os resultados apresentados a seguir referem-se aos escores equalizados
obtidos pelos alunos de 4º a 8º série, nas provas de português aplicadas entre
abril de 1999 a novembro de 2003.
196
Tabela 5 Escore equalizado médio e desvio padrão em português por estado
Ano Estados Abr-99 Nov-99 2000 2001 2002 2003
RO 48,99 48,27 54,43 55,83 56,30 58,28
(8,92) (9,79) (8,83) (9,07) (10,24) (11,05)
PA 50,78 48,90 54,00 57,07 55,99 59,57
(8,44) (9,46) (9,17) (8,53) (9,67) (10,00)
PE 47,69 46,16 52,54 54,67 53,70 57,84
(9,28) (10,01) (9,30) (9,17) (10,14) (10,83)
SE 49,99 49,38 55,46 56,78 56,10 59,59
(9,06) (9,81) (9,06) (9,16) (10,39) (10,89)
MS 50,54 50,93 56,36 58,12 61,04 65,82
(8,94) (10,22) (9,34) (9,10) (9,81) (9,26)
GO 52,71 51,61 56,59 58,27 58,97 62,55
(8,46) (10,20) (9,01) (8,64) (9,84) (9,94)
Fonte: Cedeplar/ Inep (2005)
Gráfico 17: Escores equalizados médios das provas de português
Abr-99
nov/99
nov/00
nov/01nov/02
nov/03
45
50
55
60
65
Período
Esco
re M
édio
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005)
197
Conforme a tabela 5 e o gráfico 17, é possível notar que o estado de
Pernambuco apresenta o pior desempenho médio em todo histórico da
pesquisa, além de contar com a maior variabilidade dos escores em
praticamente todos os anos. Ao contrário, os estado do Mato Grosso do Sul e
Goiás se alternaram na posição de melhor escore médio.
Em praticamente todos os estados, não se verifica uma tendência sempre
crescente do escore médio, uma vez que em alguns períodos, em geral, entre
abril e novembro de 1999 e entre 2001 e 2002, ocorre uma queda desses
escores. Por estar em uma escala comparável, espera-se que o escore
equalizado médio cresça ao longo do tempo, de forma a refletir os ganhos de
aprendizagem do aluno com o passar dos anos, o que não acontece, conforme
dito anteriormente, entre todos os períodos analisados por estado.
Tabela 6 Escore equalizado médio e desvio padrão em português por turno
Ano Turno Abr-99 Nov-99 2000 2001 2002 2003 Manhã 49,7 48,7 54,3 57,2 58,2 62,2
(9,1) (10,1) (9,2) (8,7) (9,9) (10,2)
Intermediário 49,9 48,3 52,8 56,5 56,3 62,7 (8,5) (9,2) (9,6) (8,5) (9,2) (8,9)
Tarde 50,7 49,7 55,1 56,5 56,3 59,6 (8,9) (10,2) (9,2) (9,3) (10,5) (10,8)
Fonte: Cedeplar/ Inep (2005)
198
Gráfico 18: Escores equalizados médios das provas de português
Abr-99
nov/99
nov/00
nov/01 nov/02
nov/03
47
49
51
53
55
57
59
61
63
Período
Esco
re M
édio
Manhã Intermediário Tarde Fonte: Cedeplar/ Inep (2005)
A mesma tendência sempre crescente não pode ser vista na análise por turno.
Nas primeiras rodadas da pesquisa, o turno vespertino se destaca como o de
maior desempenho, apresentando também a maior variabilidade dos escores.
Entretanto, a partir do ano 2001, esta colocação é tomada pelo turno da
manhã, que desde então apresenta a maior taxa de crescimento dos escores
até novembro de 2002, sendo ultrapassada pela taxa de crescimento do turno
intermediário entre 2002 e 2003. Contudo, o turno da manhã é o único a não
apresentar queda, tendendo sempre a um crescimento ao longo do tempo,
após novembro de 1999.
199
Tabela 7 Percentual de alunos com rendimento em português igual ou superior a 50 por estado
Ano Estado Abr/1999 Nov-99 2000 2001 2002 2003
RO 638,0 461 1260,0 1165,0 782,0 668,0 % 47,4 43,2 72,0 75,3 71,7 76,7
PA 1584,0 1104 2397,0 2758,0 1788,0 1715,0 % 57,2 46,4 71,1 81,5 72,2 81,4
PE 1091,0 864 2338,0 2514,0 1760,0 1665,0 % 40,9 36,3 63,5 70,8 62,4 73,6
SE 666,0 438 1060,0 897,0 650,0 623,0 % 52,4 48,9 76,7 78,3 72,1 78,3
MS 1226,0 1066 1816,0 1994,0 1782,0 1579,0 % 55,0 53,4 77,8 82,3 85,4 93,9
GO 1523,0 1078 2329,0 2683,0 2249,0 2065,0 % 65,0 58,0 79,1 84,6 81,2 87,7
Fonte: Cedeplar/ Inep (2005)
A trajetória do desempenho dos alunos pode ser vista também através da
tabela 7, que mostra o percentual de alunos cujo escore é igual ou superior a
50. É possível notar a mesma troca de posições verificada através da média
por estado, em que Goiás e Mato Grosso do Sul se alternavam na posição de
melhor desempenho. Ao final da pesquisa, ambos os estados possuíam mais
de 87% dos alunos com escore acima da média. No estado do Pará, ocorreu
uma das maiores quedas na proporção dos alunos com desempenho
satisfatório entre os anos 2001 e 2002. Aliás, essa tendência de queda no
rendimento só não ocorreu no estado do Mato Grosso do Sul.
200
Gráfico 19: Percentual de alunos com rendimento em português igual ou superior a 50 por estado
Abr-99
nov/99
nov/00
nov/01
nov/02
nov/03
30
40
50
60
70
80
90
Período
Perc
entu
al
RO PA PE SE MS GO
Fonte: Cedeplar/ Inep (2005)
Tabela 8 Percentual de alunos com rendimento em português igual ou superior a 50 por turno
Ano Turno Abr-99 Nov-99 2000 2001 2002 2003 Manhã 3358,0 2616,0 4234,0 4979,0 3929,0 3845,0
% 51,7 46,4 71,0 81,3 78,5 86,1
Intermediário 409,0 284,0 612,0 479,0 292,0 237,0 % 51,6 45,2 66,1 80,2 73,4 89,4
Tarde 2961,0 2111,0 6354,0 6553,0 4790,0 4233,0 % 55,5 48,9 74,1 77,1 71,1 79,2
Fonte: Cedeplar/ Inep (2005)
201
Gráfico 20: Percentual de alunos com rendimento em português igual ou superior a 50 por turno
Abr-99
nov/99
nov/00nov/01
nov/02
nov/03
40
50
60
70
80
90
Período
Perc
entu
al
Manhã Intermediário Tarde
Fonte: Cedeplar/ Inep (2005)
A análise por turno, apresentada na tabela 8 e gráfico 20, mostra um
comportamento dos escores semelhante ao percebido na abordagem por
estados. Há uma queda no período inicial e um posterior crescimento da
proporção dos alunos com escore igual ou superior a 50, seguido de nova
queda nesta proporção a partir do ano 2000 para o turno da tarde e a partir de
2001 para os demais. Inicialmente, o melhor desempenho é encontrado entre
os alunos do turno da tarde, cerca de 55% dos alunos que freqüentam a escola
no turno vespertino obtiveram desempenho igual ou superior a 50. A partir de
2001, esta posição de destaque passa para o turno da manhã, uma vez que a
queda de desempenho neste turno se dá a uma taxa mais lenta que os demais
até 2002. Entre 2002 e 2003, a maior taxa de crescimento é observada no
turno intermediário, que chega a ultrapassar até mesmo o rendimento do turno
matutino em novembro de 2003.
Com o objetivo de verificar o comportamento ao longo do tempo dos escores
obtidos pelos alunos, e o desempenho em conjunto dos mesmos, a análise
segue com a utilização de gráficos no formato de boxplot.
202
Gráfico 21: Rendimento em português por estado em abril de 1999
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Como é possível observar no gráfico 21, o estado com pior desempenho é
novamente Pernambuco, com mediana de aproximadamente 47 (46,96),
resultado abaixo do critério arbitrário utilizado, para efeito comparativo, como
média satisfatória (50). É interessante observar que nesta rodada inicial as
medianas variam de 46,96, em Pernambuco a 54 pontos no estado de Goiás.
Nas posições intermediárias encontram-se Rondônia (48,99), Sergipe (51,29),
Mato Grosso do Sul (52,07) e Pará (52,33). Pode-se dizer que a variação entre
os rendimentos dos estados é parecida, exceto para os estados de
Pernambuco e Goiás, que apresentam as maiores variabilidades.
203
Gráfico 22: Rendimento em português por estado em novembro de 1999
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Em novembro de 1999, ocorre uma queda geral nos escores dos alunos, de
forma que somente os estados de Goiás e Mato Grosso do Sul permanecem
com a mediana acima de 50, respectivamente, 53,36 e 51,86. Os estados
permanecem parecidos com o período anterior, quanto à variabilidade dos
escores, de forma que os estados de Goiás e Pernambuco continuam a
apresentar uma maior variabilidade nos rendimentos de seus alunos.
204
Gráfico 23: Rendimento em português por estado em novembro de 2000
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Em 2000, os escores começam a crescer. Nos estados que vinham
apresentando desempenho inferior, este crescimento fez com que estes
estados- Pernambuco (com mediana igual a 54,02), Rondônia (54,49) e Pará
(54,49) - apresentassem resultados mais próximos e superiores a 50. Assim,
pode-se dizer que os estados de Rondônia e Pernambuco apresentaram uma
melhora considerável, que permitiu uma aproximação dos resultados desses
dois estados ao quadro visto no Pará e Sergipe (55,30), até então superiores a
eles.
No estado de Goiás, a mediana ultrapassa 56 (56,69), sendo que pouco mais
de 20% dos alunos obtiveram escores inferiores a 50. Mato Grosso do Sul,
apresenta posição muito semelhante à do estado de Goiás, pois além do
aumento da mediana para 56,11, o estado consegue manter cerca de 78% dos
alunos acima do rendimento satisfatório e diminuir a heterogeneidade de
desempenho em relação ao período anterior.
205
Gráfico 24: Rendimento em português por estado em novembro de 2001
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Em 2001, os escores, continuam crescendo, mas, em geral, a taxas
decrescentes, com exceção do estado de Rondônia (54,49). O estado de Goiás
apresenta mediana de torno de 60 (59,47) e também uma pequena
variabilidade dos escores, indicando que os alunos deste estado são mais
homogêneos quanto a ter um bom desempenho. Em situação muito
semelhante, encontra-se Mato Grosso do Sul, que também possui rendimentos
altos, caracterizado por uma mediana de 59,11. Pode-se dizer ainda que este
estado mantém uma variabilidade muito próxima à do estado de Goiás,
situação semelhante à observada no período anterior.
206
Gráfico 25: Rendimento em português por estado em novembro de 2002
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
No ano de 2002, grande parte das medianas dos escores apresentaram leve
queda, como aquelas observadas nos estados do Pará (55,68), Pernambuco
(53,51) e Sergipe (56,12). Por outro lado, o maior aumento no desempenho foi
observado em Mato Grosso do Sul (62,61), que chega a ultrapassar o
rendimento de português em Goiás (60,22). Outra mudança percebida foi a
diminuição da variabilidade dos escores médios, em especial, nos estados de
Pará e Sergipe e, seu aumento no estado de Mato Grosso do Sul.
Apesar do decréscimo apresentado nas medianas de PA, PE e SE ter sido
pequeno, esta foi a segunda rodada em que os escores, em geral, não
apresentaram uma tendência positiva clara. O rendimento de Pernambuco
(53,51) torna-se novamente mais distante daqueles observados em outros
estados.
207
Gráfico 26: Rendimento em português por estado em novembro de 2003
Estado
GOMSSEPEPARO
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005)
No ano de 2003, os rendimentos aumentam consideravelmente. O valor das
medianas cresce em todos os estados atingindo em Rondônia
aproximadamente 61 pontos (60,50), nos estados do Pará e de Sergipe
ultrapassa o marco de 62 (62,04 e 62,55, respectivamente), em Pernambuco
fica em torno de 60 (59,75) e nos estados de Goiás e do Mato Grosso do Sul
ultrapassa 63 (63,31 e 66,37 pontos, respectivamente).
Nesta rodada da pesquisa, observa-se ainda um maior diferencial entre os
estados de melhor desempenho, Mato Grosso do Sul (66,37) e Goiás (63,31).
Apesar de o estado goiano vir apresentando escores superiores, a diferença
em relação ao segundo colocado, não chegou a ultrapassar 2,5 pontos entre
2001 e 2002. Entretanto, entre 2002 e 2003, a diferença de desempenho entre
os estados do Mato Grosso do Sul e de Goiás chega a ultrapassar 3 pontos.
208
Gráfico 27: Rendimento em português por turno em abril de 1999
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Na análise por turno, não há uma única mediana com valor inferior a 50 em
abril de 1999. Nesta etapa, os turnos apresentam-se pouco diferenciados entre
si e os escores possuem variabilidade semelhante. Ainda assim, o turno da
tarde apresenta o melhor desempenho (52,15). É possível perceber ainda que
nos turnos da tarde e da manhã há uma maior variabilidade dos escores dos
alunos cuja pontuação é inferior a mediana, indicando que o desempenho dos
alunos com escore menor que a média é mais heterogêneo nestes turnos, que
podem conter rendimentos mais baixos, a despeito do melhor posicionamento
destes dois turnos. O intermediário, ao contrário, apesar de ser o pior entre os
três turnos, é o mais homogêneo deles.
209
Gráfico 28: Rendimento em português por turno em novembro de 1999
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Como na análise por estado, ao controlar os escores por turno verifica-se a
mesma tendência de decrescimento. Isso pode ser percebido pela queda do
valor das medianas, todas próximas, porém com valores inferiores a 50. Assim,
em novembro de 1999, todos os turnos apresentam medianas inferiores à
média e variabilidade mais homogênea que a observada no período anterior. É
mantida a posição superior do turno da tarde, seguido pela da manhã e pelo
intermediário, respectivamente.
210
Gráfico 29: Rendimento em português por turno em novembro de 2000
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Conforme é possível notar no gráfico 29, o desempenho entre os turnos torna-
se bem próximo no ano de 2000, de forma que todos atingem por volta de 54,5
pontos na mediana – manhã (54,54), intermediário (54,22) e tarde (54,92). Há
crescimento dos escores em todos os turnos. A respeito da variabilidade, ela é
maior entre os alunos cujo rendimento é superior, em especial, no turno da
tarde.
211
Gráfico 30: Rendimento em matemática por turno em novembro de 2001
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Em 2001, verifica-se um aumento nos escores dos turnos, menor que o
observado no período anterior. Entre os turnos, este aumento foi menor para o
turno vespertino. É relevante ressaltar que nesta rodada da pesquisa, o
desempenho dos alunos do turno da manhã (56,93) supera o dos alunos do
turno da tarde (55,57), até então em melhor posição. O turno intermediário
mantém o pior rendimento (55,08). Por fim, a variabilidade é claramente maior
entre os alunos com rendimentos superiores à mediana para os três turnos.
212
Gráfico 31: Rendimento em matemática por turno em novembro de 2002
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o90
80
70
60
50
40
30
20
Fonte: Cedeplar/ Inep (2005)
Em 2002, os escores dos alunos não apresentam aumento, porém o turno da
manhã é o único a apresentar crescimento atingindo uma mediana de 58,89.
Isso faz com que o hiato entre o turno da manhã e os demais se aprofunde.
Entretanto os turnos intermediário e da tarde praticamente apresentam a
mesma posição, com, respectivamente, as seguintes medianas, 55,95 e 55,93.
213
Gráfico 32: Rendimento em matemática por turno em novembro de 2003
Turno
TardeIntermediárioManhã
Esc
ore
equa
lizad
o
90
80
70
60
50
40
30
Fonte: Cedeplar/ Inep (2005)
Na última rodada da pesquisa, em 2003, há um crescimento no rendimento de
todos os três turnos. O turno da manhã atinge uma mediana de
aproximadamente 63 pontos (63,28), enquanto o turno intermediário apresenta
uma mediana de 63,4, valor levemente superior ao do turno matutino. O turno
da tarde permanece na última posição com rendimento mediando de 62,19.
Assim, o turno intermediário passa a apresentar o maior valor da mediana,
seguido pela manhã e tarde. Dessa forma, é possível notar uma instabilidade
nas posições dos turnos. A tarde que liderou até 2000, em 2003 inverteu sua
posição com o turno intermediário, que tinha os piores escores no início do
processo. Contudo, essas diferenças parecem não representar mudanças
significativas.
Em resumo, considerando todo o período analisado, o que se pode afirmar é
que o nível dos rendimentos por turno em todos os estados cresceu
consideravelmente, passando de valores medianos próximos a 50 para valores
superiores a 60.
214
ANÁLISE DE TRAJETÓRIAS SEGUNDO OS ESCORES CLÁSSICOS E EQUALIZADOS
APRESENTAÇÃO
Será apresentada a seguir a trajetória dos escores médios dos alunos, por ano
e disciplina. Será chamado de trajetória completa o percurso daqueles que
participaram de todas as rodadas da pesquisa, e trajetória incompleta o
percurso daqueles que não estiveram presentes em todos os períodos.
ANÁLISE DO ESCORE CLÁSSICO
Ao analisar o comportamento dos escores médios dos alunos ao longo do
tempo, espera-se verificar que os retornos marginais da escolaridade sejam
positivos e decrescentes, ou seja, o escore do aluno cresce a cada ano de
estudo, mas a taxas declinantes. Assim, seria esperado ainda que as curvas
representativas das trajetórias dos alunos, quanto a seus escores médios entre
abril de 1999 e novembro de 2003, fossem mais inclinadas no inicio, tendendo
à estabilidade no final. Entretanto, conforme é possível notar no gráfico 1, isso
não ocorreu. As curvas que representam as trajetórias completa e incompleta,
grafadas a partir das médias dos escores clássicos, são instáveis, chegando a
apresentar retornos negativos em alguns pontos. É possível que isso tenha
ocorrido devido à utilização do escore em sua forma clássica ou “bruta”. Os
escores clássicos não estão numa mesma escala e, por isso, não deveriam ser
comparados diretamente. Ao contrário, os escores equalizados, que estão
215
numa mesma escala, apresentam trajetórias mais bem comportadas,
reiterando a importância do processo de equalização na análise dos resultados.
As trajetórias traçadas a partir dos escores clássicos de matemática mostram
que o maior retorno ocorre entre abril e novembro de 1999. Depois disso, o
ganho médio propiciado pelo próximo ano de escolaridade é pequeno, sendo
quase nulo para os alunos de trajetória completa. A partir de 2001, as
trajetórias assumem uma tendência descendente, como se o ano adicional de
estudo tivesse efeito negativo sobre os escores dos alunos. Esse
comportamento é semelhante para os alunos que completaram ou não a
trajetória da pesquisa, uma vez que as duas curvas são bem parecidas. A
diferença fundamental entre elas se dá no nível do escore, mais elevado para
os alunos de trajetória completa.
Tabela 1: Estatísticas descritivas dos escores clássicos de matemática dos alunos que não completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Tabela 2: Estatísticas descritivas dos escores clássicos de matemática dos alunos que completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10654 236,421 64,301 50 380Nov/1999 8699 260,827 74,226 50 450
2000 13507 269,243 67,946 50 4502001 13293 246,670 54,004 50 4302002 10204 247,974 61,731 50 4502003 8114 234,066 54,480 50 400
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1987 255,586 61,441 80 380Nov/1999 1987 284,872 72,858 50 450
2000 1987 286,734 68,055 50 4402001 1987 256,417 55,474 50 4202002 1987 257,162 63,231 100 4502003 1987 239,225 54,844 80 400
216
Gráfico 1: Média dos escores clássicos de matemática por trajetória
Abril/1999
Nov/1999
2003
20022001
2000
200,000
230,000
260,000
290,000
320,000
Período
Esco
re m
édio
Completa Incompleta Fonte: Cedeplar/ Inep (2005).
Os escores clássicos de português também não se comportaram conforme o
esperado. Entre as duas rodadas do ano de 1999 ocorre uma queda no valor
dos escores médios dos alunos que completaram ou não a trajetória da
pesquisa. A partir de novembro de 1999 até 2001, as trajetórias apresentam
tendência positiva e o escore médio aumenta a taxas decrescentes. Na
segunda metade da pesquisa, entretanto, entre 2001 e 2002, os escores
voltam a diminuir, e só retomam a tendência anterior no ano seguinte.
Tabela 3: Estatísticas descritivas dos escores clássicos de português dos alunos que não completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10649 286,261 74,571 50 450Nov/1999 8607 252,799 76,579 50 450
2000 13488 278,217 75,495 50 4502001 13246 294,185 79,175 50 4502002 10171 272,948 74,746 60 4502003 8110 283,822 82,885 50 450
217
Tabela 4: Estatísticas descritivas dos escores clássicos de português dos alunos que completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Gráfico 2: Média dos escores clássicos de português por trajetória
Abril/1999
Nov/1999
2003
2002
20012000
200,000
230,000
260,000
290,000
320,000
Período
Esco
re M
édio
Completa Incompleta
Fonte: Cedeplar/ Inep (2005).
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1975 306,512 71,465 50 450Nov/1999 1975 276,952 76,626 50 450
2000 1975 298,684 74,048 50 4502001 1975 306,446 78,250 70 4502002 1975 281,635 76,677 100 4502003 1975 290,289 85,367 50 450
218
ANÁLISE DOS ESCORES EQUALIZADOS
Conforme o que foi dito anteriormente, os escores equalizados possibilitam
uma comparação mais confiável dos escores recebidos em provas e momentos
diferenciados. Isso pode ser confirmado através da análise dos escores médios
equalizados de português e matemática.
As tabelas 5 e 6 e o gráfico 3 apresentam as trajetórias completa e incompleta
de matemática.
Tabela 5: Estatísticas descritivas dos escores equalizados de matemática dos alunos que não completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Tabela 6: Estatísticas descritivas dos escores equalizados de matemática dos alunos que completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10654 49,738 8,954 24,750 74,565Nov/1999 8699 51,572 8,654 27,988 76,575
2000 13507 55,978 8,093 31,096 79,3822001 13293 60,502 7,850 34,600 85,0012002 10204 61,874 9,268 37,348 88,9162003 8114 61,592 11,125 35,351 89,611
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 1987 52,415 8,516 25,957 74,565Nov/1999 1987 54,409 8,290 27,988 76,575
2000 1987 58,024 7,986 31,096 79,3822001 1987 61,988 7,924 34,600 83,0192002 1987 63,108 9,313 38,126 88,9162003 1987 62,576 11,305 36,048 89,611
219
Gráfico 3: Média dos escores equalizados de matemática por trajetória
Nov/1999
2003 20022001
2000
Abr/1999
40,000
45,000
50,000
55,000
60,000
65,000
Período
Esco
re m
édio
Completa Incompleta Fonte: Cedeplar/ Inep (2005).
Como pode ser observado, as curvas apresentam comportamento mais
próximo ao esperado. Os escores apresentam tendência crescente com o
passar dos anos, explicitando os ganhos de aprendizado possibilitados pela
permanência na escola por mais um ano, exceto pelo período entre 2002 e
2003. Além disso, o crescimento dos escores médios se dá a uma taxa
decrescente em quase todo o trajeto, conforme o que seria esperado.
As tabelas 7 e 8 e o gráfico 4 apresentam as trajetórias completa e incompleta
de português.
Tabela 7: Estatísticas descritivas dos escores equalizados de português dos alunos que não completaram a trajetória de abril/1999 a novembro/2003
Fonte: Cedeplar/ Inep (2005).
Nº de casos Média Desvio Padrão Mínimo MáximoAbril/1999 10649 49,774 8,994 24,809 73,739Nov/1999 8607 48,524 10,060 25,350 76,865
2000 13488 54,358 9,277 28,621 78,5552001 13246 56,601 9,024 30,675 78,0182002 10171 56,846 10,222 30,986 82,9722003 8098 60,653 10,551 33,514 83,392
220
Tabela 8: Estatísticas descritivas dos escores equalizados de português dos alunos que completaram a trajetória de abril/1999 a novembro/2003
N º de casos M édia D esvio Padrão M ínim o M áxim oA bril/1999 1975 52,310 8,617 24,810 73,739N ov/1999 1975 51,720 9,925 25,350 76,865
2000 1975 56,880 8,986 28,620 78,5552001 1975 57,980 8,776 31,470 78,0182002 1975 58,040 10,456 32,410 82,9722003 1975 61,460 10,782 33,510 83,392
Trajetória C om pleta
Fonte: Cedeplar/ Inep (2005).
Gráfico 4: Média dos escores equalizados de português por trajetória
Nov/1999
2003
200220012000
Abr/1999
40,00
45,00
50,00
55,00
60,00
65,00
Período
Esco
re m
édio
Completa Incompleta Fonte: Cedeplar/ Inep (2005).
As trajetórias de português apresentam decréscimo no valor dos escores
médios somente entre abril e novembro de 1999, nos demais períodos o
percurso segue com tendência positiva. A taxa de crescimento dos escores
médios é decrescente de novembro de 1999 a 2002, sendo que é praticamente
nula entre 2001 e 2002. Entre 2002 e 2003, entretanto, a taxa de crescimento
dos escores é significativamente superior a dos períodos anteriores, ao
contrário da relativa estabilidade que era esperada.
221
COMPARAÇÃO DAS TRAJETÓRIAS A PARTIR DOS ESCORES BRUTOS E DOS ESCORES EQUALIZADOS
Os escores médios apresentaram trajetória mais condizente com o esperado
em sua forma equalizada que na forma bruta, como pode ser visto nos gráficos
referentes a ambas as trajetórias apresentadas até aqui. Em português, o
escore em sua forma bruta dá origem a trajetórias inconstantes, o que só pode
ser percebido com a observação dos resultados equalizados. As trajetórias
brutas apresentam dois pontos de decréscimo dos escores médios, os
períodos entre abril e novembro de 1999 e 2001 e 2002, enquanto na forma
equalizada nota-se apenas uma pequena diminuição no primeiro período,
sendo que esta é quase nula para os alunos de trajetória completa. Além disso,
ao contrário do resultado clássico, o escore médio equalizado permanece
constante entre 2001 e 2002.
Em matemática, a diferença provocada pela equalização dos dados nas
trajetórias fica ainda mais evidente. Os escores médios clássicos apresentam
crescimento mais abrupto que os equalizados, o que fica claro principalmente
com a observação de abril e novembro de 1999 nos gráficos correspondentes.
Além disso, as trajetórias clássicas apresentam dois pontos de decréscimo,
2000 e 2001 e 2002 e 2003. Já nas trajetórias equalizadas só ocorre
diminuição do escore médio entre 2002 e 2003, mas esta se dá de forma suave
(ao contrário do que ocorre com os valores brutos) sendo quase nula para os
alunos de trajetória incompleta.
222
1.2. – ANÁLISE FINAL DOS DETERMINANTES DO RENDIMENTO ESCOLAR, COM BASE NOS DADOS
LONGITUDINAIS (4ª A 8ª SÉRIES)
APRESENTAÇÃO
Esta seção é composta de dois relatórios, Qualidade dos itens e processos de
equalização para as provas de português e matemática, de acordo com a
Teoria de Resposta ao Item - TRI, e do relatório de Estimação de modelos
hierárquicos longitudinais nas disciplinas de matemática e de português.
Vale ressaltar que os gráficos e as tabelas referentes ao relatório “Qualidade
dos itens e processos de equalização para as provas de português e
matemática de acordo com a Teoria de Resposta ao Item (TRI)” podem ser
encontrados no anexo da Ação 1.3. Estes gráficos e tabelas estão em anexo
em função da grande quantidade de gráficos e das dificuldades relacionadas à
formatação que impossibilitaram a inserção destes gráficos e tabelas no corpo
do relatório.
223
QUALIDADE DOS ITENS E PROCESSOS DE EQUALIZAÇÃO PARA AS PROVAS DE PORTUGUÊS E
MATEMÁTICA DE ACORDO COM A TEORIA DA RESPOSTA AO ITEM (TRI)
APRESENTAÇÃO
Esta seção do relatório pretende, de início, avaliar a qualidade dos itens
aplicados pela pesquisa “Avaliação de Desempenho: Fatores Associados” a
alunos que cursavam a quarta série em 1999, acompanhando-os até 2003,
quando estes deveriam estar cursando a oitava série. Entretanto, durante este
período, algumas informações se perderam, por exemplo, por transferência,
evasão ou reprovação. Por outro lado, novos alunos passaram a participar da
amostra, quando transferidos para as escolas selecionadas pela pesquisa.
Antes, porém, é necessário introduzir a teoria por meio da qual será avaliada a
qualidade dos itens e, posteriormente, colocar todos os rendimentos numa
mesma escala através da equalização. Isto será feito através da Teoria da
Resposta ao Item.
224
INTRODUÇÃO À TEORIA DA RESPOSTA AO ITEM (TRI)
Uma das principais características da Teoria da Resposta ao Item (TRI) é
considerar como elementos centrais os itens, e não a prova como um todo,
conforme considerava a Teoria Clássica do Teste. Vale lembrar que o escore
clássico é simplesmente a soma dos itens que o aluno acertou, enquanto o
escore da Teoria da Resposta ao Item leva em conta além do número de itens
respondidos corretamente pelo aluno, as características dos itens que ele
acertou. Isto garante uma medida mais apurada da habilidade ou proficiência
do aluno.
No mesmo sentido, ANDRADE; TAVARES &VALLES (2000, p.3) afirmam qual
a principal vantagem da TRI :
“Uma das grandes vantagens da TRI sobre a Teoria Clássica é
que ela permite a comparação entre populações, desde que
submetidas a provas que tenham alguns itens comuns, ou
ainda, a comparação entre indivíduos da mesma população
que tenham sido submetidos a provas totalmente diferentes.
Isto porque uma das principais características da TRI é que ela
tem como elementos centrais os itens, e não a prova como um
todo”
Esses mesmos autores definiram a Teoria da Resposta ao Item “... como um
conjunto de modelos matemáticos que procuram representar a probabilidade
de um indivíduo dar uma certa resposta a um item como função dos
parâmetros do item e da habilidade do respondente” (ANDRADE; TAVARES
&VALLES, 2000, p.7).
225
O modelo, geralmente, mais adotado é o logístico de três parâmetros, dado
pela seguinte equação:
)(1
1)1()(iji bDaiij
eccP
−−+−+= θθ
com i=1,2,...,n e j=1, 2,...,m, em que:
• θj representa a habilidade do j-ésimo aluno;
• P(θj) é a probabilidade de um aluno j com habilidade θj responder
corretamente o item i, denominada Função de Resposta ao Item (FRI)
ou Curva Característica do Item (CCI);
• D é um valor de escala igual a 1,7, quando se deseja que a função
logística forneça resultados semelhantes aos da função de ogiva normal;
• bi é o parâmetro de dificuldade do item i, medido na mesma escala da
habilidade e correspondendo ao ponto onde a inclinação da CCI é
máxima. Representa a habilidade necessária para que a probabilidade
de acerto ao item i seja igual a (1+ci)/2. Como a habilidade está
normalmente distribuída, o valor da dificuldade, em geral, varia entre -2
e +2 (HAMBLETON, 1993). Valores altos indicam itens difíceis;
• ai é o parâmetro de discriminação do item i, com valor proporcional à
inclinação da CCI no ponto bi. Quanto maior a inclinação, maior o valor
da discriminação do item. Conforme HAMBLETON (1993), os valores do
parâmetro a, em geral, variam entre 0 e 2. Valores baixos de
discriminação indicam que o item não consegue separar os alunos em
grupos de habilidades distintos. Por outro lado, valores altos implicam na
ocorrência de dois grupos: os que possuem habilidade abaixo do
parâmetro b e os que possuem acima. É importante ressaltar que
226
valores de a muito elevados também não conseguem separar os
indivíduos em grupos ou intervalos de habilidades;
• ci é probabilidade de alunos com baixa habilidade responderem
corretamente o item i, ou seja, é a probabilidade de acerto do item i ao
acaso, quando o aluno não sabe a resposta deste item.
Como exemplo, veja a curva característica do item 291 da prova de
matemática em abril de 1999.
Gráfico 1: Curva característica do item 29 da prova
de matemática em abril de 1999
De acordo com os critérios estabelecidos na seção de interpretação dos
resultados da qualidade dos itens, o item acima pôde ser bem classificado, 1 Este gráfico da Curva Característica do Item, assim como o de sua curva de informação, também se encontra em anexo, junto aos gráficos referentes a todos os itens de matemática e de português em todos os períodos de aplicação das provas. A numeração dos gráficos, em anexo, leva em conta os itens comuns e os itens que foram retirados no processo de estimação e equalização.
0
0.2
0.4
0.6
0.8
1.0
-3 -2 -1 0 1 2 3
c
b
Habilidade
Prob
abili
dade
a = 1.041 b = 0.315 c = 0.076
Fonte: Cedeplar/ Inep (2005)
227
porque ele apresentou o parâmetro de discriminação superior a 0,75
(ANDRADE, TAVARES & VALLES, 2000), o parâmetro de dificuldade no
intervalo [-2;2] e o parâmetro de acerto casual próximo a zero.
Uma outra função que tem um importante papel na avaliação de itens, a função
de informação do item, mostra a contribuição de cada item na estimação da
habilidade, em qualquer ponto de sua escala. Para o modelo logístico de três
parâmetros a função de informação do item é dada por (HAMBLETON, 1993):
2)(7,1)(7,1
2
]1][[)1(89,2)(
iiii babai
iii eec
caI −−− ++−
= θθθ (i=1, 2, ...., n)
A função de informação do item 29 da prova matemática realizada em abril de
1999 pode ser vista na figura abaixo:
Gráfico 2: Curva de Informação do Item 29 da prova de matemática realizada em abril de 1999
-3 -2 -1 0 1 2 30
0.5
1.0
1.5
2.0
2.5
Habilidade
Info
rmaç
ão
Fonte: Cedeplar/ Inep (2005)
228
Este item apresenta uma distribuição aproximadamente normal em relação à
sua curva de informação, dando uma maior contribuição à estimação das
habilidades dos alunos por volta do escore 0,3. Dito de outra forma, este item
apresenta a informação máxima, quando o escore é igual a 0,3,
correspondendo ao valor do parâmetro de dificuldade (b).
Assim, o item 29 da prova de matemática realizada em abril de 1999, dá uma
maior contribuição à estimação das habilidades dos alunos com escore 0,3,
contudo a informação pode ser considerada relevante entre [-1, 1], o que pode
ser confirmado pela inclinação da curva característica do item, conforme
Gráfico 1. Esta confirmação pode ser verificada, porque, neste intervalo, a
curva característica do item apresenta a maior inclinação e, portanto, os
maiores valores para o parâmetro de discriminação (a).
Vale ressaltar que, em anexo, podem ser vistas as tabelas, contendo os
valores dos parâmetros de discriminação, de dificuldade e de acerto casual,
assim como os seus erros padrões correspondentes, por ano e disciplina. Em
anexo, também, são apresentados os gráficos das curvas características e de
informação de todos os itens para as disciplinas de matemática e de português.
A numeração dos itens e dos gráficos, em anexo, leva em conta os itens
comuns - questões que se repetem em provas distintas com o objetivo de
viabilizar a comparação do desempenho dos alunos - assim como aqueles
itens que foram retirados durante o processo de estimação e equalização.
229
PROCESSOS DE EQUALIZAÇÃO
De início, é importante definir o termo equalizar que significa equiparar ou
tornar comparável. No caso da TRI, equalizar significa estimar, na mesma
métrica, parâmetros de itens pertencentes a provas diferentes ou habilidades
de alunos de grupos distintos. Em outras palavras, equalizar é estimar
parâmetros de itens e habilidades numa escala comum, tornado os itens e as
habilidades comparáveis (KOLEN & BRENNAN, 1995; ANDRADE, TAVARES
& VALLES, 2000).
Quando diferentes testes são estimados separadamente, não se pode garantir
que os parâmetros dos itens destes testes estejam na mesma escala, porque a
posição da escala depende do grupo de respondentes considerado. Em outras
palavras, no processo de estimação, a escala de dificuldade do item tem um
centro arbitrário, em geral, sendo a média estimada da habilidade ou a média
da dificuldade do item, fazendo com que a posição da escala dependa do
grupo de estudantes considerado. Assim, isto é especialmente importante em
estudos longitudinais em que se espera que alunos de séries mais adiantadas
tenham um nível mais elevado de habilidade, justificando a importância em se
equalizar as proficiências estimadas.
Existem dois tipos de equalização: a equalização via população, também
conhecida por equalização horizontal, e a equalização via itens comuns, a
denominada equalização vertical (ANDRADE, TAVARES & VALLES, 2000).
A equalização via população, ou equalização horizontal, envolve equalizar
escores obtidos em testes com aproximadamente o mesmo nível de
dificuldade, por exemplo, quando mais de uma versão do teste é aplicada a
alunos de um mesmo nível, ou seja, de uma mesma série. Neste tipo de
equalização, quando um único grupo de estudantes é submetido a provas
distintas, para se garantir que os parâmetros de itens estão na mesma escala,
basta estimar conjuntamente estes itens.
Por outro lado, a equalização via itens comuns, ou a equalização vertical,
permite que se coloque em uma mesma escala escores de testes de diferentes
níveis de dificuldade, por exemplo, escores obtidos por alunos de diferentes
230
níveis educacionais, respondendo a testes diferentes, mas com a presença de
itens comuns. Neste tipo de equalização, os itens comuns servem de ligação
entre as populações envolvidas, garantindo que seus parâmetros estejam
numa mesma escala.
Para o estudo longitudinal do desenvolvimento cognitivo dos alunos da quarta
série em 1999 até a oitava série em 2003, que contou com a presença de item
comum, foi realizada a equalização vertical, estando os resultados de
desempenho em cada avaliação referenciados a uma mesma escala, a de abril
de 1999. Assim, tanto para a disciplina de matemática quanto para a de
português, o período de referência escolhido para a realização da equalização
foi abril de 1999, considerado o baseline da pesquisa.
Considerando a TRI, para o caso da pesquisa longitudinal “Avaliação de
Desempenho: Fatores Associados”, poder-se-ia utilizar dois tipos de
equalização vertical, a posteriori e a priori.
A equalização a posteriori, como o próprio nome sugere, é realizada após a
estimação, separadamente, de dois conjuntos de itens que foram submetidos a
duas populações de interesse. Tendo estimativas em duas diferentes escalas
para os itens comuns, pode-se estabelecer algum tipo de relação que permita
colocar os parâmetros de um dos conjuntos de itens na escala do outro. Vários
são os métodos, que se baseiam em relações lineares entre os parâmetros de
um mesmo item medidos em escalas diferentes, por meio dos quais se pode
realizar a equalização a posteriori, como por exemplo, os conhecidos métodos
Média-Desvio e Média-média (veja KOLEN & BRENNAN, 1995; ANDRADE,
TAVARES & VALLES, 2000).
As equalizações a priori são realizadas durante o processo de estimação ou
calibração dos itens e segundo ANDRADE, TAVARES & VALLES (2000) são
mais eficazes do que as equalizações a posteriori, uma vez que permitem
estimações com menores erros. Além disto, elas exigem um menor número de
itens comuns do que as equalizações a posteriori. Em geral, os autores têm
sugerido pelo menos 6 itens comuns entre 2 provas de 30 itens, quando a
equalização é feita durante a calibração.
231
Diante do exposto, em especial, das vantagens da realização da equalização a
priori, adotou-se este método para a equalização dos dados da pesquisa.
Assim, os parâmetros de itens puderam ser estimados conjuntamente por meio
do software Bilog-mg2 e, portanto, as habilidades puderam ser estimadas em
uma mesma escala de referência (abril de 1999), para que se pudesse
prosseguir às análises descritivas e à estimação de modelos hierárquicos
longitudinais na determinação de fatores associados ao rendimento escolar dos
alunos durante o período pesquisado.
2 Este software permite a estimação conjunta dos itens de todos os períodos, de modo a colocar a habilidade de todas as séries numa mesma escala, tornado, assim, todos os escores dos alunos comparáveis, por meio do processo de equalização vertical.
232
PROCEDIMENTOS E INTERPRETAÇÃO DOS RESULTADOS DA CALIBRAÇÃO, DA QUALIDADE DOS ITENS E DA EQUALIZAÇÃO
Os procedimentos utilizados para a calibração dos itens de matemática e
português estão descritos nas Tabelas 1 e 3, respectivamente, assim como os
motivos pelos quais alguns itens foram retirados até a obtenção da calibração
final. O processo de calibração dos itens foi realizado em vários passos,
estratégia utilizada para manter o maior número possível de itens nas provas. A
qualidade dos itens foi avaliada considerando-se, principalmente, os valores
referentes às estimativas dos parâmetros de discriminação e de dificuldade e,
ainda, os erros padrões (EP) destas estimativas.
Em resumo, os critérios considerados para a retirada dos itens foram: a)
correlação bisserial3 negativa; b) item com 100% de acerto; c) parâmetro de
discriminação menor do que 0,4; d) erros padrões referentes aos parâmetros
de discriminação ou de dificuldade maiores que 0,3 (BAKER, 2001).
Depois do primeiro passo, ou seja, após a primeira calibração sem a retirada
de itens, os parâmetros dos itens foram sendo novamente re-estimados por
meio do software Bilog-mg, que estima conjuntamente os itens de todos os
períodos e coloca a habilidade de todas as séries numa mesma escala,
fazendo com que todos os escores dos alunos sejam comparáveis, por meio do
processo de equalização.
Os primeiros resultados apresentados abaixo são da disciplina de matemática.
Antes, porém, vale ressaltar que as provas de abril 1999, nas duas disciplinas,
foram consideradas como escala de referência para os processos de
calibração e equalização.
3 Indicada para medir a associação entre um item e o teste.
233
Tabela 1: Procedimentos para a calibração e retirada de itens, referentes às provas de matemática nos períodos de abril de 1999 a novembro de 2003
Passo Item retirado Motivo 1 nenhum O processo de estimação não convergiu
113 Correlação bisserial negativa
429 100% de acerto
617 Correlação bisserial negativa 631 100% de acerto
2
637 Correlação bisserial negativa
305 306 320 333 417 601
3
620
Todos com parâmetro de discriminação menor do que 0.400
107 413 EP > 0.300 para os parâmetros a ou b 4
206 EP ≈ 0.25 para o parâmetro a EP > 0.15 para o parâmetro b
211 415
5
606
Todos com parâmetro de discriminação menor do que 0.400
6 426 a < 0.400 Fonte: Cedeplar/ Inep (2005)
Vale destacar, ainda que, somente um item comum (305) foi eliminado da
calibração final, conforme pode ser visto na tabela 1. Este item aparece nas
aplicações de 2000 e 2001, conforme mostra a tabela 2, que apresenta um
esquema longitudinal com a numeração dos itens comuns das provas de
matemática de abril de 1999 a novembro de 2003.
Na tabela 2, as questões estão numeradas por ordem e ano, sendo que o
primeiro dígito diz respeito ao ano e os dois últimos, à posição do item na
prova. Os itens comuns se mantêm com o mesmo número que recebem na
primeira prova em que aparecem, mesmo quando se repetem em provas
seguintes. Voltando ao item 305, ele aparece pela primeira vez na posição 5 da
prova de novembro de 2000. Em seguida, este item se repete na posição de
número 2 da prova de novembro de 2001 (no lugar do item 402).
234
Tabela 2: Esquema longitudinal dos itens comuns das provas de matemática de abril/1999 a novembro/2003
Itens Abr/99 Nov/99 2000 2001 2002 2003 1 101 201 109 401 501 601 2 102 109 302 305 502 602 3 103 203 303 403 503 603 4 104 204 204 213 504 511 5 105 110 305 309 422 501 6 106 206 306 406 506 606 7 107 207 218 119 507 607 8 108 208 308 408 508 608 9 109 209 309 409 432 432 10 110 210 219 303 406 534 11 111 211 311 324 511 515 12 112 212 312 312 303 537 13 113 213 223 413 513 613 14 114 214 119 210 514 532 15 115 215 315 415 515 303 16 116 216 316 334 420 616 17 117 134 317 417 517 617 18 118 218 318 418 518 618 19 119 219 230 419 519 619 20 120 220 320 420 434 620 21 121 221 321 219 521 621 22 122 222 128 422 522 622 23 123 223 323 423 523 623 24 124 119 324 424 312 526 25 125 225 114 425 403 527 26 126 226 326 426 526 626 27 127 227 327 427 527 627 28 128 228 124 428 528 628 29 129 229 329 429 423 629 30 130 230 330 430 530 630 31 131 128 331 431 531 631 32 132 104 332 432 532 632 33 133 233 333 433 309 633 34 134 234 334 434 534 634 35 135 122 335 435 535 635 36 136 236 336 436 536 636 37 114 337 437 537 637 38 124 338 438 538 638 39 126 339 439 539 639 40 240 340 440 540 640
Fonte: Cedeplar/ Inep (2005)
235
Para português, os mesmos procedimentos foram utilizados, tanto que o
processo de calibração foi realizado passo a passo, buscando manter o maior
número de itens possível para a calibração final, conforme mostra a Tabela 3.
Tabela 3: Procedimentos para a calibração e retirada de itens, referentes às
provas de português nos períodos de abril de 1999 a novembro de 2003 Passo Item retirado Motivo
1 nenhum O processo de estimação não convergiu 101 106 107 209 215
2
617
Todos com parâmetro de discriminação menor do que 0.400
203 3 213 EP > 0.300 para o parâmetro a
4 508 100% de acerto Fonte: Cedeplar/ Inep (2005)
É importante lembrar que seria possível tratar de formas diferentes itens
comuns que foram aplicados em mais do que duas avaliações, diante da
possibilidade do aluno memorizar a resposta correta. Por exemplo, o item
comum 307, conforme mostra a tabela 4, fez parte das provas de português a
partir de 2000, totalizando quatro participações nas provas do período abril de
1999 a novembro de 2003.
Uma das possíveis formas de se tratar o item 307 seria considerá-lo somente
nas avaliações de 2000 e 2001, eliminando-o das avaliações de 2002 e 2003.
Entretanto, a opção escolhida foi a de manter o item 307 no processo de
estimação, porque não se espera que o resultado sofresse muitas mudanças
caso este item fosse retirado da aplicação de 2002 e/ou 2003.
236
Tabela 4: Esquema longitudinal dos itens comuns das provas de português de abril/1999 a novembro/2003
Itens Abr/99 Nov/99 2000 2001 2002 2003 1 101 201 124 401 501 601 2 102 124 302 402 502 323 3 103 203 126 403 330 603 4 104 204 304 315 418 604 5 105 132 222 405 505 526 6 106 206 306 406 506 606 7 107 207 307 407 507 607 8 108 208 224 240 508 429 9 109 209 228 409 509 609 10 110 210 310 410 510 409 11 111 211 131 411 511 411 12 112 212 312 119 401 612 13 113 213 313 413 513 613 14 114 214 314 414 514 614 15 115 215 315 415 515 615 16 116 109 123 307 516 616 17 117 126 317 417 409 617 18 118 119 122 418 518 618 19 119 219 319 419 519 619 20 120 220 320 317 307 620 21 121 221 240 421 521 621 22 122 222 119 422 522 622 23 123 223 323 423 523 623 24 124 224 324 122 524 624 25 125 225 325 425 525 625 26 126 226 326 426 526 626 27 127 123 327 427 527 529 28 128 228 328 337 429 331 29 129 229 329 429 529 629 30 130 230 330 430 530 523 31 131 231 331 431 531 631 32 132 232 332 304 532 307 33 133 110 333 433 533 633 34 134 234 334 434 331 634 35 135 235 335 323 335 317 36 136 118 336 436 411 636 37 237 337 437 317 637 38 122 338 438 538 638 39 125 339 439 539 639 40 240 340 330 540 640
Fonte: Cedeplar/ Inep (2005)
237
Conforme dito anteriormente, a qualidade dos itens pode ser avaliada pelos
valores das estimativas dos parâmetros e de seus erros padrões (EP), que
podem ser vistos nas tabelas, em anexo, contendo os valores dos parâmetros
e de seus erros padrões, para a discriminação, a dificuldade e o acerto casual
por ano e disciplina. Em anexo, também são apresentados gráficos das curvas
características e de informação de todos os itens, permitindo que a inspeção
visual auxilie no processo de avaliação dos itens.
Por sua vez, a avaliação das provas, considerando todos os períodos, foi feita
por meio da distribuição dos valores dos parâmetros dos itens, em especial, o
da discriminação, além da interpretação da curva de informação do teste, tanto
para a disciplina de português quanto para a de matemática. Vale relembrar
que as provas de português e de matemática são compostas por quarenta itens
nas rodadas de novembro de 1999 a novembro de 2003. Em abril de 1999, as
provas continham apenas trinta e seis itens. Entretanto, após a equalização, os
itens comuns passaram a ser considerados uma única vez, enquanto outros
tiveram que ser retirados das provas por apresentarem, em especial, baixo
valor para o parâmetro de discriminação. Dessa forma, a prova de matemática
contém, ao todo, cento e sessenta e sete itens válidos, e a de português, cento
e setenta e sete.
A tabela 5 mostra a distribuição dos valores dos parâmetros de discriminação
nas provas de matemática e de português.
Tabela 5: Distribuição dos valores do parâmetro de discriminação nas provas de matemática e de português
Discriminação Matemática Português 0.4 ≤ a < 0.5 14 9
8,38% 5,08% 0.5 ≤ a < 0.75 37 46
22,16% 25,99% ≥ 0.75 116 122
69,46% 68,93% Total 167 177
100% 100% Fonte: Cedeplar/Inep (2005)
238
Os resultados da distribuição, referentes ao total de itens diferentes aplicados
nas provas de matemática, podem ser analisados por meio da tabela 5. Esta
tabela mostra que um percentual de aproximadamente 8% (8,38%) dos itens
aplicados nas provas de matemática apresentou discriminação entre 0,4 e 0,5.
Para trinta e sete itens, o valor do parâmetro de discriminação ficou entre 0,5 e
0,75, o que corresponde a aproximadamente 22% (22,16%) do total de itens
aplicados. Um percentual em torno de 70% (69,46%) dos itens apresentou
parâmetro igual ou superior a 0,75.
Quanto aos resultados de português, a tabela 5 mostra que as provas contêm,
ao todo, cento e setenta e sete itens diferentes. Destes, cerca de 5% (5,08%)
apresentaram parâmetro de discriminação com valores entre 0,4 e 0,5. Para
aproximadamente um quarto (25,99%) dos itens de português, os valores dos
parâmetros de discriminação foram estimados entre 0,5 e 0,75. A grande
maioria dos itens, cerca de 70% (68,93%) obteve parâmetros de discriminação
com valor igual ou superior a 0,75.
Tabela 6: Distribuição dos valores do parâmetro de dificuldade nas provas de matemática e português
Fonte: Cedeplar/Inep (2005)
Dificuldade Matemática Português b ≤-2 1 1
0,59% 0,56% -2 < b ≤ -1 2 4
1,19% 2,25% -1< b ≤ 0 22 23
13,17% 12,99% 0 < b < 1 42 76
25,14% 42,93% 1≤ b < 2 43 61
25,74% 34,46% b ≥ 2 57 12
34,13% 6,78% Total 167 177
100% 100%
239
Quanto à distribuição dos valores dos parâmetros de dificuldade dos itens por
disciplina, nas provas de matemática, de acordo com a tabela 6, em torno de
um quarto (25,14%) apresentou dificuldade entre 0 e 1, quarenta e três itens
(25,74%), entre 1 e 2 e cinqüenta e sete (34,13%), maiores que 2. Os outros
itens obtiveram parâmetros com menor dificuldade, sendo que vinte e dois
(13,17%) apresentaram dificuldade entre -1 e 0, dois itens (1,19%), entre -2 e -
1 e,apenas, um item (0,59%), valor inferior a -2.
Dos cento e setenta e sete parâmetros de dificuldade estimados para os itens
de português, setenta e seis (42,93% do total de itens) têm valor entre 0 e 1,
sessenta e um (34,46%), entre 1 e 2 e doze (6,77%) são maiores ou iguais a 2.
Considerando os itens restantes, aqueles com menor dificuldade, vinte e três
(13% do total de itens) obtiveram parâmetros estimados com valor entre -1 e 0,
quatro (2,25%), entre -2 e -1. Apenas um item obteve parâmetro de dificuldade
abaixo de -2, o que corresponde a, apenas, um percentual de 0,56% do total de
itens aplicados.
Diante do exposto, de uma forma geral, pode-se dizer que a maioria dos itens
apresenta discriminação desejada (>=0.75), tanto em matemática quanto em
português (cerca de 70% nas duas disciplinas). No caso da probabilidade de
acerto casual, a maioria dos itens também apresentou valores adequados (por
volta de 0,25). Quanto à dificuldade, os itens contemplam parte considerável
da escala de habilidade, o que pode ser visto por meio das distribuições
apresentadas acima e por meio das curvas de informação dos testes (Gráficos
3 e 4). Isto está de acordo com o que, em geral, é esperado de uma prova:
praticamente toda a escala de habilidade deve ser considerada. Entretanto, as
curvas de informação das duas disciplinas como um todo indicam que os itens
são mais informativos na estimação de escores de alunos que apresentam uma
maior habilidade.
240
Gráfico 3: Curva Total de Informação do Teste de Matemática de Abril/1999 a Novembro/2003
Fonte: Cedeplar/ Inep (2005)
241
Gráfico 4: Curva Total de Informação do Teste de Português de Abril/1999 a Novembro/2003
Fonte: Cedeplar/ Inep (2005)
Fonte: Cedeplar/ Inep (2005)
242
ESTIMAÇÃO DE MODELOS HIERÁRQUICOS LONGITUDINAIS PARA AS DISCIPLINAS DE
MATEMÁTICA E DE PORTUGUÊS
APRESENTAÇÃO
De início, vale ressaltar que a utilização de dados longitudinais têm muito a
contribuir com as avaliações da qualidade do ensino, uma vez que permite a
análise da trajetória da proficiência dos alunos no tempo e, portanto, a
estimação adequada, em especial, do efeito-escola, com a utilização da
abordagem clássica de modelos hierárquicos longitudinais.
De uma forma geral, a literatura da proficiência educacional, incluindo
especialmente áreas como Economia e Educação, estabelece, em geral, três
níveis de fatores aos quais a proficiência está associada: nível do aluno, nível
da turma e nível da escola (HANUSHEK, 2002; WILLMS & SOMERS, 1999;
SOARES, CÉSAR & MAMBRINI, 2001). Isto se deve ao fato de, os dados
educacionais apresentarem uma estrutura hierárquica, estando os alunos
aninhados em turmas e estas aninhadas em escolas.
Entretanto, essa literatura não é consensual, nem quanto aos fatores
associados à proficiência, nem quanto às definições do efeito-escola e nem
quanto às suas formas de operacionalização (WILLMS, 2000; TOOD &
WOLPIN, 2003; FERRÃO & FERNANDES, 2003).
O termo efeito-escola foi definido, por FERRÃO & FERNANDES (2003), como
a proporção da variância total que está associada à variância entre as escolas,
ou seja, o quanto da variação do rendimento escolar entre os alunos é
explicado por diferenças existentes entre as escolas que eles freqüentam. Nos
modelos estimados a seguir, o efeito-escola pode estar associado ao status
inicial de desempenho, à taxa linear média de crescimento no desempenho do
243
aluno de um período para o seguinte ou à taxa não linear média de
crescimento.
Considerando a necessidade de se conhecer melhor os fatores associados à
proficiência escolar, visando contribuir de alguma forma para a melhoria do
sistema educacional brasileiro, este relatório pretende investigar quais são os
fatores associados à proficiência educacional da quarta à oitava série do
ensino fundamental no norte, no nordeste e no centro-oeste brasileiros que,
conforme SAEB (2004), são as regiões do Brasil com os piores resultados em
termos de desempenho.
244
INFORMAÇÕES SOBRE O BANCO DE DADOS E AS VARIÁVEIS UTILIZADAS NO PROCESSO DE ESTIMAÇÃO DOS FATORES ASSOCIADOS AO DESEMPENHO ESCOLAR NA DISCIPLINA DE MATEMÁTICA.
A base de dados utilizada nos modelos possui informações de escolas, alunos,
professores e diretores de seis Unidades da Federação: Pará (PA), Rondônia
(RO), Pernambuco, Sergipe (SE), Goiás (GO) e Mato Grosso do Sul (MS). Esta
base tem um desenho longitudinal para o acompanhamento de uma coorte de
alunos ao longo do tempo, com a principal finalidade de estimar os fatores
determinantes do desempenho escolar.
Esses dados correspondem a cinco anos de pesquisa em seis períodos
diferentes. A primeira e a segunda rodadas foram realizadas com alunos que
cursavam a 4ª série do ensino fundamental no ano de 1999, sendo a primeira
realizada em primeiro de Abril e a segunda, em primeiro de Novembro de1999.
A partir de 2000, as rodadas foram sempre realizadas em primeiro de
novembro do referente período. Assim, na terceira rodada em primeiro de
novembro de 2000 foram pesquisados os alunos da quinta série e assim,
sucessivamente até a sexta rodada em 2003 para os alunos da 8ª série.
Para estimar os modelos, optou-se por trabalhar com os alunos de trajetória
completa, ou seja, alunos que estiveram presentes ao longo de todas as seis
rodadas realizadas pela pesquisa. A Tabela 1 mostra algumas estatísticas
descritivas – o total de alunos, a média, o desvio padrão, o máximo e o mínimo
- para os alunos que completaram, ou não, a trajetória na disciplina de
matemática.
245
Tabela 1: Estatísticas descritivas dos alunos que completaram, ou não, a trajetória entre abril/1999 e novembro/2003 - Matemática.
Trajetória Completa Nº de alunos Média Desvio Padrão Mínimo Máximo
abril/99 1987 52,4 8,5 26,0 74,6 nov/99 1987 54,4 8,3 28,0 76,6 2000 1987 58,0 8,0 31,1 79,4 2001 1987 62,0 7,9 34,6 83,0 2002 1987 63,1 9,3 38,1 88,9 2003 1987 62,6 11,3 36,0 89,6
Trajetória Incompleta abril/99 10654 49,7 9,0 24,7 74,6 nov/99 8699 51,6 8,7 28,0 76,6 2000 13507 56,0 8,1 31,1 79,4 2001 13293 60,5 7,8 34,6 85,0 2002 10204 61,9 9,3 37,3 88,9 2003 8114 61,6 11,1 35,4 89,6
Fonte: Cedeplar/ Inep (2005)
Como se pode notar, por meio da Tabela 1, o número de alunos que
completaram a trajetória é bem menor, quando comparado ao número dos que
não estiveram presentes em alguma rodada da pesquisa.
Conforme já era esperado, o gráfico 1 mostra que o desempenho dos alunos
que participaram das seis rodadas é superior ao dos demais, uma vez que os
alunos que completaram a trajetória podem ter repetido no máximo até a 4ª
série. Entretanto, vale salientar que a estrutura das duas curvas é muito similar,
estando relativamente próximas ao que se espera de uma curva de
aprendizagem, ou seja, ganhos decrescentes ao longo do período com
tendência à estabilidade no final do processo.
246
Gráfico 1: Médias dos Escores Equalizados de Matemática segundo o tipo de trajetória
Abr-99
Nov-99
Nov-00
Nov-01
Nov-02 Nov-03
45
50
55
60
65
Períodos
Méd
ias
Trajetória incompleta Trajetória completa
Fonte: Cedeplar/ Inep (2005)
O software utilizado para estimar os modelos foi o HLM. Como este software
não aceita valores em branco (missings) nos arquivos de nível 2 e 3, houve
uma perda4 de 201 alunos e 30 escolas. Assim, o banco passou a contar com
1786 e 146 escolas. Como o software HLM somente identifica uma escola para
cada aluno, optou-se por retirar do banco alunos que mudaram de escola
durante a pesquisa. Assim, foram retirados também 35 alunos e 1 escola, de
forma que o banco final para a estimação dos fatores associados ao
desempenho em matemática totaliza 1751 alunos em 145 escolas.
A Tabela 2 mostra algumas estatísticas descritivas para as variáveis
quantitativas que foram consideradas na estimação dos modelos. A variável
sco, como era de se esperar, uma vez que tem uma distribuição normal com
média 50 e desvio padrão 10, apresentou, respectivamente, um mínimo de 25
e um máximo de 90 pontos. O número de horas-aula por dia variou entre 3,6 e 4 Para minimizar esta perda, foram “imputados” no questionário de alunos da oitava série os valores em branco. Assim, foram utilizados os questionários da sétima (2002) e sexta (2001) séries, sucessivamente, para tentar completar os valores em branco presentes no questionário da oitava série (2003).
247
7,4. Por sua vez, o menor tamanho médio de turma por escola foi de 21,56
alunos, enquanto o maior valor chegou a 51,38 alunos. No caso de percentual
de professores com curso superior a amplitude foi de 100%, indicando portanto
que em relação a este quesito, existe escola que não tem professor com curso
superior, em contraste com escola em que todos os professores apresentam
pelo menos curso superior.
Tabela 2: Estatísticas Descritivas das Variáveis Quantitativas Utilizadas na Estimação dos Modelos de Matemática
Variável Nº de Casos Média Desvio Padrão Mínimo MáximoEscore 10506 58,62 9,9 25,96 89,52
Horas-Aula 145 4,35 0,47 3,6 7,4 Tamanho da Turma 145 35,1 5,61 21,56 51,38
Docentes com Curso Superior 145 62,22 28,63 0 100 Fonte: Cedeplar/ Inep (2005)
O quadro 1 mostra a descrição das variáveis e suas categorias
correspondentes, utilizadas no processo de estimação dos modelos. Essas
variáveis estão divididas por níveis correspondentes aos modelos hierárquicos
longitudinais.
Assim sendo, o nível 1 contempla as habilidades dos alunos estimadas
(calibradas) e equalizadas, de acordo com a teoria da resposta ao item.
Posteriormente, esta variável resposta teve sua distribuição transformada numa
normal com média 50 e desvio-padrão 10. Além da variável resposta, no nível 1
também se encontram variáveis relacionadas ao tempo. Neste trabalho, essas
variáveis correspondem à série cursada e a uma transformação dessa variável,
série ao quadrado, para tentar captar a não linearidade do ganho no
desempenho relativo ao processo de aprendizagem.
No nível 2, encontram-se variáveis relacionadas a características familiares e
individuais, que se espera não sofrerem variações significativas com o tempo.
E por fim, o nível 3 compreende variáveis qualitativas e quantitativas
relacionadas às escolas. Vale ressaltar que as variáveis do terceiro nível foram
retiradas do censo escolar de 2001, com exceção da quadra que faz parte do
censo escolar do ano de 2000.
248
QUADRO 1 Variáveis consideradas na estimação dos modelos hierárquicos longitudinais
Nível 1 Variáveis Significado Categorias
sco Escore modificado = (escore equalizado x 10) + 50
serie Série
serie2 Série elevada ao quadrado
Nível 2 sexo Você é do sexo: 0 – Masculino 1 – Feminino
raca Você se considera: 0 – Não-branco 1 – Branco
livros Quantos livros há em sua casa? 0 – 20 ou menos 1 – Mais de 20
licão Você faz lição de casa? 0 – Não 1 – Sim
repetiu Já repetiu de ano alguma vez? 0 – Sim 1 – Não
mãe_ler Sua mãe sabe ler? 0 – Não 1 – Sim
pai_ler Seu pai sabe ler? 0 – Não 1 – Sim
abandonou Já abandonou a escola por pelo menos um ano?
0 – Sim 1 – Não
esc_pai Até que ano seu pai estudou?
0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo
esc_mae Até que ano sua mãe estudou?
0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo
Nível 3 horas-aula Número Médio de Horas-Aula Diária no Ensino Fundamental
tam_turma Número Médio de Alunos por Turma Total no Ensino Fundamental
doc_superior Percentual de Docentes com Curso Superior no Ensino Fundamental
bibliote Se a escola tem biblioteca. 0 – Não 1 – Sim
labcien Se a escola tem laboratório de ciências.
0 – Não 1 – Sim
labinfo Se a escola tem laboratório de informática.
0 – Não 1 – Sim
quadra Se a escola tem quadra. 0 – Não 1 – Sim
Fonte: Cedeplar/ Inep (2005)
249
Tabela 3: Freqüência absoluta e relativa do desempenho em matemática e dos possíveis fatores associados a ele.
Variável Categoria Freqüência Absoluta
Freqüência Relativa
masculino 768 43,90% sexo
feminino 983 56,10% não branco 1193 68,10%
raça branco 558 31,90%
até 20 livros 965 55,10% livros
mais de 20 livros 786 44,90% Não fazem 269 15,40%
lição Fazem 1482 84,60% Repetiu 531 30,30%
repetiu Não repetiu 1220 69,70%
Não completou o ensino fundamental. 271 15,50% escolaridade da mãe Pelo menos o ensino fundamental completo 1480 84,50%
Não completou o ensino fundamental. 352 20,10% escolaridade do pai Pelo menos o ensino fundamental completo 1399 79,90%
Sim 96 5,50% abandono
Não 1655 94,50% Não 103 5,90% mãe sabe ler Sim 1648 94,10% Não 90 5,10% pai sabe ler Sim 1661 94,90%
Menos de 50 1968 18,70% escore 50 ou mais 8538 81,30%
Não 62 42,80% quadra Sim 83 57,20% Não 110 75,90% laboratório de
informática Sim 35 24,10% Não 46 31,70% biblioteca Sim 99 68,30% Não 135 93,10% laboratório de ciências Sim 10 6,90%
4hs ou menos 34 23,40% Entre 4 e 5hs 107 73,80% Entre 5 e 6hs 2 1,40%
horas-aula
Mais que 6hs 2 1,40% Menor que 15 alunos 0 0,00% Entre 15 e 30 alunos 26 17,90% Entre 30 e 45 alunos 112 77,30%
tamanho da turma
Mais que 45 alunos 7 4,80% Menos de 25% 22 15,20%
Entre 25% e 50% 18 12,40% Entre 50% e 75% 47 32,40%
docentes com curso superior
Mais de 75% 58 40,00% Fonte: Cedeplar/ Inep (2005)
250
Conforme Tabela 3, variáveis que apresentaram acima de 90% de freqüência
para uma mesma categoria - conforme acontece com as variáveis mãe e pai
sabem ler, já abandonou a escola e presença de laboratório de ciências – não
foram utilizadas no modelo. Essa variabilidade baixa fez com que essas
variáveis, previamente testadas no modelo, fossem não significativas ou
apresentassem um sentido não esperado para seu coeficiente, como foi o
caso da variável laboratório de ciências.
Para a definição do calendário letivo, considerou-se que o ano letivo contém 10
meses, levando-se em conta as férias. Como a pesquisa tem sua primeira
rodada em primeiro de abril de 1999, esta será tomada como base (baseline).
A segunda rodada foi realizada em primeiro de novembro de 1999, oito meses
após a primeira. E todas as rodadas seguintes foram realizadas com um
intervalo de um ano. Para identificar cada período de acordo com os intervalos
entre as rodadas e usando como base abril de 1999 e o calendário com 10
meses, as rodadas foram classificadas da seguinte forma:
• Abr/ 1999 = 0 – base;
• Nov/1999 = 0,8 – referente aos 08 meses entre as rodadas;
• Nov/ 2000 = 1,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2001 = 2,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2002 = 3,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2003 = 4,8 – referente aos 10 meses letivos entre as
rodadas.
251
ESPECIFICAÇÃO TEÓRICA E RESULTADOS PARA O MODELO INCONDICIONAL
O primeiro modelo estimado foi o modelo incondicional, nomenclatura adotada
pelo livro HLM para informar que este modelo não apresenta nenhuma variável
preditora no nível 2 ou no nível 3, somente incluindo no nível 1, as variáveis
relacionadas ao tempo, série e série ao quadrado. Este modelo permite o
cálculo de estatísticas, por meio das quais é possível determinar o percentual
da variabilidade de π0 (status inicial médio de um aluno) , π1(taxa linear média
do crescimento do desempenho de um aluno), π2(taxa não-linear média de
crescimento de um aluno), que são devidos à variabilidade entre as escolas.
Na seção 2.1 abaixo, é apresentada a especificação teórica do modelo
incondicional, uma adaptação da especificação contida no livro de
RAUDENBUSH & BRYK (2002). Sendo assim, segue-se a mesma
nomenclatura para um modelo sem variáveis independente, exceto pelas
variáveis relativas ao tempo (série e série ao quadrado), presentes no nível 1.
A especificação teórica apresentada, a seguir ,contém a equação do modelo
completo e uma equação para cada um dos três níveis especificados
separadamente.
ESPECIFICAÇÃO TEÓRICA DO MODELO INCONDICIONAL
Modelo completo
Y=γ000+γ100(serie)+γ200(serie2)+[e+u00+r0+u10(serie)+r1(serie)+u20(serie)+r2(serie
2)]
Nível 1
Y= π0+π1(serie)+π2(serie2)+e
252
Nível 2
π0=β00+r0
π1=β10+r1
π2=β20+r2
Nível 3
β00=γ000+u00
β10=γ100+u10
β20=γ200+u20
em que:
Y é o desempenho de um aluno em sua escola num determinado período; γ000
representa o status inicial médio das escolas (Abril de 1999); β00 é o status
inicial médio de uma determinada escola:
β00=γ000+u00
π0 significa o status inicial médio de um determinado aluno:
π0=β00+r0
γ100 é a taxa linear média de crescimento anual das escolas; β10 é a taxa
linear média anual de crescimento de uma determinada escola; π1 representa
a taxa linear média de crescimento anual de determinado aluno:
π1=β10+r1
γ200 é a taxa não-linear média de crescimento anual das escolas; β20 significa a
taxa não-linear média anual de crescimento de uma determinada escola e π2 é
a taxa não-linear média de crescimento anual de determinado aluno:
π2=β20+r2
Os erros aleatórios e, rs e us são, respectivamente, termos aleatórios dos níveis
1,2 e 3.
253
Este tipo de modelo pressupõe independência entre os erros de nível 1, que
são normalmente distribuídos com média zero e variância constante σ2,
(RAUDENBUSH & BRYK, 2002). Contudo, para os erros dos níveis 2 e 3, o
pressuposto é de que eles sejam, respectivamente, dependentes. Vale, ainda,
ressaltar que, para esses mesmos autores, modelos deste tipo podem assumir
várias formas complexas de estrutura de erro.
RESULTADOS PARA O MODELO INCONDICIONAL
Modelo Completo
Y=51,35+4,78 (série) -0,50(serie2)+[e+u00+r0 + ((u10+ r1)(serie))+((u20+
r2)(serie2))]
Nível 1
Y= 51,35+u00+r0+(4,78+u10+r1(serie))+(-0,50+u20+r2(serie2))+e
Nível 2
π0=51,35+u00+r0
π1=4,78+u10+ r1
π2=-0,50+u20+r2
Nível 3
β00=51,35+u00
β10=4,78+u10
β20= -0,50+u20
A tabela 4 mostra os resultados da estimação do modelo incondicional e a
tabela 5, o cálculo do ganho médio anual do rendimento de um aluno de uma
série para outra.
254
Tabela 4: Resultados do Modelo Incondicional
Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,35 0,36 140,77 144 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 4,78 0,15 32,78 144 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,50 0,03 -15,12 144 0,000
Efeitos Aleatórios Comp. da variância
Desvio padrão
Estat. 2χ
Graus de liberdade Valor p
Nível 1 - e 24,21 4,92 - - -
Nível 2 (alunos dentro das escolas) Status inicial individual, r0 39,43 6,28 3937,21 1606 0,000
Taxa de aprendizagem anual individual, r1 2,58 1,61 1974,23 1606 0,000 Taxa não linear de aprendizagem anual individual, r2 0,18 0,43 2131,29 1606 0,000
Nível 3 (entre as escolas) Status médio das escolas, u00 12,90 3,59 538,69 144 0,000
Taxa de crescimento médio das escolas, u10 1,00 1,00 233,53 144 0,000 Taxa não linear de crescimento médio das escolas, u20 0,06 0,25 255,80 144 0,000
Fonte: Cedeplar/ Inep (2005)
255
De acordo com a Tabela 4, que mostra os resultados para o modelo
incondicional, a habilidade ou status inicial médio apresentado pelo aluno em
abril de 1999 foi de 51,35 pontos, numa escala de scores correspondente à
distribuição normal com média 50 e desvio padrão 10. Por sua vez, a taxa
linear média de crescimento no rendimento do aluno de uma série para outra
foi de 4,78 pontos, enquanto sua taxa não linear média de crescimento
apresenta um valor negativo de 0,50. Assim, pode-se dizer que, em média, um
aluno ganha 4,28 pontos no seu escore de uma série (ou período) para a
seguinte.
No final da Tabela 4 são apresentados os resultados referentes aos efeitos
aleatórios no modelo incondicional. Estes resultados sugerem que existe
variação aleatória significativa no status inicial médio, na taxas, linear e não
linear, médias de crescimento em ambos os níveis 2 e 3. Em outras palavras,
os efeitos aleatórios dos níveis 2 e 3 são significativamente diferentes de zero,
sendo, portanto, importantes na explicação do percentual da variabilidade do
status inicial, da taxa linear e da taxa não linear que pode ser explicado pela
variabilidade entre as escolas.
Assim, por meio do modelo incondicional, é possível calcular a porcentagem da
variação do status inicial que é explicada pela variabilidade entre as escolas,
conforme a equação (1)
(1) %65,2410043,3990,12
90,12100)()(
)(
000
00 ≅×+
=×+ rVaruVaruVar
em que, Var(u00) é a variância do status inicial médio entre as escolas; Var(r0) é
a variância do status inicial médio dentro das escolas.
Então, pode-se dizer que 24,65% da variação total do status inicial é explicada
pela variabilidade entre as escolas.
256
Por meio do modelo incondicional, também, é possível calcular a porcentagem
da variação da taxa linear de crescimento que é explicada pela variabilidade
entre as escolas. Essa porcentagem é dada conforme equação (2):
(2) %93,2710058,200,1
00,1100)()(
)(
110
10 ≅×+
=×+ rVaruVaruVar
em que, Var(u10) é a variância da taxa linear média de crescimento entre as
escolas; Var(r1) é a variância da taxa linear média de crescimento dentro das
escolas.
Assim, pode-se concluir que 27,93% da variação total da taxa linear média de
aprendizagem do aluno de uma série para a seguinte é explicada pela
variabilidade entre as escolas.
Através do modelo incondicional é possível, ainda, calcular a porcentagem da
variação da taxa não linear de crescimento que é explicada pela variabilidade
entre as escolas. Essa porcentagem é dada segundo a equação (3):
)3( %2510018,006,0
06,0100)()(
)(
220
20 ≅×+
=×+ rVaruVaruVar
em que, Var(u20) é a variância da taxa não linear média de crescimento entre
as escolas; Var(r2) é a variância da taxa não linear média de crescimento
dentro das escolas.
Então, um quarto (ou 25%) da variação total da taxa não linear média de
aprendizagem do aluno de uma série para a seguinte é explicada pela
variabilidade entre as escolas.
Portanto, essas três estatísticas são mais um meio para se confirmar a
importância da presença do nível 3 no modelo, ou seja, a importância da
variabilidade entre as escolas na explicação da variabilidade de cada um dos
três coeficientes presentes no nível 1- status inicial médio, taxa linear média de
crescimento e taxa não linear média de crescimento.
257
A Tabela 5 e o Gráfico 2 mostram os rendimentos médios acrescidos ao score
do aluno por período, ou seja, de uma série para a seguinte. Na coluna do
ganho marginal anual constante na Tabela 5, observa-se uma diminuição na
taxa de crescimento ao longo do tempo, o que vai ao encontro com o formato
esperado de uma curva de aprendizagem – taxas de crescimento cada vez
menores, tendendo à estabilidade no final do processo.
O gráfico 2 permite uma melhor visualização deste comentário, mostrando,
mais uma vez, que a curva estimada dos ganhos anuais apresenta estrutura
similar ao padrão de uma curva de aprendizagem típica. Assim, um aluno,
concluindo a quarta série, que possui um rendimento médio de 54,82 pontos
em novembro de 1999, alcança um rendimento médio de 60,78 pontos, ao
concluir a sexta série em novembro de 2001.
A partir deste período, o crescimento se torna bem menor, de forma que
concluindo a oitava série seu rendimento médio aumenta em aproximadamente
2 pontos em relação ao rendimento atingido na conclusão da sexta série,
enquanto o crescimento médio alcançado entre a quarta e a sexta séries é de
aproximadamente 6 pontos.
Tabela 5: Modelo Incondicional - Cálculo do ganho médio de rendimento de um aluno de uma série para outra
Modelo γ100 série γ200 série2 γ100 (série)+[γ200(série2)] Ganho anual
Ganho marginal por ano
γ000+Ganho anual (1) Rendimento médio
Abr/Nov99 4,78 0,80 -0,50 0,64 3,50 3,50 54,82 Nov99/00 4,78 1,80 -0,50 3,24 6,98 3,48 58,30 Nov00/01 4,78 2,80 -0,50 7,84 9,46 2,48 60,78 Nov01/02 4,78 3,80 -0,50 14,44 10,94 1,48 62,26 Nov02/03 4,78 4,80 -0,50 23,04 11,42 0,48 62,74
Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.
258
Gráfico 2: Escores médios de matemática dos alunos de trajetória completa com os valores estimados de acordo com o modelo
incondicional
nov/99
nov/00
nov/01
nov/02 nov/03
abr-9950
55
60
65
70
Período
Esco
res
Escore modelado
O gráfico 3 apresenta uma comparação entre as médias dos escores dos
alunos de trajetória completa, mostradas na tabela 1, e os escores obtidos para
os alunos por meio da estimação do modelo incondicional, apesar das perdas
de alunos e/ou escolas, em função da organização do banco de dados para a
estimação dos modelos. Os resultados obtidos através da estimação dos
modelos estão mais próximos daqueles esperados de uma curva de
aprendizagem – ganhos positivos, mas a taxas decrescentes tendendo à
estabilidade no final do processo - quando comparados aos resultados da
análise descritiva.
Fonte: Cedeplar/ Inep (2005)
259
Gráfico 3: Comparação entre as médias dos escores de matemática dos alunos de trajetória completa e os valores estimados de acordo
com o modelo incondicional
nov/99
nov/00
nov/01
nov/02 nov/03
abr-9950
55
60
65
70
Período
Esco
res
Escore modelado Escore descritivo
Fonte: Cedeplar/ Inep (2005)
260
PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL, SUAS ESPECIFICAÇÕES E RESULTADOS
PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL
O procedimento adotado para a estimação do modelo final foi esquematizado
da seguinte forma. No primeiro passo, foram acrescentadas variáveis do nível
3, uma a uma, no modelo incondicional. No segundo passo, foi estimado um
modelo, contendo as variáveis que se apresentaram significativas no primeiro
passo. No terceiro passo, um procedimento análogo ao do nível 3 foi utilizado
para se estimar o nível 2 do modelo, de forma que as variáveis referentes a
esse nível foram consideradas, uma a uma. No caso da primeira variável se
mostrar significativa, entraria uma segunda variável juntamente com a primeira
e, assim, sucessivamente, até que o modelo final fosse estimado.
ESPECIFICAÇÃO TEÓRICA DO MODELO FINAL
Modelo Completo
Y=γ000+γ001(tam_turma)+γ010(sexo)+γ020(lição)+γ030(repetiu)+[γ100(serie)+γ110(se
xo)(serie)]+[γ200(serie2)+γ210(sexo)(serie2)+γ220(lição)(serie2)+γ230(repetiu)(seri
e2)]+[e+u00+r0+u10(serie)+r1(serie)+u20(serie2)+r2(serie2)]
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
261
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0
π1=β10+β11(sexo)+r1
π2=β20+β21(sexo)+β22(lição)+β23(repetiu)+r2
Nível 3
β00=γ000+γ001(tam_turma)+u00
β01=γ010
β02=γ020
β03=γ030
β10=γ100+u10
β11=γ110
β20=γ200+u20
β21=γ210
β22=γ220
β23=γ230
RESULTADOS DO MODELO FINAL
Modelo Completo
Y=55,26 –0,18(tam_turma) –1,05(sexo)+1,47(lição)+2,57(repetiu) +[5,11(serie)-
0,57(sexo)(serie)]+[0,66(serie2)+0,09(sexo)(serie2)+0,06(lição)(serie2)+0,09(re
petiu)(serie2)]+[e+u00+r0+u10(serie)+r1(serie)+u20(serie2)+r2(serie2)]
262
Nível 2
π0=55,26–0,18(tam_turma)+u00 -1,05(sexo)+1,47(lição)+2,57(repetiu)+r0
π1=5,11+u10 –0,57(sexo)+r1
π2=-0,66+u20+0,09(sexo)+0,06(lição) +0,09(repetiu)+r2
Nível 3
β00=55,26 –0,18(tam_turma)+u00
β01=-1,05
β02=1,47
β03=2,57
β10=5,11+u10
β11=-0,57
β20=-0,66+u20
β21=0,09
β22=0,06
β23=0,09
A tabela 6 apresenta os resultados da estimação do modelo final. No modelo
final, a variável sexo se mostrou significativa na explicação do status inicial
médio do aluno, da taxa linear média de crescimento e da taxa não linear
média de crescimento.
Conforme a Tabela 6, pode-se dizer que se o aluno for homem, não fizer lição
e tiver repetido de ano, ele apresentará, em média, uma habilidade ou status
incial de 55,26-0,18(tam_turma). Considerando que o tamanho médio da turma
em sua escola seja de 35 alunos, seu status inicial médio seria de 48,96. Sua
taxa linear média de crescimento de aprendizagem entre as séries (ou
períodos) seria de 5,11 pontos. E, este aluno apresentaria, ainda, uma taxa
não linear média de crescimento de -0,66, totalizando, em média, um
crescimento de 4,45 (5,11-0,66) pontos no seu rendimento de um período para
o seguinte.
263
Comparando o mesmo caso para as mulheres, o sexo feminino apresentará um
status inicial médio inferior ao do sexo masculino em 1,05 pontos (47,91). A
taxa linear média de crescimento para as mulheres foi de 4,54 (5,11-0,57),
portanto, também, inferior àquela apresentada pelo sexo masculino. Contudo, o
sexo feminino apresenta uma taxa não linear de crescimento de –0,57 (-
0,66+0,09), sendo assim, menos negativa que a do sexo masculino. Entretanto
os resultados para esta taxa não são suficientes para que as mulheres
apresentem um desempenho superior ao dos homens.
Fazer lição aumenta o status médio do aluno em 1,47 pontos, assim como sua
taxa não linear de crescimento em 0,06 pontos. Resultado análogos foram
encontrado para a variável repetiu, indicando que não repetir de ano está
associado positivamente ao status médio do aluno, aumentando-o em 2,57
pontos. Por sua vez, a taxa não linear média de crescimento aumenta em 0,09,
caso o aluno não tenha repetido de ano. Conforme estes últimos resultados,
pode-se dizer que fazer lição de casa e não repetir de ano é importante para
que o aluno apresente um melhor rendimento escolar.
Assim, como não repetir de ano está associado positivamente a um melhor
desempenho escolar, este resultado está sugerindo que a repetência pode não
ser tão eficaz, quanto se pensava que ela fosse. Para exemplificar, considere
dois alunos na quarta série em 1999, um repetente e o outro não repetente. Se
existe diferença significativa entre seus escores, conforme resultados do
modelo, isto pode indicar que a repetência não foi tão eficaz, a ponto de fazer
com que essa diferença não fosse significativa. Portanto, a repetência não
deve ser considerada a principal alternativa, mas sim uma das possíveis
alternativas na busca pela melhoria do desempenho.
Os resultados para o nível 3, conforme Tabela 6, mostram que o tamanho
médio das turmas nas escolas está associado negativamente com o status
inicial médio de sua escola. Assim, quanto maior o tamanho médio da turma
em sua escola, menor será o desempenho deste aluno. Considerando um
aluno, em que o tamanho médio de alunos por turma em sua escola seja 35,
conforme a média encontrada nas estatísticas descritivas, mostradas na Tabela
2, referentes às variáveis quantitativas consideradas na estimação dos
modelos, este aluno perderá 6,3 (-0,18*35) pontos em seu status inicial.
264
As tabelas 7 e 8 apresentam, respectivamente, um exemplo do cálculo do
ganho médio do rendimento para os sexos feminino e masculino entre os
períodos, na situação em que ambos os sexos fizeram lição, não repetiram de
ano e estudavam em escola com tamanho médio de turma de 35 alunos.
Assim, maiores detalhes sobre a comparação entre os rendimentos femininos e
masculinos podem ser vistos nestas tabelas e em seus gráficos
correspondentes.
A Tabela 7 mostra, um passo a passo, para o cálculo do rendimento médio
feminino de um período (ou série) para o seguinte. Na última parte desta
tabela, estão, respectivamente, calculados o ganho anual, o ganho marginal
por ano e o rendimento médio. Dessa forma, uma aluna - que faz lição, nunca
repetiu de ano e estuda em escola com tamanho médio de turma de 35 alunos
– apresenta um ganho entre abril e novembro de 1999, concluindo a quarta
série, de 3,36 pontos no escore, atingindo um ganho acumulado de 9,42 pontos
no final da sexta série, em novembro de 2001. A partir desse período, os
ganhos são bem menores, conforme pode ser constatado na coluna de ganho
marginal. Entre novembro de 2001 e novembro de 2003, quando os alunos
estavam concluindo a oitava série, o acréscimo no escore foi de apenas 2,70
num período de dois anos letivos. Assim, enquanto as alunas obtiveram um
ganho de 6,06 pontos no escore entre a quarta e sexta série, o ganho obtido no
escore entre a sexta e a oitava série foi de apenas 2,70 pontos.
Analogamente, a mesma interpretação pode ser feita para a Tabela 8 que
mostra o cálculo do ganho anual, do ganho marginal e do rendimento médio
masculino. Entretanto, vale salientar que apesar do sexo masculino ter um
rendimento muito próximo ao feminino durante a quarta série, respectivamente,
3,36 e 3,76, ao longo do tempo, conforme mostram a Tabela 8 e o Gráfico 4, os
homens tendem a apresentar um rendimento médio cada vez maior ao longo
do tempo.
O Gráfico 4 mostra, ainda, que a maior diferença entre os escores de homens
e mulheres concentra-se entre 2000 e 2002, quando o sexo masculino
praticamente mantém uma diferença de aproximadamente 2 pontos no escore
em relação ao do sexo feminino. Contudo, a estrutura das curvas é bastante
semelhante.
265
Tabela 6: Resultados do Modelo Final Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de liberdade Valor p status inicial médio do aluno, π0 status inicial médio da escola, β00 Status inicial médio das escolas, γ000 55,26 1,94 28,50 143 0,000 Tamanho médio da turma no ensino fundamental, γ001 -0,18 0,05 -3,31 143 0,001 sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,05 0,42 -2,52 1747 0,012 lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,47 0,51 2,87 1747 0,005 repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,57 0,36 7,16 1747 0,000 taxa média de crescimento do aluno, π1 taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 5,11 0,19 27,28 144 0,000 sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,57 0,23 -2,52 1749 0,012 taxa não linear média de crescimento do aluno, π2 taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,66 0,05 -13,29 144 0,000 sexo, β21 Associação entre sexo e taxa não linear média de crescimento do aluno, γ210
0,09 0,04 1,96 1747 0,049
lição, β22 Associação entre lição e taxa não linear média de crescimento do aluno, γ220
0,06 0,03 2,21 1747 0,027
repetiu, β23 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ230
0,09 0,02 4,12 1747 0,00
Fonte: Cedeplar/ Inep (2005)
266
Tabela 6: Resultados do Modelo Final (continuação) Efeitos Aleatórios Comp. da
variância Desvio padrão Estat.
2χ Graus de liberdade Valor p Nível 1 – e 24,21 4,92 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 37,55 6,13 3962,71 1603 0,000 Taxa de aprendizagem anual individual, r1 2,49 1,58 1966,51 1605 0,000
Taxa não linear de aprendizagem anual individual, r2 0,17 0,42 2113,84 1603 0,000 Nível 3 (entre as escolas)
Status médio das escolas, u00 11,13 3,34 499,72 143 0,000 Taxa de crescimento médio das escolas, u10 1,03 1,01 225,27 144 0,000
Taxa não linear de crescimento médio das escolas, u20 0,06 0,25 256,57 144 0,000 Fonte: Cedeplar/ Inep (2005)
267
Tabela 7: Modelo Final - Cálculo do rendimento médio feminino de uma série para outra - Matemática Modelo
Final γ100 γ110 Sexo feminino série [γ100+ γ110 (sexo)]*(série)
P1*(série) Abr/Nov99 5,11 -0,57 1,00 0,80 3,63 Nov99/00 5,11 -0,57 1,00 1,80 8,17 Nov00/01 5,11 -0,57 1,00 2,80 12,71 Nov01/02 5,11 -0,57 1,00 3,80 17,25 Nov02/03 5,11 -0,57 1,00 4,80 21,79 Modelo
Final γ200 γ210 Sexo
feminino γ220 Fez
lição γ230 Não
repetiu série2[γ200+γ210*(sexo)+γ220*(lição)+γ230*(nãorepetiu)]*(série2)
P2*(série2) Abr/Nov99 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 0,64 -0,27 Nov99/00 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 3,24 -1,36 Nov00/01 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 7,84 -3,29 Nov01/02 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 14,44 -6,06 Nov02/03 -0,66 0,09 1,00 0,06 1,00 0,09 1,00 23,04 -9,68 Modelo
Final Ganho anual Ganho marginal por ano
π0 +Ganho anual (1) Rendimento médio
Abr/Nov99 3,36 3,36 56.31 Nov99/00 6,81 3,45 59.76 Nov00/01 9,42 2,61 62.37 Nov01/02 11,19 1,77 64.14 Nov02/03 12,12 0,93 65.07
Fonte: Cedeplar/ Inep (2005) Nota: (1)Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.
268
Tabela 8: Modelo Final - Cálculo do rendimento médio masculino de uma série para outra - Matemática Modelo
Final γ100 γ110 Sexo masculino série [γ100+γ110*(sexo)]*(série)
P1*(série) Ab/Nov99 5,11 -0,57 0,00 0,80 4,09 Nov99/00 5,11 -0,57 0,00 1,80 9,20 Nov00/01 5,11 -0,57 0,00 2,80 14,31 Nov01/02 5,11 -0,57 0,00 3,80 19,42 Nov02/03 5,11 -0,57 0,00 4,80 24,53 Modelo
Final γ200 γ210Sexo
masculino γ220Fez
lição γ230Não
repetiu série2[γ200+γ210*(sexo)+γ220*(lição)+γ230*(nãorepetiu)]*(série2)
P2*(série2) Ab/Nov99 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 0,64 -0,33 Nov99/00 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 3,24 -1,65 Nov00/01 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 7,84 -4,00 Nov01/02 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 14,44 -7,36 Nov02/03 -0,66 0,09 0,00 0,06 1,00 0,09 1,00 23,04 -11,75
Modelo Final
Ganho anual Ganho marginal por ano
π0 +Ganho anual (1) Rendimento médio
Ab/Nov99 3,76 3,36 57.76 Nov99/00 7,55 3,78 61.55 Nov00/01 10,31 2,76 64.31 Nov01/02 12,05 1,74 66.05 Nov02/03 12,78 0,72 66.78
Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.
269
Gráfico 4: Comparação dos rendimentos médios em matemática por sexo entre abril de 1999 e novembro de 2003
nov/99
nov/00
nov/01
nov/02nov/03
abr-99
50
55
60
65
70
Período
Esco
res
Ganho Feminino Ganho Masculino
Fonte: Cedeplar/ Inep (2005)
270
INFORMAÇÕES SOBRE O BANCO DE DADOS E AS VARIÁVEIS UTILIZADAS NO PROCESSO DE ESTIMAÇÃO DOS FATORES ASSOCIADOS AO DESEMPENHO ESCOLAR NA DISCIPLINA DE PORTUGUÊS.
A base de dados utilizada nos modelos é a mesma dos modelos de
matemática, possuindo informações de escolas, alunos, professores e diretores
de seis Unidades da Federação: Pará (PA), Rondônia (RO), Pernambuco,
Sergipe (SE), Goiás (GO) e Mato Grosso do Sul (MS). Esta base tem um
desenho longitudinal para o acompanhamento de uma coorte de alunos ao
longo do tempo, com a principal finalidade de estimar os fatores determinantes
do desempenho escolar.
Esses dados correspondem a cinco anos de pesquisa em seis períodos
diferentes. A primeira e a segunda rodadas foram realizadas com alunos que
cursavam a 4ª série do ensino fundamental no ano de 1999, sendo a primeira
realizada em primeiro de Abril e a segunda, em primeiro de Novembro de1999.
A partir de 2000, as rodadas foram sempre realizadas em primeiro de
novembro do referente período. Assim, na terceira rodada em primeiro de
novembro de 2000 foram pesquisados os alunos da quinta série e assim,
sucessivamente até a sexta rodada em 2003 para os alunos da 8ª série.
Para estimar os modelos de português, foi adotada a mesma opção, quando se
estimou os modelos para a disciplina de matemática. Dessa forma foram
selecionados para a estimação dos modelos os alunos de trajetória completa,
ou seja, alunos que estiveram presentes ao longo de todas as seis rodadas
realizadas pela pesquisa. A Tabela 1 mostra algumas estatísticas descritivas –
o total de alunos, a média, o desvio padrão, o máximo e o mínimo - para os
alunos que completaram, ou não, a trajetória na disciplina de português.
271
Tabela 1: Estatísticas descritivas dos alunos que completaram, ou não, a trajetória entre abril/1999 e novembro/2003 – Português
Trajetória Incompleta Nº de alunos Média Desvio Padrão Mínimo Máximo
abril/99 10649 49,77 8,99 24,81 73,74 nov/99 8607 48,52 10,06 25,35 76,86 2000 13488 54,36 9,28 28,62 78,55 2001 13246 56,60 9,02 30,68 78,02 2002 10171 56,85 10,22 30,99 82,97 2003 8098 60,65 10,55 33,51 83,39
Trajetória Completa abril/99 1975 52,31 8,62 24,81 73,74 nov/99 1975 51,72 9,93 25,35 76,86 2000 1975 56,88 8,99 28,62 78,55 2001 1975 57,98 8,78 31,47 78,02 2002 1975 58,04 10,46 32,41 82,97 2003 1975 61,46 10,78 33,51 83,39
Fonte: Cedeplar/ Inep (2005)
Gráfico 4: Média dos escores equalizados de português por trajetória
Nov/1999
2003
200220012000
Abr/1999
40,00
45,00
50,00
55,00
60,00
65,00
Período
Esco
re m
édio
Completa Incompleta
Fonte: Cedeplar/ Inep (2005)
272
Como se pode notar, por meio da Tabela 1, o número de alunos que
completaram a trajetória é bem menor, também como aconteceu em
matemática, quando comparado ao número dos que não estiveram presentes
em alguma rodada da pesquisa. Conforme já era esperado, o gráfico 4 mostra
que o desempenho dos alunos que participaram das seis rodadas é superior ao
dos demais, uma vez que os alunos que completaram a trajetória podem ter
repetido no máximo até a 4ª série. Entretanto, vale salientar que a estrutura
das duas curvas é muito similar, apesar destas curvas estarem menos
próximas ao que se espera de uma curva de aprendizagem - ganhos
decrescentes ao longo do período com tendência à estabilidade no final do
processo – do que às de matemática, em função do comportamento do
primeiro e do último período.
O software utilizado para estimar os modelos foi o HLM. Como este software
não aceita valores em branco (missings) nos arquivos de nível 2 e 3, houve
uma perda de 115 alunos e 31 escolas. Assim, o banco passou a contar com
1860 e 145 escolas. Como o software HLM somente identifica uma escola para
cada aluno, optou-se por retirar do banco alunos que mudaram de escola
durante a pesquisa. Assim, foram retirados também 43 alunos e 2 escolas, de
forma que o banco final para a estimação dos fatores associados ao
desempenho em matemática totaliza 1817 alunos em 143 escolas.
A Tabela 2 mostra algumas estatísticas descritivas para as variáveis
quantitativas que foram consideradas na estimação dos modelos. A variável
sco, como era de se esperar, uma vez que tem uma distribuição normal com
média 50 e desvio padrão 10, apresentou, respectivamente, um mínimo de em
torno de 20 (24,81) e um máximo em torno de 90 (83,39) pontos. O número de
horas-aula por dia variou entre 3,6 e 7,4. Por sua vez, o menor tamanho médio
de turma por escola foi de 21,56 alunos, enquanto o maior valor chegou a
51,38 alunos. No caso de percentual de professores com curso superior a
amplitude foi de 100%, indicando portanto que em relação a este quesito,
existe escola que não tem professor com curso superior, em contraste com
escola em que todos os professores apresentam pelo menos curso superior,
como aconteceu em matemática.
273
Tabela 2: Estatísticas Descritivas das Variáveis Numéricas Utilizadas nos Modelos da disciplina de Português
Variável Nº de Casos Média Desvio
Padrão Mínimo Máximo
Escore 10902 56,35 10,26 24,81 83,39 Horas-Aula 143 4,34 0,47 3,6 7,4
Tamanho da Turma 143 35,16 5,6 21,56 51,38 Docentes com Curso
Superior 143 61,99 28,72 0 100
Fonte: Cedeplar/ Inep (2005)
O quadro 1 mostra a descrição das variáveis e suas categorias
correspondentes, utilizadas no processo de estimação dos modelos de
português. Essas variáveis estão divididas por níveis correspondentes aos
modelos hierárquicos longitudinais.
274
QUADRO 1 Variáveis consideradas na estimação dos modelos hierárquicos longitudinais
Nível 1 Variáveis Significado Categorias
sco Escore modificado = (escore equalizado x 10) + 50
serie Série
serie2 Série elevada ao quadrado
Nível 2 sexo Você é do sexo: 0 – Masculino 1 – Feminino
raca Você se considera: 0 – Não-branco 1 – Branco
livros Quantos livros há em sua casa? 0 – 20 ou menos 1 – Mais de 20
licão Você faz lição de casa? 0 – Não 1 – Sim
repetiu Já repetiu de ano alguma vez? 0 – Sim 1 – Não
mãe_ler Sua mãe sabe ler? 0 – Não 1 – Sim
pai_ler Seu pai sabe ler? 0 – Não 1 – Sim
abandonou Já abandonou a escola por pelo menos um ano?
0 – Sim 1 – Não
esc_pai Até que ano seu pai estudou?
0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo
esc_mae Até que ano sua mãe estudou?
0 - Não completou o ensino fundamental. 1 - Pelo menos o ensino fundamental completo
Nível 3 horas-aula Número Médio de Horas-Aula Diária no Ensino Fundamental
tam_turma Número Médio de Alunos por Turma Total no Ensino Fundamental
doc_superior Percentual de Docentes com Curso Superior no Ensino Fundamental
bibliote Se a escola tem biblioteca. 0 – Não 1 – Sim
labcien Se a escola tem laboratório de ciências.
0 – Não 1 – Sim
labinfo Se a escola tem laboratório de informática.
0 – Não 1 – Sim
quadra Se a escola tem quadra. 0 – Não 1 – Sim
Fonte: Cedeplar/ Inep (2005)
275
Assim sendo, o nível 1 contempla as habilidades dos alunos estimadas
(calibradas) e equalizadas, de acordo com a teoria da resposta ao item.
Posteriormente, esta variável resposta teve sua distribuição transformada numa
normal com média 50 e desvio-padrão 10. Além da variável resposta, no nível 1
também se encontram variáveis relacionadas ao tempo. Neste trabalho, essas
variáveis correspondem à série cursada e a uma transformação dessa variável,
série ao quadrado, para tentar captar a não linearidade do ganho no
desempenho relativo ao processo de aprendizagem.
No nível 2, encontram-se variáveis relacionadas a características familiares e
individuais, que se espera não sofrerem variações significativas com o tempo.
E por fim, o nível 3 compreende variáveis qualitativas e quantitativas
relacionadas às escolas. Vale ressaltar que as variáveis do terceiro nível foram
retiradas do censo escolar de 2001, com exceção da quadra que faz parte do
censo escolar do ano de 2000.
Conforme Tabela 3, variáveis que apresentaram acima de 90% de freqüência
para uma mesma categoria - conforme acontece com as variáveis mãe e pai
sabem ler, já abandonou a escola e presença de laboratório de ciências – não
foram utilizadas na estimação dos modelos de português. Essa variabilidade
baixa fez com que essas variáveis, previamente testadas no modelo, fossem
não significativas.
276
Tabela 3: Freqüência absoluta e relativa do desempenho em português e dos possíveis fatores associados a ele.
Variável Categoria Freqüência Absoluta
Freqüência Relativa
masculino 808 44,50% sexo
feminino 1009 55,50% não branco 1233 67,90%
raça branco 584 32,10%
até 20 livros 1000 55,00% livros
mais de 20 livros 817 45,00% Não fazem 259 14,30%
lição Fazem 1558 85,70% Repetiu 535 29,40%
repetiu Não repetiu 1282 70,60%
Não completou o ensino fundamental. 283 15,60% escolaridade da mãe Pelo menos o ensino fundamental completo 1534 84,40%
Não completou o ensino fundamental. 367 20,20% escolaridade do pai Pelo menos o ensino fundamental completo 1450 79,80%
Sim 81 4,50% abandono
Não 1736 95,50% Não 96 5,30% mãe sabe ler Sim 1721 94,70% Não 108 5,90% pai sabe ler Sim 1709 94,10%
Menos de 50 2880 26,40% escore 50 ou mais 8022 73,60%
Não 61 42,70% quadra Sim 82 57,30% Não 109 76,20% laboratório de
informática Sim 34 23,80% Não 45 31,50% biblioteca Sim 98 68,50% Não 133 93,00% laboratório de
ciências Sim 10 7,00% 4hs ou menos 34 23,80% Entre 4 e 5hs 105 73,40% Entre 5 e 6hs 2 1,40%
horas-aula
Mais que 6hs 2 1,40% Menor que 15 alunos 0 0,00% Entre 15 e 30 alunos 25 17,50% Entre 30 e 45 alunos 111 77,60%
tamanho da turma
Mais que 45 alunos 7 4,90% Menos de 25% 22 15,40%
Entre 25% e 50% 18 12,60% Entre 50% e 75% 46 32,20%
docentes com curso superior
Mais de 75% 57 39,90%
Fonte: Cedeplar/ Inep (2005)
277
Para a definição do calendário letivo, considerou-se que o ano letivo contém 10
meses, levando-se em conta as férias. Como a pesquisa tem sua primeira
rodada em primeiro de abril de 1999, esta será tomada como base (baseline).
A segunda rodada foi realizada em primeiro de novembro de 1999, oito meses
após a primeira. E todas as rodadas seguintes foram realizadas com um
intervalo de um ano. Para identificar cada período de acordo com os intervalos
entre as rodadas e usando como base abril de 1999 e o calendário com 10
meses, as rodadas foram classificadas da seguinte forma:
• Abr/ 1999 = 0 – base;
• Nov/1999 = 0,8 – referente aos 08 meses entre as rodadas;
• Nov/ 2000 = 1,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2001 = 2,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2002 = 3,8 – referente aos 10 meses letivos entre as
rodadas;
• Nov/ 2003 = 4,8 – referente aos 10 meses letivos entre as
rodadas.
278
ESPECIFICAÇÃO TEÓRICA E RESULTADOS PARA O MODELO INCONDICIONAL
O primeiro modelo estimado foi o modelo incondicional, nomenclatura adotada
pelo livro HLM para informar que este modelo não apresenta nenhuma variável
preditora no nível 2 ou no nível 3, somente incluindo no nível 1, as variáveis
relacionadas ao tempo, série e série ao quadrado. Este modelo permite o
cálculo de estatísticas, por meio das quais é possível determinar o percentual
da variabilidade de π0 (status inicial médio de um aluno) , π1(taxa linear média
do crescimento do desempenho de um aluno), π2(taxa não-linear média de
crescimento de um aluno), que são devidos à variabilidade entre as escolas.
Na seção 3.1 a seguir, é apresentada a especificação teórica do modelo
incondicional, uma adaptação da especificação contida no livro de
RAUDENBUSH & BRYK (2002). Sendo assim, segue-se a mesma
nomenclatura para um modelo sem variáveis independente, exceto pelas
variáveis relativas ao tempo (série e série ao quadrado), presentes no nível 1.
A especificação teórica apresentada para a disciplina de português, conforme
aquela apresentada em matemática,contém a equação do modelo completo e
uma equação para cada um dos três níveis especificados separadamente.
279
ESPECIFICAÇÃO TEÓRICA DO MODELO INCONDICIONAL
Modelo completo
Y=γ000+γ100(serie)+γ200(serie2)+[e+u00+r0 +u10(serie)+r1(serie)+u20(serie)+
r2(serie2)]
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
Nível 2
π0=β00+r0
π1=β10+r1
π2=β20+r2
Nível 3
β00=γ000+u00
β10=γ100+u10
β20=γ200+u20
em que:
Y é o desempenho de um aluno em sua escola num determinado período; γ000
representa o status inicial médio das escolas (Abril de 1999); β00 é o status
inicial médio de uma determinada escola:
β00=γ000+u00
π0 significa o status inicial médio de um determinado aluno:
π0=β00+r0
280
γ100 é a taxa linear média de crescimento anual das escolas; β10 é a taxa
linear média anual de crescimento de uma determinada escola; π1 representa
a taxa linear média de crescimento anual de determinado aluno:
π1=β10+r1
γ200 é a taxa não-linear média de crescimento anual das escolas; β20 significa a
taxa não-linear média anual de crescimento de uma determinada escola e π2 é
a taxa não-linear média de crescimento anual de determinado aluno:
π2=β20+r2
Os erros aleatórios e, rs e us são, respectivamente, termos aleatórios dos níveis
1,2 e 3.
Este tipo de modelo pressupõe independência entre os erros de nível 1, que
são normalmente distribuídos com média zero e variância constante σ2,
(RAUDENBUSH & BRYK, 2002). Contudo, para os erros dos níveis 2 e 3, o
pressuposto é de que eles sejam, respectivamente, dependentes. Vale, ainda,
ressaltar que, para esses mesmos autores, modelos deste tipo podem assumir
várias formas complexas de estrutura de erro.
RESULTADOS PARA O MODELO INCONDICIONAL
A tabela 4 mostra os resultados da estimação do modelo incondicional que não
convergiu com o número máximo de iterações especificado pelo HLM.
Por sua vez, a Tabela 5 e 6 mostram, respectivamente, os resultados da
estimação do modelo incondicional “sem forçar” a convergência e o cálculo do
ganho médio anual do rendimento de um aluno de uma série para outra.
281
Tabela 4: Resultados do Modelo Incondicional
Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,41 0,33 154,67 142 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,36 0,17 13,52 142 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,08 0,04 -2,31 142 0,021
Efeitos Aleatórios Comp. da variância
Desvio padrão
Estat. 2χ
Graus de liberdade Valor p
Nível 1 -e 31,45 5,61 - - -
Nível 2 (alunos dentro das escolas) Status inicial individual, r0 45,47 6,74 4283,34 1674 0,000
Taxa de aprendizagem anual individual, r1 0,77 0,88 1709,83 1674 0,265 Taxa não linear de aprendizagem anual individual, r2 0,00 0,05 1765,03 1674 0,060
Nível 3 (entre as escolas) Status médio das escolas, u00 8,81 2,97 374,00 142 0,000
Taxa de crescimento médio das escolas, u10 1,90 1,38 271,94 142 0,000 Taxa não linear de crescimento médio das escolas, u20 0,09 0,31 304,50 142 0,000
Fonte: Cedeplar/ Inep (2005)
282
Tabela 5: Resultados do Modelo Incondicional
Efeitos Fixos Coeficiente Erro padrão Estat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 51,48 0,33 156,03 142 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,27 0,17 13,36 10899 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,07 0,04 -1,89 10899 0,058
Efeitos Aleatórios Comp. da variância
Desvio padrão
Estat. 2χ
Graus de liberdade Valor p
Nível 1 - e 36,94 6,08 - - -
Nível 2 (alunos dentro das escolas) Status inicial individual, r0 48,07 6,93 7254,42 1674 0,000
Taxa de aprendizagem anual individual, r1 - - - - - Taxa não linear de aprendizagem anual individual, r2 - - - - -
Nível 3 (entre as escolas) Status médio das escolas, u00 9,89 3,14 469,91 142 0,000
Taxa de crescimento médio das escolas, u10 - - - - - Taxa não linear de crescimento médio das escolas, u20 - - - - -
Fonte: Cedeplar/ Inep (2005)
283
Modelo Completo
Y=51,48+2,27(serie) –0,07(serie2)+[e+u00+r0]
Nível 1
Y=51,48+u00+r0+2,27(serie) –0,07(serie2)+e
Nível 2
π0=51,48+u00+r0
π1=2,27
π2=-0,07
Nível 3
β00=51,48+u00
β10=2,27
β20=-0,07
284
Tabela 6: Modelo Incondicional - Cálculo do ganho médio de rendimento de um aluno de uma série para outra
Modelo γ100 série γ200 série2 γ100 (série)+[γ200(série2)]
Ganho anual
Ganho marginal por ano
γ000 + Ganho anual (1)
Rendimento médio
Abr/Nov99 2,27 0,80 -0,07 0,64 1,77 1,77 53,25
Nov99/00 2,27 1,80 -0,07 3,24 3,86 2,09 55,34
Nov00/01 2,27 2,80 -0,07 7,84 5,81 1,95 57,29
Nov01/02 2,27 3,80 -0,07 14,44 7,62 1,81 59,10
Nov02/03 2,27 4,80 -0,07 23,04 9,28 1,67 60,76
Fonte: Cedeplar/ Inep (2005)
Nota: (1) Para o primeiro período, o ganho não é anual, mas sim entre os meses de abril e novembro do ano de 1999.
De acordo com a Tabela 5, que mostra os resultados para o modelo
incondicional, a habilidade ou status inicial médio apresentado pelo aluno em
abril de 1999 foi de 51,48 pontos, numa escala de scores correspondente à
distribuição normal com média 50 e desvio padrão 10. Por sua vez, a taxa
linear média de crescimento no rendimento do aluno de uma série para outra
foi de 2,27 pontos, enquanto sua taxa não linear média de crescimento
apresenta um valor negativo de 0,07. Assim, pode-se dizer que, em média, um
aluno ganha 2,20 pontos no seu escore de uma série (ou período) para a
seguinte.
No final da Tabela 5 são apresentados os resultados referentes aos efeitos
aleatórios no modelo incondicional. Estes resultados sugerem que existe
variação aleatória significativa somente no status inicial médio. Em outras
palavras, os efeitos aleatórios relacionados ao status inicial nos níveis 2 e 3
são significativamente diferentes de zero, não sendo, portanto, importantes na
285
explicação do percentual da variação do status inicial que pode ser explicado
pela variabilidade entre as escolas.
Portanto, essa estatística é mais um meio para se confirmar a importância da
presença do nível 3 no modelo, ou seja, a importância da variabilidade entre as
escolas na explicação da variabilidade do status inicial médio.
A Tabela 6 e o Gráfico 2 mostram os rendimentos médios acrescidos ao score
do aluno por período, ou seja, de uma série para a seguinte. Na coluna do
ganho marginal anual constante na Tabela 6, observa-se, em gera, uma taxa
de crescimento cada vez maior ao longo do tempo, indicando um crescimento
linear e cada vez maior no caso do desempenho em português.
O gráfico 2 permite uma melhor visualização deste comentário, mostrando,
mais uma vez, que a curva estimada dos ganhos anuais apresenta estrutura
linear, não tão próxima ao padrão de uma curva de aprendizagem típica,
mostrando entretanto um formato “ideal” de crescimento linear positivo. Assim,
um aluno, concluindo a quarta série, que possui um rendimento médio de 53,25
pontos em novembro de 1999, alcança um rendimento médio de 57,29 pontos,
ao concluir a sexta série em novembro de 2001.
A partir deste período, o crescimento não se torna menor como em
matemática, de forma que concluindo a oitava série seu rendimento médio
aumenta em aproximadamente 3,5 pontos em relação ao rendimento atingido
na conclusão da sexta série, enquanto o crescimento médio alcançado entre a
quarta e a sexta série atinge aproximadamente 4 pontos.
286
Gráfico 2: médias dos escores de português dos alunos de trajetória completa de acordo com o modelo incondicional
nov/99
nov/00
nov/01
nov/02
nov/03
abr-99
50
55
60
65
70
Período
Esco
re M
édio
Escore Modelado
O gráfico 3 apresenta uma comparação entre as médias dos escores dos
alunos de trajetória completa, mostradas na tabela 1, e os escores obtidos para
os alunos por meio da estimação do modelo incondicional, apesar das perdas
de alunos e/ou escolas, em função da organização do banco de dados para a
estimação dos modelos. Os resultados obtidos através da estimação dos
modelos estão bem mais próximos daqueles esperados de uma curva de
aprendizagem, quando comparados aos resultados da análise descritiva.
Fonte: Cedeplar/ Inep (2005)
287
Gráfico 3: Comparação entre as médias dos escores de português dos alunos de trajetória completa e os valores estimados de acordo
com o modelo incondicional
nov/99
nov/00
nov/01
nov/02
nov/03
nov/99
nov/01 nov/02
abr-99
nov/00
abr-99
50
55
60
65
70
Período
Esco
re M
édio
Escore Modelado Escore Descritivo
Fonte: Cedeplar/ Inep (2005)
288
PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL, SUAS ESPECIFICAÇÕES E RESULTADOS
PROCEDIMENTO ADOTADO PARA A ESTIMAÇÃO DO MODELO FINAL
O procedimento adotado para a estimação do modelo final foi esquematizado
da seguinte forma. No primeiro passo, foram acrescentadas variáveis do nível
3, uma a uma, no modelo incondicional. No segundo passo, foi estimado um
modelo, contendo as variáveis que se apresentaram significativas no primeiro
passo. No terceiro passo, um procedimento análogo ao do nível 3 foi utilizado
para se estimar o nível 2 do modelo, de forma que as variáveis referentes a
esse nível foram consideradas, uma a uma. No caso da primeira variável se
mostrar significativa, entraria uma segunda variável juntamente com a primeira
e, assim, sucessivamente, até que o modelo final fosse estimado.
ESPECIFICAÇÃO TEÓRICA DO MODELO FINAL
Modelo Completo
Y=γ000+γ010(sexo)+γ020(lição)+ γ030(repetiu)+γ040(esc_mae)+ [γ100(serie)+
γ110(sexo)(serie)]+[γ200(serie2)+γ201(labinfo)(serie2)+γ210(sexo)(serie2)+
γ220(repetiu)(serie2)]+[e+u00+r0]
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
289
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+β04(esc_mae)+r0
π1=β10+β11(sexo)
π2=β20+β21(sexo)+β22(repetiu)
Nível 3
β00=γ000+u00
β01=γ010
β02=γ020
β03=γ030
β04=γ040
β10=γ100
β11=γ110
β20=γ200+γ201(labinfo)
β21=γ210
β22=γ220
290
RESULTADOS DO MODELO FINAL
Modelo Completo
Y=45,27+1,55(sexo)+2,89(lição)+2,91(repetiu)+0,93(esc_mae)+
[1,82(serie)+0,81(sexo)(serie)]+[-0,09(serie2)+0,10(labinfo)(serie2)–0,10
(sexo)(serie2)+0,08(repetiu)(serie2)]+[e+u00+r0]
Nível 2
π0=45,27+u00+1,55(sexo)+2,89(lição)+2,91(repetiu)+0,93(esc_mae)+r0
π1=1,82+0,81(sexo)
π2=-0,09+0,10(labinfo)-0,10(sexo)+0,08(repetiu)
Nível 3
β00=45,27+u00
β01=1,55
β02=2,89
β03=2,91
β04=0,93
β10=1,82
β11=0,81
β20=-0,09+0,10(labinfo)
β21=-0,10
β22=0,08
A tabela 7 apresenta os resultados da estimação do modelo final. No modelo
final, a variável sexo se mostrou significativa na explicação do status inicial
291
médio do aluno, da taxa linear média de crescimento e da taxa não linear
média de crescimento. Fazer lição aumenta o status médio do aluno, enquanto
que não repetir aumenta além do status inicial do aluno, sua taxa não linear de
crescimento. Estes resultados encontrados para a variável repetiu, indicam que
não repetir de ano está associado positivamente ao status médio do aluno e à
sua taxa não linear média de crescimento. Conforme estes últimos resultados,
pode-se dizer que fazer lição de casa e não repetir de ano é importante para
que o aluno apresente um melhor rendimento escolar. No modelo final de
português, a variável escolaridade da mãe também foi significativa na
explicação do status inicial médio do aluno
Assim, como não repetir de ano está associado positivamente a um melhor
desempenho escolar, este resultado está sugerindo que a repetência pode não
ser tão eficaz, quanto se pensava que ela fosse. Para exemplificar, considere
dois alunos na quarta série em 1999, um repetente e o outro não repetente. Se
existe diferença significativa entre seus escores, conforme resultados do
modelo, isto pode indicar que a repetência não foi tão eficaz, a ponto de fazer
com que essa diferença fosse não significativa. Portanto, conforme dito
anteriormente, a repetência não deve ser considerada a principal alternativa,
mas sim uma das possíveis alternativas na busca pela melhoria do
desempenho.
Os resultados para o nível 3, conforme Tabela 7, mostram que a presença de
laboratório de informática nas escolas está associada positivamente com a taxa
não linear média de crescimento na aprendizagem de português.
As tabelas 8 e 9 apresentam, respectivamente, um exemplo do cálculo do
ganho médio do rendimento na disciplina de português para os sexos feminino
e masculino entre os períodos, na situação em que ambos os sexos fizeram
lição, não repetiram de ano e estudavam em escola com laboratório de
informática. Assim, maiores detalhes sobre a comparação entre os rendimentos
femininos e masculinos podem ser vistos nestas tabelas e em seus gráficos
correspondentes.
A Tabela 8 mostra, um passo a passo, para o cálculo do rendimento médio
feminino de um período (ou série) para o seguinte. Na última parte desta
tabela, estão, respectivamente, calculados o ganho anual, o ganho marginal
292
por ano e o rendimento médio. Dessa forma, uma aluna - que faz lição, nunca
repetiu de ano e estuda em escola com laboratório de informática – apresenta
um ganho entre abril e novembro de 1999, concluindo a quarta série, de 2,10
pontos no escore, atingindo um ganho acumulado de 7,29 pontos no final da
sexta série, em novembro de 2001. A partir de novembro de 2000, o
crescimento anual permanece aproximadamente constante, o que se traduz
num crescimento positivo linear, fazendo com que o escores do aluno esteja
sempre aumentando ao longo do tempo. Entre novembro de 2001 e novembro
de 2003, quando os alunos estavam concluindo a oitava série, o acréscimo
estimado no escore foi de 5,10, correspondente a um período de dois anos
letivos. Assim, as alunas obtiveram um ganho de 5,19 pontos no escore entre a
quarta e sexta série, ganho próximo ao obtido entre a sexta e a oitava série
(5,10).
Analogamente, a mesma interpretação pode ser feita para a Tabela 9 que
mostra o cálculo do ganho anual, do ganho marginal e do rendimento médio
masculino. Durante a quarta série o sexo masculino apresentou um rendimento
médio de 1,51. Este rendimento se mostrou inferior ao apresentado pelo sexo
feminino (2,10). Além do mais, a partir do período novembro de 1999 a
novembro de 2000 esta diferença entre os rendimentos por sexo tende a se
estabilizar, tornando a distância entre homens e mulheres aproximadamente
constante, entretanto maior que a estimada no início do processo .
293
Tabela 7: Resultados do Modelo Final
Efeitos Fixos Coeficiente Erro padrão
Estat. t Graus de liberdade
Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 45,27 0,73 62,09 142 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,55 0,38 4,07 1812 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 2,89 0,55 5,29 1812 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,91 0,41 7,17 1812 0,000 Esc_mãe, β04 Associação entre escolaridade da mãe e status inicial médio do aluno, γ040 0,93 0,46 2,02 1812 0,043 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 1,82 0,24 7,56 10891 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,81 0,25 3,24 10891 0,002 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,09 (1) 0,05 -1,65 10891 0,098 Laboratório de informática, γ201 0,10 0,04 2,69 10891 0,008 Sexo, β21 Associação entre sexo e taxa não linear média de crescimento do aluno, γ210 -0,10 0,05 -1,97 10891 0,048 Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220 0,08 0,02 3,31 10891 0,001
Fonte: Cedeplar/ Inep (2005) Nota: (1) Estatisticamente diferente de zero a 10% de significância.
294
Tabela 7: Resultados do Modelo Final (continuação) Efeitos Aleatórios Comp. da
variância Desvio padrão
Estat. 2χ
Graus de liberdade
Valor p
Nível 1 – e 36,58 6,05 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 43,13 6,57 7576,17 1670 0,000 Taxa de aprendizagem anual individual, r1 - - - - -
Taxa não linear de aprendizagem anual individual, r2 - - - - - Nível 3 (entre as escolas)
Status médio das escolas, u00 7,56 2,75 424,31 142 0,000 Taxa de crescimento médio das escolas, u10 - - - - -
Taxa não linear de crescimento médio das escolas, u20 - - - - - Fonte: Cedeplar/ Inep (2005)
295
Tabela 8: Modelo Final - Cálculo do rendimento médio feminino de uma série para outra - Português Modelo
Final γ100 γ110 Sexo feminino série [γ100+ γ110 (sexo)]*(série)
P1*(série) Ab/Nov99 1,82 0,81 1,00 0,80 2,10 Nov99/00 1,82 0,81 1,00 1,80 4,73 Nov00/01 1,82 0,81 1,00 2,80 7,36 Nov01/02 1,82 0,81 1,00 3,80 9,99 Nov02/03 1,82 0,81 1,00 4,80 12,62
Modelo Final γ200 γ201
Lab. Inf. γ210
Sexo Feminino γ220
Não repetiu série2
[γ200+γ201*(lab.Inf.)+γ210*(sexo)+γ220*(nãorepetiu]*(série2) P2*(série2)
Ab/Nov99 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 0,64 -0,01 Nov99/00 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 3,24 -0,03 Nov00/01 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 7,84 -0,08 Nov01/02 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 14,44 -0,14 Nov02/03 -0,09 0,10 1,00 -0,10 1,00 0,08 1,00 23,04 -0,23
Modelo Final
Ganho anual Ganho marginal por ano
π0 +Ganho anual (1) Rendimento médio
Ab/Nov99 2,10 3,36 55,66 Nov99/00 4,70 2,60 58,26 Nov00/01 7,29 2,58 60,85 Nov01/02 9,85 2,56 63,41 Nov02/03 12,39 2,54 65,95
Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.
296
Tabela 9: Modelo Final - Cálculo do rendimento médio masculino de uma série para outra - Português Modelo
Final γ100 γ110 Sexo Masculino série [γ100+ γ110 (sexo)]*(série)
P1*(série) Ab/Nov99 1,82 0,81 0,00 0,80 1,46 Nov99/00 1,82 0,81 0,00 1,80 3,28 Nov00/01 1,82 0,81 0,00 2,80 5,10 Nov01/02 1,82 0,81 0,00 3,80 6,92 Nov02/03 1,82 0,81 0,00 4,80 8,74
Modelo Final γ200
γ201
Lab. Inf. γ210
Sexo Masculino γ220
Não repetiu série2
[γ200+γ201*(lab.Inf.)+γ210*(sexo)+γ220*(nãorepetiu)]*(série2) P2*(série2)
Ab/Nov99 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 0,64 0,06 Nov99/00 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 3,24 0,29 Nov00/01 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 7,84 0,71 Nov01/02 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 14,44 1,30 Nov02/03 -0,09 0,10 1,00 -0,10 0,00 0,08 1,00 23,04 2,07
Modelo Final
Ganho anual Ganho marginal por ano
π0 +Ganho anual (1) Rendimento médio
Ab/Nov99 1,51 3,36 53,52 Nov99/00 3,57 2,05 55,58 Nov00/01 5,80 2,23 57,81 Nov01/02 8,22 2,41 60,23 Nov02/03 10,81 2,59 62,82
Fonte: Cedeplar/ Inep (2005) Nota: (1) Para o primeiro período, o ganho não é anual, ma sim entre os meses de abril e novembro do ano de 1999.
297
O Gráfico 3 mostra, também, uma comparação dos rendimentos médios em
português por sexo entre abril de 1999 e novembro de 2003. Em abril, os
rendimentos entre os sexos estão próximos apesar do sexo feminino
apresentar melhor desempenho. A partir de 1999 o rendimento médio do sexo
feminino se distancia do masculino, alcançando maiores níveis. Esta diferença
parece se manter aproximadamente constante a partir da conclusão da quinta
série em 2000 até o término do ensino fundamental. Entretanto, a estrutura das
curvas é praticamente a mesma.
Gráfico 3: Comparação dos rendimentos médios em português por sexo entre abril de 1999 e novembro de 2003
nov/99
nov/00
nov/01
nov/02
nov/03
abr-9945
50
55
60
65
70
Período
Esco
res
Ganho Feminino Ganho Masculino
Fonte: Cedeplar/ Inep (2005)
298
APÊNDICE DO RELATÓRIO SOBRE ESTIMAÇÃO DE MODELOS HIERÁRQUICOS LONGITUDINAIS PARA AS
DISCIPLINAS DE MATEMÁTICA E PORTUGUÊS
APRESENTAÇÃO
Conforme mencionado na introdução da ação 1.3, este relatório apresenta um
apêndice, contendo resultados de modelos estimados com alunos que
participaram de pelo menos duas rodadas da pesquisa. Mesmo sabendo dos
possíveis viéses desses modelos, em virtude da variável identificadora do
aluno ainda apresentar erros no banco de dados, foram estimados 2 modelos
para as disciplinas de matemática e de português, utilizando os alunos que
participaram de pelo menos duas rodada da pesquisa.
No primeiro modelo, tanto para matemática, quanto para português, foram
utilizadas as mesmas variáveis adotadas na estimação dos modelos para
alunos que completaram a trajetória. No segundo tipo de modelo foi
acrescentada a variável traj-incomp, variável dicotômica em que um significa
ter participado de 2 a 5 rodadas da pesquisa e zero indica os alunos de
trajetória completa.
Assim, a seguir são apresentadas as especificações teóricas dos quatro
modelos e seus respectivos resultados.
299
ESPECIFICAÇÃO TEÓRICA DO MODELO 1 PARA A DISCIPLINA DE MATEMÁTICA
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0
π1=β10+β11(sexo)+β12(lição)+β13(repetiu)+β14(esc_pai)+r1
π2=β20+β21(lição)+β22(repetiu)+r2
Nível 3 β00=γ000+γ001(tam_turma)+u00 β01=γ010
β02=γ020
β03=γ030
β10=γ100+u10 β11=γ110
β12=γ120
β13=γ130
β14=γ140
β20=γ200+u20
β21=γ210 β22=γ220
ESPECIFICAÇÃO TEÓRICA DO MODELO 2 PARA A DISCIPLINA DE MATEMÁTICA
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0
π1=β10+β11(sexo)+β12(lição)+β13(repetiu)+β14(esc_pai)+β15(traj_incomp)+r1
π2=β20+β21(lição)+β22(repetiu)+β23(traj_incomp)+r2
300
Nível 3 β00=γ000+γ001(tam_turma)+u00 β01=γ010
β02=γ020
β03=γ030
β10=γ100+u10 β11=γ110
β12=γ120
β13=γ130
β14=γ140
β15=γ150 β20=γ200+u20 β21=γ210 β22=γ220
β23=γ230
ESPECIFICAÇÃO TEÓRICA DO MODELO 1 PARA A DISCIPLINA DE PORTUGUÊS
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+r0 π1=β10+β11(sexo)
π2=β20+β21(lição)+β22(repetiu)+r2
Nível 3
β00=γ000+u00 β01=γ010
β02=γ020
β03=γ030
β10=γ100
β11=γ110
301
β20=γ200+γ201(lab_info)+u20 β21=γ210
β22=γ220
ESPECIFICAÇÃO TEÓRICA DO MODELO 2 PARA A DISCIPLINA DE PORTUGUÊS
Nível 1
Y=π0+π1(serie)+π2(serie2)+e
Nível 2
π0=β00+β01(sexo)+β02(lição)+β03(repetiu)+β04(traj_incomp)+r0
π1=β10+β11(sexo)+β12(traj_incomp)
π2=β20+β21(lição)+β22(repetiu)+r2
Nível 3 β00=γ000+u00
β01=γ010
β02=γ020
β03=γ030
β04=γ040
β10=γ100
β11=γ110
β12=γ120
β20=γ200+γ201(lab_info)+u20 β21=γ210
β22=γ220
302
Fonte:Cedeplar/Inep(2005)
Tabela 1: Resultados do Modelo 1 para a disciplina de matemática Efeitos Fixos Coeficiente Erro
padrãoEstat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 54,75 1,44 37,96 160 0,000 Tamanho da turma no ensino fundamental, γ001 -0,16 0,04 -4,13 160 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,77 0,24 -7,22 6437 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,75 0,39 4,52 6437 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,43 0,34 7,15 6437 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 6,09 0,28 21,82 161 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,16 0,06 -2,80 6436 0,006 Lição, β12 Associação entre lição e taxa de crescimento do aluno, γ120 -0,68 0,25 -2,76 6436 0,006 Repetiu, β13 Associação entre repetiu e taxa de crescimento do aluno, γ130 -0,65 0,19 -3,37 6436 0,001 Escolaridade do pai, β14 Associação entre escolaridade do pai e taxa de crescimento do aluno, γ140
0,26 0,06 4,69 6436 0,000
Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,90 0,05 -18,01 161 0,000 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210
0,20 0,05 4,38 6438 0,000
Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220
0,20 0,03 5,75 6438 0,000
303
Fonte:Cedeplar/Inep(2005)
Tabela 1: Resultados do Modelo 1 para a disciplina de matemática (continuação) Efeitos Aleatórios Comp. da
variância Desvio padrão
Estat. 2χ
Graus de liberdade
Valor p
Nível 1 – e 26,63 5,16 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 34,39 5,86 9232,13 5182 0,000 Taxa de aprendizagem anual individual, r1 2,77 1,66 5754,20 5181 0,000
Taxa não linear de aprendizagem anual individual, r2 0,26 0,51 6228,66 5183 0,000 Nível 3 (entre as escolas)
Status médio das escolas, u00 7,90 2,81 615,08 160 0,000 Taxa de crescimento médio das escolas, u10 1,54 1,24 342,96 161 0,000
Taxa não linear de crescimento médio das escolas, u20 0,09 0,30 440,10 161 0,000
304
Fonte:Cedeplar/Inep(2005)
Tabela 2: Resultados do Modelo 2 para a disciplina de Matemática
Efeitos Fixos Coeficiente Erro padrão
Estat. t Graus de liberdade
Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 54,75 1,42 38,43 160 0,000 Tamanho da turma no ensino fundamental, γ001 -0,16 0,04 -4,23 160 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 -1,77 0,25 -7,20 6437 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,75 0,39 4,52 6437 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,44 0,34 7,21 6437 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 5,64 0,28 20,17 161 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 -0,16 0,06 -2,79 6435 0,006 Lição, β12 Associação entre lição e taxa de crescimento do aluno, γ120 -0,68 0,25 -2,74 6435 0,006 Repetiu, β13 Associação entre repetiu e taxa de crescimento do aluno, γ130 -0,58 0,19 -2,99 6435 0,003 Escolaridade do pai, β14 Associação entre escolaridade do pai e taxa de crescimento do aluno, γ140
0,26 0,06 4,68 6435 0,000
Trajeto Incompleto (de 2 a 5 rodadas), β15 Associação entre trajeto incompleto e status inicial médio do aluno, γ150
0,71 0,14 5,11 6435 0,000
305
Tabela 2: Resultados do Modelo 2 para a disciplina de Matemática (continuação) Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,79 0,05 -14,94 161 0,000 Lição, β21
Associação entre lição e taxa não linear média de crescimento do aluno, γ210
0,20 0,05 4,36 6437 0,000
Repetiu, β22
Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220
0,19 0,03 5,28 6437 0,000
Trajeto Incompleto, β23 Associação entre trajeto incompleto e status inicial médio do aluno, γ230
-0,16 0,03 -5,27 6437 0,000
Efeitos Aleatórios Comp. da variância
Desvio padrão
Estat. 2χ
Graus de liberdade
Valor p
Nível 1 – e 26,61 5,16 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 34,44 5,87 9237,73 5182 0,000 Taxa de aprendizagem anual individual, r1 2,66 1,63 5733,06 5180 0,000
Taxa não linear de aprendizagem anual individual, r2 0,25 0,50 6196,82 5182 0,000
Fonte:Cedeplar/Inep(2005)
306
Tabela 3: Resultados do Modelo 1 para a disciplina de Português Efeitos Fixos Coeficiente Erro
padrãoEstat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 48,41 0,44 109,39 161 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,62 0,26 6,15 6400 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,66 0,33 5,04 6400 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,18 0,23 9,36 6400 0,000 Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,09 0,16 12,92 26207 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,25 0,07 3,84 26207 0,000 Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,23 0,04 -6,03 160 0,000 Laboratório de informática, γ201 0,08 0,04 2,03 160 0,042 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210
0,07 0,02 4,40 6401 0,000
Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220
0,08 0,01 5,25 6401 0,000
Fonte:Cedeplar/Inep(2005)
307
Fonte:Cedeplar/Inep(2005)
Tabela 3: Resultados do Modelo 1 para a disciplina de Português (continuação) Efeitos Aleatórios Comp. da
variância Desvio padrão
Estat. 2χ
Graus de liberdade
Valor p
Nível 1 – e 32,34 5,71 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 37,90 6,16 14240,53 6239 0,000 Taxa de aprendizagem anual individual, r1 - - - - -
Taxa não linear de aprendizagem anual individual, r2 0,04 0,20 7856,70 6240 0,000 Nível 3 (entre as escolas)
Status médio das escolas, u00 6,44 2,54 728,88 161 0,000 Taxa de crescimento médio das escolas, u10 - - - - -
Taxa não linear de crescimento médio das escolas, u20 0,03 0,18 1020,20 160 0,000
308
Tabela 4: Resultados do Modelo 2 para a disciplina de Português Efeitos Fixos Coeficiente Erro
padrãoEstat. t Graus de
liberdade Valor p
Status inicial médio do aluno, π0 Status inicial médio da escola, β00 Status inicial médio das escolas, γ000 47,66 0,50 94,70 161 0,000 Sexo, β01 Associação entre sexo e status inicial médio do aluno, γ010 1,61 0,26 6,12 6399 0,000 Lição, β02 Associação entre lição e status inicial médio do aluno, γ020 1,66 0,33 5,06 6399 0,000 Repetiu, β03 Associação entre repetiu e status inicial médio do aluno, γ030 2,30 0,23 9,95 6399 0,000 Trajeto Incompleto (de 2 a 5 rodadas), β04 Associação entre trajeto incompleto e status inicial médio do aluno, γ040
1,98 0,33 5,95 6399 0,000
Taxa média de crescimento do aluno, π1 Taxa média de crescimento da escola, β10 Taxa média de crescimento das escolas, γ100 2,04 0,16 12,56 26205 0,000 Sexo, β11 Associação entre sexo e taxa de crescimento do aluno, γ110 0,25 0,07 3,80 26205 0,000 Trajeto Incompleto, β12 Associação entre trajeto incompleto e status inicial médio do aluno, γ120
-0,45 0,07 -6,66 26205 0,000
Taxa não linear média de crescimento do aluno, π2 Taxa não linear média de crescimento da escola, β20 Taxa não linear média de crescimento das escolas, γ200 -0,18 0,04 -4,67 160 0,000 Laboratório de informática, γ201 0,08 0,04 2,07 160 0,038 Lição, β21 Associação entre lição e taxa não linear média de crescimento do aluno, γ210
0,07 0,02 4,39 6401 0,000
Repetiu, β22 Associação entre repetiu e taxa não linear média de crescimento do aluno, γ220
0,07 0,01 4,90 6401 0,000
Fonte:Cedeplar/Inep(2005)
309
Tabela 4: Resultados do Modelo 2 para a disciplina de Português (continuação) Efeitos Aleatórios Comp. da
variância Desvio padrão
Estat. 2χ
Graus de liberdade Valor p
Nível 1 – e 32,56 5,71 - - - Nível 2 (alunos dentro das escolas)
Status inicial individual, r0 37,81 6,15 14281,72 6238 0,000 Taxa de aprendizagem anual individual, r1 - - - - -
Taxa não linear de aprendizagem anual individual, r2 0,04 0,20 7847,74 6240 0,000 Nível 3 (entre as escolas)
Status médio das escolas, u00 6,33 2,51 724,73 161 0,000 Taxa de crescimento médio das escolas, u10 - - - - -
Taxa não linear de crescimento médio das escolas, u20 0,03 0,18 1003,12 160 0,000
Fonte:Cedeplar/Inep(2005)
310
1.3. – AVALIAÇÃO DO IMPACTO DA BOLSA-ESCOLA E RENDA MÍNIMA SOBRE O RENDIMENTO ESCOLAR
APRESENTAÇÃO
O cenário delineado, nas últimas décadas, para o sistema educacional
brasileiro revela importantes transformações em diversos aspectos. Destaca-se
a ampliação do acesso à escola no ensino fundamental e uma melhoria nos
níveis médios de escolarização atingidos. Entretanto, muitas lacunas ainda se
fazem notar. A escolaridade média, mensurada em termos de anos médios de
estudo, ainda se encontra abaixo da alcançada por diversos países em
desenvolvimento, enquanto persistem acentuadas desigualdades,
principalmente regionais, em termos de acesso a oportunidades educacionais
(MARTELETO, 2002).
As mudanças demográficas, principalmente a queda nos níveis de
fecundidade, a partir da década de 1970, têm proporcionado uma diminuição
proporção de população em idade de cursar a educação primária, de tal sorte
que a falta de escolas parece não ser o principal problema do sistema brasileiro
de educação e maior atenção deve ser dada a questões como a qualidade da
educação e à repetência (FLETCHER & RIBEIRO, 1987; KLEIN, 1995). Abre-
se um cenário onde assume crucial importância a investigação de aspectos
ligados à qualidade, eficácia e rendimento escolar.
Por outro lado, têm se observado uma preocupação, por parte dos órgãos
governamentais com questões ligadas à educação de crianças provenientes de
famílias de baixa renda, principalmente visando a permanência na escola, por
meio de incentivo financeiro, buscando contribuir para a melhoria das
condições de vida no seio dessas famílias e, conseqüentemente, no país.
Nesse sentido, iniciativas vêm sendo desenvolvidas visando quebrar o círculo
da transmissão intergeracional da pobreza, via educação.
311
Além da ampliação do acesso ao ensino fundamental, o Governo Federal tem
optado pela adoção de medidas de transferência de renda que, além de
incentivar as matrículas, trazem uma preocupação com a permanência na
escola e conseqüente redução nos níveis de evasão escolar. No ano de 2001,
foi criado então o Programa Nacional do Bolsa Escola, com a proposta de
conceder benefício monetário mensal a milhares de famílias brasileiras em
troca da manutenção de suas crianças nas escolas.
O Bolsa Escola era uma política de complementação de renda familiar que
visava manter os alunos carentes na escola, impedindo a evasão causada pelo
trabalho infantil. Os dados utilizados são provenientes da Prefeitura de Recife,
entre os anos 2001 e 2004, e se referem aos que receberam, ou não, o
beneficio do programa municipal ou federal. A Prefeitura de Recife concedia o
benefício a famílias com renda per capita inferior a 1/3 de salário mínimo e que
morassem na cidade a pelo menos cinco anos. Estas recebiam entre R$100.00
e R$200.00 por mês, dependendo do número de filhos inscritos no programa.
Por sua vez, o Bolsa Escola concedido pelo governo federal pagava R$15.00
por mês para cada filho entre 6 e 15 anos, até o limite de três filhos por família.
Com a unificação dos programas sociais no ano de 2004, realizada pelo
Ministério do Desenvolvimento Social, o Bolsa Escola se uniu ao Auxílio Gás,
ao Cartão Alimentação e ao Bolsa Alimentação para constituir o Bolsa Família.
A reunião destes benefícios em um único programa tem como objetivo
melhorar a focalização da população alvo, além de realizar uma
complementação de renda mais consistente, uma vez que os valores pagos
isoladamente eram relativamente baixos.
Pouco tem sido feito no sentido de se analisar o enorme potencial informativo
dos bancos de dados gerados a partir dos cadastros construídos no
desenvolvimento de tais programas e menos ainda tem sido feito no sentido de
tentar investigar o impacto de tais programas nos resultados escolares
alcançados pelos alunos beneficiados.
312
OBJETIVOS
O objetivo principal desse trabalho é avaliar o impacto da bolsa escola e renda
mínima sobre o rendimento escolar de alunos do sistema educacional da
cidade do Recife.
ASPECTOS METODOLÓGICOS
BASE DE DADOS
A base de dados do programa bolsa escola municipal de Recife é constituída
por três bancos de dados:
CADASTRO (SEBE) - este banco de dados possui as informações dos alunos
que foram selecionados para os programas bolsa escola municipal e bolsa
escola federal. As informações contidas compreendem o período de 2001 a
2004. No caso do bolsa escola municipal, quando o aluno é selecionado passa
automaticamente a receber o benefício. Portanto, todos os alunos selecionados
para o bolsa escola municipal são alunos que recebem este benefício. No caso
do programa bolsa escola federal, o aluno é selecionado, mas, a apropriação
(se vai receber ou não o benefício) é feita pelo governo federal.
Este banco de dados, inicialmente, foi criado para atender as demandas do
bolsa escola municipal, passou por várias alterações, tais como a inclusão de
informações sobre o bolsa escola federal, e cadastro único do bolsa escola
federal. Cabe ressaltar que este banco de dados ainda se encontra em fase de
padronização e formatação das informações nele contidas.
PAGAMENTO E FREQUÊNCIA - Estes bancos de dados possuem
informações referentes ao pagamento de benefícios ao aluno, seja ele
municipal ou federal. Atualmente, a Prefeitura de Recife é quem coordena o
pagamento do bolsa escola federal. Estas bases de dados ainda não se
encontram disponíveis para os usuários interessados, portanto, as análises que
dependiam de seu conteúdo deverão ficar para uma etapa posterior.
313
Por outro lado, a base de dados, referente à pesquisa “Avaliação de
Desempenho: Fatores Associados” contemplando o período entre 1999 e 2003,
contém informações sobre o rendimento escolar dos alunos, sobre questões
sócio-econômicas dos alunos, professores e diretores, além de informações
sobre a infra-estrutura das escolas, dentre outras. Os escores foram estimados
e equalizados de acordo com a Teoria da Resposta ao Item, para que estando
em uma mesma escala, esses escores pudessem ser diretamente
comparáveis.
A etapa posterior constou na “linkagem” dos bancos de dados do bolsa escola
e da base de dados longitudinal “Avaliação de Desempenho: Fatores
Associados”.
MÉTODOS UTILIZADOS
Nessa primeira abordagem do problema foram desenvolvidas análises
descritivas e exploratórias dos dados sobre rendimento escolar, considerando o
fato do aluno receber, ou não, o benefício do bolsa família. A variável utilizada
para representar a informação sobre o programa foi categorizada em três
respostas, segundo o tipo de benéfico recebido: federal, municipal ou nenhum
tipo de benefício.
Modelos de análise de variância não foram estimados, porque os valores dos
testes de hipóteses poderiam estar contaminados por violações no modelo,
principalmente quanto à independência das observações, uma vez que alguns
dos alunos investigados pertencem a uma mesma escola. Tal fato levaria à
necessidade de uma investigação com modelos que incorporassem estes
elementos. Uma análise posterior com o uso, por exemplo, de modelos
hierárquicos, agregando um maior número de variáveis preditoras é
recomendada, o que não pode ser feito nesta etapa, em virtude da
indisponibilidade de dados que permitissem tal investigação no espaço de
tempo possível.
314
RESULTADOS DE MATEMÁTICA
ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS GLOBAIS
Esta análise trata de uma abordagem preliminar dos dados, procurando
ressaltar alguns aspectos descritivos dos mesmos, tendo por base a variável
rendimento do aluno, representada pela média aritmética dos escores
estimados e equalizados, no período de 2001 a 2003, segundo a Teoria da
Resposta ao Item,
A Tabela 1 e o Gráfico 1 a seguir apresentam resultados do cruzamento dos
escores de rendimento com a variável tipo de benefício, lembrando que a
primeira foi recodificada em duas categorias de escores, compreendendo
valores baixo e acima de 60. Por outro lado, a variável tipo de benefício foi
categorizada 3 grupos: nenhum benefício; benefício federal e benefício
municipal.
Tabela 1
Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em matemática,segundo o tipo de
benefício recebido – 2001 a 2004
Tipo debenefício < 60 >60 TotalNenhum Abs. 43 43 86
% 50,0 50,0 100,0Municipal Abs. 19 10 29
% 65,5 34,5 100,0Federal Abs. 67 62 129
% 51,9 48,1 100,0Total Abs. 129 115 244
% 52,9 47,1 100,0
Classes de escore
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
315
Gráfico 1
Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em matemática, segundo o tipo
de benefício recebido – 2001 a 2004
0
10
20
30
40
50
60
70
Nenhum Municipal Federal Total
<60>=60
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
Os resultados exibem uma distribuição por classes dos escores muito
semelhante entre os que recebem benéfico federal e os que não recebem
nenhum tipo de benefício. Entre os que recebem bolsa municipal, os resultados
mostram uma maior concentração nesse grupo na categoria de escores
menores que 60, sugerindo resultados inferiores aos que não recebem nenhum
tipo de benefício.
Em seguida, foi realizada uma análise exploratória da variável escore médio,
por tipo de benefício recebido. Tais resultados são apresentados em forma de
Tabela e Gráfico 2.
316
Tabela 2
Medidas descritivas e exploratórias dos escores médiosde matemática, por tipo de benefício recebido.
Nenhum Municipal FederalMédia 59,02 58,53 59,05Tri-média(5%) 59,08 58,33 59,01Mediana 59,73 57,78 59,84Variancia 59,15 60,17 52,05Desvio padrão 7,69 7,76 7,21Mínimo 39,83 44,77 42,22Máximo 77,54 76,00 76,95Amplitude 37,71 31,23 34,73Amp. interquartil 9,57 8,75 9,66Assimetria -0,16 0,56 0,00Curtose -0,05 -0,18 -0,35
EstatísticasTipo de benefício
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
317
Gráfico 2
Escores médios de rendimento escolar em matemática,
por tipo de benefício recebido
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
Tais resultados descritivos e exploratórios, de modo geral, corroboram os
apresentados anteriormente, indicando uma distribuição semelhante, tanto em
termos de medidas de posição central, como de variabilidade, para os grupos
dos que não recebem nenhum tipo de benefício e aqueles que recebem
benefício federal, enquanto os que recebem benefício municipal apresentam
valores centrais ligeiramente inferiores e uma distribuição com menor nível de
variabilidade, ou seja, com valores ligeiramente mais homogêneos.
318
ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS POR SEXO
Em uma tentativa de aprofundar a análise, os dados são investigados nessa
seção detalhados por sexo. Para obter resultados mais robustos, a variável tipo
de benefício foi dicotomizada considerando apenas os casos em que o aluno
recebe, ou não, qualquer tipo de benefício, agregando-se os resultados dos
que recebem bolsa municipal e federal.
A Tabela 3 apresenta resultados dos escores dicotomizados, classificados por
acesso ao benefício (recebe ou não), para cada sexo.
Tabela 3
Escores de matemática, por acesso ao benefício, segundo sexo
Escore<60 >=60 Total
Não Recebe Absoluto 17 19 36% 47,2 52,8 100,0
Recebe Absoluto 31 37 68% 45,6 54,4 100,0
Total Absoluto 48 56 104% 46,2 53,8 100,0
Não Recebe Absoluto 26 24 50% 52,0 48,0 100,0
Recebe Absoluto 54 35 89% 60,7 39,3 100,0
Total Absoluto 80 59 139% 57,6 42,4 100,0
Masculino
Feminino
Tipo
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
319
Entre os homens, a chance de apresentar um escore superior a 60 não
apresenta grandes diferenciais entre os que recebem e os que não recebem o
benefício, sendo ligeiramente inferior para estes últimos. Foi encontrada uma
razão de chances da ordem de 1,064, ou seja, os que recebem o benefício
apresentam uma chance cerca de 6,5% superior de ter um escore maior que
60 do que os que não recebem.
Já entre as mulheres, os resultados são de certo surpreendentes, uma vez que
a chance de apresentar um escore superior a 60 é maior entre as que não
recebem benefício, correspondendo a uma razão de chances da ordem de 0,7,
ou seja, as que não recebem benefício apresentam uma chance 43% maior de
ter um escore inferior a 60 do que as que não recebem qualquer tipo de
benefício.
Uma abordagem exploratória dos dados, por sexo, é apresentada na Tabela 4,
em que se pode observar, inicialmente resultados ligeiramente inferiores para o
sexo feminino nos escores centrais de matemática. Observa-se ainda que entre
os homens há uma discreta tendência de valores centrais mais elevados entre
os que recebem algum tipo de benefício, ao contrário do grupo das mulheres,
em que se observam valores centrais ligeiramente superiores para os que não
recebem qualquer tipo de benefício, resultado já observado na investigação
anterior com dados mais agregados.
320
Tabela 4
Medidas descritivas e exploratórias dos escores médios de matemática,
por acesso ao benefício e sexo.
Masculino FemininoRecebem Não Recebem Recebem Não Recebem
Média 59,8 59,6 58,4 58,6Tri-média(5%) 59,8 59,8 58,2 58,6Mediana 60,7 60,3 58,1 59,0Variancia 54,4 67,0 52,5 54,3Desvio padrão 7,4 8,2 7,2 7,4Mínimo 42,2 39,8 44,2 42,3Máximo 76,0 77,5 76,9 75,0Amplitude 33,8 37,7 32,7 32,8Amp. interquartil 8,9 10,5 10,0 9,8Assimetria -0,1 -0,2 0,3 -0,2Curtose -0,1 0,0 -0,5 0,0
Estatísticas
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
321
RESULTADOS DE PORTUGUÊS
ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS GLOBAIS
A Tabela 5 e o Gráfico 3 apresentam resultados do cruzamento dos escores de
rendimento - classificados em duas categorias, correspondendo a escores
abaixo e acima de 60 - e a variável tipo de benefício, a princípio classificada em
3 categorias: nenhum tipo de benefício, benefício municipal e benefício federal.
Tabela 5
Número de benefícios recebidos no programa bolsa escola
em Recife, por classe de escore de rendimento escolar em português,
segundo o tipo de benefício recebido – 2001 a 2004
<60 >=60 TotalNenhum Abs. 23 13 36
% 63,9 36,1 100,0Municipal Abs. 5 3 8
% 62,5 37,5 100,0Federal Abs. 29 17 46
% 63,0 37,0 100,0Total Abs. 57 33 90
% 63,3 36,7 100,0
Classes de escoreTipo de Benefício
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
322
Gráfico 3
Número de benefícios recebidos no programa bolsa escola em Recife, por classe de escore de rendimento escolar em português, segundo o tipo de
benefício recebido – 2001 a 2004
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
Nenhum Municipal Federal Total
<60>=60
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
Inicialmente, cabe destacar uma participação mais elevada de escores abaixo
de 60 em português do que a observada nos escores de matemática. No que
tange à distribuição dos escores nas diversas categorias de tipos de benefícios,
nota-se bastante semelhança entre os resultados dos que não recebem
nenhum tipo de benefício e daqueles que recebem benefício, municipal ou
federal.
Em seguida, foi feita uma análise exploratória da variável escore médio, por
tipo de benefício recebido. Tais resultados são apresentados na Tabela 6 e
Gráfico 4.
323
Tabela 6
Medidas descritivas e exploratórias dos escores médios de português,
por tipo de benefício recebido.
Nenhum Municipal FederalMédia 56,6 55,6 57,5Tri-média(5%) 56,6 56,1 57,4Mediana 56,5 58,1 58,4Variancia 76,0 68,0 80,0Desvio padrão 8,7 8,2 8,9Mínimo 39,8 39,5 40,1Máximo 74,2 63,7 76,1Amplitude 34,4 24,2 36,0Amp. interquartil 14,5 12,8 11,6Assimetria 0,0 -1,2 -0,1Curtose -0,7 0,9 -0,2
EstatísticasTipo de benefício
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
Gráfico 4
Escores médios de rendimento escolar em português, por tipo de benefício recebido
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
324
A investigação exploratória dos dados indica, de modo geral, valores centrais
ligeiramente mais elevados para os que recebem algum tipo de benefício, seja
municipal ou federal, exibindo estas distribuições ainda certo grau de
assimetria positiva, ou seja, uma tendência de concentração nos escores mais
baixos; já a distribuição dos escores daqueles que não recebem benefícios
apresenta um maior grau de variabilidade, combinado com uma distribuição
ligeiramente mais simétrica.
ANÁLISE DESCRITIVA E EXPLORATÓRIA DOS DADOS: RESULTADOS POR SEXO
Em uma tentativa de aprofundar a análise, os dados são investigados nessa
seção, detalhados por sexo. Para obter resultados mais robustos, a variável
tipo de benefício foi dicotomizada considerando apenas os casos em que o
aluno recebe, ou não, qualquer tipo de benefício, agregando-se os resultados
dos que recebem bolsa municipal e federal.
A Tabela 7 apresenta resultados dos escores acima e abaixo de 60,
classificados por acesso ao benefício (recebe ou não), para cada sexo.
Tabela 7
Escores de português, por acesso ao benefício, segundo sexo
Escore<60 >=60 Total
Não Recebe Absoluto 12 4 16% 75,0 25,0 100,0
Recebe Absoluto 14 2 16% 87,5 12,5 100,0
Total Absoluto 26 6 32% 81,3 18,8 100,0
Não Recebe Absoluto 11 9 20% 55,0 45,0 100,0
Recebe Absoluto 19 18 37% 51,4 48,6 100,0
Total Absoluto 30 27 57% 52,6 47,4 100,0
TipoMasculino
Feminino
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
325
Inicialmente, cabe destacar uma participação bem mais elevada em escores
inferiores a 60 no grupo dos homens. Nesse grupo foi encontrada uma razão
de chances da ordem de 2,33, indicando que entre os que recebem algum
benefício a chance de ter um escore inferior a 60 é cerca de 2,3 vezes superior
à daqueles que não recebem.
Entre as mulheres, os resultados se invertem, com uma razão de chances da
ordem de 0,864, sugerindo que entre as que recebem benefício, as chances de
apresentarem escores acima de 60 são aproximadamente 16% superiores do
que entre o grupo das que não recebem qualquer tipo de benefício.
Uma abordagem exploratória dos dados, por sexo, é apresentada na Tabela 8,
onde se pode observar, inicialmente resultados inferiores para o sexo
masculino nos escores centrais de português. Observam-se, ainda, que entre
os homens há uma ligeira tendência de valores centrais mais elevados para os
que não recebem qualquer tipo de benefício, ao contrário do que ocorre no
grupo das mulheres em que se observam valores centrais ligeiramente
superiores para as que recebem algum tipo de benéfico, corroborando os
resultados anteriormente observados na investigação com dados mais
agregados.
Tabela 8
Medidas descritivas e exploratórias dos escores médios de português,
por acesso ao benefício e sexo.
Recebem Não Recebem Recebem Não RecebemMédia 53,7 54,4 59,2 58,4Tri-média(5%) 53,8 54,6 59,1 58,4Mediana 55,0 55,7 58,9 57,6Variancia 68,1 60,1 67,5 85,2Desvio padrão 8,3 7,8 8,2 9,2Mínimo 40,1 39,8 41,1 43,5Máximo 66,4 66,2 76,1 74,2Amplitude 26,4 26,3 35,0 30,8Amp. interquartil 12,8 13,3 9,8 15,2Assimetria -0,6 -0,3 0,0 0,0Curtose -0,7 -0,7 -0,2 -1,0
FemininoEstatísticas
Masculino
Fonte: Programa Bolsa Família –Recife (2005); Cedeplar/ Inep (2005).
326
CONSIDERAÇÕES FINAIS
Os resultados encontrados nesta etapa do trabalho têm um caráter puramente
descritivo e exploratório e devem ser examinados à luz das limitações impostas
pela base de dados, que, ainda, não permitiu a incorporação de outros
indicadores da situação sócio-econômica dos alunos investigados. Espera-se,
com a liberação das bases de dados de pagamentos e freqüência, a ser feito
em etapa posterior, uma maior disponibilidade de dados que permitam uma
modelagem mais acurada.
Alguns dos resultados encontrados nessa investigação corroboram os
encontrados em outros estudos, ao passo que outros se revestem de certo
modo surpreendem. Inicialmente cabe destacar, de modo geral, os resultados
em matemática parecem ser melhores que os de português, pois cerca de 53%
dos escores médios foram inferiores a 60 em matemática, enquanto que em
português esse percentual foi da ordem 63,3%. Desagregados por sexo, esses
dados revelam que em matemática os escores tendem a ser melhores entre os
homens, cujo percentual de escores abaixo de 60 foi da ordem de 46,2%,
contra os 57,6% encontrados entre as mulheres. Em português, a situação se
inverte, revelando um desempenho bastante inferior dos homens, cujo
percentual de escores abaixo de 60 foi da ordem de 81,3%, contra os 52,6%
detectado entre as mulheres. No tocante ao impacto do programa bolsa escola
no rendimento escolar dos alunos, os resultados sugerem pouca ou nenhuma
influência.
A distribuição dos escores de matemática foi bastante semelhante entre os que
recebem bolsa federal e os que não recebem nenhum tipo de benefício, sendo
que nesta disciplina os resultados chegam a apresentar valores ligeiramente
inferiores para os que recebem bolsa municipal. Os escores de português
também revelam uma distribuição bastante semelhante entre os que recebem e
os que não recebem qualquer benefício.
Os resultados desagregados por sexo, revelam situações interessantes. O
exame dos resultados de matemática, revelou que entre os homens, a chance
de apresentar um escore superior a 60 foi apenas ligeiramente inferior para os
327
que recebem algum benefício. Entre as mulheres, os resultados são de certo
surpreendem, uma vez que a chance de apresentar escores mais elevados foi
maior entre as que não recebem benefício.
Os resultados de português exibem um padrão diferente. Entre os homens, os
resultados sugerem que o fato de receber algum benefício piora o rendimento,
ao contrário do que acontece no grupo das mulheres.
Esta abordagem exploratória certamente deixa muito mais questões do que
respostas, mas levantou pontos importantes a serem investigados em uma
etapa posterior, uma vez que não foram feitas investigações de natureza
inferencial.
Espera-se que alguma contribuição ao aprofundamento do tema tenha sido
dada e que uma modelagem adequada possa confirmar os resultados
exploratórios aqui encontrados.
328
AÇÃO 1.5 – ESTUDOS SOBRE A PERMANÊNCIA E TRANSIÇÕES DOS ALUNOS NO SISTEMA
EDUCACIONAL BRASILEIRO
APRESENTAÇÃO
Esta ação está subdividida em duas sub-ações. A primeira delas se refere à
análise descritiva sobre a promoção, a permanência e o aproveitamento
escolar dos alunos, de 1999 a 2003. A segunda sub-ação diz respeito à
avaliação do impacto do bolsa escola e renda mínima sobre o desempenho
escolar, no que tange à promoção, permanência escolar e aproveitamento.
Este segundo relatório foi realizado com a utilização do banco de dados
“Cadastro” enviado pela Prefeitura de Recife e com a utilização do banco de
dados “Avaliação de Desempenho: Fatores Associados” do qual foram
retirados os escores equalizados dos alunos para a análise do impacto do
bolsa escola no rendimento escolar.
329
1.1 – ANÁLISE SOBRE PROMOÇÃO, PERMANÊNCIA NA ESCOLA E APROVEITAMENTO ESCOLAR DOS
ALUNOS (4ª A 8ª SÉRIE)
APRESENTAÇÃO
Para fazer a análise proposta nesta seção foi utilizado um programa no
software SPSS para identificar quais provas os alunos fizeram. Desse modo, foi
feita uma discriminação dos alunos por provas realizadas. A classificação é
apresentada nas figuras 1 e 2 a seguir.
As figuras 1 e 2 mostram a distribuição longitudinal dos alunos entre abril de
1999 e novembro de 2003 nas provas de matemática e português. O aluno,
considerando a sua participação nas provas, foi classificado por uma letra A, B,
C, D, E ou F e um número, de 1 a 6.
Desta forma, A1 corresponde aos alunos que fizeram a prova de matemática
em abril de 1999, conforme a figura 1; o grupo A2 corresponde aos alunos A1
que fizeram a prova de novembro de 1999; o conjunto A3 são os alunos A2 que
fizeram a prova de novembro de 2000 e assim, sucessivamente, até A6.
Pode-se relacionar B2 aos alunos que participaram pela primeira vez da
pesquisa em novembro de 1999; B3 representa os alunos de B2 que fizeram a
prova de 2000. O conjunto C3 são os alunos que fizeram a prova de 2000, mas
não realizaram a prova de novembro de 1999, enquanto C4 representa o grupo
C3 que fez a prova de 2001. Por sua vez, os alunos que não fizeram a prova
de 2000, contudo participaram da prova de 2001 são representados por D4. A
analogia realizada até o grupo D4, deve, também, ser aplicada aos grupos
posteriores do esquema longitudinal presentes nas figuras 1 e 2.
330
Figura 1: Distribuição longitudinal dos alunos entre abril de 1999 e novembro de 2003 nas provas de matemática.
A1 12641A2 10026 B2 660A3 6437 B3 326 C3 8731A4 4337 B4 185 C4 4544 D4 6214A5 2963 B5 111 C5 2675 D5 2997 E5 3445A6 1987 B6 64 C6 1676 D6 1640 E6 1473 F6 3261
Fonte: Cedeplar/Inep(2005)
Figura 2: Distribuição longitudinal dos alunos entre abril de 1999 e novembro de 2003 nas provas de português.
A1 12624A2 9929 B2 653A3 6360 B3 328 C3 8775A4 4311 B4 189 C4 4551 D4 6170A5 2941 B5 116 C5 2681 D5 2973 E5 3435A6 1975 B6 72 C6 1674 D6 1625 E6 1452 F6 3275
Fonte: Cedeplar/Inep(2005)
O gráfico 1 mostra uma comparação do número de alunos em cada grupo da
pesquisa por disciplina entre abril de 1999 e novembro de 2003. Observa-se
que em todos os grupos A, D e E foram realizadas mais provas de matemática
do que de português. Já nas etapas B e C houve uma alternância entre as
disciplinas cujas provas foram realizadas por um maior número de alunos.
Somente no conjunto F as provas de português foram realizadas por uma
maior quantidade de alunos do que matemática.
331
Fonte: Cedeplar/Inep(2005)
A tabela 1 e o gráfico 2 mostram os números de alunos que fizeram prova por
ano e por disciplina entre abril de 1999 e novembro de 2003. Nota-se que a
prova de matemática foi realizada com maior freqüência pelos alunos em todos
os anos, quando comparada à freqüência com que os alunos realizaram as
provas de português.
Tabela 1: Número de alunos que fizeram prova por ano e por disciplina entre abril de 1999 e novembro de 2003
Ano Português Matemáticaabr/99 12624 12641nov/99 10582 106862000 15463 154942001 15221 152802002 12146 121912003 10073 10101
Fonte: Cedeplar/Inep(2005)
Gráfico 1: Comparação do número de alunos em cada etapa da pesquisa por disciplina entre abril de 1999 e novembro de 2003
0
2000
4000
6000
8000
10000
12000
14000
A1 A2 A3 A4 A5 A6 B2 B3 B4 B5 B6 C3 C4 C5 C6 D4 D5 D6 E5 E6 F6
Etapa da pesquisa
Núm
ero
de a
luno
s
MatemáticaPortuguês
332
Fonte: Cedeplar/Inep(2005)
As tabelas 2 e 3 mostram o percentual de alunos que realizaram as provas de
acordo com os períodos apresentados nas células destas tabelas para as
disciplinas de matemática e de português, respectivamente.
Pela análise da tabela 2, por exemplo, que contém os resultados referentes à
discilpina de matemática, observa-se que 79,31% dos alunos que realizaram a
prova de abril de 1999 fizeram a prova de novembro do mesmo ano. Do
mesmo modo, aproximadamente 28% dos que fizeram a prova de novembro de
1999 continuaram no processo até 2001. Pode-se notar, também, que apenas
15,72% dos alunos apresentaram uma trajetória completa, ou seja, fizeram
todas as provas, desde abril de 1999 a novembro de 2003.
Para a prova de português, este percentual é próximo ao observado em
matemática, visto que 15,64% dos alunos fizeram todas as provas. Em geral,
vale ressaltar que os demais percentuais são semelhantes nas duas
disciplinas.
Gráfico 2: Comparação do número de alunos por ano e por disciplina entre abril de 1999 e novembro de 2003
Apr-99
Nov-99
Nov-00 Nov-01
Nov-02
Nov-03
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
Ano
Núm
ero
de a
luno
s
PortuguêsMatemática
333
Tabela 2: Percentual de alunos que realizaram as provas de acordo com os períodos mostrados nas células da tabela para a disciplina de
matemática
Período abr/99 nov/99 2000 2001 2002 nov/99 79,31% - - - -
2000 50,92% 49,39% - - -
2001 34,31% 28,03% 52,04% - -
2002 23,44% 16,82% 30,64% 48,23% -
2003 15,72% 9,70% 19,20% 26,39% 42,76%
Fonte: Cedeplar/Inep(2005)
Tabela 3: Percentual de alunos que realizaram as provas de acordo com os períodos mostrados nas células da tabela para a disciplina de
português
Período abr/99 nov/99 2000 2001 2002 nov/99 78,65% - - - -
2000 50,38% 50,23% - - -
2001 34,15% 28,94% 51,86% - -
2002 23,30% 17,76% 30,55% 48,18% -
2003 15,64% 11,03% 19,08% 26,34% 42,27%
Fonte: Cedeplar/Inep(2005)
As tabelas 4 e 5 apresentam o percentual dos alunos que fizeram prova em
dois anos consecutivos, entre abril de 1999 e novembro de 2003, por grupo em
matemática e português, respectivamente.
Por meio da tabela 4, pode-se observar, por exemplo, que 64,20% dos alunos
do grupo A fizeram prova em novembro de 1999 e de 2000. Esta foi o menor
percentual de realização de provas entre anos consecutivos, quando se
considera apenas o grupo A. Da mesma forma, observa-se que no grupo E,
aproximadamente 43% (42,76%) dos alunos que fizeram a prova em 2002
continuaram no processo em 2003.
334
Análise semelhante pode ser feita para a tabela 5, referente às provas de
português, que em geral, apresentam resultados próximos aos observados em
matemática.
Tabela 4: Percentual dos alunos que fizeram prova em dois anos consecutivos, conforme períodos especificados, por grupo em
matemática
período grupo
abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003
A 79,31% 64,20% 67,38% 68,32% 67,06%
B - 49,39% 56,75% 60,00% 57,66%
C - - 52,04% 58,87% 62,65%
D - - - 48,23% 54,72%
E - - - - 42,76%
Fonte: Cedeplar/Inep(2005)
Tabela 5: Percentual dos alunos que fizeram prova em dois anos consecutivos, conforme períodos especificados, por grupo em português
período grupo
abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003
A 78,65% 64,05% 67,78% 68,22% 67,15% B - 50,23% 57,62% 61,38% 62,07% C - - 51,86% 58,91% 62,44% D - - - 48,18% 54,66% E - - - - 42,27%
Fonte: Cedeplar/Inep(2005)
335
A tabela 6 mostra o número de alunos relacionados à permanência nas escolas
entre abril de 1999 e novembro de 2003 em matemática, e a tabela 7 apresenta
os percentuais correspondentes. Por meio dessas tabelas, pode-se notar três
situações nas quais os alunos podem estar inseridos: 1) aqueles que mudaram
de escola de um ano para o outro; 2) os que nela permaneceram por pelo
menos duas rodadas consecutivas; e 3) os que não fizeram prova em dois
anos consecutivos.
Pela análise desses dados, pode-se observar que o percentual de alunos que
mudaram de escola é baixo em relação aos que realizaram pelo menos duas
provas de matemática. Como pode ser notado o maior percentual de alunos
que mudaram de escola foi de 2,24% entre 2001 e 2002, o que corresponde,
em valor absoluto, a 196 alunos de 8746 que fizeram as provas.
O menor percentual de alunos que mudaram de escola foi entre abril e
novembro de 1999, como é esperado, haja vista que o ano é o mesmo. Assim,
apenas 19 alunos migraram de escola, o que representa 0,19% do total de
alunos que fizeram as duas provas.
Além disso, percebe-se que entre 2002 e 2003, houve uma diminuição do
percentual de alunos que mudaram de escola e, por conseguinte, uma
elevação do percentual de alunos que continuaram numa mesma escola.
Assim, entre 2002 e 2003, aproximadamente 0,4% dos alunos mudaram de
escola enquanto que este percentual atinge 2,24% entre os anos de 2001 e
2002, citados anteriormente. Para os alunos que não fizeram prova em dois
anos consecutivos, somente é apresentado o valor absoluto, observando-se
um número considerável de alunos nesta situação.
Tabela 6: Situação dos alunos com relação à continuidade nas escolas
entre abril de 1999 e novembro de 2003 para matemática Situação Período mudaram de escola permaneceram na escola não fizeram prova em dois
anos consecutivosabr99/nov99 19 10007 3275nov99/2000 110 6653 126542000/2001 90 8976 126422001/2002 196 8550 99792002/2003 24 6816 8612
Fonte: Cedeplar/Inep(2005)
336
Tabela 7: Percentual dos alunos com relação à continuidade nas escolas entre
abril de 1999 e novembro de 2003 para matemática
Situação Período mudaram de escola permaneceram na escola
abr99/nov99 0,19% 99,81%nov99/2000 1,63% 98,37%2000/2001 0,99% 99,01%2001/2002 2,24% 97,76%2002/2003 0,35% 99,65%
Fonte: Cedeplar/Inep(2005)
As tabelas 8 e 9 representam o número e o percentual, respectivamente, de
alunos relacionados à permanência nas escolas entre abril de 1999 e
novembro de 2003 para a disciplina de português. Por meio dessas tabelas,
observa-se que os resultados de português não variam expressivamente, se
comparados aos de matemática.
Para a disciplina de português, entre os períodos de abril de 1999 a novembro
do mesmo ano, apenas 0,11% dos alunos mudaram de escola. Os demais
percentuais são também semelhantes aos seus correspondentes na prova de
matemática, tanto que para a transição referente aos períodos de 2001 e 2002,
o percentual de mudança de alunos é de 2,25%, ocorrendo uma redução nesse
percentual para o período de 2002 e 2003, que foi de 0,35%.
Tabela 8: Situação dos alunos com relação à continuidade nas escolas entre abril de 1999 e novembro de 2003 para português
Situação Período mudaram de escola permaneceram na escola não fizeram prova em dois
anos consecutivosabr99/nov99 11 9918 3348nov99/2000 106 6582 126692000/2001 91 8960 125822001/2002 196 8515 99452002/2003 24 6775 8633
Fonte: Cedeplar/Inep(2005)
337
Tabela 9: Percentual dos alunos com relação à continuidade nas escolas entre
abril de 1999 e novembro de 2003 para português
Situação Período mudaram de escola permaneceram na escola
abr99/nov99 0,11% 99,89%nov99/2000 1,58% 98,42%2000/2001 1,01% 98,99%2001/2002 2,25% 97,75%2002/2003 0,35% 99,65%
Fonte: Cedeplar/Inep(2005)
O gráfico 3 refere-se ao percentual de alunos que mudaram de escola entre
rodadas consecutivas realizadas durante a pesquisa, no período de abril de
1999 a novembro de 2003 por disciplina. Novamente, os valores para as
provas de português e de matemática são semelhantes, podendo ser
ressaltada uma maior diferença no período referente a abril de 1999 e
novembro de 1999.
Gráfico 3: Percentual de alunos que mudaram de escola em anos consecutivos entre abril de 1999 e novembro de 2003 por disciplina
0,00%
0,50%
1,00%
1,50%
2,00%
2,50%
abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003
Período
Perc
entu
al
PortuguêsMatemática
Fonte: Cedeplar/Inep(2005)
338
O gráfico 4 mostra uma comparação do percentual de alunos que
permaneceram na escola em anos consecutivos, entre as provas de abril de
1999 e novembro de 2003, por disciplina. Percebe-se uma certa oscilação,
mesmo que pequena, em relação aos percentuais de alunos que
permaneceram em uma mesma escola. Até 2000, português apresenta um
maior percentual de alunos que continuaram numa mesma escola em anos
consecutivos. A partir deste período, o este percentual referente à disciplina de
matemática passa a ser maior.
Gráfico 4: Percentual de alunos que permaneceram na escola em anos consecutivos entre abril de 1999 e novembro de 2003 por disciplina
96,50%
97,00%
97,50%
98,00%
98,50%
99,00%
99,50%
100,00%
100,50%
abr99/nov99 nov99/2000 2000/2001 2001/2002 2002/2003
Período
Perc
entu
al
PortuguêsMatemática
Fonte: Cedeplar/Inep(2005)
339
1.2 – AVALIAÇÃO DO IMPACTO DA BOLSA ESCOLA E RENDA MÍNIMA SOBRE O DESEMPENHO ESCOLAR
(PROMOÇÃO, PERMANÊMCIA ESCOLAR E APROVEITAMENTO)
APRESENTAÇÃO
Conforme dito anteriormente, este relatório foi realizado com a utilização do
banco de dados “Cadastro” enviado pela Prefeitura de Recife e com a
utilização do banco de dados “Avaliação de Desempenho: Fatores Associados”
do qual foram retirados os escores equalizados dos alunos para a análise do
impacto do bolsa escola no rendimento escolar.
De início, conforme a Tabela 1, é apresentada uma comparação entre as
estatísticas descritivas dos escores equalizados referentes aos alunos do
banco de dados “Avaliação de desempenho e fatores associados” (2001-2003)
e do banco de dados cadastro do programa Bolsa Escola do Recife (2001-
2004), após o merge com os escores equalizados advindos da pesquisa
Avaliação de desempenho, para a disciplina de matemática.
Sendo assim, o banco do Bolsa Escola passou a contar com 244 alunos que
participaram das provas de matemática da pesquisa “Avaliação de
desempenho e fatores associados” no período de 2001 a 2003. Por meio da
Tabela 1, pode-se observar que os escores médios desses alunos (58,98) são
menores que os escores médios quando se consideram todos os alunos do
banco de dados “Avaliação de desempenho e fatores associados” durante o
período de 2001 a 2003 (61,44). Contudo, os alunos do bolsa escola
apresentam um valor mínimo (39,83) maior do que o observado para todos
alunos que realizaram as provas de matemática entre 2001 e 2003 na pesquisa
da avaliação de desempenho.
340
Tabela 1
Estatisticas descritivas dos escores equalizados referentes aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e do banco Bolsa Escola do Recife, após junção com escores equalizados
advindos da pesquisa Avaliação de desempenho -Matemática
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
Comparação análoga à anterior para a disciplina de português pode ser vista
na Tabela 2. Neste caso, a comparação entre as estatísticas descritivas dos
escores equalizados referentes aos alunos do banco de dados “Avaliação de
desempenho e fatores associados” (2001-2003) e do banco de dados cadastro
do programa Bolsa Escola do Recife (2001-2004) mostra que novamente os
escores médios dos alunos constantes no banco de dados bolsa escola são
levemente inferiores (56,97) aos escores equalizados médios apresentados
pelos alunos da pesquisa “Avaliação de Desempenho: Fatores Associados”
(57,95). O mesmo acontece no caso do desvio padrão e dos valores máximos.
Contudo, conforme aconteceu em matemática, os alunos em português
constantes no banco bolsa escola de Recife apresentaram um valor mínimo
superior em aproximadamente 9 pontos ao valor apresentado pelos alunos que
fizeram as provas de português entre 2001 e 2003, aplicadas pela pesquisa
anteriormente citada.
Escore Frequência Média Desvio Padrão Mínimo Máximo
61.44 9.33 34.60 89.61
Bolsa Escola - 01/04 244 58.98 7.42 39.83 77.54
Avaliação de Desempenho - 01/03 37564
341
Tabela 2
Estatisticas descritivas dos escores equalizados referentes aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e do banco Bolsa Escola do Recife, após junção com escores equalizados
advindos da pesquisa Avaliação de desempenho -Português
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
A seguir são apresentadas as freqüências absolutas e relativas dos escores
equalizados referente aos alunos do banco de dados “Avaliação de
Desempenho: Fatores Associados” e aos alunos do banco Bolsa Escola do Re
cife, respectivamente para as disciplinas de matemática (Tabela 3) e português
(Tabela 4).
Tabela 3
Frequência dos escores equalizados referente aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e aos alunos do
banco Bolsa Escola do Recife, após junção com escores equalizados advindos da pesquisa Avaliação de desempenho -Matemática
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
No caso da disciplina de matemática, conforme mostra a Tabela 3, dos alunos
referentes ao programa Bolsa Escola, um percentual de 47,13 apresentam
escores médios iguais ou superiores a 60, enquanto que este percentual para
os alunos que realizaram as provas de matemática entre 2001 e 2003 foi de
Escore Frequência Média Desvio Padrão Mínimo Máximo
30.68 83.39
Bolsa Escola - 01/04 90 56.97 8.72 39.51 76.11
Avaliação de Desempenho - 01/03 37440 57.95 10.02
Escores Média Frequência PercentualMenor que 60 15621 41.59
Maior ou igual a 60 21943 58.41Total 37564 100
Menor que 60 129 52.87Maior ou igual a 60 115 47.13
Total 244 100
Avaliação de Desempenho - 01/03
Bolsa Escola - 01/04
342
58,41%. Este percentual é, portanto, superior em aproximadamente 11 pontos
ao percentual que se refere aos alunos constates no banco bolsa escola.
Tabela 4
Frequência dos escores equalizados referente aos alunos do banco de dados "Avaliação de desempenho e fatores associados" e aos alunos do
banco Bolsa Escola do Recife, após junção com escores equalizados advindos da pesquisa Avaliação de desempenho –Português
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
Quanto à disciplina de português, apesar da diferença de percentual entre os
alunos com escores iguais ou superiores a 60 ser praticamente a mesma
(aproximadamente 11 pontos) , quando se compara os escores médios obtidos
por meio dos dois bancos de dados, há uma diferença de, também,
aproximadamente 11 pontos, quando se compara cada um desses percentuais
com os seus correspondentes em matemática. Então, comparando-se
matemática e português, pode-se dizer que os alunos apresentaram
desempenhos inferiores na disciplina de português, tanto no que se refere ao
banco de dados “Avaliação de Desempenho: Fatores Associados”, quanto no
que se refere aos dados do Bolsa Escola.
Por fim, são apresentadas tabelas cruzadas, para as disciplinas de português e
matemática, a fim de se ter uma indicação do tipo de relação existente entre
receber, ou não, o benefício referente ao Bolsa Escola Municipal ou Federa e
os escores médios dos alunos constantes no banco Bolsa Escola de Recife.
Escores Média Frequência PercentualMenor que 60 19520 52.14
Maior ou igual a 60 17920 47.86Total 37440 100
Menor que 60 57 63.33Maior ou igual a 60 33 36.67
Total 90 100
Avaliação de Desempenho - 01/03
Bolsa Escola - 01/04
343
Tabela 5
Recebe, ou não, benefício versus escore equalizado- Matemática Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
Para a disciplina de matemática, a tabela 5 mostra os valores absolutos e os
percentuais de linha, considerando recebe, ou não, o benefício bolsa escola
versus escores equalizados médios recodificados em menores que 60 e iguais
ou maiores que 60. Dos que não recebem nenhum tipo de benefício, um
percentual de 50% obtiveram escores iguais ou maiores que 60. Entre os que
recebem algum tipo de benefício, seja ele municipal ou federal, este percentual
é inferior a aproximadamente 4,5 pontos (45,57%). Esses resultados sugerem
não haver dependência entre receber benefício e possuir maiores escores.
Tabela 6
Recebe, ou não, benefício versus escore equalizado- Português
Fonte: Cedeplar/ Inep (2005); Programa Bolsa Família –Recife (2005)
<60 >=60 Total43 43 86
50.00% 50.00% 100%86 72 158
54.43% 45.57% 100%129 115 244
52.87% 47.13% 100%
Escore
Não recebe nenhum tipo de beneficioRecebe beneficio
municipal ou federal
Total
Bolsa
<60 >=60 Total23 13 36
63.89% 36.11% 100%34 20 54
62.96% 37.03% 100%57 33 90
63.33% 36.66% 100%
Escore
Total
Bolsa
Não recebe nenhum tipo de beneficioRecebe beneficio
municipal ou federal
344
Para a disciplina de português, conforme mostra a tabela 6, considerando a
diferença no percentual de escores iguais ou superiores a 60 entre aqueles que
recebem benefício (37,03%), ou não recebem (36,11%), pode-se dizer que esta
é ainda menor que no caso de matemática. Portanto, estes resultados mais
uma vez, sugerem a independência entre o recebimento de benefício e
melhores rendimentos escolares.
345
CONSIDERAÇÕES FINAIS
APRESENTAÇÃO
De início vale, ressaltar que embora o banco de dados tenha passado por um
processo de “limpeza” e consistência, ainda existem neste banco erros
consideráveis, além de uma grande quantidade de valores em branco
(missings) presente nas possíveis variáveis preditoras do rendimento escolar.
Assim, erros, como números diferentes para identificar um mesmo aluno ao
longo da pesquisa, fazem ainda com que essa base necessite, até o momento,
de cautela em sua utilização. Recomenda-se, posteriormente, que este banco
de dados passe por um processo de identificação e correção de erros em
variáveis tão importantes como a de identificação do aluno e da escola.
Diante do conhecimento dos erros acima citados e tentando minimizar os
possíveis viéses que estes causariam na estimação dos fatores associados ao
rendimento escolar, foram estimados modelos hierárquicos longitudinais
somente para os alunos que participaram das seis rodadas da pesquisa,
garantindo assim que pelo menos esses alunos não apresentavam problemas
em sua variável identificadora. De qualquer forma, um apêndice contendo
modelos, que consideram alunos participantes de pelo menos duas rodadas da
pesquisa, podem ser visto no final do relatório referente à estimação de
modelos para trajetória completa.
Para a estimação de modelos foi necessária a estimação da variável
dependente habilidade ou escore do aluno, de acordo com a Teoria da
Resposta ao Item. Por meio dos processos de calibração e equalização da TRI,
é possível comparar diretamente todos os escores estimados, uma vez que
eles se encontram em uma mesma escala.
346
Quanto aos modelos de trajetória completa, para os quais existe um relatório
detalhado dos resultados, observa-se, em geral, o que já era esperado quanto
à associação entre rendimento escolar e sexo. Em matemática, os homens
apresentam melhores resultados, enquanto que em português, as mulheres
superam o rendimento masculino.
Tanto para matemática quanto para português, os modelos mostraram a
importância da realização da lição de casa para um melhor rendimento escolar.
No caso da repetência, se existe diferença significativa entre os escores dos
alunos que já repetiram e os que nunca repetiram, conforme mostram os
resultados dos modelos, isto pode indicar que a repetência não foi tão eficaz, a
ponto de fazer com que essa diferença fosse não significativa. Portanto, a
repetência não deve ser considerada a principal alternativa, mas sim uma das
possíveis alternativas na busca pela melhoria do desempenho.
No nível da escola, os modelos mostram que as variáveis do tamanho da
turma, para a disciplina de matemática, e a presença do laboratório de
informática, para a disciplina de português foram estatisticamente significativas
para explicar o desempenho. Contudo, recomenda-se para trabalhos futuros a
utilização de modelos de variáveis latentes para a construção de um fatores
relacionados ao nível da escola, tal como o de infra-estrutura. Ainda neste
sentido, mas com relação ao aluno, recomenda-se a realização de análise
fatorial para a identificação de constructos, como por exemplo o do nível sócio-
econômico.
Para o nível da escola, sem a utilização de constructos ou de qualquer outra
variável preditora, é possível perceber a importância dessa dimensão na
explicação do status inicial do aluno, da taxa linear de crescimento e da taxa
não linear de crescimento. Dessa forma, para dados educacionais, mais uma
vez se confirma a necessidade de utilização de metodologias que levam em
conta a dependência entre as observações, tal como a de modelos lineares
hierárquicos longitudinais, ou não.
347
BIBLIOGRAFIA
ANDRADE, D.F; TAVARES, H.R.; VALLE, R.C. Teoria da resposta ao item: conceitos e aplicações. Caxambu: Associação Brasileira de Estatística, 2000. ALBERNAZ, A.; FERREIRA, F.H.G.; FRANCO, C. Qualidade e equidade no ensino fundamental brasileiro. Pesquisa e planejamento econômico. Rio de Janeiro: Instituto de Pesquisa Econômica Aplicada, V. 32, n. 3, p.453-476, dez.2002. BAKER, F.B. The Basics of Item Response Theory. USA: ERIC Clearinghouse on Assessment and Evaluation, 2001. BARBOSA, M.E.F.; FERNANDES, C. A escola brasileira faz diferença? Uma investigação dos efeitos da escola na proficiência em matemática dos alunos da 4ª série. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. BUCHMANN, C.; HANNUM, E. Education and stratification in developing countries: a review of theories and research. Annual Review of Sociology, v. 102, p.27-77, 2001.
CARVALHO, J.A .M., WONG, L.R. A window of opportunity: some demographic and socioeconomic implications of the rapid fertility decline in Brazil. Belo Horizonte: FACE/CEDEPLAR, 1995 (Texto para discussão 91). CÉSAR, C.C.; SOARES, J.F. Desigualdades acadêmicas induzidas pelo contexto escolar. Revista Brasileira de Estudos de População. Campinas: Associação Brasileira de Estudos Populacionais, v. 18, n.1/2, p. 97-110, jan./dez. 2001. CERQUEIRA, C.A. Tipologia e características dos estabelecimento escolares brasileiros. Tese (Doutorado em Demografia) – Centro de Desenvolvimento e Planejamento Regional, Universidade Federal de Minas Gerais, Belo Horizonte, 2004 COLEMAN, J.S., CAMPBELL, E.Q., HOBSON, C.J.,McPARTLAND, J., MOOD, A M., WEINFELD, F.D.; YORK, R.L. Equality of educational opportunity. Washington, D.C.:U.S. Government Printing Office, 1966.
348
FERRÃO, M. A.; BELTRÃO, K. I.; FERNANDES, C.; SANTOS, D.; SUÁREZ, M; ANDRADE, A. C. O SAEB- Sistema Nacional de Avaliação da Educação Básica: objetivos, características e contribuições na investigação da escola eficaz. Revista Brasileira de Estudos de População. Campinas: Associação Brasileira de Estudos Populacionais, v. 18, n.1/2, p. 111-130, jan./dez. 2001. FERRÃO, M. A.; FERNANDES, C. O efeito-escola e a mudança- Dá para mudar? Evidências da Investigação Brasileira. Revista Eletrônica Iberoamericana sobre Calidad em Educación, v.1, n. 1, 2003 FLETCHER, P. R., RIBEIRO, S.C. O ensino de primeiro grau no Brasil hoje. INEP. 1987. (6) FRANCO, C.; BONAMINO, A. Iniciativas recentes de avaliação da qualidade da educação no Brasil. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. FRANCO, C.; MANDARINO, M.; ORTIGÃO, M. I. O projeto pedagógico e os resultados escolares. Pesquisa e planejamento econômico. Rio de Janeiro: Instituto de Pesquisa Econômica Aplicada, V. 32, n. 3, p.477-4493, dez. 2002. GOLDSTEIN, H. Modelos da Realidade: novas abordagens para a compreensão de processos educacionais. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. HAMBLETON, R.K. Principles and selected applications of item response theory. In: LINN, R. L. Educational Measurement. 3ed. Phoenix: American Council on Education, Oryx Press, p.147-200, 1993. HANUSHEK, E. A.; KAIN, J.F.; MARKMAN, J.M.; RIVKIN, S.G. Does peer ability affect student achievement?, National Bureau of Economic Research , 2001 HANUSHEK, E. A. Publicy provided education. In: AUERBACH , A. J., FELDSTEIN, M. Handbook of Public Economics. Stanford: Elsevier Science B.V., v. 4, p. 2046-2107, 2002. HANUSHEK, E. A. The failure of input-based schooling policies. The Economic Journal, v. 113, p.64-98, Feb.2003. INEP – Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Avaliação internacional mostra desempenho de alunos de 41 países, 2003. Disponível em http://www.inep.gov.br. Acesso em 15 de jul. 2004. KLEIN, R. Produção e utilização de indicadores educacionais. LNCC/CNPQ. Rio de Janeiro: Fevereiro, p.1-35. 1995
349
KOLEN, M. J., BRENNAN, R.L. Test Equating – Methods and Pratices. New York: Springer, 1995 KRUEGER, A. B. Economic considerations and class size. The Economic Journal, v.113, p.34-63, Feb.2003. LAZEAR, E.P. Educational production. Quartely Journal of Economics, v.116(3), p.777-803, 2001. LEE, V. E.; BRYK, A. S. A multilevel model of the social distribution of high school achievement. Sociology of Education. V.62, p.172-192, 1989. MARTELETO, L. Desigualdade regional e intergeracional de oportunidades: a matrícula e a escolaridade de crianças e jovens no Brasil. In: XIII Encontro da Associação Brasileira de Estudos Populacionais. Ouro Preto-MG: ABEP, 2002. Disponível em CD-ROM. PISA- Programa Internacional de Avaliação de Estudantes. PISA 2000: Relatório Nacional. Brasília, dez.2001. Disponível em http://www.inep.gov.br. Acesso em 15 de jul. 2004. RAUDENBUSH, S.W.& BRYK, A S. Hierarquical Linear Models: Applications and Data Analysis Methods. Second Edition. London: Sage Publications, 2002. ROSENBAUM, J.E. Two revolutions in educational attainment research over the past 30 years: their impact on public understanding and social policy. Institute for Policy Research. Working paper 02-21, 2002. SAEB- Sistema Nacional de Avaliação da Educação Básica. Relatório SAEB99. Disponível em http://www.inep.gov.br. Acesso em 12 de mai. 2004 SAEB- Sistema Nacional de Avaliação da Educação Básica. Relatório SAEB 2001-Matemática. Brasília, 2002. Disponível em http://www.inep.gov.br. Acesso em 12 de mai. 2004 SAEB- Sistema Nacional de Avaliação da Educação Básica. Resultados do SAEB 2003. Brasília, 2004. Disponível em http://www.inep.gov.br. Acesso em 23 de set.. 2004. SOARES, J.F.; CÉSAR, C.C.; MAMBRINI, J. Determinantes de desempenho dos alunos do ensino básico brasileiro: evidências do SAEB de 1997. In: FRANCO, C. (org.) Avaliação, ciclos e promoção na Educação. Porto Alegre: ARTMED, 2001. THOMAS, S.; MORTIMORE, P. Comparison of value-added models for secondary-school effectiveness. Research Papers in Education, v.11, n.1, p.5-33, 1996.
350
THOMAS, S. Value added approaches for school self-evaluation in the United Kingdom. Trabalho apresentado no International Seminar on Education Evaluation. Rio de Janeiro, 1997. TOOD, P. E., WOLPIN, K.I. On the specification and estimation of the production function for cognitive achievement . The Economic Journal, v. 113, p.F3-F33, Feb.2003. WILLMS, J.D. Monitoring school performance: a non-technical guide for educational administrators. Lewes: Falmer press, 1992. WILLMS, J. D.; SOMERS, M-A. Schooling outcomes in Latin America. A report for UNESCO, 1999. WILLMS, J. D. Monitoring school performance for “standards-based reform”. Evaluation and Research in Education, v.14, n. 3 e 4, p. 237-253, 2000. WINSTON, G.C., ZIMMERMAN, D.J. Peer effects in higher education. National Bureau of Economic Research. Working paper 9501. Cambrigde, Feb.2003. Disponível em http://www.nber.org/papers/w9501. Acesso em 6 de abr. 2004. ZIMOWSKI, M. F.. MURAKI, E. MISLEVY, R. J. & BOCK, R. D. BILOG-MG: Multiple-Group IRT Analysis and Test Maintenance for Binary Items. Chicago: Scientific Software, Inc., 1996.
top related