il rendimento dell’istruzione in italia: evidenza empirica ... · particolare, poiché la...
TRANSCRIPT
Il rendimento dell’istruzione in Italia: evidenza empirica
dai quantili di regressione
Pamela Giustinelli*Università degli Studi di Verona
Questo lavoro si propone di fornire dell’evidenza empirica ag-giornata sul “rendimento dell’istruzione in Italia” attraverso i“quantili di regressione”. Tale metodologia ci permette di studiareil Quantile Treatment Effect dell’istruzione sulla distribuzione con-dizionale del reddito (che consideriamo riflettere quella dell’abilitànon osservata), e di analizzare la relazione tra abilità ed istruzio-ne, e gli effetti sul reddito generati dalla loro interazione. Le stimeda noi ottenute presentano un andamento a “U”, ovvero rendimentimaggiori ai quantili estremi della distribuzione del reddito, sugge-rendo una relazione di sostituibilità tra istruzione ed abilità, perlivelli bassi dell’abilità, e di complementarietà, per livelli elevati diessa. [Cod. JEL: C21, I20, J24, J31]
1. - Introduzione
I risultati di numerosi studi empirici, sulla relazione esisten-te tra il grado di istruzione degli individui ed il loro reddito, mo-strano che i lavoratori più istruiti percepiscono retribuzioni piùelevate (Ashenfelter e Rouse, 1998; Card, 1995). Da qui l’interes-se e gli sforzi che gli economisti del lavoro hanno rivolto allo stu-
53
* <[email protected]>. Sono sinceramente grata a tre referee ano-nimi per i loro commenti su questo saggio, e al Prof. Gustavo Piga per i suoi uti-li suggerimenti. Ringrazio inoltre di cuore il mio Relatore di tesi Diego Lubianper la motivazione e l’entusiasmo che sempre mi trasmette, e per l’incoraggia-mento, gli utili commenti e i consigli su questo lavoro.
dio del rendimento dell’istruzione, nel tentativo di darne una com-piuta giustificazione teorica e una precisa quantificazione.
A fronte dell’elaborazione in letteratura di modelli economicisull’acquisizione dell’istruzione (come investimento mirante ad in-crementare le capacità reddituali future), che tengono conto del-l’endogeneità e degli elementi di eterogeneità individuale (l’abilità,l’ambiente familiare, etc.) che caratterizzano tale scelta (Becker,1967; Card, 1994), esistono diversi problemi metodologici per lastima del rendimento dell’istruzione come esso viene definito intali modelli.
Comuni dicoltà derivano dalla possibilità che il livello di istru-zione dell’individuo sia osservato con errore, e dal problema del-l’omissione di variabili rilevanti non osservabili (tipicamente l’a-bilità), con conseguenti distorsioni nelle stime. Ma il problemaprincipale per la stima del rendimento dell’istruzione emerge dal-l’osservazione che chi è istruito potrebbe guadagnare di più nontanto per un effetto causale del maggior tempo trascorso a scuo-la, bensì perché più abile (Ichino, 2001). Allora la stima del coef-ficiente dell’istruzione nella regressione del reddito non esprime-rebbe una misura (distorta) della relazione causale tra le due va-riabili, quanto, piuttosto, della loro correlazione spuria (Problemadell’identificazione di causalità). La maggiore dicoltà nella stimadel rendimento dell’istruzione riguarda, dunque, il fatto che l’i-struzione e il reddito degli individui sono congiuntamente deter-minati, venendo meno la causalità tra il reddito e l’istruzione me-desimi.
Nel tentativo di trattare tali aspetti è andata sviluppandosi unacopiosa letteratura (v. ad esempio la rassegna in Card, 2001; Card,1995; Ichino e Winter-Ebmer, 1999; e per l’Italia, Flabbi, 1997;Brunello e Miniaci, 1999; Brunello, Comi e Lucifora, 2001) costi-tuita da studi empirici in cui il rendimento dell’istruzione vienestimato utilizzando il Metodo delle variabili strumentali (IV). Lamaggior parte di tali lavori stimano però il rendimento margina-le medio dell’istruzione, sotto l’ipotesi che le distribuzioni condi-zionali del reddito risultino semplicemente traslate l’una rispettoall’altra al variare dell’istruzione. In realtà, non è detto che taleipotesi valga, né che una stima del rendimento marginale medio
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
54
dell’istruzione permetta di sintetizzare in modo efficace il feno-meno oggetto di studio. Da qui l’idea di stimare il rendimento del-l’istruzione attraverso la metodologia dei Quantili di regressione(Koenker e Bassett, 1978), che permette di analizzare il rendi-mento dell’istruzione degli individui ai diversi quantili della di-stribuzione dei redditi. L’effetto dell’istruzione sul reddito potreb-be infatti essere diverso per gli individui che si trovano in “pun-ti” differenti della distribuzione reddituale. Utilizzando i quantilidi regressione è possibile, dunque, controllare se la distribuzionecondizionale del reddito subisca solo un effetto di traslazione alvariare dell’istruzione, o intervenga anche un effetto di scala, equindi un cambiamento nella forma della distribuzione stessa. Inparticolare, poiché la distribuzione condizionale dei redditi tendea riflettere la distribuzione dell’abilità non osservata, una indagi-ne basata sui quantili di regressione dovrebbe risultare informa-tiva ed esplicativa della relazione tra l’abilità e l’istruzione, e de-gli effetti sul reddito generati dall’interazione tra queste variabili,senza che venga posta alcuna restrizione a priori su di essa. Inol-tre, lo stimatore quantile campionario ha una interpretazione intermini di Quantile Treatment Effect (QTE): esso misura, per ogniquantile τ, il cambiamento nel reddito richiesto per restare, dopoil trattamento (un anno aggiuntivo di istruzione), al τ-esimo quan-tile della distribuzione condizionale (sotto l’ipotesi di Rank Inva-riance1).
L’obiettivo del presente lavoro è quello di evidenziare comeuna indagine basata sui quantili possa risultare più informativarispetto ad una stima OLS o IV valida per l’individuo medio. Dauna parte, questo studio fornisce dell’evidenza empirica aggior-nata sui rendimenti dell’istruzione in Italia (stime OLS, sui datitratti dalla Banca d’Italia, 1993; 1995; 1998; 2000); dall’altra, l’a-spetto centrale è rappresentato dalla stima dei quantili per que-sti dati.
Nel secondo paragrafo viene presentato brevemente il model-lo endogeno di Card (1994) sulla scelta di acquisizione dell’istru-
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
55
1 L’ipotesi di Rank Invariance richiede che la posizione relativa degli individuinella distribuzione dei redditi non cambi dopo il trattamento.
zione e vengono analizzate le implicazioni di tale modello sullostimatore OLS del rendimento marginale medio dell’istruzione.Viene anche effettuata una breve rassegna dei principali lavori em-pirici sul rendimento dell’istruzione condotti sui dati italiani, uti-lizzando stimatori OLS e IV. Nel terzo paragrafo viene presenta-ta la teoria sui quantili di regressione e la loro interpretazione nelcontesto di una indagine sul rendimento dell’istruzione. Sono poipresentati alcuni studi della letteratura internazionale sulle distri-buzioni condizionali dei redditi attraverso i quantili di regressio-ne. Infine nel sesto paragrafo sono descritti i dati, e nel settimosono riportati i risultati delle stime da noi condotte. Seguono leconclusioni.
2. - Il rendimento dell’istruzione: teoria economica e analisieconometriche
2.1 Un modello endogeno per l’acquisizione dell’istruzione
Un modello endogeno per le scelte di istruzione è stato pro-posto da Card (1994), a partire dal modello di Becker (1967).In questo modello gli individui compiono le loro scelte d’istru-zione attraverso un processo di ottimizzazione che si basa sulconfronto dei benefici e dei costi derivanti dal proseguire glistudi. Il reddito e i costi dell’individuo vengono espressi comefunzioni degli anni di istruzione, nelle quali si tiene conto de-gli aspetti di eterogeneità tra gli individui. Ciascun individuo ef-fettua la propria scelta d’istruzione massimizzando una funzio-ne di utilità:
U (Y, S) = log (Y) – φ (S)
dove S è il numero di anni d’istruzione, Y è il reddito medio an-nuo dell’individuo, e φ (S) è la sua funzione di costo. In partico-lare, si ipotizza che l’istruzione permetta di accumulare capitaleumano, e che individui maggiormente dotati di capitale umanopercepiscano redditi più elevati sul mercato del lavoro; quindi, la
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
56
funzione generatrice del reddito è definita da Y = Y (S), con Y’ >0 e Y’’ < 0. Il “reddito da capitale umano” aumenta all’aumentaredel grado di istruzione, ma in modo decrescente, come avviene ingenerale per tutti fattori produttivi.
La funzione di costo φ (S) è strettamente convessa; cioè, i co-sti associati all’istruzione aumentano all’aumentare degli anni tra-scorsi a scuola in modo crescente. In φ’ (S) sono compresi i costimonetari diretti (tasse scolastiche, libri, trasporto, etc.), i costi mo-netari indiretti o costi opportunità (mancati guadagni che si sa-rebbero ottenuti entrando immediatamente nel mercato del lavo-ro) e i costi non monetari (costi psicologici).
Considerando una funzione di utilità globalmente concava inS, esiste un (unico) numero ottimo di anni di istruzione, che siottiene dalla soluzione delle condizioni del primo ordine:
(1)
dove Y’ (S)/Y (S) rappresenta il tasso marginale di rendimento as-sociato ad un anno aggiuntivo di scuola, e φ’ (S) rappresenta il co-sto marginale di un anno di istruzione. Il significato economicodella condizione di equilibrio è che l’individuo raggiunge il pro-prio livello ottimo di istruzione quando i benefici marginali ad es-so associati eguagliano i costi marginali.
Per rendere operativo il modello, vengono assegnate unaforma funzionale al rendimento marginale e una ai costi mar-ginali. Card (1994) ipotizza che queste due funzioni siano li-neari e incorporino nelle intercette i fattori di eterogeneità in-dividuale:
(2)
(3) [φ (S)]i = δi(S) = r i+ k rS (kr ≥ 0)
Le scelte di istruzione variano dunque per due ragioni: 1) ledifferenze nell’abilità, bi, generano eterogeneità nei rendimentimarginali dell’istruzione degli individui; 2) le differenze nei vin-
′
= = − ≥Y SY S
S b k S ki
i i b b( )( )
( ) ( )β 0
′ = ′Y SY S
S( )( )
( )φ
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
57
coli di liquidità e nella condizione finanziaria e culturale delle fa-miglie, ri, generano eterogeneità nei costi marginali fronteggiatidagli individui.
Queste ipotesi sulla caratterizzazione dei rendimenti e dei co-sti marginali associati all’acquisizione di istruzione implicano aloro volta delle specifiche forme funzionali per Y (S) e φ (S). In-tegrando la (2) e prendendo il logaritmo, si ottiene la funzione ge-neratrice dei redditi, o earning function:
(4)
In tale specificazione, l’abilità influenza la pendenza della ear-ning function; per cui, con preferenze omotetiche, gli individui do-tati di maggior abilità sceglieranno livelli più elevati di istruzio-ne2.
La funzione di costo individuale è invece rappresentata da:
(5)
in cui l’elemento di eterogeneità determina una maggior in-clinazione della funzione stessa.
Il livello ottimo di istruzione è dato da:
(6)
con k = kb + kr. S
b rki
i i* = −
φ( )S c r S k Si r= + + 1
22
log( )Y a b S k Si i b= + − 1
22
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
58
2 Al contrario, se il termine di abilità fosse inserito nell’intercetta, ai, la con-clusione sarebbe opposta: in quanto individui con maggiori opportunità di reddi-to per ogni livello di istruzione potrebbero ben investire meno in istruzione, dalmomento che avrebbero maggiori costi opportunità se continuassero a frequenta-re la scuola. In tal caso, però, si dovrebbe forse attribuire un diverso significatoa questa componente. CARD D. (1994), richiamando HAUSE J.C. (1972), ricorre alconcetto di “abilità cognitiva” (capacità di un soggetto di rielaborare ed applicarela conoscenza acquisita; cioè una forma di abilità che il soggetto esprime nel con-testo lavorativo, e che lo porta a percepire redditi più elevati, indipendentementedal suo livello di istruzione e dalle sue abilità in ambito scolastico). Naturalmen-te, unendo le due specificazioni in una unica, con l’abilità incorporata sia nell’in-tercetta sia nella pendenza della earning function, l’effetto finale sulla scelta diistruzione sarebbe (a priori) incerto.
Dove le equazioni (6) e (4) assieme determinano la distribu-zione congiunta dei redditi e dell’istruzione3.
Il rendimento marginale dell’istruzione in corrispondenza del-la scelta ottima è dato da:
(7)
e rappresenta l’effetto causale dell’istruzione sul reddito dell’indi-viduo i4. Tuttavia, a causa del «problema fondamentale dell’infe-renza causale» (Holland, 1986), esso non può essere né identifi-cato né misurato. Ciò che può essere identificato, invece, e cherappresenta un utile parametro di riferimento con cui confronta-re gli stimatori (OLS e IV) del rendimento dell’istruzione è il ren-dimento marginale medio dell’istruzione nella popolazione:
(8) β β= = − = − =
++
+E E b k S b k S
kk k
bk
k kri i b i b
r
b r
b
b r
[ ] [ ]
βi i b i
b
b ri
b
b rib k S
kk k
bk
k kr* *= − = −
+
++
1
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
59
3 L’evidenza empirica (CARD D. - KRUEGER A.B., 1992; PARK J.H., 1994) testi-monia a favore di una relazione per dati sezionali approssimativamente linearetra il logaritmo del reddito e gli anni d’istruzione. Tale circostanza sembrereb-be inconsistente con l’equazione (4), a meno di kb = 0. In realtà, nonostante larelazione proposta dal modello sia quadratica, i dati generati dal modello stes-so potrebbero presentarsi secondo una relazione lineare. Da una parte, infatti,l’andamento dovrebbe essere concavo, dato che, a parità di bi, gli individui contasso marginale di sconto più basso tendono a scegliere livelli più elevati di istru-zione. Dall’altra, poiché, tra gli individui con diversa abilità, quelli maggiormentedotati sceglieranno livelli più elevati di istruzione, tale relazione dovrebbe risul-tare convessa. In definitiva, la relazione reddito-istruzione nella popolazione èdeterminata dalla combinazione dei due effetti, e tenderà maggiormente ad es-sere concava quanto minore è la varianza dell’abilità bi rispetto a quella del tas-so di sconto ri.
4 Come correttamente osservato da un anonimo referee, che colgo l’occasionedi ringraziare, sembrerebbe dunque di dover fronteggiare un problema di aggre-gazione, che peraltro mai viene esplicitamente rilevato nella letteratura di riferi-mento. In realtà, le specificazioni da noi stimate, eq. (31), (rispettivamente nellaversione con gli anni di istruzione e in quella con le variabili dicotomiche per ititoli di studio) e i dati a nostra disposizione ci permettono di effettuare una in-dagine cross-section dei rendimenti marginali dell’istruzione, che sono medi, nelcaso della stima OLS, e quantilici nel caso della stima con i quantili di regressio-ne. Come infatti da noi precedentemente osservato, a fronte dei modelli econo-mici sull’acquisizione dell’istruzione elaborati in letteratura, che incorporano adesempio le caratteristiche di eterogeneità individuale proprie di tale scelta (BECKER
G.S., 1967; CARD D., 1994), esistono diversi problemi metodologici e di stima delrendimento dell’istruzione così come esso viene definito in tali modelli.
A partire dalla specificazione:
log (Yi) = α + ρSi + εi
è possibile dimostrare che il limite in probabilità dello stimatoreOLS è:
(9)
da cui l’inconsistenza per il rendimento marginale medio dell’i-struzione.
La distorsione è positiva, in quanto prodotto di due fattoripositivi (λ rappresenta la frazione della varianza di S attribuibilealla variabilità di b; mentre b
–è sicuramente maggiore di r–, dato
che il livello ottimo di istruzione non può essere negativo). Essainoltre tenderà ad aumentare tanto maggiore è σ2
b rispetto a σ2r, e
tanto più ampia è la differenza (b–
– r–). Il termine λ (b–
– r–) può es-sere interpretato come una endogenity bias dovuta al fatto che gliindividui che hanno un rendimento marginale dell’istruzione mag-giore (perché più abili), o un minor costo marginale (perché me-no “vincolati monetariamente”), tendono a studiare più a lungo.In altri termini, lo stimatore OLS del coefficiente degli anni diistruzione è influenzato dal modo in cui gli individui, caratteriz-zati dal proprio livello di abilità e dai propri vincoli di liquidità,sono distribuiti nella popolazione5.
2.2 L’ability bias
Una ulteriore difficoltà nella stima del rendimento dell’istru-zione deriva dalla possibilità che siano presenti fattori non osser-
p
kk
bkk
r b rOLSb blim(ˆ ) ( )ρ λ λ β λ= − +
+ −
= + −1
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
60
5 Ammettendo l’esistenza di una correlazione negativa tra bi ed ri, si osserve-ranno presumibilmente con maggior frequenza individui con abilità elevata e bas-si vincoli di liquidità e viceversa, ossia individui con un alto grado di istruzionee redditi elevati, oppure individui con un basso livello di istruzione e basso red-dito. Quindi la retta di regressione avrà pendenza positiva e la sua inclinazionetenderà a crescere all’aumentare della frequenza relativa con cui si presentano ta-li osservazioni.
vati di eterogeneità nel livello dei redditi. L’approccio adottato inletteratura per affrontare la questione della cosiddetta ability biasè quello di considerare una funzione generatrice dei redditi checontenga una componente specifica individuale (Griliches, 1977).
Card (1994) introduce tale aspetto aggiungendo un’intercettaindividuale ai nella earning function:
(10)
Di conseguenza, l’espressione per il limite in probabilità del-lo stimatore OLS del coeciente degli anni di istruzione diventa:
(11)
Una correlazione tra ai e Si può sussistere per due motivi: per-ché ai è correlato con bi, oppure con ri, cioè la parte di redditoche l’individuo è potenzialmente in grado di percepire grazie a suepeculiari abilità (di tipo cognitivo) è correlata ai fattori che de-terminano l’abilità (in ambito scolastico) e il tasso individuale disconto, quali il benessere familiare, il substrato culturale, etc., del-l’individuo stesso. Analiticamente, poiché:
(12)
l’espressione per il termine di distorsione risulta essere:
(13)
Si può ragionevolmente supporre che ai e bi siano positivamentecorrelati (σab > 0), mentre ai e ri lo siano negativamente (σar < 0). Inparticolare, una correlazione positiva tra ai e bi può presentarsi seai esprime una qualche misura di abilità cognitiva dell’individuo ese il grado di istruzione e tale genere di abilità sono complementa-
E a S S
Sk
i i
i
ab ar
b r br
( )
( )( )
( )
−[ ] = −+ −Varσ σ
σ σ σ2 2 2
E a S S E a
b b r rk ki i i
i iab ar[ ( )]
( ) ( )( )− = − − −
= −1 σ σ
pY S
Var S
E a S S b S S S k S S S
S
OLSi i
i
i i i i i b i i
i
lim(ˆ )[log( ), ]
( )
( ) ( ) ( )
( )
ρ = =
=− + − − −
Cov
Var
12
2
log( )Y a b S k Si i i b= + − 1
22
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
61
ri. Invece una correlazione negativa tra ai e ri può derivare dalla cir-costanza che i figli delle famiglie più ricche abbiano tassi di scontopiù bassi, o una naturale propensione a studiare più a lungo, e chequesti individui tendano in generale a raggiungere livelli di redditopiù elevati in virtù di migliori accessi al mercato del lavoro.
2.3 Variabile esplicativa osservata con errore
Consideriamo, infine, la possibilità che la variabile esplicati-va “anni di istruzione” sia osservata con errore, cioè gli anni diistruzione osservati (Si
0) differiscono dal vero livello di istruzione(Si) per un termine d’errore additivo:
Si0 = Si + εi
dove εi ha media 0, varianza σ2ε, ed è incorrelato con Yi. In que-
sto caso, il limite in probabilità dello stimatore OLS è:
(14)
Sfruttando la relazione:
il limite in probabilità (14) può essere scritto come:
(15)
dove il primo fattore non è altro che il limite in probabilità del-lo stimatore OLS nel caso standard, mentre il secondo rappresentail termine di distorsione. È immediato verificare che tale distor-sione porta ad una sottostima del parametro ρ, infatti:
In conclusione, tenendo conto di tutte le problematiche ana- p p
Y SS
S S
SOLS
i i
i
i i
i
lim( ˆ )[log( ), ]
( )[ , ]
( )0
0
0= ⋅Cov
VarCov
Var
p p
Y SS
S S
SOLS
i i
i
i i
i
lim( ˆ )[log( ), ]
( )[ , ]
( )0
0
0= ⋅Cov
VarCov
Var
Cov
Cov
CovVar
[log( ), ]
[ , ]
[log( ), ]( )
Y S
S S
Y SS
i i
i i
i i
i
0
0=
p p
Y S
SOLS
i i
i
lim( ˆ )[log( ), ]
( )0
0
0= Cov
Var
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
62
lizzate inerenti alla procedura di stima, l’espressione per il limitein probabilità dello stimatore OLS sarà:
(16)
in cui sono presenti tre fonti di distorsione nello stimatore OLSrispetto al rendimento marginale medio dell’istruzione β
– 6: 1) lacomponente dovuta alla endogenity bias, λ (b
–– r–); 2) la ability bias
attribuibile alla presenza di componenti non osservate di etero-geneità nel livello dei redditi,
3) la distorsione verso il basso generata da errori di misuradella variabile anni di istruzione, θ0.
2.4 Il rendimento dell’istruzione in Italia nei precedenti studi
Nella seconda metà degli anni ’80 e durante gli anni ’90, so-no stati condotti numerosi studi empirici rivolti alla stima del ren-dimento dell’istruzione in Italia (nella tavola 1 sono riassunti i ri-sultati delle principali stime). Come osservato da Brunello e Mi-niaci (1999), i primi studi si basavano su stime OLS effettuate sudati eterogenei e non sempre rappresentativi7.
k ab ar
b r br
( )
( )
σ σσ σ σ
−+ −2 2 2
p p b r kOLSab ar
b r br
lim( ˆ ) ( )( )0
0 2 2 2= + − + −
+ −
θ β λ σ σ
σ σ σ
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
63
6 Occorre invece ricordare che una procedura di stima IV dovrebbe fornirestime immuni da tali distorsioni. D’altra parte, strumenti diversi tendono a gene-rare stime differenti dei rendimenti medi per differenti sottogruppi nella popola-zione (ICHINO A. - WINTER-EBMER R., 1999). Infatti, una stima IV misura il rendi-mento marginale degli individui che, nel contesto dell’esperimento naturale con-siderato, sono compliers, con una tendenza così a sovrastimare il rendimento mar-ginale medio dell’istruzione nella popolazione, dato che tali individui hanno tipi-camente rendimenti più elevati (discount rate bias) (CARD D., 1994).
7 Ad esempio, ANTONELLI G. (1985) stima una equazione minceriana standardcon gli OLS, utilizzando un data-set a carattere regionale, e ottenendo un rendi-mento pari al 4,6%. Medesimo risultato viene trovato da CANNARI L. - PELLEGRINI
G. - SESTITO P. (1989), i quali utilizzano un campione più ampio tratto da BANCA
D’ITALIA (1986). LUCIFORA C. - REILLY B. (1990) (sulla base dei dati ENI-IRI sui red-diti individuali) effettuano una stima OLS per genere, trovando che il rendimen-to marginale dell’istruzione è più elevato per le donne che per gli uomini.
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
64
TA
V.
1
I R
EN
DIM
EN
TI
DE
LL’
IST
RU
ZIO
NE
IN
ITA
LIA
IN
PR
EC
ED
EN
TI
ST
UD
I
auto
red
ati
cam
pio
ne
OL
SIV
stru
men
ti
stim
e
An
ton
elli
(19
85)
ER
(uom
ini)
0,04
6–
Can
nar
i, P
elle
grin
iS
HIW
198
6(u
omin
i)0,
046
–e
Ses
tito
(19
89)
Lu
cifo
ra e
Rei
lly
EN
I-IR
I(d
onn
e)0,
040
–(1
990)
(uom
ini)
0,03
6–
Can
nar
i e
D’A
less
ioS
HIW
199
3(u
omin
i)0,
045
0,07
0is
tru
zion
e d
ei g
enit
ori
(199
5)C
olu
ssi
(199
7)S
HIW
199
3(u
omin
i)0,
062
0,07
6is
tru
zion
e d
ei g
enit
ori
Fla
bb
i (1
997)
SH
IW 1
991
(don
ne)
0,02
20,
056
rifo
rme
1962
e 1
969,
(uom
ini)
0,01
70,
062
vici
nan
za a
ll’u
niv
ersi
tàB
run
ello
e M
inia
ciS
HIW
199
3-19
95(u
omin
i)0,
048
0,05
7is
tru
zion
e d
ei g
enit
ori,
(199
9)ri
form
a 19
69B
run
ello
, C
omi
SH
IW 1
995
(don
ne)
0,07
7–
istr
uzi
one
e p
rofe
ssio
ne
e L
uci
fora
(20
01)
(esp
erie
nza
)(u
omin
i)0,
062
-ge
nit
ori,
rif
orm
a 19
69(e
tà)
(don
ne)
–0,
077
(uom
ini)
0,04
80,
059
(uom
ini)
0,04
80,
061
+ a
vver
sion
e al
ris
chio
Mar
tin
s e
Per
eira
(20
04)
SH
IW 1
995
OL
S0,
062
%Q
uan
tili
100,
065
200,
063
300,
057
400,
057
500,
056
600,
057
700,
061
800,
065
900,
068
Gli studi più recenti, a partire dalla seconda metà degli anni’90, utilizzano ampiamente i dati delle Indagini sui bilanci delle fa-miglie, effettuando stime IV del rendimento dell’istruzione in Ita-lia. Cannari e D’Alessio (1995), con i dati del 1993 (Banca d’Ita-lia, 1993), e sulla base di variabili strumentali relative al substra-to familiare, ottengono una stima vicina al 7%, più elevata di quel-le ottenute dalle ricerche precedenti. Colussi (1997) ottiene unastima del 6,6%, utilizzando i dati relativi al medesimo anno e ungruppo simile di strumenti.
Flabbi (1997) stima il rendimento dell’istruzione per le don-ne e per gli uomini separatamente (dati Banca d’Italia, 1991), uti-lizzando come strumenti: la variabile binaria “provincie”, indica-tore della presenza o meno di sedi universitarie nella provincia diresidenza dell’individuo quando questi aveva 19 anni; e la varia-bile “riforme”, costruita considerando come eventi esogeni le rifor-me del sistema scolastico italiano del ’62 (media unica) e del ’69(accesso a tutte le facoltà universitarie per i diplomati presso qua-lunque tipo di istituto secondario superiore). Le stime IV sono0,56 per le donne e 0,62 per gli uomini. Il risultato nuovo otte-nuto dall’autore è dato dal rovesciamento della “gerarchia” nei ri-sultati. Le stime IV del rendimento dell’istruzione risultano infat-ti maggiori per gli uomini, mentre le stime OLS ottenute da Flab-bi (1997) sono 0,22 per le donne e 0,17 per gli uomini. Obiettivodi Flabbi (1997), (1999) è quello di chiarire se l’usuale gerarchia,ovvero un rendimento femminile superiore a quello maschile, pos-sa essere considerata un risultato empirico acquisito nel mercatodel lavoro italiano o non dipenda piuttosto dalle tecniche di sti-ma utilizzate. La conclusione dell’autore è che tale gerarchia èconfermata solo in parte. Essa tende a valere, anche se in modonon indipendente dalla specificazione, quando si applica la pro-cedura OLS. È invece rovesciata dalle stime IV. Una prima inter-pretazione è rappresentata dall’osservazione che la distorsione del-le stime con i minimi quadrati ordinari sarebbe tale da nascon-dere il vero rapporto relativo dei rendimenti in base al genere. Maè possibile anche una interpretazione alternativa, e cioè che l’in-versione non varrebbe in realtà per tutto il campione, ma solo percoloro che presentano un rendimento dell’istruzione più elevato
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
65
(ad esempio perché provenienti da famiglie meno abbienti). L’in-terpretazione economica di un rendimento dell’istruzione supe-riore per il gruppo di trattamento maschile, rispetto a quello delgruppo femminile, porterebbe allora ad ipotizzare variabilità deirendimenti all’interno della popolazione e discriminazione di ge-nere pre-mercato del lavoro a svantaggio delle donne.
Brunello e Miniaci (1999) e Brunello, Comi e Lucifora (2001),utilizzando i dati della Banca d’Italia ’93 e ’95, stimano il rendi-mento dell’istruzione, con variabili strumentali relative al back-ground familiare (istruzione e posizione professionale dei genito-ri), alla riforma scolastica del ’69 e (solo i secondi) al grado diavversione al rischio dell’individuo. Brunello e Miniaci (1999) ot-tengono una stima OLS del 4,8% e una stima IV del 5,7% per icapifamiglia maschi. Valori simili sono ottenuti da Brunello, Co-mi e Lucifora (2001). Le stime IV mantengono però la configu-razione di quelle OLS, relativamente alla gerarchia dei rendimentifemminili e maschili. Brunello, Comi e Lucifora (2001) ottengo-no infatti rendimenti dell’istruzione più elevati per i campionifemminili, anche con le stime IV, a differenza di Flabbi (1997),(1999).
3. - L’approccio dei “quantili di regressione” nello studio dellarelazione reddito-istruzione-abilità
3.1 Lo stimatore dei quantili
Il modello dei quantili di regressione, introdotto da Koenkere Bassett (1978), estende la nozione degli ordinari quantili del mo-dello di locazione alla più generale classe dei modelli lineari, neiquali i quantili condizionali hanno appunto la forma di funzionilineari (nei parametri).
I quantili di regressione possono dunque considerarsi una me-todologia statistica, volta a stimare le funzioni quantile condizio-nale, e a condurre inferenza su di esse. Infatti, come il modellolineare classico costituisce un modello di media condizionale, iquantili di regressione rappresentano dei modelli di mediana con-
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
66
dizionale, o delle altre funzioni quantile condizionale. Un ben no-to caso particolare di quantile di regressione è costituito dallo sti-matore LAD, proposto da Koenker e Bassett (1978), che adatta lamediana ad una funzione lineare di variabili esplicative, mini-mizzando la somma dei valori assoluti dei residui.
La stima LAD è potenzialmente attrattiva per le medesime ra-gioni per cui la mediana può costituire un indice di localizzazio-ne migliore rispetto alla media: esiste sempre all’interno della di-stribuzione considerata; è rappresentativa della posizione della di-stribuzione stessa anche in presenza di valori anomali, limitan-dosi a tener conto solo della modalità dell’elemento che occupauna certa posizione nella distribuzione delle osservazioni ordina-te. Analogamente, gli stimatori dei quantili sono robusti alla pre-senza di outliers nelle osservazioni sulla variabile dipendente, e sidimostrano più efficienti degli stimatori OLS, nei casi in cui il ter-mine di errore non possieda una distribuzione normale. Inoltre,dal punto di vista computazionale (ed estetico), il modello deiquantili di regressione può essere formulato come un problemadi Programmazione Lineare (LP), il che agevola la stima e per-mette di semplificare i problemi computazionali8. Esso può esse-re anche “contestualizzato” nello schema del Metodo Generaliz-zato dei Momenti (GMM), il che si rivela utile per la determina-zione delle proprietà asintotiche dello stimatore quantile campio-nario. Infine, un aspetto altamente interessante e peculiare di que-sta metodologia è costituito dal fatto che le differenti soluzioniper i diversi quantili possono essere interpretate come differentirisposte della variabile dipendente, nei vari punti della distribu-zione condizionale della variabile dipendente stessa, alle variazio-ni nei regressori9.
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
67
8 La rappresentazione del problema di minimizzazione del quale lo stimatorequantile campionario è soluzione eq. (18) come programma lineare è riportata inAppendice. Per una trattazione sull’utilizzo della programmazione lineare nel con-testo delle regressioni quantiliche v. BUCHINSKY M. (1995), e KOENKER R. - BASSETT
G. (1978) per un semplice ma esplicativo esempio bivariato con cinque osserva-zioni. Si rimanda inoltre a HILLIER F.S. - LIEBERMAN G.J. (1990) per la necessariateoria di LP.
9 Per chiarire tale affermazione, richiamiamo qualche applicazione di tale tec-nica, mutuandola da KOENKER R. (2003). I quantili di regressione sono stati uti-
Il τ-esimo quantile di regressione è definito da:
(17) Qτ (yi|X = x) = x’iβτ
dove xi è il vettore k × 1 dell’i-esima osservazione su k regressori,e yi l’i-esima osservazione sulla variabile dipendente. Il processouτi = yi – x’iβτ possiede funzione di ripartizione Fuτ
(·) e, per defini-zione, Qτ (uτi|xi) = 0. Lo stimatore quantile campionario βτ è defi-nito come qualsiasi soluzione al problema di minimizzazione10.
(18)
Alla luce di tale rappresentazione, preme sottolineare la pro-prietà di robustezza di tale stimatore, influenzato solo dal com-portamento locale della distribuzione condizionale della variabiledipendente vicino al quantile specificato. Data una soluzione βτ ,basata sulle osservazioni {y, X}, fintanto che non viene cambiatoil segno dei residui uτ = y – Xβτ , qualsiasi osservazione su y puòessere arbitrariamente modificata senza alterare la soluzione ini-ziale. Solo i segni degli scarti entrano nella determinazione delle
minβ
τ τ
τ τ
τ
β τ β
β τ β
∈ =
− ′( ⋅ ⋅ > ′{ } +
+ − ′ ⋅ −( ) ⋅ ≤ ′{ } )
∑� k
y x y x
y x y x
i ii
n
i i
i i i i
1
1
1 1
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
68
lizzati, ad esempio, per studiare l’impatto di varie caratteristiche demografiche edel comportamento materno sul peso dei bambini alla nascita, permettendo in par-ticolare di concentrare l’analisi sulla coda inferiore della distribuzione, ossia suibambini sottopeso. Questa risulta infatti di particolare interesse per i ricercatori,in quanto un basso peso alla nascita viene comunemente associato ad una seriedi conseguenti problemi di salute, nonché ai risultati scolastici e professionali chegli individui mediamente raggiungono. Ancora, negli studi sulle relazioni esisten-ti tra i risultati ottenuti dagli studenti di scuole pubbliche in esami standardizza-ti e alcune variabili socio-economiche, quali il reddito familiare e il livello di istru-zione dei genitori, e normative, quali la numerosità delle classi e la qualifica de-gli insegnanti, i quantili di regressione vengono utilmente impiegati per capire segli interventi normativi influiscono sulle performance degli studenti migliori nellostesso modo che su quelle dei meno brillanti. Non sembra plausibile, infatti, chegli effetti di tali variabili agiscano in modo da traslare l’intera distribuzione dei ri-sultati dei test di una misura fissata.
10 In Appendice vengono ripercorsi i passaggi dalla definizione di quantile nelmodello di locazione, e dalla sua rappresentazione come soluzione di un proble-ma di ottimizzazione, a quella analoga nel modello lineare, rappresentata appun-to dall’equazione (18).
stime dei quantili di regressione; quindi, le osservazioni estremeinfluenzano il risultato in quanto si trovino al di sopra o al di sot-to dell’iperpiano stimato, ma quanto al di sopra, o al di sotto, èirrilevante. È utile inoltre osservare come, allo stesso modo dellostimatore OLS, anche lo stimatore dei quantili gode di una seriedi “proprietà di equivarianza”. E in più, a differenza di quello, lostimatore quantile campionario soddisfa la proprietà di invarian-za alle trasformazioni monotone11, la quale permette di superarei problemi di stima dei modelli trasformati, che si presentano nelcontesto della media condizionale12.
Il problema (18) appena specificato può essere riscritto come:
(19)
dove sgn (α) = I (α ≥ 0) – I (α < 0), da cui seguono le condizioni delprimo ordine
(20)
che, se considerate all’interno dello schema del Metodo generaliz-zato dei momenti (GMM), permettono di stabilire le proprietà ingrandi campioni dello stimatore quantile campionario βτ . Se-guendo Buchinsky (1995), si definisce la seguente funzione deimomenti:
(21) ψ (xi, yi, βτ) = (τ – 1/2 + 1/2sgn (yi – x’iβτ)) xi
per la quale, sotto le ipotesi del modello (17), valgono le condi-zioni di ortogonalità:
E [ψ (xi, yi, βτ)] = 0
i
n
i i iy x x=∑ − + − ′ =
1
1 2 1 2 0( / / sgn( ˆ ))τ βτ
min ( / / sgn( ))( )β τ τ
τ ττ β β
∈=∑ − + − ′ − ′
Bi
n
i i i iny x y x
11 2 1 2
1
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
69
11 Per ogni funzione monotona h (·) vale Qτ (h (Y)|x) = h (Qτ (Y|x)), mentre nor-malmente E (h (Y)|x) ≠ h (E (Y|x)).
12 Per una trattazione dettagliata di tali proprietà v. KOENKER R. - BASSETT G.(1978).
Nonostante tale funzione dei momenti non soddisfi la condi-zione di differenziabilità è possibile ottenere la distribuzione asin-totica (n → ∞) di βτ , riassunta dalla seguente proposizione:
PROPOSIZIONE 1 (Buchinsky, 1995)Se βτ è nell’interno di Bτ, dove Bτ è l’insieme compatto dei pa-
rametri in �k; Fuτ (0|x) = τ con probabilità 1; Fuτ (·|x) è continuacon densità fuτ (0|x) > 0; e n–1 Σn
i=1 xix’i →p
E [xix’i], matrice defini-ta positiva; allora:
(22)
dove:
(23) Λτ = τ (1 – τ) (E [fuτ (0|xi) xix’i])–1 E [xix’i] (E [fuτ (0|xi) xix’i])
–1
Nel contesto dei quantili di regressione si assume talvolta chela distribuzione di uτi = yi – x’iβτ non dipenda da xi (per cui E (uτi|xi)= 0). In tal caso la (23) si semplifica in:
come in Koenker e Bassett (1978).Un possibile metodo per stimare in modo consistente la
matrice di varianza-covarianza Λτ è rappresentato dal bootstrap,utilizzato nella parte empirica. Brevemente, si consideri un cam-pione casuale (yi, xi), con i = 1, ..., n, generato dalla funzione didistribuzione empirica Fn (x, y). Sia βτ la stima bootstrap ottenutada un quantile di regressione di yi su xi. Se la procedura di cam-pionamento e di stima viene ripetuta M volte, ottenendo βτ1, βτB,si ha che:
(24)
costituisce lo stimatore bootstrap della varianza asintotica di βτ .
ˆ ( ˆ ) ˜ ˆ ˜ ˆVnM
M
j
M
j jβ β β β βτ τ τ τ τ= −
−
′
=
∧ ∧
∑1
Λτ
τ
τ τ= − ′ −( )
( )( [ ])
1
021
fE x x
ui i
n Ndˆ ( , )β βτ τ τ−( ) → 0 Λ
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
70
3.2 Quantili di regressione e abiltà non osservata
Come precedentemente osservato, un importante aspetto diquesta metodologia è rappresentato dall’interpretazione delle sti-me dei diversi quantili come le differenti risposte della variabiledipendente alle variazioni nei regressori in diversi punti della di-stribuzione condizionale della variabile dipendente stessa. In par-ticolare, lo stimatore quantile campionario ha una interpretazio-ne in termini di Quantile Treatment Effect (QTE): esso misura,per ogni quantile τ, il cambiamento nella variabile dipendente ri-chiesto per restare, dopo il trattamento, al τ-esimo quantile delladistribuzione condizionale.
I quantili di regressione rappresentano pertanto un approcciopiù flessibile per caratterizzare l’effetto dell’istruzione su differen-ti percentili della distribuzione condizionale dei redditi, per ana-lizzare la relazione tra abilità ed istruzione e gli effetti sul reddi-to generati dalla loro interazione.
Nel paragrafo 2 si è mostrato come l’abilità non osservata in-duca eterogeneità nella distribuzione condizionale dei redditi, in-fluenzando sia l’intercetta sia il coeciente della earning function(10). Consideriamo dunque, seguendo Arias, Hallock e Sosa-Escu-dero (2001), una specificazione più generica dell’equazione min-ceriana:
(25) ln (Yi) = αXi + β0Si + ϕ (Si, vi) + vi
dove Xi raggruppa alcune variabili di controllo (quali l’età dell’in-dividuo, l’esperienza, etc.), la funzione ϕ esprime l’interazione esi-stente tra l’istruzione e l’abilità degli individui, e vi è un terminedi errore che contiene anche l’abilità non osservata: vi = γAi + εi.Questa specificazione corrisponde alla (10), con ϕ = biSi – 0,5kbS
2i
e γAi = ai.Si consideri ora il caso in cui il termine di interazione sia
semplicemente ϕ = δAiSi, così che il rendimento dell’istruzione siadato da:
(26) ∂ln (Yi)/∂Si � βi = β0 + δAi
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
71
dove δ cattura l’effetto dell’abilità sul rendimento dell’istruzione.Se δ < 0, il rendimento decresce all’aumentare dell’abilità, e vice-versa. Questo conduce a un modello con coefficienti casuali, taleche lo stimatore OLS applicato alla (25) stima consistentemente:
(27) ∂E (ln (Yi)|Xi, Si)/∂Si = β0 + δA–
ossia il rendimento dell’istruzione per un individuo con abilità me-dia, o average treatment effect. Questo approccio però si basa suuna parametrizzazione restrittiva dell’interazione tra istruzione edabilità non osservata. Infatti, nel modello (26) si presuppone cheβi sia una funzione monotonica dell’abilità.
Invece, con Si esogeno e la restrizione sul termine di erroreQτ (vi|Si) = 0, l’effetto dell’istruzione sul τ-esimo quantile condizio-nale di Yi è dato da:
(28) ∂Qτ (ln (Yi)|Xi, Si)/∂Si = ∂ln (Qτ (Yi)|Xi, Si)/∂Si
(29) = β0 + ∂Qτ (ϕ (Si, vi)|Xi, Si)/∂Si
(30) = β0 + Gv–1 (τ|Xi, Si) � βτ
dove Gv è una qualche trasformazione della distribuzione dell’ abi-lità nella popolazione, e βt può essere considerato una misura delQTE dell’istruzione sui redditi, dato τ ∈ (0, 1)13. I quantili di re-gressione per differenti valori di τ conducono alla stima di unaintera famiglia di rendimenti dell’istruzione che riflettono la di-stribuzione dell’abilità tra gli individui. L’interazione tra istruzio-ne ed abilità può allora essere analizzata confrontando βτ a diffe-renti quantili τk e τs, con k ≠ s.
3.3 Quantili di regressione e distribuzione del reddito nella lettera-tura internazionale
Numerosi studi, oltre a quello di Arias, Hallock e Sosa-Escu-dero (2001), sono stati recentemente condotti utilizzando i quan-
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
72
13 Nel caso particolare della specificazione (26), l’equazione (30) diventa ∂ln(Qτ (Yi)|Xi, Si)/∂Si � βτ = β0 + δQτ (Ai).
tili di regressione al fine di analizzare la distribuzione condizio-nale dei redditi di differenti paesi: tra questi, ad esempio, Bu-chinsky (1994); Mwabu e Schultz (1996); Martins e Pereira (2004);Fitzenberger e Kurz (2003).
In particolare, Buchinsky (1994), pur non trattando esplicita-mente l’interazione tra educazione ed abilità, analizza i cambia-menti verificatisi negli ultimi decenni nella struttura dei salari de-gli Stati Uniti (da una parte, le cresciute disuguaglianze retribu-tive, anche dopo aver controllato per le caratteristiche individua-li; dall’altra, l’aumento del rendimento di fattori come l’istruzionee l’esperienza), utilizzando i dati del Current Population Survey(CPS). Secondo l’autore risulta essenziale esaminare tali cambia-menti ai diversi punti della distribuzione: infatti, negli anni piùrecenti i redditi sono sì aumentati, in generale, a tutti i quantilidella distribuzione, al crescere degli anni di istruzione, ma le dif-ferenze negli incrementi sono maggiori in corrispondenza di de-terminati quantili (ad esempio, l’aumento del rendimento dell’i-struzione viene registrato come più sensibile ai quantili più altidella distribuzione dei redditi).
Tale configurazione viene riscontrata anche da Martins e Pe-reira (2004), i quali conducono una stima del rendimento dell’i-struzione per 16 paesi europei con l’intento di analizzare le diffe-renze negli incrementi reddituali determinati dall’istruzione lun-go l’intera distribuzione dei salari. In tal modo essi confrontanoil rendimento dell’istruzione per i lavoratori “più abili” e “menoabili”, con l’intento di chiarire l’effetto dell’istruzione sulla disu-guaglianza dei redditi tra gli individui. Il fatto stilizzato emergenteda questo studio è che il rendimento dell’istruzione è maggiore aiquantili più elevati delle distribuzioni condizionali dei redditi (coe-rentemente con quanto trovato da Buchinsky, 1994 per gli US).La Svezia viene citata come caso tipo; la Grecia come eccezione,poiché le stime per questo paese seguono un andamento esatta-mente opposto. Martins e Pereira (2004) hanno stimato il rendi-mento dell’istruzione anche per un campione tratto dalla Bancad’Italia (1995). Le stime ottenute (piuttosto simili alle nostre perquell’anno, data l’identica specificazione e la somiglianza nei cri-teri di costruzione del campione) seguono un andamento legger-
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
73
mente a U, ma non viene commentato dagli autori (v. tav. 1). Dun-que, dai risultati emerge che i lavoratori più abili (che ricevonosalari orari maggiori, condizionatamente alle loro caratteristiche)sono associati ad un maggiore incremento reddituale legato all’i-struzione. Martins e Pereira (2004) propongono tre possibili spie-gazioni. La prima fa riferimento al fenomeno della “sovra-educa-zione”, cioè alla diffusione di situazioni in cui lavoratori con ele-vata istruzione sono impiegati in occupazioni che richiedono scar-sa abilità o qualificazione, e che dunque sono remunerati con unbasso salario. Così che, più la coda inferiore dei redditi dei lavo-ratori con elevata abilità è popolata da individui “sovra-istruiti”(lavoratori altamente qualificati con lavori non qualificati), piùbasso sarà il rendimento dell’istruzione ai quantili inferiori delladistribuzione dei redditi.
Una seconda spiegazione riguarda l’abilità e la sua interazio-ne con l’istruzione. Il ruolo delle differenze nell’abilità, dato uncerto livello di istruzione, tenderebbe ad amplificarsi in modo cre-scente in termini di salario, via via che si considerano livelli diistruzione più elevati.
Un’ultima spiegazione si basa sulla presenza di differenze nel-la qualità scolastica o nei diversi indirizzi di studio (l’equazionedi Mincer controlla infatti solo per la quantità dell’istruzione). Po-trebbe cioè essere che gli individui che cadono nella coda infe-riore della distribuzione dei redditi siano proprio coloro che han-no ricevuto una istruzione scolastica di modesta qualità o che han-no seguito indirizzi scolastici scarsamente remunerati (ex-post) sulmercato del lavoro. Tali differenze tendono inoltre a prevalere ailivelli di istruzione medio-alti, che presentano una maggior varietànegli indirizzi formativi, ed eventualmente nel grado qualitativo.
Mwabu e Schultz (1996) utilizzano i quantili di regressioneper stimare il rendimento dell’istruzione per etnia in Sud Africae spiegarne le differenze. Considerando i residui dei quantili di re-gressione come espressione dell’abilità non osservata, essi inter-pretano i rendimenti crescenti/decrescenti come indicatori di com-plementarietà/sostituibilità tra questa misura di abilità e l’istru-zione nell’incrementare la produttività dei lavoratori. Mwabu eSchultz (1996) trovano che tra la popolazione bianca più istruita
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
74
il rendimento dell’istruzione aumenta all’aumentare dei decili delreddito e interpretano tale evidenza in termini di complementa-rietà tra abilità ed istruzione, mentre il rendimento derivante dal-l’aver frequentato la scuola secondaria presenta una correlazionenegativa (istruzione e abilità sostituti, almeno tra i meno abili). Ilrendimento per la popolazione nera che possiede un basso livel-lo di istruzione (scuola primaria) diminuisce all’aumentare del de-cile dei redditi indicando sostituibilità; mentre segue un anda-mento non lineare (convesso) per quanto riguarda l’istruzione se-condaria; e un andamento piuttosto irregolare per l’istruzione piùelevata.
4. - Evidenza empirica dai quantili di regressione per l’Italia
4.1 I dati
I dati utilizzati per costruire i campioni sono tratti da Bancad’Italia (1993), (1995), (1998) e (2000).
Le tavole 2, 3, 4 e 5 mostrano le statistiche descrittive delleprincipali variabili utilizzate nelle stime e delle altre variabili diinteresse. Questo per ognuno degli anni considerati, e tenendo di-stinti donne e uomini.
Nei campioni sono compresi individui tra i 14 ed i 60 anni,esclusivamente lavoratori dipendenti, non appartenenti al settoreagricolo. Inoltre, tra gli individui di sesso maschile sono stati con-siderati solamente i lavoratori a tempo pieno, mentre sono inclu-se sia le lavoratrici a tempo parziale sia quelle a tempo pieno.
Qualche precisazione preliminare sulle variabili utilizzate:1) Gli anni di istruzione degli individui sono ricostruiti a par-
tire dal dato sul titolo di studio più elevato conseguito. (Agli in-dividui che non hanno raggiunto alcun titolo di studio è stato as-segnato 0). A partire dal 1995 la classificazione relativa ai titoli distudio è stata particolareggiata, prevedendo le voci: diploma pro-fessionale (3 anni) e diploma universitario o laurea breve (3 an-ni). Dal medesimo anno l’indagine chiede all’intervistato anche iltipo di diploma conseguito e il tipo di laurea. Attraverso que-
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
75
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
76
TA
V.
2
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
FE
MM
INIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
min
imo
med
iam
assi
mo
età
1515
1616
36,9
637
,16
38,3
638
,74
6060
6060
(10,
06)
(10,
13)
(10,
07)
(10,
07)
ann
i is
tru
zion
e0
00
011
,22
11,2
811
,94
11,8
320
2121
21(3
,83)
(3,6
6)(3
,53)
(3,5
3)
med
ie i
nf.
––
––
0,28
0,26
0,22
0,23
––
––
(0,4
5)(0
,44)
(0,4
2)(0
,42)
med
ie s
up
.–
––
–0,
450,
480,
520,
52–
––
(0,4
9)(0
,50)
(0,5
0)(0
,50)
un
iver
sità
––
––
0,14
0,14
0,18
0,18
––
––
(0,3
5)(0
,35)
(0,3
9)(0
,38)
esp
erie
nza
pot
.0
00
019
,74
19,8
820
,42
20,9
154
5053
53(1
1,08
)(1
1,06
)(1
0,91
)(1
0,94
)
oper
aio
––
––
0,33
0,37
0,32
0,33
––
––
(0,4
7)(0
,48)
(0,4
7)(0
,47)
par
t-ti
me
––
––
0,11
0,13
0,15
0,16
––
––
(0,3
1)(0
,34)
(0,3
5)(0
,37)
ore
sett
iman
ali
41
55
34,3
834
,23
34,0
634
,82
7070
6510
0la
vora
te(9
,06)
(9,4
8)(9
,11)
(9,4
3)
redd
ito
400
600
500
500
18.6
77,3
219
.034
,68
21.4
82,5
222
.787
,49
64.0
0063
.900
180.
000
150.
000
annu
o ne
tto
(7.8
49,3
4)(8
.247
,59)
(9.3
84,2
4)(1
0.10
0,93
)
sala
rio
0,80
11,
201,
7412
,98
13.3
915
,13
15,4
410
2,08
150
264,
2975
0or
ario
net
to(7
,33)
(7.9
3)(1
1,41
)(1
8,06
)
istr
uz.
padr
e0
00
06,
276.
416,
987,
0917
1717
20(4
,17)
(4,1
0)(4
,07)
(4,4
3)
istr
uz.
mad
re0
00
05,
395.
606,
096,
3217
1717
20(3
,64)
(3,5
0)(3
,59)
(4,1
4)
padr
e op
erai
o–
––
–0,
370.
420,
410,
40–
––
–(0
,48)
(0,4
9)(0
,49)
(0,4
9)
mad
re n
on l
av.
––
––
0,64
0.58
0,58
0,55
––
––
(0,4
8)(0
,49)
(0,4
9)(0
,50)
padr
e au
tono
mo
––
––
0,24
0.27
0,21
0,22
––
––
(0,4
3)(0
,45)
(0,4
1)(0
,41)
n.di
osse
rvaz
ioni
2.21
22.
355
2.12
82.
299
*D
evia
zion
i st
anda
rdin
par
ente
si.
Red
dit
i in
mig
liai
a d
i li
re.
TA
V.
2 se
gue
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
FE
MM
INIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
min
imo
med
iam
assi
mo
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
77
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
78
TA
V.
3
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
FE
MM
INIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
I qu
arti
lem
edia
na
III
quar
tile
età
2929
3031
3737
3839
4545
4647
ann
i is
tru
zion
e8
88
813
1313
1313
1313
13m
edie
in
f.–
––
––
––
––
––
–m
edie
su
p.
––
––
––
––
––
––
un
iver
sità
––
––
––
––
––
––
esp
erie
nza
pot
.11
1112
1218
1920
2128
2828
29op
erai
o–
––
––
––
––
––
–pa
rt-t
ime
––
––
––
––
––
––
ore
sett
iman
ali
3028
3030
3636
3636
4040
4040
lavo
rate
red
dit
o an
nu
o n
etto
14.0
0014
.000
16.0
0017
.000
19.0
0019
.500
22.0
0023
.000
24.0
0024
.000
26.0
0028
.000
sala
rio
orar
io n
etto
8,68
9,25
10,4
210
,42
11,2
811
,57
13,0
213
,20
15,0
515
,62
16,6
717
,36
istr
uz.
pad
re5
55
55
55
58
88
8is
tru
z. m
adre
55
55
55
55
88
88
pad
re o
per
aio
––
––
––
––
––
––
mad
re n
on l
av.
––
––
––
––
––
––
pad
re a
uto
nom
o–
––
––
––
––
––
–
*D
evia
zion
i st
anda
rdin
par
ente
si.
Red
dit
i in
mig
liai
a d
i li
re.
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
79
TA
V.
4
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
MA
SC
HIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
min
imo
med
iam
assi
mo
età
1414
1515
39,2
938
,90
39,7
939
,73
6060
6060
(10,
79)
(10,
83)
(10,
42)
(10,
47)
ann
i is
tru
zion
e0
00
09,
8810
.31
10.7
410
.73
2021
2121
(3,7
9)(3
,78)
(3,6
2)(3
,65)
med
ie i
nf.
––
––
0,41
0,36
0,35
0,36
––
––
(0,4
9)(0
,48)
(0,4
7)(0
,48)
med
ie s
up
.–
––
–0,
330,
390,
440,
43–
––
–(0
,47)
(0,4
8)(0
,50)
(0,4
9)
un
iver
sità
––
––
0,09
0,10
0,11
0,12
––
––
(0,2
8)(0
,30)
(0,3
1)(0
,32)
esp
erie
nza
pot
.0
00
023
,41
22,5
923
,05
22,9
954
5454
54(1
1,71
)(1
1,65
)(1
1,13
)(1
1,16
)
oper
aio
––
––
0,50
0,52
0,49
0,50
––
––
(0,5
0)(0
,50)
(0,5
0)(0
,50)
ore
sett
iman
ali
55
55
40,2
240
,56
40,5
540
,95
7098
150
100
lavo
rate
(6,8
6)(7
,56)
(7,4
0)(7
,67)
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
80
red
dit
o80
070
01.
000
800
24.3
00,0
625
.109
,26
28.4
65,2
829
.687
,22
110.
000
150.
000
180.
000
350.
000
ann
uo
net
to(1
1.62
1,83
)(1
2.55
7,43
)(1
3.20
1,74
)(1
5.05
3,04
)
sala
rio
0,56
1,67
0,65
0,69
13,4
213
,90
15,5
115
,74
166,
6793
,75
156,
2519
1,89
orar
io n
etto
(7,2
0)(7
)(8
,35)
(8,0
8)
istr
u.
pad
re0
00
05,
275,
506,
016,
4117
1717
20(3
,90)
(3,9
2)(4
,02)
(4,4
5)
istr
u.
mad
re0
00
04,
584,
815,
415,
5317
1717
20(3
,43)
(3,5
5)(3
,62)
(3,9
7)
pad
re o
per
aio
––
––
0,43
0,50
0,46
0,44
––
––
(0,5
0)(0
,50)
(0,5
0)(0
,50)
mad
re n
on l
av.
––
––
0,71
0,66
0,63
0,60
––
––
(0,4
6)(0
,47)
(0,4
8)(0
,49)
pad
re a
uto
nom
o–
––
–0,
240,
240,
210,
19–
––
–(0
,43)
(0,4
3)(0
,41)
(0,3
9)
n.d
ioss
erva
zion
i3.
618
3.56
82.
996
3.26
5
*D
evia
zion
i st
anda
rdin
par
ente
si.
Red
dit
i in
mig
liai
a d
i li
re.
segu
eT
AV.
4
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
MA
SC
HIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
min
imo
med
iam
assi
mo
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
81
TA
V.
5
STA
TIS
TIC
HE
DE
SC
RIT
TIV
E P
ER
I C
AM
PIO
NI
FE
MM
INIL
I*
1993
1995
1998
2000
1993
1995
1998
2000
1993
1995
1998
2000
I qu
arti
lem
edia
na
III
quar
tile
età
3130
3131
4039
4040
4848
4849
ann
i is
tru
zion
e8
88
88
811
1113
1313
13
med
ie i
nf.
––
––
––
––
––
––
med
ie s
up
.–
––
––
––
––
––
–
un
iver
sità
––
––
––
––
––
––
esp
erie
nza
pot
.14
1314
1423
2223
2332
.75
3232
32
oper
aio
––
––
––
––
––
––
ore
sett
iman
ali
3838
3838
4040
4040
4040
4242
lavo
rate
red
dit
o an
nu
o n
etto
18.0
0018
.200
21.0
0022
.000
22.5
0023
.800
26.0
0027
.000
28.0
0030
.000
32.0
0033
.000
sala
rio
orar
io n
etto
9,40
9,90
10,9
411
,51
11,9
812
,50
13,8
914
,17
15,3
616
,03
17,3
618
,06
istr
u.
pad
re5
55
55
55
58
88
8
istr
u.
mad
re0
55
55
55
55
58
8
pad
re o
per
aio
––
––
––
––
––
––
mad
re n
on l
av.
––
––
––
––
––
––
pad
re a
uto
nom
o–
––
––
––
––
––
–
*D
evia
zion
i st
anda
rdin
par
ente
si.
Red
dit
i in
mig
liai
a d
i li
re.
st’ultima informazione è stato possibile diversificare il numero dianni di istruzione assegnati ai laureati delle diverse facoltà, te-nendo conto della differente durata dei vari corsi di laurea; 2) levariabili relative ai titoli di studio (medie inferiori, medie supe-riori, studi universitari), allo status di operaio dell’individuo e delpadre di questi, al tempo parziale, allo status di lavoratore auto-nomo del padre e alla condizione non lavorativa della madre so-no variabili dicotomiche. Per gli anni 1995, 1998 e 2000 nella va-riabile medie superiori sono compresi anche coloro che hannoconseguito un diploma professionale, e nella variabile relativa aglistudi universitari sono uniti tutti i soggetti che hanno conseguitoun diploma universitario o laurea breve, una laurea regolare edanche una specializzazione post-laurea; 3) l’esperienza potenzialeè così calcolata: età meno anni di istruzione meno 6 (considera-to l’inizio dell’obbligo di frequenza previsto dal sistema scolasticoitaliano); 4) le ore lavorate in media a settimana sono compren-sive dello straordinario; 5) il reddito annuo da lavoro dipendenteè al netto delle imposte e dei contributi; 6) il salario orario nettoè definito come: (reddito netto annuo)/(mesi lavorati * ore setti-manali lavorate * 4).
Dalle tavole 2, 3, 4 e 5 emerge che per le donne l’età mediaè tra i 37 e i 39 anni, e vicina ai 40 per gli uomini; più bassaquindi per le prime, ma con una tendenza all’aumento nel corsodegli anni. Gli anni di istruzione sono più elevati in media per ledonne (11-12 anni) che per gli uomini (10-11 anni), ed aumenta-no nel tempo per entrambi. Il comportamento delle variabili re-lative al titolo di studio conseguito rispecchia naturalmente quel-lo della variabile anni di istruzione. In particolare, negli anni ten-dono ad aumentare le percentuali di individui (donne e uomini)che raggiungono un diploma di scuola superiore o una laurea, ascapito di coloro che raggiungono solamente la licenza media.
Per quanto concerne le caratteristiche lavorative, si può no-tare come il lavoro a tempo parziale costituisca ancora un feno-meno piuttosto marginale, ma in crescita (dall’11% del 1993 al16% del 2000). Gli uomini tendono a lavorare (in media) un mag-gior numero di ore delle donne, pur escludendo le lavoratrici atempo parziale. Gli uomini hanno redditi annui medi significati-
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
82
vamente maggiori rispetto alle donne, ma il divario viene note-volmente a ridursi quando si considerino i salari orari; tale diffe-renza tende inoltre a diminuire leggermente negli anni.
Le informazioni sul substrato familiare sono disponibili a par-tire dall’indagine del 1993. Guardando ai valori medi, si nota lapresenza di una persistenza generazionale sia per il livello di istru-zione sia per le scelte occupazionali, soprattutto per le donne: que-ste infatti, condizionatamente al fatto di essere mediamente piùistruite degli uomini nei campioni, tendono ad avere genitori piùistruiti, mentre gli uomini hanno in maggior percentuale padri di-pendenti come operai e madri non occupate.
4.2 Stime OLS del rendimento dell’istruzione (in anni)
La prima stima effettuata sui campioni descritti è una stimaOLS della seguente equazione minceriana (Mincer, 1974):
(31) ln (wi) = α + βSi + γ1Xi + γ2X2i + εi
dove ln (w) è logaritmo del salario orario netto, S sono gli annidi istruzione, X è l’esperienza potenziale e ε è il termine di erro-re.
Le stime OLS del coefficiente degli anni di istruzione per tut-ti gli anni considerati (1993, 1995, 1998 e 2000) sono presentatenell’ultima colonna della tavola 6, tenendo distinti donne e uomi-ni. La regressione per i campioni femminili include anche la va-riabile dummy partime, che assume il valore 1 se la lavoratrice èoccupata a tempo parziale e 0 altrimenti. Nella tavola 6, in pa-rentesi sotto le stime, sono riportati gli standard error, robusti al-la presenza di eteroschedasticità (HCSE) (a fronte dei risultati ot-tenuti effettuando il test di Breusch-Pagan, che portano a rifiuta-re l’ipotesi nulla di omoschedasticità; v. in proposito la tavola 7).
Le stime mostrano i seguenti valori del rendimento dell’i-struzione: 8,7% (1993), 7,5% (1995), 6,2% (1998) e 6,1% (2000)per quanto riguarda i campioni femminili; mentre per gli uominisi ha: 6,7% (1993), 6,6% (1995), e circa 6% (1998 e 2000). Si può
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
83
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
84
TA
V.
6
ST
IME
DE
L R
EN
DIM
EN
TO
DE
LL’
IST
RU
ZIO
NE
(an
ni)
*
quan
tile
0,05
0,10
0,25
0,50
0,75
0,90
0,95
OL
S
don
ne
1993
0,09
190,
0829
0,07
840,
0826
0,08
930,
0955
0,09
730,
0867
(0,0
072)
(0,0
053)
(0,0
030)
(0,0
030)
(0,0
025)
(0,0
032)
(0,0
041)
(0,0
024)
1995
0,07
920,
0698
0,06
920,
0735
0,08
280,
0879
0,08
760,
0749
(0,0
057)
(0,0
043)
(0,0
031)
(0,0
025)
(0,0
031)
(0,0
040)
(0,0
046)
(0,0
026)
1998
0,06
150,
0527
0,05
260,
0571
0,07
290,
0751
0,07
410,
0622
(0,0
053)
(0,0
040)
(0,0
030)
(0,0
027)
(0,0
032)
(0,0
037)
(0,0
046)
(0,0
028)
2000
0,05
490,
0575
0,05
390,
0596
0,06
850,
0778
0,07
660,
0612
(0,0
072)
(0,0
062)
(0,0
025)
(0,0
030)
(0,0
028)
(0,0
033)
(0,0
052)
(0,0
028)
uom
ini
1993
0,06
120,
0567
0,05
390,
0629
0,07
150,
0790
0,08
290,
0676
(0,0
052)
(0,0
027)
(0,0
017)
(0,0
018)
(0,0
024)
(0,0
023)
(0,0
040)
(0,0
0177
)19
950,
0647
0,06
510,
0609
0,05
980,
0671
0,07
320,
0769
0,06
60(0
,003
9)(0
,002
4)(0
,002
2)(0
,001
6)(0
,001
8)(0
,002
8)(0
,003
9)(0
,001
74)
1998
0,05
230,
0522
0,05
140,
0534
0,06
240,
0741
0,08
300,
0599
(0,0
060)
(0,0
045)
(0,0
021)
(0,0
019)
(0,0
026)
(0,0
030)
(0,0
038)
(0,0
0215
)20
000,
0640
0,05
620,
0491
0,05
320,
0632
0,07
210,
0719
0,06
03(0
,004
2)(0
,003
7)(0
,002
5)(0
,001
6)(0
,002
2)(0
,002
7)(0
,004
2)(0
,001
94)
*In
par
ente
si g
li s
tan
dard
err
or(b
oots
trap
). S
tim
e ef
fett
uat
e co
n R
.
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
85
TA
V.
7
TE
ST
DIA
GN
OS
TIC
I
ann
id
onn
eu
omin
id
onn
eu
omin
id
onn
eu
omin
id
onn
eu
omin
i
1993
1995
1998
2000
R2
(OL
S)
0,44
695
0,42
595
0,35
140
0,43
385
0,26
911
0,35
439
0,27
804
0,36
538
test
di
B-P
*0,
0003
0,00
021
0,00
000,
0025
70,
0000
00,
0000
40,
0000
20,
0705
0(p
-val
ue)
eter
osch
.**11
9.31
516
3.04
120
0.30
071
.160
185.
342
108.
299
295.
589
121.
678
p-va
lue
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
sim
met
ria**
1.78
9.72
33.
828.
609
1.98
1.36
05.
021.
722
1.73
9.93
93.
404.
891
1.68
9.24
44.
510.
693
p-va
lue
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
R2
(OL
S)
0,45
033
0,43
232
0,35
056
0,43
183
0,27
216
0,34
902
0,27
619
0,37
004
test
di
B-P
*0,
0022
70,
0000
10,
0000
00,
0026
10,
0000
00,
0001
70,
0000
40,
0682
3(p
-val
ue)
eter
osch
.**16
0.97
217
6.29
721
2.28
388
.517
210.
779
157.
659
338.
073
195.
671
p-va
lue
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
sim
met
ria**
1.69
1.70
03.
933.
010
2.06
1.01
64.
608.
752
1.24
1.25
83.
462.
240
1.42
5.51
34.
136.
447
p-va
lue
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
0,00
000
n.d
ios
serv
.2.
212
3.61
82.
365
3.56
82.
128
2.99
62.
299
3.26
5
*Te
std
i B
reu
sch
-Pag
an.
**B
UC
HIN
SK
YM
.(1
995)
.
notare dunque come le stime del rendimento dell’istruzione sianomaggiori per le femmine che per i maschi (medesimo risultato èstato ottenuto da Brunello, Comi e Lucifora (2001) su un cam-pione simile di individui). In realtà le intercette, che rappresenta-no il logaritmo del reddito di un lavoratore a tempo pieno senzaistruzione e con esperienza potenziale pari a 0, sono maggiori pergli uomini; inoltre il gap tra lavoratrici e lavoratori si riduce viavia negli anni considerati. Flabbi (1997), (1999) affrontando in mo-do specifico (e più esaustivo di quanto non ci si proponga qui)l’aspetto delle differenze di rendimento in base al genere, propo-ne alcune interpretazioni dell’evidenza empirica ottenuta, e notacome i risultati siano legati alle tecniche di stima utilizzate (OLS,OLS con correzione à la Heckman, IV). Una interpretazione deimaggiori rendimenti dell’istruzione delle lavoratrici rispetto ailavoratori potrebbe derivare comunque, alla luce del modello diCard, dalla presenza di una maggior “distorsione da abilità” del-lo stimatore OLS per i campioni femminili. Ipotizzando che l’in-cidenza della distorsione derivante da errori nell’osservazione del-la variabile esplicativa “anni di istruzione” non sia diversa per ledonne e per gli uomini, e che b
–e r– non differiscano per femmi-
ne e maschi, si tratta di capire se è possibile che per le donne esi-sta una maggiore correlazione negativa tra le forme di abilità (ai
e bi) e i vincoli di liquidità, oltre ad una maggiore correlazionepositiva tra ai e bi stesse. La correlazione negativa tra abilità evincoli di liquidità può essere facilmente giustificata ammettendol’esistenza di una anche solo parziale persistenza intergenerazio-nale dell’abilità. In questa situazione i genitori più abili scelgonolivelli di istruzione più elevati, hanno redditi maggiori e figli inmedia più abili. Nella generazione dei figli, quindi, i più abili ten-dono ad avere genitori con redditi più alti. Nella misura in cui imaggiori redditi dei genitori riducono i vincoli di liquidità dei fi-gli, nella generazione di questi ultimi, gli individui più abili han-no costi marginali dell’istruzione inferiori. Da quanto ottenuto nel-le statistiche descrittive relative ai campioni qui utilizzati sembraplausibile ritenere che per le femmine esista una maggior persi-stenza generazionale, o comunque un maggior legame con il pro-prio ambiente familiare; le donne hanno in media una maggiore
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
86
istruzione, oltre che genitori anch’essi in media più istruiti. Inol-tre minore, rispetto a quella degli uomini, è la percentuale di don-ne nei campioni che hanno un padre occupato come operaio euna madre non lavoratrice.
5. - Stime del rendimento dell’istruzione (in anni) attraversoi quantili di regressione
Sempre nella tavola 6 sono presentate le stime dei quantili diregressione secondo la medesima specificazione utilizzata per lestime OLS, e sulla base degli stessi campioni. In particolare, latavola 6 contiene per ogni anno (1993, 1995, 1998 e 2000), e di-stinguendo tra donne e uomini, le stime del coefficiente degli an-ni di istruzione per diversi quantili di regressione, τ = {0,05, 0,10,0,25, 0,50, 0,75, 0,90, 0,95}. Sono riportati anche i valori deglistandard error, calcolati attraverso il metodo Bootstrap non para-metrico. I tratti del grafico 2 raffigurano, per il coefficiente del-l’istruzione, le stime ai vari quantili, attraverso una linea conti-nua, mentre le linee tratteggiate rappresentano l’intervallo di con-fidenza al 90%. È poi sovrapposta una linea punteggiata che rap-presenta la stima OLS per quel coefficiente, anch’essa con unabanda di confidenza al 90%. Nella tavola 7 sono riportati i risul-tati dei test di eteroschedasticità e di simmetria effettuati per lestime dei quantili di regressione (costruiti seguendo Buchinsky,1995; 1998). I campioni sono i medesimi utilizzati per le stimeOLS. I p-value ottenuti portano a rifiutare le ipotesi nulle di omo-schedasticità e di simmetria per tutti i campioni.
Le stime dei quantili, inizialmente elevate (per τ = 0,05), ten-dono a calare per gli individui che si collocano al di sotto del pri-mo quartile della distribuzione dei redditi (τ = 0,25), poi invececominciano a crescere, tendendo più o meno a stabilizzarsi aiquantili più elevati del reddito (τ = 0,90; τ = 0,95). Inoltre, il valo-re della stima OLS, che rappresenta l’effetto medio, tende ad ugua-gliare la stima corrispondente a 0,50 < τ < 0,75, cioè il valore me-dio del rendimento marginale dell’istruzione è generalmente mag-giore del rendimento di coloro che si trovano al quantile media-
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
87
no della distribuzione dei redditi. È confermato un rendimentodell’istruzione maggiore per i campioni femminili che per quellimaschili. Inoltre si può notare una differenza tra i campioni fem-minili e quelli maschili nel comportamento delle stime ai variquantili. Le stime relative agli uomini appartenenti alla coda in-feriore della distribuzione dei redditi si trovano infatti al di sottodella stima OLS, e fuori dalla sua banda di confidenza, in modopiù marcato rispetto a quanto avvenga per le corrispondenti sti-me effettuate sui campioni femminili; d’altro canto per i primi lestime tendono poi a crescere maggiormente, soprattutto ai quan-tili più elevati, di quanto facciano le seconde. Per comprenderetali risultati, occorre ricordare che il coefficiente degli anni diistruzione nella regressione di un dato quantile viene interpreta-to come la variazione (del logaritmo) del reddito dell’individuo ne-cessaria affinché tale individuo rimanga al medesimo quantile del-la distribuzione dei redditi, dopo aver studiato un anno in più(avendo cioè ricevuto il trattamento). Ad esempio, se si conside-ra il campione delle donne per il 1995, nella seconda riga dellatavola 6 leggiamo che il logaritmo del reddito di una lavoratriceche si trova al quantile mediano della distribuzione dei redditi (τ= 0,50) dovrebbe aumentare del 7,35% perché essa si possa collo-care nuovamente al quantile mediano della distribuzione dei red-diti delle lavoratrici con un anno di istruzione in più. Dalle stimeottenute, si evince dunque che maggiore deve essere l’incrementodei redditi degli individui che si trovano ai quantili bassi e a quel-li alti della distribuzione dei redditi, perché essi, con un anno ag-giuntivo di istruzione, mantengano il medesimo quantile. Questosignifica che la forma delle distribuzioni condizionali cambia; nonsi ha cioè in questo caso una semplice traslazione della posizio-ne della distribuzione della variabile dipendente, ma anche la suascala e la sua forma risultano modificate.
È inoltre possibile interpretare i risultati ottenuti in terminidi sostituibilità/complementarietà tra i “fattori” istruzione ed abi-lità. Dal grafico 2, i rendimenti decrescenti per i primi quantili(cioè per gli individui meno abili) testimoniano a favore della pre-senza di un certo grado di sostituibilità tra istruzione ed abilità.Il rapporto tra i due fattori tende a diventare però di comple-
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
88
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
89
GRAF. 2STIME DEL RENDIMENTO DELL’ISTRUZIONE PER DIVERSI QUANTILI
DELLA DISTRIBUZIONE CONDIZIONALE DEI REDDITI(anni di istruzione)
donne 1993
istr
uzi
one
istr
uzi
one
0.07
0.
08
0.09
0.
10
0.11
0,2 0,4 0,6 0,8tau
uomini 1993
0.05
0.
06
0.07
0.
08
0.09
0,2 0,4 0,6 0,8
tau
uomini 1995
0,05
0,
06
0,07
0,
08
0,09
0,2 0,4 0,6 0,8
tau
uomini 1998
0,04
0,0
5 0,
06 0
,07
0,08
0,0
9
0,2 0,4 0,6 0,8tau
uomini 2000
0,04
0,
05
0,06
0,
07
0,08
0,2 0,4 0,6 0,8
tau
donne 1995
istr
uzi
one
istr
uzi
one
0,06
0 0,
070
0,08
0
0,09
0
0,2 0,4 0,6 0,8
tau
donne 1998
istr
uzi
one
istr
uzi
one
0,04
0,0
5 0,
06 0
,07
0,08
0,0
9
0,2 0,4 0,6 0,8tau
donne 2000
istr
uzi
one
istr
uzi
one
0,04
0,0
5 0,
06 0
,07
0,08
0,0
9
0,2 0,4 0,6 0,8
tau
mentarietà per i quantili medio-alti di reddito (cioè per gli indi-vidui con maggiore abilità), infatti le stime crescono all’aumenta-re del quantile a partire dai quantili intermedi di reddito.
5.1 Stime OLS del rendimento dell’istruzione per titolo di studio
Analizziamo ora delle regressioni standard e quantili che con-tengono come variabili esplicative, in luogo degli anni di istru-zione, delle variabili dicotomiche relative al titolo di studio rag-giunto dall’individuo. La motivazione che spinge a stimare questomodello si basa sull’osservazione che in alcuni sistemi scolastici— incluso quello italiano — un maggior investimento in istruzio-ne che non conduca all’ottenimento di un titolo di studio potreb-be non garantire rendimenti maggiori sul mercato del lavoro. Pertrattare tale aspetto, stimiamo dunque per ogni anno consideratola regressione del logaritmo del salario orario netto sulle varia-bili dicotomiche “medie inferiori”, “medie superiori”, “università”,controllando per l’esperienza potenziale e il suo quadrato, e man-tenendo la variabile partime per i campioni femminili. I risultatidelle stime OLS sono presentati nell’ultima colonna della tavola8. Le stime dei coefficienti delle variabili binarie sui titoli di stu-dio vanno interpretate come differenziali rispetto al rendimentobase, ottenuto dagli individui senza alcun titolo di studio o chehanno raggiunto solamente la licenza elementare. Ad esempio, peril campione del 1995, un lavoratore maschio in possesso di un di-ploma di scuola superiore percepisce, in media, il 48% in più direddito orario di un lavoratore con la medesima esperienza po-tenziale, ma in possesso della licenza elementare. La configura-zione delle stime ottenute utilizzando i livelli di istruzione, inve-ce che gli anni, conferma la presenza di una relazione positivamonotonica tra il rendimento dell’istruzione e il maggior titolo distudio acquisito.
Inoltre, si trova che per il 1993 il rendimento dell’istruzionedelle lavoratrici è maggiore di quello dei lavoratori, ma nel 1995la differenza tende a ridursi, e negli anni successivi le stime deirendimenti per gli uomini sono superiori rispetto a quelle otte-
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
90
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
91
TA
V.
8
ST
IME
DE
L R
EN
DIM
EN
TO
DE
LL’
IST
RU
ZIO
NE
(tit
oli
di
stu
dio
)*
quan
tile
0,05
0,10
0,25
0,50
0,75
0,90
0,95
OL
S
don
ne
med
ie i
nf.
1993
0,29
470,
3075
0,19
970,
1865
60,
2236
0,23
470,
2595
0,23
52(0
,090
9)(0
,069
1)(0
,044
6)(0
,032
4)(0
,028
6)(0
,032
0)(0
,042
2)(0
,030
2)19
950,
3034
0,18
210,
1692
0,14
204
0,19
820,
1818
0,19
930,
1802
(0,1
212)
(0,1
004)
(0,0
437)
(0,0
345)
(0,0
318)
(0,0
659)
(0,0
736)
(0,0
361)
1998
0,10
740,
1302
0,10
530,
1620
70,
1493
0,20
390,
2138
0,11
40(0
,092
8)(0
,076
4)(0
,039
0)(0
,045
3)(0
,036
9)(0
,082
3)(0
,194
8)(0
,044
4)20
000,
3883
0,32
620,
1311
0,10
079
0,07
370,
0117
0,04
800,
1198
(0,1
046)
(0,0
865)
(0,0
583)
(0,0
409)
(0,0
456)
(0,0
684)
(0,1
111)
(0,0
455)
med
ie s
up.
1993
0,75
350,
6807
0,55
770,
5352
0,62
290,
6987
0,77
300,
6265
(0,0
749)
(0,0
734)
(0,0
495)
(0,0
328)
(0,0
329)
(0,0
349)
(0,0
518)
(0,0
316)
1995
0,73
190,
5414
0,48
550,
4669
0,55
870,
5905
0,63
160,
5193
(0,1
238)
(0,0
971)
(0,0
422)
(0,0
358)
(0,0
301)
(0,0
602)
(0,0
734)
(0,0
367)
1998
0,43
730,
3930
0,36
210,
3861
0,42
840,
5072
0,55
020,
3799
(0,0
785)
(0,0
755)
(0,0
393)
(0,0
474)
(0,0
400)
(0,0
812)
(0,1
950)
(0,0
439)
2000
0,69
270,
5866
0,36
630,
3377
0,36
740,
3721
0,42
730,
3919
(0,0
995)
(0,0
892)
(0,0
623)
(0,0
452)
(0,0
475)
(0,0
683)
(0,1
078)
(0,0
456)
un
iver
sità
1993
1,15
651,
0444
0,97
461,
0035
41,
1148
1,16
931,
1827
1,08
16(0
,082
5)(0
,083
3)(0
,060
1)(0
,039
2)(0
,036
6)(0
,040
4)(0
,050
8)(0
,036
2)19
951,
0370
0,81
130,
8055
0,87
338
1,02
941,
0499
1,08
660,
9032
(0,1
272)
(0,1
041)
(0,0
533)
(0,0
488)
(0,0
367)
(0,0
662)
(0,0
776)
(0,0
422)
1998
0,58
800,
5965
0,62
600,
7064
00,
8786
0,92
390,
9422
0,71
59(0
,084
6)(0
,079
2)(0
,044
5)(0
,053
6)(0
,041
8)(0
,083
1)(0
,209
8)(0
,050
3)20
000,
8360
0,83
310,
6146
0,66
452
0,76
390,
7783
0,81
930,
7028
(0,1
172)
(0,0
997)
(0,0
622)
(0,0
487)
(0,0
520)
(0,0
699)
(0,1
244)
(0,0
504)
*In
par
ente
si g
li s
tan
dard
err
orbo
otst
rap.
Sti
me
con
dot
te c
on R
.
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
92
segu
eT
AV.
8
ST
IME
DE
L R
EN
DIM
EN
TO
DE
LL’
IST
RU
ZIO
NE
(tit
oli
di
stu
dio
)*
quan
tile
0,05
0,10
0,25
0,50
0,75
0,90
0,95
OL
S
uom
ini
med
ie i
nf.
1993
0,23
440,
1923
0,14
240,
1782
0,17
620,
2321
0,24
230,
1825
(0,0
622)
(0,0
271)
(0,0
171)
(0,0
157)
(0,0
233)
(0,0
255)
(0,0
282)
(0,0
162)
1995
0,17
540,
2040
0,20
060,
2054
0,20
590,
2258
0,20
750,
2096
(0,0
608)
(0,0
354)
(0,0
246)
(0,0
197)
(0,0
251)
(0,0
273)
(0,0
507)
(0,0
189)
1998
0,10
470,
1421
0,16
890,
1513
0,19
760,
1702
0,19
730,
1649
(0,0
587)
(0,0
418)
(0,0
256)
(0,0
187)
(0,0
187)
(0,0
274)
(0,0
492)
(0,0
244)
2000
0,34
850,
3047
0,18
030,
1417
0,14
610,
1409
0,14
240,
1720
(0,0
939)
(0,0
546)
(0,0
355)
(0,0
236)
(0,0
242)
(0,0
661)
(0,0
492)
(0,0
267)
med
ie s
up.
1993
0,51
880,
4658
0,40
250,
4562
0,50
830,
5801
0,60
650,
4950
(0,0
573)
(0,0
291)
(0,0
174)
(0,0
174)
(0,0
274)
(0,0
295)
(0,0
340)
(0,0
179)
1995
0,50
870,
4947
0,45
500,
4346
0,46
990,
5227
0,57
560,
4810
(0,0
589)
(0,0
351)
(0,0
246)
(0,0
197)
(0,0
274)
(0,0
287)
(0,0
612)
(0,0
201)
1998
0,36
700,
3496
0,34
980,
3472
0,42
030,
5164
0,60
550,
4023
(0,0
578)
(0,0
444)
(0,0
276)
(0,0
225)
(0,0
225)
(0,0
367)
(0,0
512)
(0,0
259)
2000
0,61
780,
4922
0,34
730,
3379
0,41
230,
4812
0,48
590,
4106
(0,0
870)
(0,0
561)
(0,0
376)
(0,0
256)
(0,0
285)
(0,0
678)
(0,0
514)
(0,0
278)
un
iver
sità
1993
0,81
360,
7654
0,74
600,
8541
0,93
091,
0440
1,11
730,
8845
(0,0
757)
(0,0
470)
(0,0
362)
(0,0
299)
(0,0
324)
(0,0
501)
(0,0
518)
(0,0
267)
1995
0,80
160,
8187
0,81
250,
8325
0,92
420,
9902
1,02
010,
8784
(0,0
720)
(0,0
538)
(0,0
369)
(0,0
330)
(0,0
347)
(0,0
396)
(0,0
682)
(0,0
264)
1998
0,62
930,
6718
0,68
980,
7207
0,86
860,
9218
1,04
470,
7763
(0,0
825)
(0,0
570)
(0,0
389)
(0,0
296)
(0,0
296)
(0,0
534)
(0,1
164)
(0,0
357)
2000
0,86
860,
8082
0,66
560,
6980
0,82
960,
8940
0,92
920,
7774
(0,1
028)
(0,0
715)
(0,0
424)
(0,0
320)
(0,0
372)
(0,0
732)
(0,0
673)
(0,0
334)
*In
par
ente
si g
li s
tan
dard
err
orbo
otst
rap.
Sti
me
con
dot
te c
on R
.
nute per i campioni femminili. Si nota anche che le stime relati-ve alle lavoratrici mostrano un andamento decrescente nell’arcodegli anni considerati.
5.2 Stime del rendimento dell’istruzione per titolo di studio attra-verso i quantili di regressione
Le stime dei quantili di regressione ottenute per la specifica-zione con i titoli di studio sono presentate nella tavola 8 e conl’ausilio dei grafici 3 e 4.
In questa specificazione le stime vanno interpretate (dato uncerto quantile) come l’aumento percentuale di reddito che un in-dividuo con al più la licenza elementare dovrebbe avere per man-tenersi al medesimo quantile della distribuzione condizionale delreddito, se conseguisse, rispettivamente, la licenza media, il di-ploma, e la laurea. Dalle tabelle si evince che il rendimento del-l’istruzione è generalmente maggiore per i campioni femminili cheper i maschili a tutti i livelli di istruzione, anche se la differenzaa favore delle femmine scompare nel 1998 e nel 2000, quando incorrispondenza dei quantili più alti della distribuzione dei reddi-ti si rileva un rendimento superiore per gli uomini. Distinguendoper titolo di studio, diversamente da quanto non sia possibile fa-re per le stime basate sugli anni di istruzione, si può notare undifferente comportamento dei rendimenti al variare dei quantiliper i diversi livelli di istruzione. In generale, dai grafici risulta evi-dente come il rendimento derivante dall’aver conseguito la licen-za di scuola media inferiore cada, per quasi tutti i quantili e inquasi tutti i campioni, all’interno dell’intervallo di confidenza del-la corrispondente stima OLS. Cioè, non sembra esserci una par-ticolare variabilità delle stime tra quantili. Nei termini del rap-porto (di sostituibilità/complementarietà) tra istruzione ed abilità,potremmo dire che le stime non presentano un andamento spe-cifico al variare del quantile. Forse solo per il 2000 si nota un an-damento decrescente al crescere del quantile che porterebbe aduna lettura in chiave di sostituibilità tra i due fattori.
Ma questa configurazione cambia, quando si analizzino le sti-
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
93
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
94
GRAF. 3
STIME DEL RENDIMENTO DELL’ISTRUZIONE PER I CAMPIONIFEMMINILI A DIVERSI QUANTILI DELLA DISTRIBUZIONE
CONDIZIONALE DEI REDDITI(titoli di studio)
donne 1993
med
ie
0,1
0,2
0,3
0,4
0,2 0,4 0,6 0,8
tau
sup
erio
ri
0,4
0,5
0,6
0,7
0,8
0,9
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,8
0,9
1,0
1,1
1,2
1,3
0,2 0,4 0,6 0,8tau
med
ie
0,0
0,1
0,2
0,3
0,4
0,5
0,2 0,4 0,6 0,8
tau
sup
erio
ri
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,2 0,4 0,6 0,8tau
med
ie
-0,2
0,
0 0,
1 0,
2 0,
3 0,
4
0,2 0,4 0,6 0,8
tau
sup
erio
ri
0,0
0,2
0,4
0,6
0,8
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,4
0,6
0,8
1,0
1,2
0,2 0,4 0,6 0,8tau
med
ie-0
,1
0,1
0,3
0,5
0,2 0,4 0,6 0,8
tau
sup
erio
ri
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,5
0,6
0,7
0,8
0,9
1,0
0,2 0,4 0,6 0,8tau
donne 1995
donne 1998
donne 2000
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
0,2
0,3
0,4
0,5
0,6
0,7
0,8
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
95
GRAF. 4
STIME DEL RENDIMENTO DELL’ISTRUZIONE PER I CAMPIONIMASCHILI A DIVERSI QUANTILI DELLA DISTRIBUZIONE
CONDIZIONALE DEI REDDITI(titoli di studio)
uomini 1993
med
ie0,
0 0,
1 0,
2 0,
3 0,
4
0,2 0,4 0,6 0,8
tau
sup
erio
ri0,
3 0,
4 0,
5 0,
6 0,
7 0,
8
0,2 0,4 0,6 0,8
tauu
niv
ersi
tà0,
6 0,
7 0,
8 0,
9 1,
0 1,
1 1,
2
0,2 0,4 0,6 0,8tau
med
ie
0,2 0,4 0,6 0,8
tau
sup
erio
ri0,
4 0,
5 0,
6 0,
7
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,6
0,7
0,8
0,9
1,0
1,1
1,2
0,2 0,4 0,6 0,8tau
med
ie0,
05 0
,10
0,15
0,2
0 0,
25 0
,30
0,2 0,4 0,6 0,8
tau
sup
erio
ri0,
2 0,
3 0,
4 0,
5 0,
6 0,
7
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,4
0,6
0,8
1,0
1,2
0,2 0,4 0,6 0,8tau
med
ie0,
0 0,
1 0,
2 0,
3 0,
4 0,
5
0,2 0,4 0,6 0,8
tau
sup
erio
ri0,
3 0,
4 0,
5 0,
6 0,
7
0,2 0,4 0,6 0,8
tau
un
iver
sità
0,5
0,6
0,7
0,8
0,9
1,0
1,1
0,2 0,4 0,6 0,8tau
uomini 1995
uomini 1998
uomini 2000
0,05
0,1
0 0,
15 0
,20
0,25
0,3
0 0,
35
me dei coefficienti delle variabili medie superiori e università. Perquanto riguarda la prima, infatti, si osserva un andamento con-vesso ai vari quantili, in modo analogo a quanto visto in prece-denza con la variabile anni di istruzione. Cioè, ai quantili bassie a quelli elevati della distribuzione dei redditi, gli individui ne-cessitano (a parità di condizioni) di un maggior incremento direddito per mantenere la stessa posizione nella distribuzione deiredditi dei lavoratori diplomati, rispetto agli individui che si tro-vano ai quantili centrali della medesima distribuzione. Quindi an-che qui, cambia la forma della distribuzione condizionale del red-dito dei diplomati rispetto agli individui con istruzione elemen-tare. Per quanto riguarda l’istruzione secondaria superiore pos-siamo dunque interpretare i risultati in termini di sostituibilitàtra istruzione ed abilità ai quantili bassi, e di complementarietàai quantili alti.
Anche le stime dei coefficienti della variabile università mo-strano la presenza di differenze tra quantili, ma in questo casol’andamento tende ad essere meno convesso, o meglio, meno sim-metrico, cioè tende a prevalere un trend crescente all’aumentaredel quantile a favore dell’interpretazione in termini di comple-mentarietà tra i “fattori”. Questo si riscontra in particolar modoper quanto riguarda gli anni intermedi (1995 e 1998) e per i cam-pioni maschili. Mentre per le donne l’andamento delle stime pre-senta una forma maggiormente convessa, con valori molto ele-vati ai quantili estremi inferiori (τ = 0,05 e τ = 0,10), pari o spes-so anche superiori alle stime ottenute ai quantili più alti (τ = 0,90e τ = 0,95); per gli uomini prevale l’aspetto della crescita del ren-dimento all’aumentare del quantile di reddito considerato. Que-sto ad eccezione dell’anno 2000, anno in cui si riscontra un an-damento piuttosto convesso anche per il campione maschile,mentre il campione femminile vede addirittura una tendenza de-crescente all’aumentare del quantile di reddito considerato (so-stituibilità).
Un altro aspetto interessante è rappresentato dalla circostan-za che l’andamento piatto delle stime dei coefficienti delle varia-bili medie inferiori e medie superiori caratterizza particolarmen-te il campione femminile 1998, l’anno cioè in cui si registra il
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
96
maggior calo del rendimento marginale medio dell’istruzione perle donne. Per tale anno una certa differenziazione tra i rendimentiai diversi quantili di reddito è presentata solo dalle lavoratrici lau-reate. In particolare, si notano stime più elevate ai quantili altidella distribuzione dei redditi (complementarietà).
6. - Conclusioni
Questo lavoro, si propone di fornire dell’evidenza empirica ag-giornata sui rendimenti dell’istruzione in Italia attraverso la suastima condotta sia con i minimi quadrati ordinari, sia sulla basedi un certo numero di quantili di regressione (Koenker e Bassett,1978), evidenziando come una indagine basata sui quantili possarisultare più informativa rispetto ad una stima OLS standard va-lida per l’individuo medio.
I risultati ottenuti dalle stime OLS (effettuate sui dati trattidalla Banca d’Italia 1993, 1995, 1998 e 2000) sono molto vicini aquelli precedentemente trovati nella letteratura italiana e confer-mano la presenza di un rendimento dell’istruzione maggiore perle lavoratrici. L’interpretazione da noi proposta è che tale maggiorrendimento potrebbe essere dovuto ad una più forte incidenza del-l’endogenity bias e dell’ability bias sulle stime relative ai campionifemminili, ammettendo una maggiore persistenza generazionale euna maggiore correlazione dell’abilità e dei vincoli di liquidità del-le donne con quelli della loro famiglia di provenienza.
Il risultato più originale è ottenuto però dalle stime dei quan-tili. In generale, per quanto riguarda il coefficiente degli anni diistruzione, i quantili stimati hanno un andamento a U. Maggiore,cioè, deve essere l’incremento dei redditi degli individui che si tro-vano ai quantili bassi e a quelli alti della distribuzione dei reddi-ti, perché essi, dopo aver studiato un anno in più, si mantenganosul medesimo quantile. In altri termini, non si ha una semplicetraslazione della distribuzione del reddito, ma anche la sua scalae la sua forma risultano modificate al variare di τ. Nei termini delrapporto di sostituibilità/complementarietà tra istruzione e abilità,è possibile considerare dunque i due fattori come sostituiti ai
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
97
quantili inferiori della distribuzione dei redditi, e come comple-menti per i quantili medio-alti (cioè per gli individui più abili).
L’aspetto più significativo delle stime relative alla specifica-zione con i titoli di studio è la presenza di un diverso comporta-mento del rendimento ai vari quantili per i tre livelli di istruzio-ne considerati. Infatti, mentre i rendimenti derivanti dall’aver con-seguito la licenza di scuola media inferiore cadono, per quasi tut-ti i quantili e in quasi tutti i campioni, all’interno dell’intervallodi confidenza della corrispondente stima OLS, la configurazionecambia, quando si analizzino le stime dei coecienti delle variabi-li medie superiori e università. Le prime presentano un andamen-to convesso al variare dei quantili (sostituibilità tra istruzione edabilità per i meno abili e complementarietà per i più abili), ana-logamente a quelle relative agli anni di istruzione. Cambia dun-que la forma della distribuzione condizionale della variabile di-pendente dei diplomati rispetto agli individui con istruzione ele-mentare. Anche le stime dei coefficienti della variabile universitàmostrano la presenza di differenze tra quantili, anche se menomarcate, infatti tende a prevalere un trend crescente all’aumenta-re del quantile (complementarietà).
Si comprende quindi la capacità dei modelli basati sui quan-tili di regressione di meglio caratterizzare l’impatto dell’istruzio-ne sull’intera distribuzione del reddito, e la loro attrattività per di-verse applicazioni economiche. Purtroppo, spesso il trattamentosi presenta come endogeno o soggetto a self-selection; rendendo iquantili di regressione convenzionali (così come lo stimatore OLS)inadeguati a stimare consistentemente l’effetto del trattamentostesso. Da qui il principale limite e possibilità di sviluppo futurodi questo lavoro, dato che un caso tipico di endogeneità è rap-presentato dalla scelta dell’istruzione. Sono state infatti propostein letteratura delle metodologie di stima che utilizzano le varia-bili strumentali assieme ai quantili di regressione per trattare ta-le problema (Honoré e Hu, 2004; Arias, Hallock e Sosa-Escudero,2001; Chernozhukov e Hansen, 2005). Uno sviluppo futuro di que-sta indagine sui dati italiani potrebbe essere dunque quello di sti-mare il rendimento dell’istruzione utilizzando le dette metodolo-gie, nel tentativo di coniugare i vantaggi informativi derivanti da
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
98
una indagine basata sui quantili con i vantaggi derivanti dall’usodelle variabili strumentali, che permettono di trattare i problemilegati all’endogenità e all’eterogenità nelle scelte di istruzione.
Un’altra direzione di sviluppo del presente lavoro14 potrebbeessere quella di utilizzare specificazioni più articolate per l’equa-zione stimata, che includano ad esempio, da una parte il voto dimaturità e di laurea come proxy per l’abilità e dall’altra alcune va-riabili relative al settore o alla qualifica del lavoro dell’individuo.Queste ultime permetterebbero quindi di effettuare un’indaginepiù mirata, focalizzata su particolari settori o realtà, distinguen-do ad esempio tra settore pubblico e privato. Per quanto riguar-da l’Italia, tale aspetto è trattato ad esempio da Brunello, Comi eLucifora, 2001, che utilizzano però stime OLS e IV. Per quantoconcerne invece la prima proposta, essa si inserisce in quel filo-ne della letteratura che, seguendo Griliches, 1977, utilizza i votiriportati in esami standardizzati (ad esempio il test IQ), come va-riabili in grado di catturare l’abilità non osservata degli individui.Un “contro” di carattere generale di tale approccio consiste nel-l’implicita definizione che verrebbe così data del concetto di abi-lità, e nel fatto che in tal modo verrebbe catturato solo un certo“genere di abilità” individuale.
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
99
14 Come osservato da un anonimo referee, che ringrazio.
APPENDICE
1. - Dalla localizzazione alla regressione: quantili in ottimiz-zazione
Ogni variabile casuale a valori reali Y può essere caratteriz-zata attraverso la sua funzione di ripartizione:
F (y) = Prob (Y ≤ y)
Per ogni 0 < τ < 1, si definisce il τ-esimo quantile di Y nel mo-do seguente:
(32) Quant (τ) = inf {y |F (y) ≥ τ}
La mediana, Quant (1/2), rappresenta il quantile centrale. Co-me la funzione di ripartizione, anche la funzione quantile forni-sce una caratterizzazione completa della variabile casuale Y.
I quantili possono essere formulati come soluzione di un sem-plice problema di ottimizzazione. Per ogni 0 < τ < 1, si definisce laseguente funzione di perdita assoluta simmetrica, lineare a tratti:
(33) ρτ (u) = u (τ – 1 {u ≤ 0})
illustrata nel grafico 1.Minimizzando il valore atteso di ρτ (Y – ξ) rispetto a ξ, si ot-
tengono le soluzioni ξ (τ), la più piccola delle quali è Quant (τ),definito nell’equazione (2). Formalmente, si può scrivere:
ξ∈ �
min E [ρτ (Y – ξ)]
o, equivalentemente:
ξ* (τ) = argminξ∈ � E [ρτ (Y – ξ)]
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
100
con:
(34) Quant (τ) = inf ξ*(τ)
L’equivalente campionario di Quant (τ), a partire da un cam-pione casuale {y1, …, yn}, è detto τ-esimo quantile campionario, epuò essere determinato risolvendo:
ξ∈ �
min ∑n
i=1ρτ (yi – ξ)
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
101
GRAF. 1
FUNZIONE DI PERDITA ASSOLUTA ASIMMETRICA
ρτ (u)
τ – 1 τ
ovvero:
ξ* (τ) = argminξ∈ � ∑n
i=1ρτ (yi – ξ)
con:
(35)�
Quant (τ) = inf ξ* (τ)
in modo analogo a quanto visto sopra.Utilizzando poi il fatto che:
u = –|u| · 1 {u ≤ 0} + |u| · (1 – 1 {u ≤ 0}) = |u| · (1 – 2 · 1 {u ≤ 0})
la check function può essere utilmente riscritta nel modo seguente:
ρτ (u) = |u| (1 – 2 · 1 {u ≤ 0}) (τ – 1 {u ≤ 0})
= |u| (τ – 2τ · 1{u ≤ 0} + 1 {u ≤ 0})
= |u| (τ · 1 {u ≤ 0} + (1 – τ) · 1 {u ≤ 0})
da cui deriva, ad esempio, che la mediana corrisponde a:
(36)
mentre per gli altri quantili si pesano differentemente, in modoasimmetrico, gli scarti positivi e quelli negativi.
Per comprendere l’utilità e la validità di tale formulazione, siconsideri la funzione obiettivo:
(37)
La derivata di questa funzione rispetto a ξ (tranne che per yi
= ξ, in corrispondenza delle quali la derivata non esiste) è:
(38)
Se la frazione di osservazioni (rispetto al totale) con yi ≤ ξ èpari a τ, questa derivata è nulla:
∂∂
= − > + − ⋅ ≤[ ] =
+ ≤( ) =
≤ =
=
=
=
∑
∑
∑
Qy y
y
ny
i
n
i i
i
n
i
i
n
i
τ ξξ
τ ξ τ ξ
τ ξ
ξ τ
( )– ( { }) ( ) { }
– { })
{ }
1
1
1
1 1 1 1 0
1 0
11
∂∂
= ⋅ > + − ⋅ ≤( )=∑Q
y yi
n
i iτ ξξ
τ ξ τ ξ( )– { } ( ) { }
1
1 1 1
Q y y y y
i
n
i i i iτ ξ ξ τ ξ ξ τ ξ( ) { } ( ) { }= − ⋅ ⋅ > + − ⋅ − ⋅ ≤( )=∑
1
1 1 1
ρ1
2
12
1 1 012
1 012
( ) ( { }) { }u u u u u= − ≤ + ⋅ ≤
=
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
102
Quest’ultima è proprio la condizione sugli scarti; essendo in-fatti ξτ il τ-esimo quantile, il numero degli scarti negativi e nullisarà pari a nτ.
Sarebbe più comune definire i quantili campionari attraversol’ordinamento delle osservazioni, ma la formulazione in terminidi problema di minimizzazione ha il vantaggio di condurre ad unanaturale generalizzazione per i quantili condizionali.
Allo stesso modo con cui l’idea di stimare la media non con-dizionale come:
µ = argminµ∈ � ∑n
i=1(yi – µ)2
può essere estesa alla stima della funzione lineare media condi-zionale E (Y|X = x) = x’iβ risolvendo:
β= argminβ∈ �k ∑
n
i=1(yi – x’iβ)2
la funzione lineare quantile condizionale:
(39) Qτ (Y|X = x) = x’iβτ
può essere stimata risolvendo:
(40) βτ = argminβ∈ �k ∑
n
i=1ρτ (yi – x’iβτ)
2. - Quantili di regressione e programmazione lineare
È possible mostrare che il problema (18) può essere rappre-sentato anche come un problema di programmazione lineare. Unaconseguenza attrattiva di questo fatto è che, sia dal punto di vi-sta teorico sia da quello pratico, la programmazione lineare puòessere utilizzata per meglio caratterizzare la soluzione βτ specifi-cata nel problema (40). In particolare, il Teorema della Dualità eil Teorema dell’Equilibrio della programmazione lineare fanno lu-ce sulle proprietà della soluzione e sulla sua sensibilità agli ou-tliers (Buchinsky, 1995).
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
103
Si consideri il modello di base:
(41) yi = x’iβτ + ui
Qτ (yi|xi) = x’iβτ
con Qτ (uτi|xi) = 0 (per costruzione), e il problema di minimizza-
zione (18)
(42)
Si noti poi che yi può essere riscritto come funzione di solielementi positivi:
(43)
dove: β1τj ≥ 0, β2
τj ≥ 0, (con j = 1, ..., k), e u+τi ≥ 0, u–
τi ≥ 0, (con i = 1,..., n).
Segue quindi che il problema (18), scritto nei termini dellecomponenti della (43), assume la forma seguente:
o, equivalentemente, in notazione matriciale, più compatta:
dove A = (X, –X, In, –In) è una matrice n × (2n + 2k); y = (y1, …, yn)’è un vettore n × 1 che raccoglie le osservazioni sulla variabile di-
min z
c z
Az y
z
′
=
≥
0
min[ ( ) ]
( , , )
τι τ ιβ
βτ τ τ
τ τ τ
′ + − ′= + −
∈ ×
+ −
+ −
+ −+
u u
y X u u
u u k n
1
2� �
y x u x u uij
k
ij j ij
k
ij j j i i= + = − + −= =
+ −∑ ∑1 1
1 2β β βτ τ τ τ τ τ( ) ( )
minβ
τ τ τ ττ
β τ β β τ β∈ =
− ′ ⋅ ⋅ > ′{ } + − ′ ⋅ −( ) ⋅ ≤ ′{ }( )∑� k
y x y x y x y xi i i i i i i ii
n
1 1 11
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
104
pendente; z = (βτ1’, βτ
2’, uτ+’, uτ
–’)’ è un vettore (2k + 2n) × 1; c = (0’, 0’,τι ’, (1 – τ) ι ’)’; X = (x1, …, xn)’ è una matrice n × k con la i-esima ri-ga data da x’i, con i = 1, ..., n; In è una matrice identità di dimen-sione n; 0’ è un vettore k × 1 di zeri e ι è un vettore n × 1 di uno.Nel sistema di LP, uτ
+, uτ– vengono utilizzati in modo da rendere
vincoli di uguaglianza i vincoli del sistema, che risulta così espres-so in forma standard, secondo le comuni regole di trasformazio-ne valide per i sistemi di programmazione lineare. I vincoli, in ge-nerale, sarebbero costituiti da disuguaglianze, nella forma cano-nica del programma: per le osservazioni della variabile dipenden-te al di sotto dell’iperpiano, infatti, yi – x’iβτ < 0; per le osservazio-ni al di sopra di esso, yi – x’iβτ > 0. In altri temini, la variabile uτi
non è vincolata in segno. Tale problema rappresenta un problemaprimale di programmazione lineare. Di conseguenza, il problemaduale è definito da:
Esso equivale approssimativamente alle FOC (20) del proble-ma di minimizzazione Buchinsky (1995).
max w
w y
w A c
′
′ ≤ ′
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
105
BIBLIOGRAFIA
ANTONELLI G., Risorse umane e redditi da lavoro, Milano, F. Angeli, 1985.ARIAS O. - HALLOCK K.F. - SOSA-ESCUDERO W., «Individual Heterogeneity in the Re-
turns to Schooling: Instrumental Variables Quantile Regression Using Twins Da-ta», Empirical Economics, vol. 26, 2001, pp. 7-40.
ASHENFELTER O. - ROUSE C., «Income, Schooling and Ability: Evidence from a NewSample of Identical Twins», Quarterly Journal of Economics, vol. 113, 1998, pp.253-84.
BANCA D’ITALIA, Indagine sui bilanci delle famiglie italiane, distribuzione elettronicadei microdati, Roma, Banca d’Italia, 1986, 1991, 1993, 1995, 1998, 2000.
BECKER G.S., Human Capital and the Personal Distribution of Income, Ann Arbor(Michigan), University of Michigan Press, 1967.
BRUNELLO G. - MINIACI R., «The Economic Returns to Schooling for Italian Men.An Evaluation Based on Instrumental Variables», Labour Economics, vol. 6, n.4, 1999, pp. 509-19.
BRUNELLO G. - COMI S. - LUCIFORA C., «The Returns to Education in Italy: A NewLook at the Evidence», in HARMON C. - WALKER I. - WESTERGARD-NIELSEN N. (acura di), The Returns to Education in Europe, Cheltenham (UK), Edward Elgar,2001.
BUCHINSKY M., «Changes in the US Wage Structure 1963-1987: Application of Quan-tile Regression», Econometrica, vol. 62, 1994, pp. 405-58.
— —, «Estimating the Asymptotic Covariance Matrix for Quantile Regression Mo-dels: A Monte Carlo Study», Journal of Econometrics, vol. 68, 1995, pp. 303-38.
— —, «Recent Advances in Quantile Regression Models: A Practical Guideline forEmpirical Research», Journal of Human Resources, vol. 33, 1998, pp. 88-126.
CANNARI L. - D’ALESSIO G., «Il rendimento dell’istruzione: alcuni problemi di sti-ma», Roma, Banca d’Italia, Temi di Discussione, n. 253, 1998.
CANNARI L. - PELLEGRINI G. - SESTITO P., «Redditi da lavoro dipendente: un’analisiin termini di capitale umano», Roma, Banca d’Italia, Temi di Discussione, n.124, 1989.
CARD D., «Earnings, Schooling, and Ability Revisited», Cambridge (MA), NBER,Working Paper, n. 4832, 1994.
— —, «Using Geographic Variation in College Proximity to Estimate the Return toSchooling», Aspects of Labour Market Behaviour: Essays in Honour of John Van-derkamp, Toronto, Università di Toronto, 1995, pp. 201-22.
— —, «Estimating the Return to Schooling: Progress on Some Persistent Econo-metric Problems», Econometrica, vol. 69, 2001, pp. 1127-60.
CARD D. - KRUEGER A.B., «Does School Quality Matter? Return to Education andthe Characteristics of Public Schools in the United States», Journal of PoliticalEconomy, vol. 100, 1992, pp. 1-40.
CHERNOZHUKOV V. - HANSEN C., «An IV Model of Quantile Treatment Effect», Eco-nometrica, vol. 73, n. 1, 2005.
COLUSSI A., «Una Analisi Cross Section del Tasso di Rendimento dell’Istruzione inItalia», Politica Economica, vol. 13, n. 2, 1997.
FITZENBERGER B. - KURZ C., «New Insights on Earnings Trends Across Skill Grou-ps and Industries in West Germany», Empirical Economics, vol. 28, 2003, pp.479-514.
RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004
106
FLABBI L., «Investire in istruzione: è meglio per lui o per lei? Stima per genere deirendimenti dell’istruzione in Italia», Milano, Università degli studi di Milano -Bicocca, Working Paper, n. 08, 1997.
— —, «Returns to Schooling in Italy: OLS, IV and Gender Differences», Milano,Università Bocconi, Working Paper, n. 1, 1999.
GRILICHES Z., «Estimating the Returns to Schooling: Some Econometric Problems»,Econometrica, vol. 45, 1977, pp. 1-22.
HAUSE J.C., «Earnings Profile: Ability and Schooling», Journal of Political Economy,vol. 80, 1972, pp. 108-38.
HILLIER F.S. - LIEBERMAN G.J., Introduction to Operations Research, New York, Mc-Graw-Hill, 1990.
HOLLAND P.W., «Statistics and Causal Inference», Journal of the American Statisti-cal Association, vol. 81, 1986, pp. 945-60.
HONORÉ B.E. - HU L., «On Performance of Some Robust Instrumental VariablesEstimators», Journal of Business and Economic Statistics, vol. 22, n. 1, 2004,pp. 30-9.
ICHINO A., «Il problema della causalità. Una introduzione generale e un esempio»,Manuale di economia del lavoro, Bologna, Il Mulino, 2001, pp. 457-83.
ICHINO A. - WINTER-EBMER R., «Lower and Upper Bounds of Returns to Schooling:An Exercise in IV Estimation with Different Instruments», European EconomicReview, vol. 43, 1999, pp. 889-901.
KOENKER R., «Short Course on Quantile Regression», Technical Report, Urbana-Campaign, University of Illinois, 2003.
KOENKER R. - BASSETT G., «Regression Quantiles», Econometrica, vol. 46, 1978, pp.33-50.
LUCIFORA C. - REILLY B., «Wage Discrimination and Female Occupational Inten-sity», Labour, vol. 4, n. 2, 1990, pp. 147-68.
MARTINS P.S. - PEREIRA P.T., «Does Education Reduce Wage Inequality? QuantileRegression and Evidence From 16 Countries», Labour Economics, vol. 11, 2004,pp. 355-71.
MINCER J., Schooling, Experience and Earnings, New York, Columbia UniversityPress, 1974.
MWABU G. - SCHULTZ T.P., «Education Returns Across Quantiles of the Wage Func-tion: Alternative Explanations for Returns to Education by Race in South Afri-ca», American Economic Review, vol. 86, n. 2, 1996.
PARK J.H., «Returns to Schooling: A Peculiar Deviation from Linearity», Princeton(NJ), Princeton University, Working Paper, n. 335, 1994.
Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI
107