il rendimento dell’istruzione in italia: evidenza empirica ... · particolare, poiché la...

Il rendimento dell’istruzione in Italia: evidenza empirica

dai quantili di regressione

Pamela Giustinelli*Università degli Studi di Verona

Questo lavoro si propone di fornire dell’evidenza empirica ag-giornata sul “rendimento dell’istruzione in Italia” attraverso i“quantili di regressione”. Tale metodologia ci permette di studiareil Quantile Treatment Effect dell’istruzione sulla distribuzione con-dizionale del reddito (che consideriamo riflettere quella dell’abilitànon osservata), e di analizzare la relazione tra abilità ed istruzio-ne, e gli effetti sul reddito generati dalla loro interazione. Le stimeda noi ottenute presentano un andamento a “U”, ovvero rendimentimaggiori ai quantili estremi della distribuzione del reddito, sugge-rendo una relazione di sostituibilità tra istruzione ed abilità, perlivelli bassi dell’abilità, e di complementarietà, per livelli elevati diessa. [Cod. JEL: C21, I20, J24, J31]

1. - Introduzione

I risultati di numerosi studi empirici, sulla relazione esisten-te tra il grado di istruzione degli individui ed il loro reddito, mo-strano che i lavoratori più istruiti percepiscono retribuzioni piùelevate (Ashenfelter e Rouse, 1998; Card, 1995). Da qui l’interes-se e gli sforzi che gli economisti del lavoro hanno rivolto allo stu-

53

* <[email protected]>. Sono sinceramente grata a tre referee ano-nimi per i loro commenti su questo saggio, e al Prof. Gustavo Piga per i suoi uti-li suggerimenti. Ringrazio inoltre di cuore il mio Relatore di tesi Diego Lubianper la motivazione e l’entusiasmo che sempre mi trasmette, e per l’incoraggia-mento, gli utili commenti e i consigli su questo lavoro.

dio del rendimento dell’istruzione, nel tentativo di darne una com-piuta giustificazione teorica e una precisa quantificazione.

A fronte dell’elaborazione in letteratura di modelli economicisull’acquisizione dell’istruzione (come investimento mirante ad in-crementare le capacità reddituali future), che tengono conto del-l’endogeneità e degli elementi di eterogeneità individuale (l’abilità,l’ambiente familiare, etc.) che caratterizzano tale scelta (Becker,1967; Card, 1994), esistono diversi problemi metodologici per lastima del rendimento dell’istruzione come esso viene definito intali modelli.

Comuni dicoltà derivano dalla possibilità che il livello di istru-zione dell’individuo sia osservato con errore, e dal problema del-l’omissione di variabili rilevanti non osservabili (tipicamente l’a-bilità), con conseguenti distorsioni nelle stime. Ma il problemaprincipale per la stima del rendimento dell’istruzione emerge dal-l’osservazione che chi è istruito potrebbe guadagnare di più nontanto per un effetto causale del maggior tempo trascorso a scuo-la, bensì perché più abile (Ichino, 2001). Allora la stima del coef-ficiente dell’istruzione nella regressione del reddito non esprime-rebbe una misura (distorta) della relazione causale tra le due va-riabili, quanto, piuttosto, della loro correlazione spuria (Problemadell’identificazione di causalità). La maggiore dicoltà nella stimadel rendimento dell’istruzione riguarda, dunque, il fatto che l’i-struzione e il reddito degli individui sono congiuntamente deter-minati, venendo meno la causalità tra il reddito e l’istruzione me-desimi.

Nel tentativo di trattare tali aspetti è andata sviluppandosi unacopiosa letteratura (v. ad esempio la rassegna in Card, 2001; Card,1995; Ichino e Winter-Ebmer, 1999; e per l’Italia, Flabbi, 1997;Brunello e Miniaci, 1999; Brunello, Comi e Lucifora, 2001) costi-tuita da studi empirici in cui il rendimento dell’istruzione vienestimato utilizzando il Metodo delle variabili strumentali (IV). Lamaggior parte di tali lavori stimano però il rendimento margina-le medio dell’istruzione, sotto l’ipotesi che le distribuzioni condi-zionali del reddito risultino semplicemente traslate l’una rispettoall’altra al variare dell’istruzione. In realtà, non è detto che taleipotesi valga, né che una stima del rendimento marginale medio

RIVISTA DI POLITICA ECONOMICA NOVEMBRE-DICEMBRE 2004

54

dell’istruzione permetta di sintetizzare in modo efficace il feno-meno oggetto di studio. Da qui l’idea di stimare il rendimento del-l’istruzione attraverso la metodologia dei Quantili di regressione(Koenker e Bassett, 1978), che permette di analizzare il rendi-mento dell’istruzione degli individui ai diversi quantili della di-stribuzione dei redditi. L’effetto dell’istruzione sul reddito potreb-be infatti essere diverso per gli individui che si trovano in “pun-ti” differenti della distribuzione reddituale. Utilizzando i quantilidi regressione è possibile, dunque, controllare se la distribuzionecondizionale del reddito subisca solo un effetto di traslazione alvariare dell’istruzione, o intervenga anche un effetto di scala, equindi un cambiamento nella forma della distribuzione stessa. Inparticolare, poiché la distribuzione condizionale dei redditi tendea riflettere la distribuzione dell’abilità non osservata, una indagi-ne basata sui quantili di regressione dovrebbe risultare informa-tiva ed esplicativa della relazione tra l’abilità e l’istruzione, e de-gli effetti sul reddito generati dall’interazione tra queste variabili,senza che venga posta alcuna restrizione a priori su di essa. Inol-tre, lo stimatore quantile campionario ha una interpretazione intermini di Quantile Treatment Effect (QTE): esso misura, per ogniquantile τ, il cambiamento nel reddito richiesto per restare, dopoil trattamento (un anno aggiuntivo di istruzione), al τ-esimo quan-tile della distribuzione condizionale (sotto l’ipotesi di Rank Inva-riance1).

L’obiettivo del presente lavoro è quello di evidenziare comeuna indagine basata sui quantili possa risultare più informativarispetto ad una stima OLS o IV valida per l’individuo medio. Dauna parte, questo studio fornisce dell’evidenza empirica aggior-nata sui rendimenti dell’istruzione in Italia (stime OLS, sui datitratti dalla Banca d’Italia, 1993; 1995; 1998; 2000); dall’altra, l’a-spetto centrale è rappresentato dalla stima dei quantili per que-sti dati.

Nel secondo paragrafo viene presentato brevemente il model-lo endogeno di Card (1994) sulla scelta di acquisizione dell’istru-

Il rendimento dell’istruzione in Italia: etc.P. GIUSTINELLI

55

1 L’ipotesi di Rank Invariance richiede che la posizione relativa degli individuinella distribuzione dei redditi non cambi dopo il trattamento.

zione e vengono analizzate le implicazioni di tale modello sullostimatore OLS del rendimento marginale medio dell’istruzione.Viene anche effettuata una breve rassegna dei principali lavori em-pirici sul rendimento dell’istruzione condotti sui dati italiani, uti-lizzando stimatori OLS e IV. Nel terzo paragrafo viene presenta-ta la teoria sui quantili di regressione e la loro interpretazione nelcontesto di una indagine sul rendimento dell’istruzione. Sono poipresentati alcuni studi della letteratura internazionale sulle distri-buzioni condizionali dei redditi attraverso i quantili di regressio-ne. Infine nel sesto paragrafo sono descritti i dati, e nel settimosono riportati i risultati delle stime da noi condotte. Seguono leconclusioni.

2. - Il rendimento dell’istruzione: teoria economica e analisieconometriche

2.1 Un modello endogeno per l’acquisizione dell’istruzione

Un modello endogeno per le scelte di istruzione è stato pro-posto da Card (1994), a partire dal modello di Becker (1967).In questo modello gli individui compiono le loro scelte d’istru-zione attraverso un processo di ottimizzazione che si basa sulconfronto dei benefici e dei costi derivanti dal proseguire glistudi. Il reddito e i costi dell’individuo vengono espressi comefunzioni degli anni di istruzione, nelle quali si tiene conto de-gli aspetti di eterogeneità tra gli individui. Ciascun individuo ef-fettua la propria scelta d’istruzione massimizzando una funzio-ne di utilità:

U (Y, S) = log (Y) – φ (S)

dove S è il numero di anni d’istruzione, Y è il reddito medio an-nuo dell’individuo, e φ (S) è la sua funzione di costo. In partico-lare, si ipotizza che l’istruzione permetta di accumulare capitaleumano, e che individui maggiormente dotati di capitale umanopercepiscano redditi più elevati sul mercato del lavoro; quindi, la


56

funzione generatrice del reddito è definita da Y = Y (S), con Y’ >0 e Y’’ < 0. Il “reddito da capitale umano” aumenta all’aumentaredel grado di istruzione, ma in modo decrescente, come avviene ingenerale per tutti fattori produttivi.

La funzione di costo φ (S) è strettamente convessa; cioè, i co-sti associati all’istruzione aumentano all’aumentare degli anni tra-scorsi a scuola in modo crescente. In φ’ (S) sono compresi i costimonetari diretti (tasse scolastiche, libri, trasporto, etc.), i costi mo-netari indiretti o costi opportunità (mancati guadagni che si sa-rebbero ottenuti entrando immediatamente nel mercato del lavo-ro) e i costi non monetari (costi psicologici).

Considerando una funzione di utilità globalmente concava inS, esiste un (unico) numero ottimo di anni di istruzione, che siottiene dalla soluzione delle condizioni del primo ordine:

(1)

dove Y’ (S)/Y (S) rappresenta il tasso marginale di rendimento as-sociato ad un anno aggiuntivo di scuola, e φ’ (S) rappresenta il co-sto marginale di un anno di istruzione. Il significato economicodella condizione di equilibrio è che l’individuo raggiunge il pro-prio livello ottimo di istruzione quando i benefici marginali ad es-so associati eguagliano i costi marginali.

Per rendere operativo il modello, vengono assegnate unaforma funzionale al rendimento marginale e una ai costi mar-ginali. Card (1994) ipotizza che queste due funzioni siano li-neari e incorporino nelle intercette i fattori di eterogeneità in-dividuale:

(2)

(3) [φ (S)]i = δi(S) = r i+ k rS (kr ≥ 0)

Le scelte di istruzione variano dunque per due ragioni: 1) ledifferenze nell’abilità, bi, generano eterogeneità nei rendimentimarginali dell’istruzione degli individui; 2) le differenze nei vin-

′

= = − ≥Y SY S

S b k S ki

i i b b( )( )

( ) ( )β 0

′ = ′Y SY S

S( )( )

( )φ


57

coli di liquidità e nella condizione finanziaria e culturale delle fa-miglie, ri, generano eterogeneità nei costi marginali fronteggiatidagli individui.

Queste ipotesi sulla caratterizzazione dei rendimenti e dei co-sti marginali associati all’acquisizione di istruzione implicano aloro volta delle specifiche forme funzionali per Y (S) e φ (S). In-tegrando la (2) e prendendo il logaritmo, si ottiene la funzione ge-neratrice dei redditi, o earning function:

(4)

In tale specificazione, l’abilità influenza la pendenza della ear-ning function; per cui, con preferenze omotetiche, gli individui do-tati di maggior abilità sceglieranno livelli più elevati di istruzio-ne2.

La funzione di costo individuale è invece rappresentata da:

(5)

in cui l’elemento di eterogeneità determina una maggior in-clinazione della funzione stessa.

Il livello ottimo di istruzione è dato da:

(6)

con k = kb + kr. S

b rki

i i* = −

φ( )S c r S k Si r= + + 1

22

log( )Y a b S k Si i b= + − 1

22


58

2 Al contrario, se il termine di abilità fosse inserito nell’intercetta, ai, la con-clusione sarebbe opposta: in quanto individui con maggiori opportunità di reddi-to per ogni livello di istruzione potrebbero ben investire meno in istruzione, dalmomento che avrebbero maggiori costi opportunità se continuassero a frequenta-re la scuola. In tal caso, però, si dovrebbe forse attribuire un diverso significatoa questa componente. CARD D. (1994), richiamando HAUSE J.C. (1972), ricorre alconcetto di “abilità cognitiva” (capacità di un soggetto di rielaborare ed applicarela conoscenza acquisita; cioè una forma di abilità che il soggetto esprime nel con-testo lavorativo, e che lo porta a percepire redditi più elevati, indipendentementedal suo livello di istruzione e dalle sue abilità in ambito scolastico). Naturalmen-te, unendo le due specificazioni in una unica, con l’abilità incorporata sia nell’in-tercetta sia nella pendenza della earning function, l’effetto finale sulla scelta diistruzione sarebbe (a priori) incerto.

Dove le equazioni (6) e (4) assieme determinano la distribu-zione congiunta dei redditi e dell’istruzione3.

Il rendimento marginale dell’istruzione in corrispondenza del-la scelta ottima è dato da:

(7)

e rappresenta l’effetto causale dell’istruzione sul reddito dell’indi-viduo i4. Tuttavia, a causa del «problema fondamentale dell’infe-renza causale» (Holland, 1986), esso non può essere né identifi-cato né misurato. Ciò che può essere identificato, invece, e cherappresenta un utile parametro di riferimento con cui confronta-re gli stimatori (OLS e IV) del rendimento dell’istruzione è il ren-dimento marginale medio dell’istruzione nella popolazione:

(8) β β= = − = − =

++

+E E b k S b k S

kk k

bk

k kri i b i b

r

b r

b

b r

[ ] [ ]

βi i b i

b

b ri

b

b rib k S

kk k

bk

k kr* *= − = −

+

++

1


59

3 L’evidenza empirica (CARD D. - KRUEGER A.B., 1992; PARK J.H., 1994) testi-monia a favore di una relazione per dati sezionali approssimativamente linearetra il logaritmo del reddito e gli anni d’istruzione. Tale circostanza sembrereb-be inconsistente con l’equazione (4), a meno di kb = 0. In realtà, nonostante larelazione proposta dal modello sia quadratica, i dati generati dal modello stes-so potrebbero presentarsi secondo una relazione lineare. Da una parte, infatti,l’andamento dovrebbe essere concavo, dato che, a parità di bi, gli individui contasso marginale di sconto più basso tendono a scegliere livelli più elevati di istru-zione. Dall’altra, poiché, tra gli individui con diversa abilità, quelli maggiormentedotati sceglieranno livelli più elevati di istruzione, tale relazione dovrebbe risul-tare convessa. In definitiva, la relazione reddito-istruzione nella popolazione èdeterminata dalla combinazione dei due effetti, e tenderà maggiormente ad es-sere concava quanto minore è la varianza dell’abilità bi rispetto a quella del tas-so di sconto ri.

4 Come correttamente osservato da un anonimo referee, che colgo l’occasionedi ringraziare, sembrerebbe dunque di dover fronteggiare un problema di aggre-gazione, che peraltro mai viene esplicitamente rilevato nella letteratura di riferi-mento. In realtà, le specificazioni da noi stimate, eq. (31), (rispettivamente nellaversione con gli anni di istruzione e in quella con le variabili dicotomiche per ititoli di studio) e i dati a nostra disposizione ci permettono di effettuare una in-dagine cross-section dei rendimenti marginali dell’istruzione, che sono medi, nelcaso della stima OLS, e quantilici nel caso della stima con i quantili di regressio-ne. Come infatti da noi precedentemente osservato, a fronte dei modelli econo-mici sull’acquisizione dell’istruzione elaborati in letteratura, che incorporano adesempio le caratteristiche di eterogeneità individuale proprie di tale scelta (BECKER

G.S., 1967; CARD D., 1994), esistono diversi problemi metodologici e di stima delrendimento dell’istruzione così come esso viene definito in tali modelli.

A partire dalla specificazione:

log (Yi) = α + ρSi + εi

è possibile dimostrare che il limite in probabilità dello stimatoreOLS è:

(9)

da cui l’inconsistenza per il rendimento marginale medio dell’i-struzione.

La distorsione è positiva, in quanto prodotto di due fattoripositivi (λ rappresenta la frazione della varianza di S attribuibilealla variabilità di b; mentre b

–è sicuramente maggiore di r–, dato

che il livello ottimo di istruzione non può essere negativo). Essainoltre tenderà ad aumentare tanto maggiore è σ2

b rispetto a σ2r, e

tanto più ampia è la differenza (b–

– r–). Il termine λ (b–

– r–) può es-sere interpretato come una endogenity bias dovuta al fatto che gliindividui che hanno un rendimento marginale dell’istruzione mag-giore (perché più abili), o un minor costo marginale (perché me-no “vincolati monetariamente”), tendono a studiare più a lungo.In altri termini, lo stimatore OLS del coefficiente degli anni diistruzione è influenzato dal modo in cui gli individui, caratteriz-zati dal proprio livello di abilità e dai propri vincoli di liquidità,sono distribuiti nella popolazione5.

2.2 L’ability bias

Una ulteriore difficoltà nella stima del rendimento dell’istru-zione deriva dalla possibilità che siano presenti fattori non osser-

p

kk

bkk

r b rOLSb blim(ˆ ) ( )ρ λ λ β λ= − +

+ −

= + −1


60

5 Ammettendo l’esistenza di una correlazione negativa tra bi ed ri, si osserve-ranno presumibilmente con maggior frequenza individui con abilità elevata e bas-si vincoli di liquidità e viceversa, ossia individui con un alto grado di istruzionee redditi elevati, oppure individui con un basso livello di istruzione e basso red-dito. Quindi la retta di regressione avrà pendenza positiva e la sua inclinazionetenderà a crescere all’aumentare della frequenza relativa con cui si presentano ta-li osservazioni.

vati di eterogeneità nel livello dei redditi. L’approccio adottato inletteratura per affrontare la questione della cosiddetta ability biasè quello di considerare una funzione generatrice dei redditi checontenga una componente specifica individuale (Griliches, 1977).

Card (1994) introduce tale aspetto aggiungendo un’intercettaindividuale ai nella earning function:

(10)

Di conseguenza, l’espressione per il limite in probabilità del-lo stimatore OLS del coeciente degli anni di istruzione diventa:

(11)

Una correlazione tra ai e Si può sussistere per due motivi: per-ché ai è correlato con bi, oppure con ri, cioè la parte di redditoche l’individuo è potenzialmente in grado di percepire grazie a suepeculiari abilità (di tipo cognitivo) è correlata ai fattori che de-terminano l’abilità (in ambito scolastico) e il tasso individuale disconto, quali il benessere familiare, il substrato culturale, etc., del-l’individuo stesso. Analiticamente, poiché:

(12)

l’espressione per il termine di distorsione risulta essere:

(13)

Si può ragionevolmente supporre che ai e bi siano positivamentecorrelati (σab > 0), mentre ai e ri lo siano negativamente (σar < 0). Inparticolare, una correlazione positiva tra ai e bi può presentarsi seai esprime una qualche misura di abilità cognitiva dell’individuo ese il grado di istruzione e tale genere di abilità sono complementa-

E a S S

Sk

i i

i

ab ar

b r br

( )

( )( )

( )

−[ ] = −+ −Varσ σ

σ σ σ2 2 2

E a S S E a

b b r rk ki i i

i iab ar[ ( )]

( ) ( )( )− = − − −

= −1 σ σ

pY S

Var S

E a S S b S S S k S S S

S

OLSi i

i

i i i i i b i i

i

lim(ˆ )[log( ), ]

( )

( ) ( ) ( )

( )

ρ = =

=− + − − −

Cov

Var

12

2

log( )Y a b S k Si i i b= + − 1

22


61

ri. Invece una correlazione negativa tra ai e ri può derivare dalla cir-costanza che i figli delle famiglie più ricche abbiano tassi di scontopiù bassi, o una naturale propensione a studiare più a lungo, e chequesti individui tendano in generale a raggiungere livelli di redditopiù elevati in virtù di migliori accessi al mercato del lavoro.

2.3 Variabile esplicativa osservata con errore

Consideriamo, infine, la possibilità che la variabile esplicati-va “anni di istruzione” sia osservata con errore, cioè gli anni diistruzione osservati (Si

0) differiscono dal vero livello di istruzione(Si) per un termine d’errore additivo:

Si0 = Si + εi

dove εi ha media 0, varianza σ2ε, ed è incorrelato con Yi. In que-

sto caso, il limite in probabilità dello stimatore OLS è:

(14)

Sfruttando la relazione:

il limite in probabilità (14) può essere scritto come:

(15)

dove il primo fattore non è altro che il limite in probabilità del-lo stimatore OLS nel caso standard, mentre il secondo rappresentail termine di distorsione. È immediato verificare che tale distor-sione porta ad una sottostima del parametro ρ, infatti:

In conclusione, tenendo conto di tutte le problematiche ana- p p

Y SS

S S

SOLS

i i

i

i i

i

lim( ˆ )[log( ), ]

( )[ , ]

( )0

0

0= ⋅Cov

VarCov

Var

p p

Y SS

S S

SOLS

i i

i

i i

i

lim( ˆ )[log( ), ]

( )[ , ]

( )0

0

0= ⋅Cov

VarCov

Var

Cov

Cov

CovVar

[log( ), ]

[ , ]

[log( ), ]( )

Y S

S S

Y SS

i i

i i

i i

i

0

0=

p p

Y S

SOLS

i i

i

lim( ˆ )[log( ), ]

( )0

0

0= Cov

Var


62

lizzate inerenti alla procedura di stima, l’espressione per il limitein probabilità dello stimatore OLS sarà:

(16)

in cui sono presenti tre fonti di distorsione nello stimatore OLSrispetto al rendimento marginale medio dell’istruzione β

– 6: 1) lacomponente dovuta alla endogenity bias, λ (b

–– r–); 2) la ability bias

attribuibile alla presenza di componenti non osservate di etero-geneità nel livello dei redditi,

3) la distorsione verso il basso generata da errori di misuradella variabile anni di istruzione, θ0.

2.4 Il rendimento dell’istruzione in Italia nei precedenti studi

Nella seconda metà degli anni ’80 e durante gli anni ’90, so-no stati condotti numerosi studi empirici rivolti alla stima del ren-dimento dell’istruzione in Italia (nella tavola 1 sono riassunti i ri-sultati delle principali stime). Come osservato da Brunello e Mi-niaci (1999), i primi studi si basavano su stime OLS effettuate sudati eterogenei e non sempre rappresentativi7.

k ab ar

b r br

( )

( )

σ σσ σ σ

−+ −2 2 2

p p b r kOLSab ar

b r br

lim( ˆ ) ( )( )0

0 2 2 2= + − + −

+ −

θ β λ σ σ

σ σ σ


63

6 Occorre invece ricordare che una procedura di stima IV dovrebbe fornirestime immuni da tali distorsioni. D’altra parte, strumenti diversi tendono a gene-rare stime differenti dei rendimenti medi per differenti sottogruppi nella popola-zione (ICHINO A. - WINTER-EBMER R., 1999). Infatti, una stima IV misura il rendi-mento marginale degli individui che, nel contesto dell’esperimento naturale con-siderato, sono compliers, con una tendenza così a sovrastimare il rendimento mar-ginale medio dell’istruzione nella popolazione, dato che tali individui hanno tipi-camente rendimenti più elevati (discount rate bias) (CARD D., 1994).

7 Ad esempio, ANTONELLI G. (1985) stima una equazione minceriana standardcon gli OLS, utilizzando un data-set a carattere regionale, e ottenendo un rendi-mento pari al 4,6%. Medesimo risultato viene trovato da CANNARI L. - PELLEGRINI

G. - SESTITO P. (1989), i quali utilizzano un campione più ampio tratto da BANCA

D’ITALIA (1986). LUCIFORA C. - REILLY B. (1990) (sulla base dei dati ENI-IRI sui red-diti individuali) effettuano una stima OLS per genere, trovando che il rendimen-to marginale dell’istruzione è più elevato per le donne che per gli uomini.


64

TA

V.

1

I R

EN

DIM

EN

TI

DE

LL’

IST

RU

ZIO

NE

IN

ITA

LIA

IN

PR

EC

ED

EN

TI

ST

UD

I

auto

red

ati

cam

pio

ne

OL

SIV

stru

men

ti

stim

e

An

ton

elli

(19

85)

ER

(uom

ini)

0,04

6–

Can

nar

i, P

elle

grin

iS

HIW

198

6(u

omin

i)0,

046

–e

Ses

tito

(19

89)

Lu

cifo

ra e

Rei

lly

EN

I-IR

I(d

onn

e)0,

040

–(1

990)

(uom

ini)

0,03

6–

Can

nar

i e

D’A

less

ioS

HIW

199

3(u

omin

i)0,

045

0,07

0is

tru

zion

e d

ei g

enit

ori

(199

5)C

olu

ssi

(199

7)S

HIW

199

3(u

omin

i)0,

062

0,07

6is

tru

zion

e d

ei g

enit

ori

Fla

bb

i (1

997)

SH

IW 1

991

(don

ne)

0,02

20,

056

rifo

rme

1962

e 1

969,

(uom

ini)

0,01

70,

062

vici

nan

za a

ll’u

niv

ersi

tàB

run

ello

e M

inia

ciS

HIW

199

3-19

95(u

omin

i)0,

048

0,05

7is

tru

zion

e d

ei g

enit

ori,

(199

9)ri

form

a 19

69B

run

ello

, C

omi

SH

IW 1

995

(don

ne)

0,07

7–

istr

uzi

one

e p

rofe

ssio

ne

e L

uci

fora

(20

01)

(esp

erie

nza

)(u

omin

i)0,

062

-ge

nit

ori,

rif

orm

a 19

69(e

tà)

(don

ne)

–0,

077

(uom

ini)

0,04

80,

059

(uom

ini)

0,04

80,

061

+ a

vver

sion

e al

ris

chio

Mar

tin

s e

Per

eira

(20

04)

SH

IW 1

995

OL

S0,

062

%Q

uan

tili

100,

065

200,

063

300,

057

400,

057

500,

056

600,

057

700,

061

800,

065

900,

068

Gli studi più recenti, a partire dalla seconda metà degli anni’90, utilizzano ampiamente i dati delle Indagini sui bilanci delle fa-miglie, effettuando stime IV del rendimento dell’istruzione in Ita-lia. Cannari e D’Alessio (1995), con i dati del 1993 (Banca d’Ita-lia, 1993), e sulla base di variabili strumentali relative al substra-to familiare, ottengono una stima vicina al 7%, più elevata di quel-le ottenute dalle ricerche precedenti. Colussi (1997) ottiene unastima del 6,6%, utilizzando i dati relativi al medesimo anno e ungruppo simile di strumenti.

Flabbi (1997) stima il rendimento dell’istruzione per le don-ne e per gli uomini separatamente (dati Banca d’Italia, 1991), uti-lizzando come strumenti: la variabile binaria “provincie”, indica-tore della presenza o meno di sedi universitarie nella provincia diresidenza dell’individuo quando questi aveva 19 anni; e la varia-bile “riforme”, costruita considerando come eventi esogeni le rifor-me del sistema scolastico italiano del ’62 (media unica) e del ’69(accesso a tutte le facoltà universitarie per i diplomati presso qua-lunque tipo di istituto secondario superiore). Le stime IV sono0,56 per le donne e 0,62 per gli uomini. Il risultato nuovo otte-nuto dall’autore è dato dal rovesciamento della “gerarchia” nei ri-sultati. Le stime IV del rendimento dell’istruzione risultano infat-ti maggiori per gli uomini, mentre le stime OLS ottenute da Flab-bi (1997) sono 0,22 per le donne e 0,17 per gli uomini. Obiettivodi Flabbi (1997), (1999) è quello di chiarire se l’usuale gerarchia,ovvero un rendimento femminile superiore a quello maschile, pos-sa essere considerata un risultato empirico acquisito nel mercatodel lavoro italiano o non dipenda piuttosto dalle tecniche di sti-ma utilizzate. La conclusione dell’autore è che tale gerarchia èconfermata solo in parte. Essa tende a valere, anche se in modonon indipendente dalla specificazione, quando si applica la pro-cedura OLS. È invece rovesciata dalle stime IV. Una prima inter-pretazione è rappresentata dall’osservazione che la distorsione del-le stime con i minimi quadrati ordinari sarebbe tale da nascon-dere il vero rapporto relativo dei rendimenti in base al genere. Maè possibile anche una interpretazione alternativa, e cioè che l’in-versione non varrebbe in realtà per tutto il campione, ma solo percoloro che presentano un rendimento dell’istruzione più elevato


65

(ad esempio perché provenienti da famiglie meno abbienti). L’in-terpretazione economica di un rendimento dell’istruzione supe-riore per il gruppo di trattamento maschile, rispetto a quello delgruppo femminile, porterebbe allora ad ipotizzare variabilità deirendimenti all’interno della popolazione e discriminazione di ge-nere pre-mercato del lavoro a svantaggio delle donne.

Brunello e Miniaci (1999) e Brunello, Comi e Lucifora (2001),utilizzando i dati della Banca d’Italia ’93 e ’95, stimano il rendi-mento dell’istruzione, con variabili strumentali relative al back-ground familiare (istruzione e posizione professionale dei genito-ri), alla riforma scolastica del ’69 e (solo i secondi) al grado diavversione al rischio dell’individuo. Brunello e Miniaci (1999) ot-tengono una stima OLS del 4,8% e una stima IV del 5,7% per icapifamiglia maschi. Valori simili sono ottenuti da Brunello, Co-mi e Lucifora (2001). Le stime IV mantengono però la configu-razione di quelle OLS, relativamente alla gerarchia dei rendimentifemminili e maschili. Brunello, Comi e Lucifora (2001) ottengo-no infatti rendimenti dell’istruzione più elevati per i campionifemminili, anche con le stime IV, a differenza di Flabbi (1997),(1999).

3. - L’approccio dei “quantili di regressione” nello studio dellarelazione reddito-istruzione-abilità

3.1 Lo stimatore dei quantili

Il modello dei quantili di regressione, introdotto da Koenkere Bassett (1978), estende la nozione degli ordinari quantili del mo-dello di locazione alla più generale classe dei modelli lineari, neiquali i quantili condizionali hanno appunto la forma di funzionilineari (nei parametri).

I quantili di regressione possono dunque considerarsi una me-todologia statistica, volta a stimare le funzioni quantile condizio-nale, e a condurre inferenza su di esse. Infatti, come il modellolineare classico costituisce un modello di media condizionale, iquantili di regressione rappresentano dei modelli di mediana con-


66

dizionale, o delle altre funzioni quantile condizionale. Un ben no-to caso particolare di quantile di regressione è costituito dallo sti-matore LAD, proposto da Koenker e Bassett (1978), che adatta lamediana ad una funzione lineare di variabili esplicative, mini-mizzando la somma dei valori assoluti dei residui.

La stima LAD è potenzialmente attrattiva per le medesime ra-gioni per cui la mediana può costituire un indice di localizzazio-ne migliore rispetto alla media: esiste sempre all’interno della di-stribuzione considerata; è rappresentativa della posizione della di-stribuzione stessa anche in presenza di valori anomali, limitan-dosi a tener conto solo della modalità dell’elemento che occupauna certa posizione nella distribuzione delle osservazioni ordina-te. Analogamente, gli stimatori dei quantili sono robusti alla pre-senza di outliers nelle osservazioni sulla variabile dipendente, e sidimostrano più efficienti degli stimatori OLS, nei casi in cui il ter-mine di errore non possieda una distribuzione normale. Inoltre,dal punto di vista computazionale (ed estetico), il modello deiquantili di regressione può essere formulato come un problemadi Programmazione Lineare (LP), il che agevola la stima e per-mette di semplificare i problemi computazionali8. Esso può esse-re anche “contestualizzato” nello schema del Metodo Generaliz-zato dei Momenti (GMM), il che si rivela utile per la determina-zione delle proprietà asintotiche dello stimatore quantile campio-nario. Infine, un aspetto altamente interessante e peculiare di que-sta metodologia è costituito dal fatto che le differenti soluzioniper i diversi quantili possono essere interpretate come differentirisposte della variabile dipendente, nei vari punti della distribu-zione condizionale della variabile dipendente stessa, alle variazio-ni nei regressori9.


67

8 La rappresentazione del problema di minimizzazione del quale lo stimatorequantile campionario è soluzione eq. (18) come programma lineare è riportata inAppendice. Per una trattazione sull’utilizzo della programmazione lineare nel con-testo delle regressioni quantiliche v. BUCHINSKY M. (1995), e KOENKER R. - BASSETT

G. (1978) per un semplice ma esplicativo esempio bivariato con cinque osserva-zioni. Si rimanda inoltre a HILLIER F.S. - LIEBERMAN G.J. (1990) per la necessariateoria di LP.

9 Per chiarire tale affermazione, richiamiamo qualche applicazione di tale tec-nica, mutuandola da KOENKER R. (2003). I quantili di regressione sono stati uti-

Il τ-esimo quantile di regressione è definito da:

(17) Qτ (yi|X = x) = x’iβτ

dove xi è il vettore k × 1 dell’i-esima osservazione su k regressori,e yi l’i-esima osservazione sulla variabile dipendente. Il processouτi = yi – x’iβτ possiede funzione di ripartizione Fuτ

(·) e, per defini-zione, Qτ (uτi|xi) = 0. Lo stimatore quantile campionario βτ è defi-nito come qualsiasi soluzione al problema di minimizzazione10.

(18)

Alla luce di tale rappresentazione, preme sottolineare la pro-prietà di robustezza di tale stimatore, influenzato solo dal com-portamento locale della distribuzione condizionale della variabiledipendente vicino al quantile specificato. Data una soluzione βτ ,basata sulle osservazioni {y, X}, fintanto che non viene cambiatoil segno dei residui uτ = y – Xβτ , qualsiasi osservazione su y puòessere arbitrariamente modificata senza alterare la soluzione ini-ziale. Solo i segni degli scarti entrano nella determinazione delle

minβ

τ τ

τ τ

τ

β τ β

β τ β

∈ =

− ′( ⋅ ⋅ > ′{ } +

+ − ′ ⋅ −( ) ⋅ ≤ ′{ } )

∑� k

y x y x

y x y x

i ii

n

i i

i i i i

1

1

1 1


68

lizzati, ad esempio, per studiare l’impatto di varie caratteristiche demografiche edel comportamento materno sul peso dei bambini alla nascita, permettendo in par-ticolare di concentrare l’analisi sulla coda inferiore della distribuzione, ossia suibambini sottopeso. Questa risulta infatti di particolare interesse per i ricercatori,in quanto un basso peso alla nascita viene comunemente associato ad una seriedi conseguenti problemi di salute, nonché ai risultati scolastici e professionali chegli individui mediamente raggiungono. Ancora, negli studi sulle relazioni esisten-ti tra i risultati ottenuti dagli studenti di scuole pubbliche in esami standardizza-ti e alcune variabili socio-economiche, quali il reddito familiare e il livello di istru-zione dei genitori, e normative, quali la numerosità delle classi e la qualifica de-gli insegnanti, i quantili di regressione vengono utilmente impiegati per capire segli interventi normativi influiscono sulle performance degli studenti migliori nellostesso modo che su quelle dei meno brillanti. Non sembra plausibile, infatti, chegli effetti di tali variabili agiscano in modo da traslare l’intera distribuzione dei ri-sultati dei test di una misura fissata.

10 In Appendice vengono ripercorsi i passaggi dalla definizione di quantile nelmodello di locazione, e dalla sua rappresentazione come soluzione di un proble-ma di ottimizzazione, a quella analoga nel modello lineare, rappresentata appun-to dall’equazione (18).

stime dei quantili di regressione; quindi, le osservazioni estremeinfluenzano il risultato in quanto si trovino al di sopra o al di sot-to dell’iperpiano stimato, ma quanto al di sopra, o al di sotto, èirrilevante. È utile inoltre osservare come, allo stesso modo dellostimatore OLS, anche lo stimatore dei quantili gode di una seriedi “proprietà di equivarianza”. E in più, a differenza di quello, lostimatore quantile campionario soddisfa la proprietà di invarian-za alle trasformazioni monotone11, la quale permette di superarei problemi di stima dei modelli trasformati, che si presentano nelcontesto della media condizionale12.

Il problema (18) appena specificato può essere riscritto come:

(19)

dove sgn (α) = I (α ≥ 0) – I (α < 0), da cui seguono le condizioni delprimo ordine

(20)

che, se considerate all’interno dello schema del Metodo generaliz-zato dei momenti (GMM), permettono di stabilire le proprietà ingrandi campioni dello stimatore quantile campionario βτ . Se-guendo Buchinsky (1995), si definisce la seguente funzione deimomenti:

(21) ψ (xi, yi, βτ) = (τ – 1/2 + 1/2sgn (yi – x’iβτ)) xi

per la quale, sotto le ipotesi del modello (17), valgono le condi-zioni di ortogonalità:

E [ψ (xi, yi, βτ)] = 0

i

n

i i iy x x=∑ − + − ′ =

1

1 2 1 2 0( / / sgn( ˆ ))τ βτ

min ( / / sgn( ))( )β τ τ

τ ττ β β

∈=∑ − + − ′ − ′

Bi

n

i i i iny x y x

11 2 1 2

1


69

11 Per ogni funzione monotona h (·) vale Qτ (h (Y)|x) = h (Qτ (Y|x)), mentre nor-malmente E (h (Y)|x) ≠ h (E (Y|x)).

12 Per una trattazione dettagliata di tali proprietà v. KOENKER R. - BASSETT G.(1978).

Nonostante tale funzione dei momenti non soddisfi la condi-zione di differenziabilità è possibile ottenere la distribuzione asin-totica (n → ∞) di βτ , riassunta dalla seguente proposizione:

PROPOSIZIONE 1 (Buchinsky, 1995)Se βτ è nell’interno di Bτ, dove Bτ è l’insieme compatto dei pa-

rametri in �k; Fuτ (0|x) = τ con probabilità 1; Fuτ (·|x) è continuacon densità fuτ (0|x) > 0; e n–1 Σn

i=1 xix’i →p

E [xix’i], matrice defini-ta positiva; allora:

(22)

dove:

(23) Λτ = τ (1 – τ) (E [fuτ (0|xi) xix’i])–1 E [xix’i] (E [fuτ (0|xi) xix’i])

–1

Nel contesto dei quantili di regressione si assume talvolta chela distribuzione di uτi = yi – x’iβτ non dipenda da xi (per cui E (uτi|xi)= 0). In tal caso la (23) si semplifica in:

come in Koenker e Bassett (1978).Un possibile metodo per stimare in modo consistente la

matrice di varianza-covarianza Λτ è rappresentato dal bootstrap,utilizzato nella parte empirica. Brevemente, si consideri un cam-pione casuale (yi, xi), con i = 1, ..., n, generato dalla funzione didistribuzione empirica Fn (x, y). Sia βτ la stima bootstrap ottenutada un quantile di regressione di yi su xi. Se la procedura di cam-pionamento e di stima viene ripetuta M volte, ottenendo βτ1, βτB,si ha che:

(24)

costituisce lo stimatore bootstrap della varianza asintotica di βτ .

ˆ ( ˆ ) ˜ ˆ ˜ ˆVnM

M

j

M

j jβ β β β βτ τ τ τ τ= −

−

′

=

∧ ∧

∑1

Λτ

τ

τ τ= − ′ −( )

( )( [ ])

1

021

fE x x

ui i

n Ndˆ ( , )β βτ τ τ−( ) → 0 Λ


70

3.2 Quantili di regressione e abiltà non osservata

Come precedentemente osservato, un importante aspetto diquesta metodologia è rappresentato dall’interpretazione delle sti-me dei diversi quantili come le differenti risposte della variabiledipendente alle variazioni nei regressori in diversi punti della di-stribuzione condizionale della variabile dipendente stessa. In par-ticolare, lo stimatore quantile campionario ha una interpretazio-ne in termini di Quantile Treatment Effect (QTE): esso misura,per ogni quantile τ, il cambiamento nella variabile dipendente ri-chiesto per restare, dopo il trattamento, al τ-esimo quantile delladistribuzione condizionale.

I quantili di regressione rappresentano pertanto un approcciopiù flessibile per caratterizzare l’effetto dell’istruzione su differen-ti percentili della distribuzione condizionale dei redditi, per ana-lizzare la relazione tra abilità ed istruzione e gli effetti sul reddi-to generati dalla loro interazione.

Nel paragrafo 2 si è mostrato come l’abilità non osservata in-duca eterogeneità nella distribuzione condizionale dei redditi, in-fluenzando sia l’intercetta sia il coeciente della earning function(10). Consideriamo dunque, seguendo Arias, Hallock e Sosa-Escu-dero (2001), una specificazione più generica dell’equazione min-ceriana:

(25) ln (Yi) = αXi + β0Si + ϕ (Si, vi) + vi

dove Xi raggruppa alcune variabili di controllo (quali l’età dell’in-dividuo, l’esperienza, etc.), la funzione ϕ esprime l’interazione esi-stente tra l’istruzione e l’abilità degli individui, e vi è un terminedi errore che contiene anche l’abilità non osservata: vi = γAi + εi.Questa specificazione corrisponde alla (10), con ϕ = biSi – 0,5kbS

2i

e γAi = ai.Si consideri ora il caso in cui il termine di interazione sia

semplicemente ϕ = δAiSi, così che il rendimento dell’istruzione siadato da:

(26) ∂ln (Yi)/∂Si � βi = β0 + δAi


71

dove δ cattura l’effetto dell’abilità sul rendimento dell’istruzione.Se δ < 0, il rendimento decresce all’aumentare dell’abilità, e vice-versa. Questo conduce a un modello con coefficienti casuali, taleche lo stimatore OLS applicato alla (25) stima consistentemente:

(27) ∂E (ln (Yi)|Xi, Si)/∂Si = β0 + δA–

ossia il rendimento dell’istruzione per un individuo con abilità me-dia, o average treatment effect. Questo approccio però si basa suuna parametrizzazione restrittiva dell’interazione tra istruzione edabilità non osservata. Infatti, nel modello (26) si presuppone cheβi sia una funzione monotonica dell’abilità.

Invece, con Si esogeno e la restrizione sul termine di erroreQτ (vi|Si) = 0, l’effetto dell’istruzione sul τ-esimo quantile condizio-nale di Yi è dato da:

(28) ∂Qτ (ln (Yi)|Xi, Si)/∂Si = ∂ln (Qτ (Yi)|Xi, Si)/∂Si

(29) = β0 + ∂Qτ (ϕ (Si, vi)|Xi, Si)/∂Si

(30) = β0 + Gv–1 (τ|Xi, Si) � βτ

dove Gv è una qualche trasformazione della distribuzione dell’ abi-lità nella popolazione, e βt può essere considerato una misura delQTE dell’istruzione sui redditi, dato τ ∈ (0, 1)13. I quantili di re-gressione per differenti valori di τ conducono alla stima di unaintera famiglia di rendimenti dell’istruzione che riflettono la di-stribuzione dell’abilità tra gli individui. L’interazione tra istruzio-ne ed abilità può allora essere analizzata confrontando βτ a diffe-renti quantili τk e τs, con k ≠ s.

3.3 Quantili di regressione e distribuzione del reddito nella lettera-tura internazionale

Numerosi studi, oltre a quello di Arias, Hallock e Sosa-Escu-dero (2001), sono stati recentemente condotti utilizzando i quan-


72

13 Nel caso particolare della specificazione (26), l’equazione (30) diventa ∂ln(Qτ (Yi)|Xi, Si)/∂Si � βτ = β0 + δQτ (Ai).

tili di regressione al fine di analizzare la distribuzione condizio-nale dei redditi di differenti paesi: tra questi, ad esempio, Bu-chinsky (1994); Mwabu e Schultz (1996); Martins e Pereira (2004);Fitzenberger e Kurz (2003).

In particolare, Buchinsky (1994), pur non trattando esplicita-mente l’interazione tra educazione ed abilità, analizza i cambia-menti verificatisi negli ultimi decenni nella struttura dei salari de-gli Stati Uniti (da una parte, le cresciute disuguaglianze retribu-tive, anche dopo aver controllato per le caratteristiche individua-li; dall’altra, l’aumento del rendimento di fattori come l’istruzionee l’esperienza), utilizzando i dati del Current Population Survey(CPS). Secondo l’autore risulta essenziale esaminare tali cambia-menti ai diversi punti della distribuzione: infatti, negli anni piùrecenti i redditi sono sì aumentati, in generale, a tutti i quantilidella distribuzione, al crescere degli anni di istruzione, ma le dif-ferenze negli incrementi sono maggiori in corrispondenza di de-terminati quantili (ad esempio, l’aumento del rendimento dell’i-struzione viene registrato come più sensibile ai quantili più altidella distribuzione dei redditi).

Tale configurazione viene riscontrata anche da Martins e Pe-reira (2004), i quali conducono una stima del rendimento dell’i-struzione per 16 paesi europei con l’intento di analizzare le diffe-renze negli incrementi reddituali determinati dall’istruzione lun-go l’intera distribuzione dei salari. In tal modo essi confrontanoil rendimento dell’istruzione per i lavoratori “più abili” e “menoabili”, con l’intento di chiarire l’effetto dell’istruzione sulla disu-guaglianza dei redditi tra gli individui. Il fatto stilizzato emergenteda questo studio è che il rendimento dell’istruzione è maggiore aiquantili più elevati delle distribuzioni condizionali dei redditi (coe-rentemente con quanto trovato da Buchinsky, 1994 per gli US).La Svezia viene citata come caso tipo; la Grecia come eccezione,poiché le stime per questo paese seguono un andamento esatta-mente opposto. Martins e Pereira (2004) hanno stimato il rendi-mento dell’istruzione anche per un campione tratto dalla Bancad’Italia (1995). Le stime ottenute (piuttosto simili alle nostre perquell’anno, data l’identica specificazione e la somiglianza nei cri-teri di costruzione del campione) seguono un andamento legger-


73

mente a U, ma non viene commentato dagli autori (v. tav. 1). Dun-que, dai risultati emerge che i lavoratori più abili (che ricevonosalari orari maggiori, condizionatamente alle loro caratteristiche)sono associati ad un maggiore incremento reddituale legato all’i-struzione. Martins e Pereira (2004) propongono tre possibili spie-gazioni. La prima fa riferimento al fenomeno della “sovra-educa-zione”, cioè alla diffusione di situazioni in cui lavoratori con ele-vata istruzione sono impiegati in occupazioni che richiedono scar-sa abilità o qualificazione, e che dunque sono remunerati con unbasso salario. Così che, più la coda inferiore dei redditi dei lavo-ratori con elevata abilità è popolata da individui “sovra-istruiti”(lavoratori altamente qualificati con lavori non qualificati), piùbasso sarà il rendimento dell’istruzione ai quantili inferiori delladistribuzione dei redditi.

Una seconda spiegazione riguarda l’abilità e la sua interazio-ne con l’istruzione. Il ruolo delle differenze nell’abilità, dato uncerto livello di istruzione, tenderebbe ad amplificarsi in modo cre-scente in termini di salario, via via che si considerano livelli diistruzione più elevati.

Un’ultima spiegazione si basa sulla presenza di differenze nel-la qualità scolastica o nei diversi indirizzi di studio (l’equazionedi Mincer controlla infatti solo per la quantità dell’istruzione). Po-trebbe cioè essere che gli individui che cadono nella coda infe-riore della distribuzione dei redditi siano proprio coloro che han-no ricevuto una istruzione scolastica di modesta qualità o che han-no seguito indirizzi scolastici scarsamente remunerati (ex-post) sulmercato del lavoro. Tali differenze tendono inoltre a prevalere ailivelli di istruzione medio-alti, che presentano una maggior varietànegli indirizzi formativi, ed eventualmente nel grado qualitativo.

Mwabu e Schultz (1996) utilizzano i quantili di regressioneper stimare il rendimento dell’istruzione per etnia in Sud Africae spiegarne le differenze. Considerando i residui dei quantili di re-gressione come espressione dell’abilità non osservata, essi inter-pretano i rendimenti crescenti/decrescenti come indicatori di com-plementarietà/sostituibilità tra questa misura di abilità e l’istru-zione nell’incrementare la produttività dei lavoratori. Mwabu eSchultz (1996) trovano che tra la popolazione bianca più istruita


74

il rendimento dell’istruzione aumenta all’aumentare dei decili delreddito e interpretano tale evidenza in termini di complementa-rietà tra abilità ed istruzione, mentre il rendimento derivante dal-l’aver frequentato la scuola secondaria presenta una correlazionenegativa (istruzione e abilità sostituti, almeno tra i meno abili). Ilrendimento per la popolazione nera che possiede un basso livel-lo di istruzione (scuola primaria) diminuisce all’aumentare del de-cile dei redditi indicando sostituibilità; mentre segue un anda-mento non lineare (convesso) per quanto riguarda l’istruzione se-condaria; e un andamento piuttosto irregolare per l’istruzione piùelevata.

4. - Evidenza empirica dai quantili di regressione per l’Italia

4.1 I dati

I dati utilizzati per costruire i campioni sono tratti da Bancad’Italia (1993), (1995), (1998) e (2000).

Le tavole 2, 3, 4 e 5 mostrano le statistiche descrittive delleprincipali variabili utilizzate nelle stime e delle altre variabili diinteresse. Questo per ognuno degli anni considerati, e tenendo di-stinti donne e uomini.

Nei campioni sono compresi individui tra i 14 ed i 60 anni,esclusivamente lavoratori dipendenti, non appartenenti al settoreagricolo. Inoltre, tra gli individui di sesso maschile sono stati con-siderati solamente i lavoratori a tempo pieno, mentre sono inclu-se sia le lavoratrici a tempo parziale sia quelle a tempo pieno.

Qualche precisazione preliminare sulle variabili utilizzate:1) Gli anni di istruzione degli individui sono ricostruiti a par-

tire dal dato sul titolo di studio più elevato conseguito. (Agli in-dividui che non hanno raggiunto alcun titolo di studio è stato as-segnato 0). A partire dal 1995 la classificazione relativa ai titoli distudio è stata particolareggiata, prevedendo le voci: diploma pro-fessionale (3 anni) e diploma universitario o laurea breve (3 an-ni). Dal medesimo anno l’indagine chiede all’intervistato anche iltipo di diploma conseguito e il tipo di laurea. Attraverso que-


75


76

TA

V.

2

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

FE

MM

INIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

min

imo

med

iam

assi

mo

età

1515

1616

36,9

637

,16

38,3

638

,74

6060

6060

(10,

06)

(10,

13)

(10,

07)

(10,

07)

ann

i is

tru

zion

e0

00

011

,22

11,2

811

,94

11,8

320

2121

21(3

,83)

(3,6

6)(3

,53)

(3,5

3)

med

ie i

nf.

––

––

0,28

0,26

0,22

0,23

––

––

(0,4

5)(0

,44)

(0,4

2)(0

,42)

med

ie s

up

.–

––

–0,

450,

480,

520,

52–

––

(0,4

9)(0

,50)

(0,5

0)(0

,50)

un

iver

sità

––

––

0,14

0,14

0,18

0,18

––

––

(0,3

5)(0

,35)

(0,3

9)(0

,38)

esp

erie

nza

pot

.0

00

019

,74

19,8

820

,42

20,9

154

5053

53(1

1,08

)(1

1,06

)(1

0,91

)(1

0,94

)

oper

aio

––

––

0,33

0,37

0,32

0,33

––

––

(0,4

7)(0

,48)

(0,4

7)(0

,47)

par

t-ti

me

––

––

0,11

0,13

0,15

0,16

––

––

(0,3

1)(0

,34)

(0,3

5)(0

,37)

ore

sett

iman

ali

41

55

34,3

834

,23

34,0

634

,82

7070

6510

0la

vora

te(9

,06)

(9,4

8)(9

,11)

(9,4

3)

redd

ito

400

600

500

500

18.6

77,3

219

.034

,68

21.4

82,5

222

.787

,49

64.0

0063

.900

180.

000

150.

000

annu

o ne

tto

(7.8

49,3

4)(8

.247

,59)

(9.3

84,2

4)(1

0.10

0,93

)

sala

rio

0,80

11,

201,

7412

,98

13.3

915

,13

15,4

410

2,08

150

264,

2975

0or

ario

net

to(7

,33)

(7.9

3)(1

1,41

)(1

8,06

)

istr

uz.

padr

e0

00

06,

276.

416,

987,

0917

1717

20(4

,17)

(4,1

0)(4

,07)

(4,4

3)

istr

uz.

mad

re0

00

05,

395.

606,

096,

3217

1717

20(3

,64)

(3,5

0)(3

,59)

(4,1

4)

padr

e op

erai

o–

––

–0,

370.

420,

410,

40–

––

–(0

,48)

(0,4

9)(0

,49)

(0,4

9)

mad

re n

on l

av.

––

––

0,64

0.58

0,58

0,55

––

––

(0,4

8)(0

,49)

(0,4

9)(0

,50)

padr

e au

tono

mo

––

––

0,24

0.27

0,21

0,22

––

––

(0,4

3)(0

,45)

(0,4

1)(0

,41)

n.di

osse

rvaz

ioni

2.21

22.

355

2.12

82.

299

*D

evia

zion

i st

anda

rdin

par

ente

si.

Red

dit

i in

mig

liai

a d

i li

re.

TA

V.

2 se

gue

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

FE

MM

INIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

min

imo

med

iam

assi

mo


77


78

TA

V.

3

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

FE

MM

INIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

I qu

arti

lem

edia

na

III

quar

tile

età

2929

3031

3737

3839

4545

4647

ann

i is

tru

zion

e8

88

813

1313

1313

1313

13m

edie

in

f.–

––

––

––

––

––

–m

edie

su

p.

––

––

––

––

––

––

un

iver

sità

––

––

––

––

––

––

esp

erie

nza

pot

.11

1112

1218

1920

2128

2828

29op

erai

o–

––

––

––

––

––

–pa

rt-t

ime

––

––

––

––

––

––

ore

sett

iman

ali

3028

3030

3636

3636

4040

4040

lavo

rate

red

dit

o an

nu

o n

etto

14.0

0014

.000

16.0

0017

.000

19.0

0019

.500

22.0

0023

.000

24.0

0024

.000

26.0

0028

.000

sala

rio

orar

io n

etto

8,68

9,25

10,4

210

,42

11,2

811

,57

13,0

213

,20

15,0

515

,62

16,6

717

,36

istr

uz.

pad

re5

55

55

55

58

88

8is

tru

z. m

adre

55

55

55

55

88

88

pad

re o

per

aio

––

––

––

––

––

––

mad

re n

on l

av.

––

––

––

––

––

––

pad

re a

uto

nom

o–

––

––

––

––

––

–

*D

evia

zion

i st

anda

rdin

par

ente

si.

Red

dit

i in

mig

liai

a d

i li

re.


79

TA

V.

4

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

MA

SC

HIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

min

imo

med

iam

assi

mo

età

1414

1515

39,2

938

,90

39,7

939

,73

6060

6060

(10,

79)

(10,

83)

(10,

42)

(10,

47)

ann

i is

tru

zion

e0

00

09,

8810

.31

10.7

410

.73

2021

2121

(3,7

9)(3

,78)

(3,6

2)(3

,65)

med

ie i

nf.

––

––

0,41

0,36

0,35

0,36

––

––

(0,4

9)(0

,48)

(0,4

7)(0

,48)

med

ie s

up

.–

––

–0,

330,

390,

440,

43–

––

–(0

,47)

(0,4

8)(0

,50)

(0,4

9)

un

iver

sità

––

––

0,09

0,10

0,11

0,12

––

––

(0,2

8)(0

,30)

(0,3

1)(0

,32)

esp

erie

nza

pot

.0

00

023

,41

22,5

923

,05

22,9

954

5454

54(1

1,71

)(1

1,65

)(1

1,13

)(1

1,16

)

oper

aio

––

––

0,50

0,52

0,49

0,50

––

––

(0,5

0)(0

,50)

(0,5

0)(0

,50)

ore

sett

iman

ali

55

55

40,2

240

,56

40,5

540

,95

7098

150

100

lavo

rate

(6,8

6)(7

,56)

(7,4

0)(7

,67)


80

red

dit

o80

070

01.

000

800

24.3

00,0

625

.109

,26

28.4

65,2

829

.687

,22

110.

000

150.

000

180.

000

350.

000

ann

uo

net

to(1

1.62

1,83

)(1

2.55

7,43

)(1

3.20

1,74

)(1

5.05

3,04

)

sala

rio

0,56

1,67

0,65

0,69

13,4

213

,90

15,5

115

,74

166,

6793

,75

156,

2519

1,89

orar

io n

etto

(7,2

0)(7

)(8

,35)

(8,0

8)

istr

u.

pad

re0

00

05,

275,

506,

016,

4117

1717

20(3

,90)

(3,9

2)(4

,02)

(4,4

5)

istr

u.

mad

re0

00

04,

584,

815,

415,

5317

1717

20(3

,43)

(3,5

5)(3

,62)

(3,9

7)

pad

re o

per

aio

––

––

0,43

0,50

0,46

0,44

––

––

(0,5

0)(0

,50)

(0,5

0)(0

,50)

mad

re n

on l

av.

––

––

0,71

0,66

0,63

0,60

––

––

(0,4

6)(0

,47)

(0,4

8)(0

,49)

pad

re a

uto

nom

o–

––

–0,

240,

240,

210,

19–

––

–(0

,43)

(0,4

3)(0

,41)

(0,3

9)

n.d

ioss

erva

zion

i3.

618

3.56

82.

996

3.26

5

*D

evia

zion

i st

anda

rdin

par

ente

si.

Red

dit

i in

mig

liai

a d

i li

re.

segu

eT

AV.

4

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

MA

SC

HIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

min

imo

med

iam

assi

mo


81

TA

V.

5

STA

TIS

TIC

HE

DE

SC

RIT

TIV

E P

ER

I C

AM

PIO

NI

FE

MM

INIL

I*

1993

1995

1998

2000

1993

1995

1998

2000

1993

1995

1998

2000

I qu

arti

lem

edia

na

III

quar

tile

età

3130

3131

4039

4040

4848

4849

ann

i is

tru

zion

e8

88

88

811

1113

1313

13

med

ie i

nf.

––

––

––

––

––

––

med

ie s

up

.–

––

––

––

––

––

–

un

iver

sità

––

––

––

––

––

––

esp

erie

nza

pot

.14

1314

1423

2223

2332

.75

3232

32

oper

aio

––

––

––

––

––

––

ore

sett

iman

ali

3838

3838

4040

4040

4040

4242

lavo

rate

red

dit

o an

nu

o n

etto

18.0

0018

.200

21.0

0022

.000

22.5

0023

.800

26.0

0027

.000

28.0

0030

.000

32.0

0033

.000

sala

rio

orar

io n

etto

9,40

9,90

10,9

411

,51

11,9

812

,50

13,8

914

,17

15,3

616

,03

17,3

618

,06

istr

u.

pad

re5

55

55

55

58

88

8

istr

u.

mad

re0

55

55

55

55

58

8

pad

re o

per

aio

––

––

––

––

––

––

mad

re n

on l

av.

––

––

––

––

––

––

pad

re a

uto

nom

o–

––

––

––

––

––

–

*D

evia

zion

i st

anda

rdin

par

ente

si.

Red

dit

i in

mig

liai

a d

i li

re.

st’ultima informazione è stato possibile diversificare il numero dianni di istruzione assegnati ai laureati delle diverse facoltà, te-nendo conto della differente durata dei vari corsi di laurea; 2) levariabili relative ai titoli di studio (medie inferiori, medie supe-riori, studi universitari), allo status di operaio dell’individuo e delpadre di questi, al tempo parziale, allo status di lavoratore auto-nomo del padre e alla condizione non lavorativa della madre so-no variabili dicotomiche. Per gli anni 1995, 1998 e 2000 nella va-riabile medie superiori sono compresi anche coloro che hannoconseguito un diploma professionale, e nella variabile relativa aglistudi universitari sono uniti tutti i soggetti che hanno conseguitoun diploma universitario o laurea breve, una laurea regolare edanche una specializzazione post-laurea; 3) l’esperienza potenzialeè così calcolata: età meno anni di istruzione meno 6 (considera-to l’inizio dell’obbligo di frequenza previsto dal sistema scolasticoitaliano); 4) le ore lavorate in media a settimana sono compren-sive dello straordinario; 5) il reddito annuo da lavoro dipendenteè al netto delle imposte e dei contributi; 6) il salario orario nettoè definito come: (reddito netto annuo)/(mesi lavorati * ore setti-manali lavorate * 4).

Dalle tavole 2, 3, 4 e 5 emerge che per le donne l’età mediaè tra i 37 e i 39 anni, e vicina ai 40 per gli uomini; più bassaquindi per le prime, ma con una tendenza all’aumento nel corsodegli anni. Gli anni di istruzione sono più elevati in media per ledonne (11-12 anni) che per gli uomini (10-11 anni), ed aumenta-no nel tempo per entrambi. Il comportamento delle variabili re-lative al titolo di studio conseguito rispecchia naturalmente quel-lo della variabile anni di istruzione. In particolare, negli anni ten-dono ad aumentare le percentuali di individui (donne e uomini)che raggiungono un diploma di scuola superiore o una laurea, ascapito di coloro che raggiungono solamente la licenza media.

Per quanto concerne le caratteristiche lavorative, si può no-tare come il lavoro a tempo parziale costituisca ancora un feno-meno piuttosto marginale, ma in crescita (dall’11% del 1993 al16% del 2000). Gli uomini tendono a lavorare (in media) un mag-gior numero di ore delle donne, pur escludendo le lavoratrici atempo parziale. Gli uomini hanno redditi annui medi significati-


82

vamente maggiori rispetto alle donne, ma il divario viene note-volmente a ridursi quando si considerino i salari orari; tale diffe-renza tende inoltre a diminuire leggermente negli anni.

Le informazioni sul substrato familiare sono disponibili a par-tire dall’indagine del 1993. Guardando ai valori medi, si nota lapresenza di una persistenza generazionale sia per il livello di istru-zione sia per le scelte occupazionali, soprattutto per le donne: que-ste infatti, condizionatamente al fatto di essere mediamente piùistruite degli uomini nei campioni, tendono ad avere genitori piùistruiti, mentre gli uomini hanno in maggior percentuale padri di-pendenti come operai e madri non occupate.

4.2 Stime OLS del rendimento dell’istruzione (in anni)

La prima stima effettuata sui campioni descritti è una stimaOLS della seguente equazione minceriana (Mincer, 1974):

(31) ln (wi) = α + βSi + γ1Xi + γ2X2i + εi

dove ln (w) è logaritmo del salario orario netto, S sono gli annidi istruzione, X è l’esperienza potenziale e ε è il termine di erro-re.

Le stime OLS del coefficiente degli anni di istruzione per tut-ti gli anni considerati (1993, 1995, 1998 e 2000) sono presentatenell’ultima colonna della tavola 6, tenendo distinti donne e uomi-ni. La regressione per i campioni femminili include anche la va-riabile dummy partime, che assume il valore 1 se la lavoratrice èoccupata a tempo parziale e 0 altrimenti. Nella tavola 6, in pa-rentesi sotto le stime, sono riportati gli standard error, robusti al-la presenza di eteroschedasticità (HCSE) (a fronte dei risultati ot-tenuti effettuando il test di Breusch-Pagan, che portano a rifiuta-re l’ipotesi nulla di omoschedasticità; v. in proposito la tavola 7).

Le stime mostrano i seguenti valori del rendimento dell’i-struzione: 8,7% (1993), 7,5% (1995), 6,2% (1998) e 6,1% (2000)per quanto riguarda i campioni femminili; mentre per gli uominisi ha: 6,7% (1993), 6,6% (1995), e circa 6% (1998 e 2000). Si può


83


84

TA

V.

6

ST

IME

DE

L R

EN

DIM

EN

TO

DE

LL’

IST

RU

ZIO

NE

(an

ni)

*

quan

tile

0,05

0,10

0,25

0,50

0,75

0,90

0,95

OL

S

don

ne

1993

0,09

190,

0829

0,07

840,

0826

0,08

930,

0955

0,09

730,

0867

(0,0

072)

(0,0

053)

(0,0

030)

(0,0

030)

(0,0

025)

(0,0

032)

(0,0

041)

(0,0

024)

1995

0,07

920,

0698

0,06

920,

0735

0,08

280,

0879

0,08

760,

0749

(0,0

057)

(0,0

043)

(0,0

031)

(0,0

025)

(0,0

031)

(0,0

040)

(0,0

046)

(0,0

026)

1998

0,06

150,

0527

0,05

260,

0571

0,07

290,

0751

0,07

410,

0622

(0,0

053)

(0,0

040)

(0,0

030)

(0,0

027)

(0,0

032)

(0,0

037)

(0,0

046)

(0,0

028)

2000

0,05

490,

0575

0,05

390,

0596

0,06

850,

0778

0,07

660,

0612

(0,0

072)

(0,0

062)

(0,0

025)

(0,0

030)

(0,0

028)

(0,0

033)

(0,0

052)

(0,0

028)

uom

ini

1993

0,06

120,

0567

0,05

390,

0629

0,07

150,

0790

0,08

290,

0676

(0,0

052)

(0,0

027)

(0,0

017)

(0,0

018)

(0,0

024)

(0,0

023)

(0,0

040)

(0,0

0177

)19

950,

0647

0,06

510,

0609

0,05

980,

0671

0,07

320,

0769

0,06

60(0

,003

9)(0

,002

4)(0

,002

2)(0

,001

6)(0

,001

8)(0

,002

8)(0

,003

9)(0

,001

74)

1998

0,05

230,

0522

0,05

140,

0534

0,06

240,

0741

0,08

300,

0599

(0,0

060)

(0,0

045)

(0,0

021)

(0,0

019)

(0,0

026)

(0,0

030)

(0,0

038)

(0,0

0215

)20

000,

0640

0,05

620,

0491

0,05

320,

0632

0,07

210,

0719

0,06

03(0

,004

2)(0

,003

7)(0

,002

5)(0

,001

6)(0

,002

2)(0

,002

7)(0

,004

2)(0

,001

94)

*In

par

ente

si g

li s

tan

dard

err

or(b

oots

trap

). S

tim

e ef

fett

uat

e co

n R

.


85

TA

V.

7

TE

ST

DIA

GN

OS

TIC

I

ann

id

onn

eu

omin

id

onn

eu

omin

id

onn

eu

omin

id

onn

eu

omin

i

1993

1995

1998

2000

R2

(OL

S)

0,44

695

0,42

595

0,35

140

0,43

385

0,26

911

0,35

439

0,27

804

0,36

538

test

di

B-P

*0,

0003

0,00

021

0,00

000,

0025

70,

0000

00,

0000

40,

0000

20,

0705

0(p

-val

ue)

eter

osch

.**11

9.31

516

3.04

120

0.30

071

.160

185.

342

108.

299

295.

589

121.

678

p-va

lue

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

sim

met

ria**

1.78

9.72

33.

828.

609

1.98

1.36

05.

021.

722

1.73

9.93

93.

404.

891

1.68

9.24

44.

510.

693

p-va

lue

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

R2

(OL

S)

0,45

033

0,43

232

0,35

056

0,43

183

0,27

216

0,34

902

0,27

619

0,37

004

test

di

B-P

*0,

0022

70,

0000

10,

0000

00,

0026

10,

0000

00,

0001

70,

0000

40,

0682

3(p

-val

ue)

eter

osch

.**16

0.97

217

6.29

721

2.28

388

.517

210.

779

157.

659

338.

073

195.

671

p-va

lue

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

sim

met

ria**

1.69

1.70

03.

933.

010

2.06

1.01

64.

608.

752

1.24

1.25

83.

462.

240

1.42

5.51

34.

136.

447

p-va

lue

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

0,00

000

n.d

ios

serv

.2.

212

3.61

82.

365

3.56

82.

128

2.99

62.

299

3.26

5

*Te

std

i B

reu

sch

-Pag

an.

**B

UC

HIN

SK

YM

.(1

995)

.

notare dunque come le stime del rendimento dell’istruzione sianomaggiori per le femmine che per i maschi (medesimo risultato èstato ottenuto da Brunello, Comi e Lucifora (2001) su un cam-pione simile di individui). In realtà le intercette, che rappresenta-no il logaritmo del reddito di un lavoratore a tempo pieno senzaistruzione e con esperienza potenziale pari a 0, sono maggiori pergli uomini; inoltre il gap tra lavoratrici e lavoratori si riduce viavia negli anni considerati. Flabbi (1997), (1999) affrontando in mo-do specifico (e più esaustivo di quanto non ci si proponga qui)l’aspetto delle differenze di rendimento in base al genere, propo-ne alcune interpretazioni dell’evidenza empirica ottenuta, e notacome i risultati siano legati alle tecniche di stima utilizzate (OLS,OLS con correzione à la Heckman, IV). Una interpretazione deimaggiori rendimenti dell’istruzione delle lavoratrici rispetto ailavoratori potrebbe derivare comunque, alla luce del modello diCard, dalla presenza di una maggior “distorsione da abilità” del-lo stimatore OLS per i campioni femminili. Ipotizzando che l’in-cidenza della distorsione derivante da errori nell’osservazione del-la variabile esplicativa “anni di istruzione” non sia diversa per ledonne e per gli uomini, e che b

–e r– non differiscano per femmi-

ne e maschi, si tratta di capire se è possibile che per le donne esi-sta una maggiore correlazione negativa tra le forme di abilità (ai

e bi) e i vincoli di liquidità, oltre ad una maggiore correlazionepositiva tra ai e bi stesse. La correlazione negativa tra abilità evincoli di liquidità può essere facilmente giustificata ammettendol’esistenza di una anche solo parziale persistenza intergenerazio-nale dell’abilità. In questa situazione i genitori più abili scelgonolivelli di istruzione più elevati, hanno redditi maggiori e figli inmedia più abili. Nella generazione dei figli, quindi, i più abili ten-dono ad avere genitori con redditi più alti. Nella misura in cui imaggiori redditi dei genitori riducono i vincoli di liquidità dei fi-gli, nella generazione di questi ultimi, gli individui più abili han-no costi marginali dell’istruzione inferiori. Da quanto ottenuto nel-le statistiche descrittive relative ai campioni qui utilizzati sembraplausibile ritenere che per le femmine esista una maggior persi-stenza generazionale, o comunque un maggior legame con il pro-prio ambiente familiare; le donne hanno in media una maggiore


86

istruzione, oltre che genitori anch’essi in media più istruiti. Inol-tre minore, rispetto a quella degli uomini, è la percentuale di don-ne nei campioni che hanno un padre occupato come operaio euna madre non lavoratrice.

5. - Stime del rendimento dell’istruzione (in anni) attraversoi quantili di regressione

Sempre nella tavola 6 sono presentate le stime dei quantili diregressione secondo la medesima specificazione utilizzata per lestime OLS, e sulla base degli stessi campioni. In particolare, latavola 6 contiene per ogni anno (1993, 1995, 1998 e 2000), e di-stinguendo tra donne e uomini, le stime del coefficiente degli an-ni di istruzione per diversi quantili di regressione, τ = {0,05, 0,10,0,25, 0,50, 0,75, 0,90, 0,95}. Sono riportati anche i valori deglistandard error, calcolati attraverso il metodo Bootstrap non para-metrico. I tratti del grafico 2 raffigurano, per il coefficiente del-l’istruzione, le stime ai vari quantili, attraverso una linea conti-nua, mentre le linee tratteggiate rappresentano l’intervallo di con-fidenza al 90%. È poi sovrapposta una linea punteggiata che rap-presenta la stima OLS per quel coefficiente, anch’essa con unabanda di confidenza al 90%. Nella tavola 7 sono riportati i risul-tati dei test di eteroschedasticità e di simmetria effettuati per lestime dei quantili di regressione (costruiti seguendo Buchinsky,1995; 1998). I campioni sono i medesimi utilizzati per le stimeOLS. I p-value ottenuti portano a rifiutare le ipotesi nulle di omo-schedasticità e di simmetria per tutti i campioni.

Le stime dei quantili, inizialmente elevate (per τ = 0,05), ten-dono a calare per gli individui che si collocano al di sotto del pri-mo quartile della distribuzione dei redditi (τ = 0,25), poi invececominciano a crescere, tendendo più o meno a stabilizzarsi aiquantili più elevati del reddito (τ = 0,90; τ = 0,95). Inoltre, il valo-re della stima OLS, che rappresenta l’effetto medio, tende ad ugua-gliare la stima corrispondente a 0,50 < τ < 0,75, cioè il valore me-dio del rendimento marginale dell’istruzione è generalmente mag-giore del rendimento di coloro che si trovano al quantile media-


87

no della distribuzione dei redditi. È confermato un rendimentodell’istruzione maggiore per i campioni femminili che per quellimaschili. Inoltre si può notare una differenza tra i campioni fem-minili e quelli maschili nel comportamento delle stime ai variquantili. Le stime relative agli uomini appartenenti alla coda in-feriore della distribuzione dei redditi si trovano infatti al di sottodella stima OLS, e fuori dalla sua banda di confidenza, in modopiù marcato rispetto a quanto avvenga per le corrispondenti sti-me effettuate sui campioni femminili; d’altro canto per i primi lestime tendono poi a crescere maggiormente, soprattutto ai quan-tili più elevati, di quanto facciano le seconde. Per comprenderetali risultati, occorre ricordare che il coefficiente degli anni diistruzione nella regressione di un dato quantile viene interpreta-to come la variazione (del logaritmo) del reddito dell’individuo ne-cessaria affinché tale individuo rimanga al medesimo quantile del-la distribuzione dei redditi, dopo aver studiato un anno in più(avendo cioè ricevuto il trattamento). Ad esempio, se si conside-ra il campione delle donne per il 1995, nella seconda riga dellatavola 6 leggiamo che il logaritmo del reddito di una lavoratriceche si trova al quantile mediano della distribuzione dei redditi (τ= 0,50) dovrebbe aumentare del 7,35% perché essa si possa collo-care nuovamente al quantile mediano della distribuzione dei red-diti delle lavoratrici con un anno di istruzione in più. Dalle stimeottenute, si evince dunque che maggiore deve essere l’incrementodei redditi degli individui che si trovano ai quantili bassi e a quel-li alti della distribuzione dei redditi, perché essi, con un anno ag-giuntivo di istruzione, mantengano il medesimo quantile. Questosignifica che la forma delle distribuzioni condizionali cambia; nonsi ha cioè in questo caso una semplice traslazione della posizio-ne della distribuzione della variabile dipendente, ma anche la suascala e la sua forma risultano modificate.

È inoltre possibile interpretare i risultati ottenuti in terminidi sostituibilità/complementarietà tra i “fattori” istruzione ed abi-lità. Dal grafico 2, i rendimenti decrescenti per i primi quantili(cioè per gli individui meno abili) testimoniano a favore della pre-senza di un certo grado di sostituibilità tra istruzione ed abilità.Il rapporto tra i due fattori tende a diventare però di comple-


88


89

GRAF. 2STIME DEL RENDIMENTO DELL’ISTRUZIONE PER DIVERSI QUANTILI

DELLA DISTRIBUZIONE CONDIZIONALE DEI REDDITI(anni di istruzione)

donne 1993

istr

uzi

one

istr

uzi

one

0.07

0.

08

0.09

0.

10

0.11

0,2 0,4 0,6 0,8tau

uomini 1993

0.05

0.

06

0.07

0.

08

0.09

0,2 0,4 0,6 0,8

tau

uomini 1995

0,05

0,

06

0,07

0,

08

0,09

0,2 0,4 0,6 0,8

tau

uomini 1998

0,04

0,0

5 0,

06 0

,07

0,08

0,0

9

0,2 0,4 0,6 0,8tau

uomini 2000

0,04

0,

05

0,06

0,

07

0,08

0,2 0,4 0,6 0,8

tau

donne 1995

istr

uzi

one

istr

uzi

one

0,06

0 0,

070

0,08

0

0,09

0

0,2 0,4 0,6 0,8

tau

donne 1998

istr

uzi

one

istr

uzi

one

0,04

0,0

5 0,

06 0

,07

0,08

0,0

9

0,2 0,4 0,6 0,8tau

donne 2000

istr

uzi

one

istr

uzi

one

0,04

0,0

5 0,

06 0

,07

0,08

0,0

9

0,2 0,4 0,6 0,8

tau

mentarietà per i quantili medio-alti di reddito (cioè per gli indi-vidui con maggiore abilità), infatti le stime crescono all’aumenta-re del quantile a partire dai quantili intermedi di reddito.

5.1 Stime OLS del rendimento dell’istruzione per titolo di studio

Analizziamo ora delle regressioni standard e quantili che con-tengono come variabili esplicative, in luogo degli anni di istru-zione, delle variabili dicotomiche relative al titolo di studio rag-giunto dall’individuo. La motivazione che spinge a stimare questomodello si basa sull’osservazione che in alcuni sistemi scolastici— incluso quello italiano — un maggior investimento in istruzio-ne che non conduca all’ottenimento di un titolo di studio potreb-be non garantire rendimenti maggiori sul mercato del lavoro. Pertrattare tale aspetto, stimiamo dunque per ogni anno consideratola regressione del logaritmo del salario orario netto sulle varia-bili dicotomiche “medie inferiori”, “medie superiori”, “università”,controllando per l’esperienza potenziale e il suo quadrato, e man-tenendo la variabile partime per i campioni femminili. I risultatidelle stime OLS sono presentati nell’ultima colonna della tavola8. Le stime dei coefficienti delle variabili binarie sui titoli di stu-dio vanno interpretate come differenziali rispetto al rendimentobase, ottenuto dagli individui senza alcun titolo di studio o chehanno raggiunto solamente la licenza elementare. Ad esempio, peril campione del 1995, un lavoratore maschio in possesso di un di-ploma di scuola superiore percepisce, in media, il 48% in più direddito orario di un lavoratore con la medesima esperienza po-tenziale, ma in possesso della licenza elementare. La configura-zione delle stime ottenute utilizzando i livelli di istruzione, inve-ce che gli anni, conferma la presenza di una relazione positivamonotonica tra il rendimento dell’istruzione e il maggior titolo distudio acquisito.

Inoltre, si trova che per il 1993 il rendimento dell’istruzionedelle lavoratrici è maggiore di quello dei lavoratori, ma nel 1995la differenza tende a ridursi, e negli anni successivi le stime deirendimenti per gli uomini sono superiori rispetto a quelle otte-


90


91

TA

V.

8

ST

IME

DE

L R

EN

DIM

EN

TO

DE

LL’

IST

RU

ZIO

NE

(tit

oli

di

stu

dio

)*

quan

tile

0,05

0,10

0,25

0,50

0,75

0,90

0,95

OL

S

don

ne

med

ie i

nf.

1993

0,29

470,

3075

0,19

970,

1865

60,

2236

0,23

470,

2595

0,23

52(0

,090

9)(0

,069

1)(0

,044

6)(0

,032

4)(0

,028

6)(0

,032

0)(0

,042

2)(0

,030

2)19

950,

3034

0,18

210,

1692

0,14

204

0,19

820,

1818

0,19

930,

1802

(0,1

212)

(0,1

004)

(0,0

437)

(0,0

345)

(0,0

318)

(0,0

659)

(0,0

736)

(0,0

361)

1998

0,10

740,

1302

0,10

530,

1620

70,

1493

0,20

390,

2138

0,11

40(0

,092

8)(0

,076

4)(0

,039

0)(0

,045

3)(0

,036

9)(0

,082

3)(0

,194

8)(0

,044

4)20

000,

3883

0,32

620,

1311

0,10

079

0,07

370,

0117

0,04

800,

1198

(0,1

046)

(0,0

865)

(0,0

583)

(0,0

409)

(0,0

456)

(0,0

684)

(0,1

111)

(0,0

455)

med

ie s

up.

1993

0,75

350,

6807

0,55

770,

5352

0,62

290,

6987

0,77

300,

6265

(0,0

749)

(0,0

734)

(0,0

495)

(0,0

328)

(0,0

329)

(0,0

349)

(0,0

518)

(0,0

316)

1995

0,73

190,

5414

0,48

550,

4669

0,55

870,

5905

0,63

160,

5193

(0,1

238)

(0,0

971)

(0,0

422)

(0,0

358)

(0,0

301)

(0,0

602)

(0,0

734)

(0,0

367)

1998

0,43

730,

3930

0,36

210,

3861

0,42

840,

5072

0,55

020,

3799

(0,0

785)

(0,0

755)

(0,0

393)

(0,0

474)

(0,0

400)

(0,0

812)

(0,1

950)

(0,0

439)

2000

0,69

270,

5866

0,36

630,

3377

0,36

740,

3721

0,42

730,

3919

(0,0

995)

(0,0

892)

(0,0

623)

(0,0

452)

(0,0

475)

(0,0

683)

(0,1

078)

(0,0

456)

un

iver

sità

1993

1,15

651,

0444

0,97

461,

0035

41,

1148

1,16

931,

1827

1,08

16(0

,082

5)(0

,083

3)(0

,060

1)(0

,039

2)(0

,036

6)(0

,040

4)(0

,050

8)(0

,036

2)19

951,

0370

0,81

130,

8055

0,87

338

1,02

941,

0499

1,08

660,

9032

(0,1

272)

(0,1

041)

(0,0

533)

(0,0

488)

(0,0

367)

(0,0

662)

(0,0

776)

(0,0

422)

1998

0,58

800,

5965

0,62

600,

7064

00,

8786

0,92

390,

9422

0,71

59(0

,084

6)(0

,079

2)(0

,044

5)(0

,053

6)(0

,041

8)(0

,083

1)(0

,209

8)(0

,050

3)20

000,

8360

0,83

310,

6146

0,66

452

0,76

390,

7783

0,81

930,

7028

(0,1

172)

(0,0

997)

(0,0

622)

(0,0

487)

(0,0

520)

(0,0

699)

(0,1

244)

(0,0

504)

*In

par

ente

si g

li s

tan

dard

err

orbo

otst

rap.

Sti

me

con

dot

te c

on R

.


92

segu

eT

AV.

8

ST

IME

DE

L R

EN

DIM

EN

TO

DE

LL’

IST

RU

ZIO

NE

(tit

oli

di

stu

dio

)*

quan

tile

0,05

0,10

0,25

0,50

0,75

0,90

0,95

OL

S

uom

ini

med

ie i

nf.

1993

0,23

440,

1923

0,14

240,

1782

0,17

620,

2321

0,24

230,

1825

(0,0

622)

(0,0

271)

(0,0

171)

(0,0

157)

(0,0

233)

(0,0

255)

(0,0

282)

(0,0

162)

1995

0,17

540,

2040

0,20

060,

2054

0,20

590,

2258

0,20

750,

2096

(0,0

608)

(0,0

354)

(0,0

246)

(0,0

197)

(0,0

251)

(0,0

273)

(0,0

507)

(0,0

189)

1998

0,10

470,

1421

0,16

890,

1513

0,19

760,

1702

0,19

730,

1649

(0,0

587)

(0,0

418)

(0,0

256)

(0,0

187)

(0,0

187)

(0,0

274)

(0,0

492)

(0,0

244)

2000

0,34

850,

3047

0,18

030,

1417

0,14

610,

1409

0,14

240,

1720

(0,0

939)

(0,0

546)

(0,0

355)

(0,0

236)

(0,0

242)

(0,0

661)

(0,0

492)

(0,0

267)

med

ie s

up.

1993

0,51

880,

4658

0,40

250,

4562

0,50

830,

5801

0,60

650,

4950

(0,0

573)

(0,0

291)

(0,0

174)

(0,0

174)

(0,0

274)

(0,0

295)

(0,0

340)

(0,0

179)

1995

0,50

870,

4947

0,45

500,

4346

0,46

990,

5227

0,57

560,

4810

(0,0

589)

(0,0

351)

(0,0

246)

(0,0

197)

(0,0

274)

(0,0

287)

(0,0

612)

(0,0

201)

1998

0,36

700,

3496

0,34

980,

3472

0,42

030,

5164

0,60

550,

4023

(0,0

578)

(0,0

444)

(0,0

276)

(0,0

225)

(0,0

225)

(0,0

367)

(0,0

512)

(0,0

259)

2000

0,61

780,

4922

0,34

730,

3379

0,41

230,

4812

0,48

590,

4106

(0,0

870)

(0,0

561)

(0,0

376)

(0,0

256)

(0,0

285)

(0,0

678)

(0,0

514)

(0,0

278)

un

iver

sità

1993

0,81

360,

7654

0,74

600,

8541

0,93

091,

0440

1,11

730,

8845

(0,0

757)

(0,0

470)

(0,0

362)

(0,0

299)

(0,0

324)

(0,0

501)

(0,0

518)

(0,0

267)

1995

0,80

160,

8187

0,81

250,

8325

0,92

420,

9902

1,02

010,

8784

(0,0

720)

(0,0

538)

(0,0

369)

(0,0

330)

(0,0

347)

(0,0

396)

(0,0

682)

(0,0

264)

1998

0,62

930,

6718

0,68

980,

7207

0,86

860,

9218

1,04

470,

7763

(0,0

825)

(0,0

570)

(0,0

389)

(0,0

296)

(0,0

296)

(0,0

534)

(0,1

164)

(0,0

357)

2000

0,86

860,

8082

0,66

560,

6980

0,82

960,

8940

0,92

920,

7774

(0,1

028)

(0,0

715)

(0,0

424)

(0,0

320)

(0,0

372)

(0,0

732)

(0,0

673)

(0,0

334)

*In

par

ente

si g

li s

tan

dard

err

orbo

otst

rap.

Sti

me

con

dot

te c

on R

.

nute per i campioni femminili. Si nota anche che le stime relati-ve alle lavoratrici mostrano un andamento decrescente nell’arcodegli anni considerati.

5.2 Stime del rendimento dell’istruzione per titolo di studio attra-verso i quantili di regressione

Le stime dei quantili di regressione ottenute per la specifica-zione con i titoli di studio sono presentate nella tavola 8 e conl’ausilio dei grafici 3 e 4.

In questa specificazione le stime vanno interpretate (dato uncerto quantile) come l’aumento percentuale di reddito che un in-dividuo con al più la licenza elementare dovrebbe avere per man-tenersi al medesimo quantile della distribuzione condizionale delreddito, se conseguisse, rispettivamente, la licenza media, il di-ploma, e la laurea. Dalle tabelle si evince che il rendimento del-l’istruzione è generalmente maggiore per i campioni femminili cheper i maschili a tutti i livelli di istruzione, anche se la differenzaa favore delle femmine scompare nel 1998 e nel 2000, quando incorrispondenza dei quantili più alti della distribuzione dei reddi-ti si rileva un rendimento superiore per gli uomini. Distinguendoper titolo di studio, diversamente da quanto non sia possibile fa-re per le stime basate sugli anni di istruzione, si può notare undifferente comportamento dei rendimenti al variare dei quantiliper i diversi livelli di istruzione. In generale, dai grafici risulta evi-dente come il rendimento derivante dall’aver conseguito la licen-za di scuola media inferiore cada, per quasi tutti i quantili e inquasi tutti i campioni, all’interno dell’intervallo di confidenza del-la corrispondente stima OLS. Cioè, non sembra esserci una par-ticolare variabilità delle stime tra quantili. Nei termini del rap-porto (di sostituibilità/complementarietà) tra istruzione ed abilità,potremmo dire che le stime non presentano un andamento spe-cifico al variare del quantile. Forse solo per il 2000 si nota un an-damento decrescente al crescere del quantile che porterebbe aduna lettura in chiave di sostituibilità tra i due fattori.

Ma questa configurazione cambia, quando si analizzino le sti-


93


94

GRAF. 3

STIME DEL RENDIMENTO DELL’ISTRUZIONE PER I CAMPIONIFEMMINILI A DIVERSI QUANTILI DELLA DISTRIBUZIONE

CONDIZIONALE DEI REDDITI(titoli di studio)

donne 1993

med

ie

0,1

0,2

0,3

0,4

0,2 0,4 0,6 0,8

tau

sup

erio

ri

0,4

0,5

0,6

0,7

0,8

0,9

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,8

0,9

1,0

1,1

1,2

1,3

0,2 0,4 0,6 0,8tau

med

ie

0,0

0,1

0,2

0,3

0,4

0,5

0,2 0,4 0,6 0,8

tau

sup

erio

ri

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,2 0,4 0,6 0,8tau

med

ie

-0,2

0,

0 0,

1 0,

2 0,

3 0,

4

0,2 0,4 0,6 0,8

tau

sup

erio

ri

0,0

0,2

0,4

0,6

0,8

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,4

0,6

0,8

1,0

1,2

0,2 0,4 0,6 0,8tau

med

ie-0

,1

0,1

0,3

0,5

0,2 0,4 0,6 0,8

tau

sup

erio

ri

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,5

0,6

0,7

0,8

0,9

1,0

0,2 0,4 0,6 0,8tau

donne 1995

donne 1998

donne 2000

0,6

0,7

0,8

0,9

1,0

1,1

1,2

1,3

0,2

0,3

0,4

0,5

0,6

0,7

0,8


95

GRAF. 4

STIME DEL RENDIMENTO DELL’ISTRUZIONE PER I CAMPIONIMASCHILI A DIVERSI QUANTILI DELLA DISTRIBUZIONE

CONDIZIONALE DEI REDDITI(titoli di studio)

uomini 1993

med

ie0,

0 0,

1 0,

2 0,

3 0,

4

0,2 0,4 0,6 0,8

tau

sup

erio

ri0,

3 0,

4 0,

5 0,

6 0,

7 0,

8

0,2 0,4 0,6 0,8

tauu

niv

ersi

tà0,

6 0,

7 0,

8 0,

9 1,

0 1,

1 1,

2

0,2 0,4 0,6 0,8tau

med

ie

0,2 0,4 0,6 0,8

tau

sup

erio

ri0,

4 0,

5 0,

6 0,

7

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,6

0,7

0,8

0,9

1,0

1,1

1,2

0,2 0,4 0,6 0,8tau

med

ie0,

05 0

,10

0,15

0,2

0 0,

25 0

,30

0,2 0,4 0,6 0,8

tau

sup

erio

ri0,

2 0,

3 0,

4 0,

5 0,

6 0,

7

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,4

0,6

0,8

1,0

1,2

0,2 0,4 0,6 0,8tau

med

ie0,

0 0,

1 0,

2 0,

3 0,

4 0,

5

0,2 0,4 0,6 0,8

tau

sup

erio

ri0,

3 0,

4 0,

5 0,

6 0,

7

0,2 0,4 0,6 0,8

tau

un

iver

sità

0,5

0,6

0,7

0,8

0,9

1,0

1,1

0,2 0,4 0,6 0,8tau

uomini 1995

uomini 1998

uomini 2000

0,05

0,1

0 0,

15 0

,20

0,25

0,3

0 0,

35

me dei coefficienti delle variabili medie superiori e università. Perquanto riguarda la prima, infatti, si osserva un andamento con-vesso ai vari quantili, in modo analogo a quanto visto in prece-denza con la variabile anni di istruzione. Cioè, ai quantili bassie a quelli elevati della distribuzione dei redditi, gli individui ne-cessitano (a parità di condizioni) di un maggior incremento direddito per mantenere la stessa posizione nella distribuzione deiredditi dei lavoratori diplomati, rispetto agli individui che si tro-vano ai quantili centrali della medesima distribuzione. Quindi an-che qui, cambia la forma della distribuzione condizionale del red-dito dei diplomati rispetto agli individui con istruzione elemen-tare. Per quanto riguarda l’istruzione secondaria superiore pos-siamo dunque interpretare i risultati in termini di sostituibilitàtra istruzione ed abilità ai quantili bassi, e di complementarietàai quantili alti.

Anche le stime dei coefficienti della variabile università mo-strano la presenza di differenze tra quantili, ma in questo casol’andamento tende ad essere meno convesso, o meglio, meno sim-metrico, cioè tende a prevalere un trend crescente all’aumentaredel quantile a favore dell’interpretazione in termini di comple-mentarietà tra i “fattori”. Questo si riscontra in particolar modoper quanto riguarda gli anni intermedi (1995 e 1998) e per i cam-pioni maschili. Mentre per le donne l’andamento delle stime pre-senta una forma maggiormente convessa, con valori molto ele-vati ai quantili estremi inferiori (τ = 0,05 e τ = 0,10), pari o spes-so anche superiori alle stime ottenute ai quantili più alti (τ = 0,90e τ = 0,95); per gli uomini prevale l’aspetto della crescita del ren-dimento all’aumentare del quantile di reddito considerato. Que-sto ad eccezione dell’anno 2000, anno in cui si riscontra un an-damento piuttosto convesso anche per il campione maschile,mentre il campione femminile vede addirittura una tendenza de-crescente all’aumentare del quantile di reddito considerato (so-stituibilità).

Un altro aspetto interessante è rappresentato dalla circostan-za che l’andamento piatto delle stime dei coefficienti delle varia-bili medie inferiori e medie superiori caratterizza particolarmen-te il campione femminile 1998, l’anno cioè in cui si registra il


96

maggior calo del rendimento marginale medio dell’istruzione perle donne. Per tale anno una certa differenziazione tra i rendimentiai diversi quantili di reddito è presentata solo dalle lavoratrici lau-reate. In particolare, si notano stime più elevate ai quantili altidella distribuzione dei redditi (complementarietà).

6. - Conclusioni

Questo lavoro, si propone di fornire dell’evidenza empirica ag-giornata sui rendimenti dell’istruzione in Italia attraverso la suastima condotta sia con i minimi quadrati ordinari, sia sulla basedi un certo numero di quantili di regressione (Koenker e Bassett,1978), evidenziando come una indagine basata sui quantili possarisultare più informativa rispetto ad una stima OLS standard va-lida per l’individuo medio.

I risultati ottenuti dalle stime OLS (effettuate sui dati trattidalla Banca d’Italia 1993, 1995, 1998 e 2000) sono molto vicini aquelli precedentemente trovati nella letteratura italiana e confer-mano la presenza di un rendimento dell’istruzione maggiore perle lavoratrici. L’interpretazione da noi proposta è che tale maggiorrendimento potrebbe essere dovuto ad una più forte incidenza del-l’endogenity bias e dell’ability bias sulle stime relative ai campionifemminili, ammettendo una maggiore persistenza generazionale euna maggiore correlazione dell’abilità e dei vincoli di liquidità del-le donne con quelli della loro famiglia di provenienza.

Il risultato più originale è ottenuto però dalle stime dei quan-tili. In generale, per quanto riguarda il coefficiente degli anni diistruzione, i quantili stimati hanno un andamento a U. Maggiore,cioè, deve essere l’incremento dei redditi degli individui che si tro-vano ai quantili bassi e a quelli alti della distribuzione dei reddi-ti, perché essi, dopo aver studiato un anno in più, si mantenganosul medesimo quantile. In altri termini, non si ha una semplicetraslazione della distribuzione del reddito, ma anche la sua scalae la sua forma risultano modificate al variare di τ. Nei termini delrapporto di sostituibilità/complementarietà tra istruzione e abilità,è possibile considerare dunque i due fattori come sostituiti ai


97

quantili inferiori della distribuzione dei redditi, e come comple-menti per i quantili medio-alti (cioè per gli individui più abili).

L’aspetto più significativo delle stime relative alla specifica-zione con i titoli di studio è la presenza di un diverso comporta-mento del rendimento ai vari quantili per i tre livelli di istruzio-ne considerati. Infatti, mentre i rendimenti derivanti dall’aver con-seguito la licenza di scuola media inferiore cadono, per quasi tut-ti i quantili e in quasi tutti i campioni, all’interno dell’intervallodi confidenza della corrispondente stima OLS, la configurazionecambia, quando si analizzino le stime dei coecienti delle variabi-li medie superiori e università. Le prime presentano un andamen-to convesso al variare dei quantili (sostituibilità tra istruzione edabilità per i meno abili e complementarietà per i più abili), ana-logamente a quelle relative agli anni di istruzione. Cambia dun-que la forma della distribuzione condizionale della variabile di-pendente dei diplomati rispetto agli individui con istruzione ele-mentare. Anche le stime dei coefficienti della variabile universitàmostrano la presenza di differenze tra quantili, anche se menomarcate, infatti tende a prevalere un trend crescente all’aumenta-re del quantile (complementarietà).

Si comprende quindi la capacità dei modelli basati sui quan-tili di regressione di meglio caratterizzare l’impatto dell’istruzio-ne sull’intera distribuzione del reddito, e la loro attrattività per di-verse applicazioni economiche. Purtroppo, spesso il trattamentosi presenta come endogeno o soggetto a self-selection; rendendo iquantili di regressione convenzionali (così come lo stimatore OLS)inadeguati a stimare consistentemente l’effetto del trattamentostesso. Da qui il principale limite e possibilità di sviluppo futurodi questo lavoro, dato che un caso tipico di endogeneità è rap-presentato dalla scelta dell’istruzione. Sono state infatti propostein letteratura delle metodologie di stima che utilizzano le varia-bili strumentali assieme ai quantili di regressione per trattare ta-le problema (Honoré e Hu, 2004; Arias, Hallock e Sosa-Escudero,2001; Chernozhukov e Hansen, 2005). Uno sviluppo futuro di que-sta indagine sui dati italiani potrebbe essere dunque quello di sti-mare il rendimento dell’istruzione utilizzando le dette metodolo-gie, nel tentativo di coniugare i vantaggi informativi derivanti da


98

una indagine basata sui quantili con i vantaggi derivanti dall’usodelle variabili strumentali, che permettono di trattare i problemilegati all’endogenità e all’eterogenità nelle scelte di istruzione.

Un’altra direzione di sviluppo del presente lavoro14 potrebbeessere quella di utilizzare specificazioni più articolate per l’equa-zione stimata, che includano ad esempio, da una parte il voto dimaturità e di laurea come proxy per l’abilità e dall’altra alcune va-riabili relative al settore o alla qualifica del lavoro dell’individuo.Queste ultime permetterebbero quindi di effettuare un’indaginepiù mirata, focalizzata su particolari settori o realtà, distinguen-do ad esempio tra settore pubblico e privato. Per quanto riguar-da l’Italia, tale aspetto è trattato ad esempio da Brunello, Comi eLucifora, 2001, che utilizzano però stime OLS e IV. Per quantoconcerne invece la prima proposta, essa si inserisce in quel filo-ne della letteratura che, seguendo Griliches, 1977, utilizza i votiriportati in esami standardizzati (ad esempio il test IQ), come va-riabili in grado di catturare l’abilità non osservata degli individui.Un “contro” di carattere generale di tale approccio consiste nel-l’implicita definizione che verrebbe così data del concetto di abi-lità, e nel fatto che in tal modo verrebbe catturato solo un certo“genere di abilità” individuale.


99

14 Come osservato da un anonimo referee, che ringrazio.

APPENDICE

1. - Dalla localizzazione alla regressione: quantili in ottimiz-zazione

Ogni variabile casuale a valori reali Y può essere caratteriz-zata attraverso la sua funzione di ripartizione:

F (y) = Prob (Y ≤ y)

Per ogni 0 < τ < 1, si definisce il τ-esimo quantile di Y nel mo-do seguente:

(32) Quant (τ) = inf {y |F (y) ≥ τ}

La mediana, Quant (1/2), rappresenta il quantile centrale. Co-me la funzione di ripartizione, anche la funzione quantile forni-sce una caratterizzazione completa della variabile casuale Y.

I quantili possono essere formulati come soluzione di un sem-plice problema di ottimizzazione. Per ogni 0 < τ < 1, si definisce laseguente funzione di perdita assoluta simmetrica, lineare a tratti:

(33) ρτ (u) = u (τ – 1 {u ≤ 0})

illustrata nel grafico 1.Minimizzando il valore atteso di ρτ (Y – ξ) rispetto a ξ, si ot-

tengono le soluzioni ξ (τ), la più piccola delle quali è Quant (τ),definito nell’equazione (2). Formalmente, si può scrivere:

ξ∈ �

min E [ρτ (Y – ξ)]

o, equivalentemente:

ξ* (τ) = argminξ∈ � E [ρτ (Y – ξ)]


100

con:

(34) Quant (τ) = inf ξ*(τ)

L’equivalente campionario di Quant (τ), a partire da un cam-pione casuale {y1, …, yn}, è detto τ-esimo quantile campionario, epuò essere determinato risolvendo:

ξ∈ �

min ∑n

i=1ρτ (yi – ξ)


101

GRAF. 1

FUNZIONE DI PERDITA ASSOLUTA ASIMMETRICA

ρτ (u)

τ – 1 τ

ovvero:

ξ* (τ) = argminξ∈ � ∑n

i=1ρτ (yi – ξ)

con:

(35)�

Quant (τ) = inf ξ* (τ)

in modo analogo a quanto visto sopra.Utilizzando poi il fatto che:

u = –|u| · 1 {u ≤ 0} + |u| · (1 – 1 {u ≤ 0}) = |u| · (1 – 2 · 1 {u ≤ 0})

la check function può essere utilmente riscritta nel modo seguente:

ρτ (u) = |u| (1 – 2 · 1 {u ≤ 0}) (τ – 1 {u ≤ 0})

= |u| (τ – 2τ · 1{u ≤ 0} + 1 {u ≤ 0})

= |u| (τ · 1 {u ≤ 0} + (1 – τ) · 1 {u ≤ 0})

da cui deriva, ad esempio, che la mediana corrisponde a:

(36)

mentre per gli altri quantili si pesano differentemente, in modoasimmetrico, gli scarti positivi e quelli negativi.

Per comprendere l’utilità e la validità di tale formulazione, siconsideri la funzione obiettivo:

(37)

La derivata di questa funzione rispetto a ξ (tranne che per yi

= ξ, in corrispondenza delle quali la derivata non esiste) è:

(38)

Se la frazione di osservazioni (rispetto al totale) con yi ≤ ξ èpari a τ, questa derivata è nulla:

∂∂

= − > + − ⋅ ≤[ ] =

+ ≤( ) =

≤ =

=

=

=

∑

∑

∑

Qy y

y

ny

i

n

i i

i

n

i

i

n

i

τ ξξ

τ ξ τ ξ

τ ξ

ξ τ

( )– ( { }) ( ) { }

– { })

{ }

1

1

1

1 1 1 1 0

1 0

11

∂∂

= ⋅ > + − ⋅ ≤( )=∑Q

y yi

n

i iτ ξξ

τ ξ τ ξ( )– { } ( ) { }

1

1 1 1

Q y y y y

i

n

i i i iτ ξ ξ τ ξ ξ τ ξ( ) { } ( ) { }= − ⋅ ⋅ > + − ⋅ − ⋅ ≤( )=∑

1

1 1 1

ρ1

2

12

1 1 012

1 012

( ) ( { }) { }u u u u u= − ≤ + ⋅ ≤

=


102

Quest’ultima è proprio la condizione sugli scarti; essendo in-fatti ξτ il τ-esimo quantile, il numero degli scarti negativi e nullisarà pari a nτ.

Sarebbe più comune definire i quantili campionari attraversol’ordinamento delle osservazioni, ma la formulazione in terminidi problema di minimizzazione ha il vantaggio di condurre ad unanaturale generalizzazione per i quantili condizionali.

Allo stesso modo con cui l’idea di stimare la media non con-dizionale come:

µ = argminµ∈ � ∑n

i=1(yi – µ)2

può essere estesa alla stima della funzione lineare media condi-zionale E (Y|X = x) = x’iβ risolvendo:

β= argminβ∈ �k ∑

n

i=1(yi – x’iβ)2

la funzione lineare quantile condizionale:

(39) Qτ (Y|X = x) = x’iβτ

può essere stimata risolvendo:

(40) βτ = argminβ∈ �k ∑

n

i=1ρτ (yi – x’iβτ)

2. - Quantili di regressione e programmazione lineare

È possible mostrare che il problema (18) può essere rappre-sentato anche come un problema di programmazione lineare. Unaconseguenza attrattiva di questo fatto è che, sia dal punto di vi-sta teorico sia da quello pratico, la programmazione lineare puòessere utilizzata per meglio caratterizzare la soluzione βτ specifi-cata nel problema (40). In particolare, il Teorema della Dualità eil Teorema dell’Equilibrio della programmazione lineare fanno lu-ce sulle proprietà della soluzione e sulla sua sensibilità agli ou-tliers (Buchinsky, 1995).


103

Si consideri il modello di base:

(41) yi = x’iβτ + ui

Qτ (yi|xi) = x’iβτ

con Qτ (uτi|xi) = 0 (per costruzione), e il problema di minimizza-

zione (18)

(42)

Si noti poi che yi può essere riscritto come funzione di solielementi positivi:

(43)

dove: β1τj ≥ 0, β2

τj ≥ 0, (con j = 1, ..., k), e u+τi ≥ 0, u–

τi ≥ 0, (con i = 1,..., n).

Segue quindi che il problema (18), scritto nei termini dellecomponenti della (43), assume la forma seguente:

o, equivalentemente, in notazione matriciale, più compatta:

dove A = (X, –X, In, –In) è una matrice n × (2n + 2k); y = (y1, …, yn)’è un vettore n × 1 che raccoglie le osservazioni sulla variabile di-

min z

c z

Az y

z

′

=

≥

0

min[ ( ) ]

( , , )

τι τ ιβ

βτ τ τ

τ τ τ

′ + − ′= + −

∈ ×

+ −

+ −

+ −+

u u

y X u u

u u k n

1

2� �

y x u x u uij

k

ij j ij

k

ij j j i i= + = − + −= =

+ −∑ ∑1 1

1 2β β βτ τ τ τ τ τ( ) ( )

minβ

τ τ τ ττ

β τ β β τ β∈ =

− ′ ⋅ ⋅ > ′{ } + − ′ ⋅ −( ) ⋅ ≤ ′{ }( )∑� k

y x y x y x y xi i i i i i i ii

n

1 1 11


104

pendente; z = (βτ1’, βτ

2’, uτ+’, uτ

–’)’ è un vettore (2k + 2n) × 1; c = (0’, 0’,τι ’, (1 – τ) ι ’)’; X = (x1, …, xn)’ è una matrice n × k con la i-esima ri-ga data da x’i, con i = 1, ..., n; In è una matrice identità di dimen-sione n; 0’ è un vettore k × 1 di zeri e ι è un vettore n × 1 di uno.Nel sistema di LP, uτ

+, uτ– vengono utilizzati in modo da rendere

vincoli di uguaglianza i vincoli del sistema, che risulta così espres-so in forma standard, secondo le comuni regole di trasformazio-ne valide per i sistemi di programmazione lineare. I vincoli, in ge-nerale, sarebbero costituiti da disuguaglianze, nella forma cano-nica del programma: per le osservazioni della variabile dipenden-te al di sotto dell’iperpiano, infatti, yi – x’iβτ < 0; per le osservazio-ni al di sopra di esso, yi – x’iβτ > 0. In altri temini, la variabile uτi

non è vincolata in segno. Tale problema rappresenta un problemaprimale di programmazione lineare. Di conseguenza, il problemaduale è definito da:

Esso equivale approssimativamente alle FOC (20) del proble-ma di minimizzazione Buchinsky (1995).

max w

w y

w A c

′

′ ≤ ′


105

BIBLIOGRAFIA

ANTONELLI G., Risorse umane e redditi da lavoro, Milano, F. Angeli, 1985.ARIAS O. - HALLOCK K.F. - SOSA-ESCUDERO W., «Individual Heterogeneity in the Re-

turns to Schooling: Instrumental Variables Quantile Regression Using Twins Da-ta», Empirical Economics, vol. 26, 2001, pp. 7-40.

ASHENFELTER O. - ROUSE C., «Income, Schooling and Ability: Evidence from a NewSample of Identical Twins», Quarterly Journal of Economics, vol. 113, 1998, pp.253-84.

BANCA D’ITALIA, Indagine sui bilanci delle famiglie italiane, distribuzione elettronicadei microdati, Roma, Banca d’Italia, 1986, 1991, 1993, 1995, 1998, 2000.

BECKER G.S., Human Capital and the Personal Distribution of Income, Ann Arbor(Michigan), University of Michigan Press, 1967.

BRUNELLO G. - MINIACI R., «The Economic Returns to Schooling for Italian Men.An Evaluation Based on Instrumental Variables», Labour Economics, vol. 6, n.4, 1999, pp. 509-19.

BRUNELLO G. - COMI S. - LUCIFORA C., «The Returns to Education in Italy: A NewLook at the Evidence», in HARMON C. - WALKER I. - WESTERGARD-NIELSEN N. (acura di), The Returns to Education in Europe, Cheltenham (UK), Edward Elgar,2001.

BUCHINSKY M., «Changes in the US Wage Structure 1963-1987: Application of Quan-tile Regression», Econometrica, vol. 62, 1994, pp. 405-58.

— —, «Estimating the Asymptotic Covariance Matrix for Quantile Regression Mo-dels: A Monte Carlo Study», Journal of Econometrics, vol. 68, 1995, pp. 303-38.

— —, «Recent Advances in Quantile Regression Models: A Practical Guideline forEmpirical Research», Journal of Human Resources, vol. 33, 1998, pp. 88-126.

CANNARI L. - D’ALESSIO G., «Il rendimento dell’istruzione: alcuni problemi di sti-ma», Roma, Banca d’Italia, Temi di Discussione, n. 253, 1998.

CANNARI L. - PELLEGRINI G. - SESTITO P., «Redditi da lavoro dipendente: un’analisiin termini di capitale umano», Roma, Banca d’Italia, Temi di Discussione, n.124, 1989.

CARD D., «Earnings, Schooling, and Ability Revisited», Cambridge (MA), NBER,Working Paper, n. 4832, 1994.

— —, «Using Geographic Variation in College Proximity to Estimate the Return toSchooling», Aspects of Labour Market Behaviour: Essays in Honour of John Van-derkamp, Toronto, Università di Toronto, 1995, pp. 201-22.

— —, «Estimating the Return to Schooling: Progress on Some Persistent Econo-metric Problems», Econometrica, vol. 69, 2001, pp. 1127-60.

CARD D. - KRUEGER A.B., «Does School Quality Matter? Return to Education andthe Characteristics of Public Schools in the United States», Journal of PoliticalEconomy, vol. 100, 1992, pp. 1-40.

CHERNOZHUKOV V. - HANSEN C., «An IV Model of Quantile Treatment Effect», Eco-nometrica, vol. 73, n. 1, 2005.

COLUSSI A., «Una Analisi Cross Section del Tasso di Rendimento dell’Istruzione inItalia», Politica Economica, vol. 13, n. 2, 1997.

FITZENBERGER B. - KURZ C., «New Insights on Earnings Trends Across Skill Grou-ps and Industries in West Germany», Empirical Economics, vol. 28, 2003, pp.479-514.


106

FLABBI L., «Investire in istruzione: è meglio per lui o per lei? Stima per genere deirendimenti dell’istruzione in Italia», Milano, Università degli studi di Milano -Bicocca, Working Paper, n. 08, 1997.

— —, «Returns to Schooling in Italy: OLS, IV and Gender Differences», Milano,Università Bocconi, Working Paper, n. 1, 1999.

GRILICHES Z., «Estimating the Returns to Schooling: Some Econometric Problems»,Econometrica, vol. 45, 1977, pp. 1-22.

HAUSE J.C., «Earnings Profile: Ability and Schooling», Journal of Political Economy,vol. 80, 1972, pp. 108-38.

HILLIER F.S. - LIEBERMAN G.J., Introduction to Operations Research, New York, Mc-Graw-Hill, 1990.

HOLLAND P.W., «Statistics and Causal Inference», Journal of the American Statisti-cal Association, vol. 81, 1986, pp. 945-60.

HONORÉ B.E. - HU L., «On Performance of Some Robust Instrumental VariablesEstimators», Journal of Business and Economic Statistics, vol. 22, n. 1, 2004,pp. 30-9.

ICHINO A., «Il problema della causalità. Una introduzione generale e un esempio»,Manuale di economia del lavoro, Bologna, Il Mulino, 2001, pp. 457-83.

ICHINO A. - WINTER-EBMER R., «Lower and Upper Bounds of Returns to Schooling:An Exercise in IV Estimation with Different Instruments», European EconomicReview, vol. 43, 1999, pp. 889-901.

KOENKER R., «Short Course on Quantile Regression», Technical Report, Urbana-Campaign, University of Illinois, 2003.

KOENKER R. - BASSETT G., «Regression Quantiles», Econometrica, vol. 46, 1978, pp.33-50.

LUCIFORA C. - REILLY B., «Wage Discrimination and Female Occupational Inten-sity», Labour, vol. 4, n. 2, 1990, pp. 147-68.

MARTINS P.S. - PEREIRA P.T., «Does Education Reduce Wage Inequality? QuantileRegression and Evidence From 16 Countries», Labour Economics, vol. 11, 2004,pp. 355-71.

MINCER J., Schooling, Experience and Earnings, New York, Columbia UniversityPress, 1974.

MWABU G. - SCHULTZ T.P., «Education Returns Across Quantiles of the Wage Func-tion: Alternative Explanations for Returns to Education by Race in South Afri-ca», American Economic Review, vol. 86, n. 2, 1996.

PARK J.H., «Returns to Schooling: A Peculiar Deviation from Linearity», Princeton(NJ), Princeton University, Working Paper, n. 335, 1994.


107

il rendimento dell’istruzione in italia: evidenza empirica ... · particolare, poiché la...

Documents