estimadores de razon: una revisi´on

33
Estimadores de raz´ on: una revisi´ on Mayor Gallego, Jos´ e A. Dpto. de Estad´ ıstica e Investigaci´ on Operativa Universidad de Sevilla Resumen En este trabajo de revisi´ on exponemos los principios b´ asicos de la utilizaci´ on de informa- ci´ on adicional en la estimaci´ on de par´ ametros definidos sobre poblaciones finitas, mediante el empleo de estimadores de raz´ on. Aunque la introducci´ on de este tipo de estimadores se rea- liz´ o inicialmente desde un punto de vista “heur´ ıstico”, basado en la existencia de relaciones de proporcionalidad directa “aproximada” entre la variable de estudio y otras variables m´ as con- troladas, su estudio detallado se desarrolla a partir del enfoque de modelos de superpoblaci´ on. La problem´ atica principal que presentan este tipo de estimaciones es la existencia de sesgo, lo que obliga a utilizar dise˜ nos muestrales espec´ ıficos o a modificar las expresiones de los estima- dores con el fin de obtener estrategias insesgadas o con sesgo reducido, pero manteniendo la simplicidad en la estimaci´ on del error de muestreo. Palabras clave: muestreo, poblaciones finitas, estimadores de raz´ on. 1. Introducci´ on La utilizaci´ on de informaci´ on auxiliar es un recurso muy extendido en los diversos ´ ambitos del muestreo en poblaciones finitas, siendo su principal objetivo la obtenci´ on de estimaciones m´ as acuradas. En t´ erminos generales, podemos afirmar que la informaci´ on auxiliar, generalmente suminis- trada por una o m´ as variables auxiliares, conocidas o controladas al menos en cierto grado, puede ser aplicada en la fase de muestreo, en la fase de estimaci´ on o en ambas. As´ ı, los dise˜ nos ΠPS y PPS, es decir, con probabilidades de inclusi´ on o de selecci´ on de ele- mentos, proporcionales al tama˜ no, utilizan probabilidades de selecci´ on de elementos, que est´ an afectadas por los valores de una variable auxiliar, X . Tambi´ en, en el muestreo estratificado, se emplean variables auxiliares en cuestiones tales como la afijaci´ on y la definici´ on de estratos. En este trabajo revisaremos diferentes formas de construir estimadores, con una estructura matem´ atica de tipo fraccional, y que utilicen en la forma m´ as adecuada, dicha informaci´ on auxi- liar, buscando la obtenci´ on de buenas estimaciones. Por supuesto, ello no va en detrimento de utilizar estos estimadores en combinaci´ on con dise˜ nos muestrales que tambi´ en incorporen infor- maci´ on auxiliar como los mencionado anteriormente. Una clasificaci´ on pormenorizada de estas y otras formas de empleo de la informaci´ on auxiliar puede verse en Hedayat y Sinha (1991). Este tipo de estimadores de raz´ on resultan muy apropiados cuando se presenta una relaci´ on aproximada de proporcionalidad directa entre la variable de estudio y otras variables auxiliares. 1

Upload: others

Post on 02-Jul-2022

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimadores de razon: una revisi´on

Estimadores de razon: una revision

Mayor Gallego, Jose A.Dpto. de Estadıstica e Investigacion Operativa

Universidad de Sevilla

Resumen

En este trabajo de revision exponemos los principios basicos de la utilizacion de informa-cion adicional en la estimacion de parametros definidos sobre poblaciones finitas, mediante elempleo de estimadores de razon. Aunque la introduccion de este tipo de estimadores se rea-lizo inicialmente desde un punto de vista “heurıstico”, basado en la existencia de relaciones deproporcionalidad directa “aproximada” entre la variable de estudio y otras variables mas con-troladas, su estudio detallado se desarrolla a partir del enfoque de modelos de superpoblacion.La problematica principal que presentan este tipo de estimaciones es la existencia de sesgo, loque obliga a utilizar disenos muestrales especıficos o a modificar las expresiones de los estima-dores con el fin de obtener estrategias insesgadas o con sesgo reducido, pero manteniendo lasimplicidad en la estimacion del error de muestreo.

Palabras clave: muestreo, poblaciones finitas, estimadores de razon.

1. Introduccion

La utilizacion de informacion auxiliar es un recurso muy extendido en los diversos ambitosdel muestreo en poblaciones finitas, siendo su principal objetivo la obtencion de estimaciones masacuradas.

En terminos generales, podemos afirmar que la informacion auxiliar, generalmente suminis-trada por una o mas variables auxiliares, conocidas o controladas al menos en cierto grado,puede ser aplicada en la fase de muestreo, en la fase de estimacion o en ambas.

Ası, los disenos ΠPS y PPS, es decir, con probabilidades de inclusion o de seleccion de ele-mentos, proporcionales al tamano, utilizan probabilidades de seleccion de elementos, que estanafectadas por los valores de una variable auxiliar, X. Tambien, en el muestreo estratificado, seemplean variables auxiliares en cuestiones tales como la afijacion y la definicion de estratos.

En este trabajo revisaremos diferentes formas de construir estimadores, con una estructuramatematica de tipo fraccional, y que utilicen en la forma mas adecuada, dicha informacion auxi-liar, buscando la obtencion de buenas estimaciones. Por supuesto, ello no va en detrimento deutilizar estos estimadores en combinacion con disenos muestrales que tambien incorporen infor-macion auxiliar como los mencionado anteriormente. Una clasificacion pormenorizada de estas yotras formas de empleo de la informacion auxiliar puede verse en Hedayat y Sinha (1991).

Este tipo de estimadores de razon resultan muy apropiados cuando se presenta una relacionaproximada de proporcionalidad directa entre la variable de estudio y otras variables auxiliares.

1

Page 2: Estimadores de razon: una revisi´on

INTRODUCCION 2

Estas relaciones aparecen con frecuencia en situaciones reales. Por ejemplo, para estimar el conte-nido total de azucares de un gran cargamento de naranjas, podemos utilizar la proporcionalidadexistente entre el peso de fruto y el de azucares que contiene, empleando el muestreo para estimarel factor de proporcionalidad. O para estimar el total de automoviles en una poblacion, podemostener en cuenta la proporcionalidad aproximada, existente entre estos y el numero de habitantes.De esta forma, la existencia de este tipo de relaciones puede ayudarnos a obtener estimacionesmas precisas, aunque como veremos, con la contrapartida de la aparicion de sesgos en las mismas.

Ası, en la seccion 2., iniciaremos el desarrollo de estas cuestiones estudiando lo que denomina-mos soluciones heurısticas, basadas en considerar el parametro a estimar como una derivacionde una expresion mas compleja, sobre la cual se sustituyen ciertas cantidades poblacionales pormuestrales. Un estudio posterior permitira calibrar si hemos obtenido un estimador adecuado, yencontrar las mejores condiciones para su aplicacion.

En la seccion 3., enfocaremos nuestro estudio bajo la perspectiva de los modelos de super-poblacion, desarrollando la solucion general obtenida para el caso de diseno muestral aleatoriosimple, MAS(N,n), y para el caso de disenos ΠPS, es decir, con probabilidades de inclusionproporcionales al tamano.

En la seccion 4., se estudian varias estrategias insesgadas, basadas en el diseno de Lahiri-Midzuno, y en el diseno MAS(N,n) combinado con estimadores especiales como el de Hartley-Ross y el de Mickey. Estas estrategias presentan estimadores de la varianza complicado, por loque, en esta misma seccion, introducimos varias estrategias cuasi-insesgadas, con estimadores dela varianza mas simples.

La seccion 5., se dedica al estudio del estimador de razon multivariante, y la seccion 6., a lasdistintas formas de combinar el estimador de razon con la estructura de estratos.

Finalmente, en la seccion 7. estudiamos propiedades de optimalidad del estimador de razon,bajo el modelo de superpoblacion de proporcionalidad directa, exponiendo los resultados clasicossobre optimalidad de ciertas estrategias basadas en muestreo intencional.

En lo que sigue, denotaremos por U a la poblacion finita bajo estudio, siendo sus elementos,

U = {1, 2, 3, . . . , N}

Jose A. Mayor Gallego. Universidad de Sevilla

Page 3: Estimadores de razon: una revisi´on

SOLUCIONES HEURISTICAS 3

Tambien denotaremos por Y una variable generica, definida sobre U que asocia a cada ele-mento, i ∈ U , un numero real, Yi.

Supondremos que las estimaciones se realizan a partir de una muestra, m, obtenida de lapoblacion mediante un determinado diseno muestral. En particular, emplearemos frecuentementeel diseno muestral formado por todas las muestras posibles (en el sentido de subconjuntos) detamano n, con distribucion de probabilidad uniforme sobre las mismas, al que denominamosdiseno muestral aleatorio simple, ya mencionado previamente, y que denotaremos MAS(N,n).

2. Soluciones heurısticas

Si suponemos que el parametro a estimar es la media poblacional de la variable Y ,

Y =1N

∑i∈U

Yi

y que X es una variable auxiliar perfectamente conocida para todos los elementos de U , podemosconsiderar la expresion,

Y =Y

XX = R X

a partir de la cual podemos definir, heurısticamente, el estimador,

Y R = R X

La forma final del estimador dependera del diseno muestral utilizado. Por ejemplo, si la muestrase obtiene mediante diseno muestral aleatorio simple, MAS(N,n), podemos estimar R por la razonde medias muestrales, obteniendo,

Y R =y

xX

Obviamente, la eficiencia de este estimador depende en gran medida de la relacion existenteentre las variables Y y X, siendo el caso mas favorable aquel en el que existe una relacion apro-ximada de proporcionalidad entre la variable de estudio y la variable auxiliar. Graficamente ellosignifica una nube de puntos concentrada en las proximidades de una lınea recta que pasa por elorigen. Vease la Figura 1.

El caso ideal, aunque utopico, se darıa cuando la proporcionalidad entre las variables es exacta.En tal caso V [Y R] = 0, y la estimacion coincide con el verdadero valor. En general, y suponiendodiseno MAS(N,n), basta aplicar las expresiones usuales para la varianza aproximada de la razon,y su estimacion, vease Fernandez y Mayor (1995), para obtener inmediatamente las conocidasexpresiones,

V [Y R] ≈ 1− f

n

(S2

y + R2S2x − 2RSxy

)

V [Y R] =1− f

n

(s2y + R2s2

x − 2Rsxy

)Jose A. Mayor Gallego. Universidad de Sevilla

Page 4: Estimadores de razon: una revisi´on

SOLUCIONES HEURISTICAS 4

""

""

""

""

""

""

""

""

""

""

""

""

""

""

""

q qq q qq q qq qqq q qq qq qqqq qq q qq qqq q q q qq qq

q qq q qq qqqqqqqq

qqqqq qqq qq

qq q qq

q q qqqq q q q qqq q qqqqqqqq q qq qqq qq q q q q qqqq q qq q q qqqqqqqqqqqqqqqq q q qqqqqq

qqq q qqqq q q q qqqqqqqqqq

qq q qq qq qq

qqqq

q qqq

qqqqq qq q q

Y

X

FIGURA 1. Relacion de proporcionalidad aproximada entre dos variables.

donde S2y , S2

x, Sxy denotan cuasivarianzas y cuasicovarianza poblacionales, y s2y, s2

x, sxy las corres-pondientes muestrales. Tambien denotamos f = n/N .

Es interesante observar que la solucion obtenida heurısticamente volvera a aparecer al aplicarel enfoque predictivo, por lo que pospondremos para mas adelante un estudio en profundidad deesta solucion, en lo que se refiere al tratamiento del sesgo y del error cuadratico medio.

Tambien es necesario resaltar que, en el enfoque heurıstico se esta empleando, aunque no apriori o de una forma manifiesta, la existencia de una relacion aproximada de proporcionalidaddirecta, entre las variables Y y X, y en este sentido, hemos de recordar los trabajos pioneros dealgunos cientıficos, en el campo de la demografıa, que han utilizado esta idea.

Ası, son clasicos los estudios del ingles John Graunt sobre la estimacion del numero de habi-tantes de Londres. Sus resultados se publicaron en el famoso trabajo Natural and Political Obser-vations made upon the Bills of Mortality, aparecido en 1662. En este estudio, Graunt investigo unconjunto de familias pertenecientes a determinadas parroquias de la ciudad de Londres, donde losregistros resultaban fiables, y observo que habıa un promedio de tres fallecimientos anuales en 11familias, siendo la cantidad total de fallecimientos por ano en esta ciudad de aproximadamentede 13000. De este forma, Graunt concluyo que el numero de familias era de 48000, y suponiendoun tamano medio familiar de 8, estimo en 384000 el numero de habitantes de la ciudad.

Como puede observarse, en estos calculo esta implıcito un modelo de proporcionalidad entreel numero de fallecimientos y el de familias y tambien entre el numero de estas y el de habitantes.Tambien hay que notar como Graunt no realizo ningun estudio adicional encaminado a cuantificarlos posibles errores cometidos. Veanse Chang (1976) y Hald (1990) para un estudio pormenorizadodel trabajo de Graunt.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 5: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 5

Otro precedente historico de gran relevancia lo constituyen los estudios sobre la poblacionde Francia, llevados a cabo por Laplace, y cuyos primeros resultados aparecieron en 1786. Susmetodos de muestreo y estimacion fueron similares a los empleados por Graunt, pero el cientıficofrances vio la necesidad de tener en cuenta de alguna forma la precision de los resultados obtenidos,tanto en su control, seleccionando una muestra de calidad, como en su medicion.

A partir de una muestra, Laplace estimo la poblacion total del paıs utilizando una estimacionde razon, empleando los nacimientos ocurridos el ano precente como variable auxiliar. Adicional-mente, calculo la distribucion de la diferencia entre el verdadero valor y el estimado, aproximandoesta distribucion por una normal. Sus metodos y resultados aparecieron en la clasica obra TheorieAnalytique des Probabilites, publicada en 1812. Vease Cochran (1978) y Chang (1976).

3. Modelo de superpoblacion de proporcionalidad directa

El enfoque considerado en el apartado anterior, que denominamos heurıstico, en cierto modose contrapone, metodologicamente, al que vamos a considerar ahora, mas formal, y denominadoenfoque predictivo. Este enfoque se basa en suponer un “modelo” o relacion funcional entre lavariable de estudio, Y , y la variable auxiliar, X, de la forma Y = f(X). Si f(·) fuera conocidacompletamente, el conocimiento de X nos llevarıa al de Y y por tanto al de cualquier parametroθ(Y ).

Usualmente, f(·) es desconocida y su determinacion solo puede realizarse de un modo apro-ximado, a partir del conocimiento de la variable X, y de la informacion suministrada por elestadıstico,

{(Xi, Yi) | i ∈ m}

Con dicha informacion, buscaremos la funcion f(·) que “mejor” explique la relacion observaday que denominaremos funcion predictora.

En este sentido, es muy importante realizar estudios exploratorios de los datos muestrales, porejemplo dibujando la nube de puntos, que proporcionen indicios sobre las pautas que relacionanX con Y . Vease Fernandez y Mayor (1995).

El siguiente paso sera estimar θ(Y ) mediante θ(Y ), siendo Yi, i ∈ U los valores aproximadosa los verdaderos valores Yi, i ∈ U , proporcionados por la funcion predictora f(·), es decir,

Yi = f(Xi) i ∈ U

Por ejemplo, para un parametro lineal del tipo θ(Y ) =∑

i∈U aiYi se tendra,

θ(Y ) =∑i∈U

aiYi =∑i∈U

aiYi +∑i∈U

ai(Yi − Yi)

cuyo primer sumando es conocido, y el segundo es desconocido, siendo funcion del error de es-timacion de f(·). Si es posible despreciar este segundo sumando, entonces podemos dar comoestimador,

θ1(Y ) =∑i∈U

aiYi

Jose A. Mayor Gallego. Universidad de Sevilla

Page 6: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 6

en otro caso, podemos estimarlo, por ejemplo mediante el estimador de Horvitz-Thompson, obte-niendo el estimador alternativo,

θ2 =∑i∈U

aiYi +∑i∈m

aiYi − Yi

πi

Es importante observar que en el enfoque predictivo se combinan dos procesos estadısticos,el ajuste y la estimacion, dependiendo la bondad de las estimaciones de numerosos factoresentre los que destacamos la habilidad en la conjuncion de ambos procesos, la bondad del ajusterealizado y la estructura de la poblacion en lo que atane a las variables involucradas.

Con el fin de obtener el estimador de razon a partir del enfoque predictivo, vamos a suponerque la poblacion, en relacion a la variable de estudio, Y , y la variable auxiliar, X, posee el siguientemodelo de superpoblacion, de proporcionalidad directa,

Yi = βXi + εi

Es[εi] = 0Vs[εi] = σ2v(Xi)Es[εiεj ] = 0, i 6= j

siendo v(·) una funcion conocida que marca la estructura de la varianza. Adicionalmente, supon-dremos que X toma unicamente valores no negativos.

Notemos que si fuera posible observar la totalidad de los valores {(Xi, Yi) | i ∈ U}, como en elcaso de un censo, podrıamos obtener una estimacion de β basandonos en el teorema de Gauss-Markov generalizado dado por C.R. Rao (1965), mediante la resolucion del siguiente problema deminimizacion,

mınβ

∑i∈U

(Yi − β Xi)2

σ2 v(Xi)

lo que proporcionarıa,

β =∑

i∈U YiXi/v(Xi)∑i∈U X2

i /v(Xi)

Pero como solo disponemos de la informacion suministrada por la muestra, utilizaremos elmetodo de estimacion propuesto por Kish y Frankel (1974) y Fuller (1975), consistente en re-emplazar la suma poblacional por una estimacion muestral, y mas concretamente, si es la deHorvitz-Thompson, resolviendo el problema,

mınβ

∑i∈m

(Yi − β Xi)2

σ2v(Xi)πi

Para simplificar la solucion del mismo, tomaremos v(x) = x, lo que representa una situacionmuy general, en la cual la varianza en la superpoblacion aumenta proporcionalmente al valor de la

Jose A. Mayor Gallego. Universidad de Sevilla

Page 7: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 7

variable auxiliar (que ha de ser no negativa). Con esta hipotesis, obtenemos sin mas que derivar,la siguiente ecuacion normal,

∑i∈m

Yi − βXi

πi= 0

y la siguiente estimacion de β,

β =∑

i∈m Yi/πi∑i∈m Xi/πi

Si ahora empleamos el estimador θ2 para estimar la media poblacional, obtendremos,

θ2 =∑i∈U

Yi/N +∑i∈m

Yi − Yi

Nπi=∑i∈U

β Xi/N +∑i∈m

Yi − β Xi

Nπi

= β X4= Y R

donde el segundo sumando se ha anulado por la ecuacion normal. Ası pues, hemos obtenido elsiguiente estimador de la media poblacional,

Y R =∑

i∈m Yi/πi∑i∈m Xi/πi

X

caso particular del de Sanchez-Crespo (1980).

El estudio de la varianza de Y R dependera del diseno muestral que se emplee, y en general,se puede realizar por los metodos usuales basados en aproximacion lineal.

A continuacion particularizaremos la solucion obtenida, para el diseno muestral aleatorio sim-ple, MAS(N,n), y para los disenos ΠPS, esto es, con probabilidades de inclusion de los elementosproporcionales a su valor de la variable auxiliar.

3.1. Diseno MAS(N, n)

Al ser las probabilidades de inclusion de primer orden para este diseno muestral,πi = n/N, ∀i ∈ U , obtenemos el estimador,

Y R =y

xX

que coincide con el obtenido heurısticamente, y obviamente es, en general sesgado, ya que,

B[Y R] = E[Y R]− Y = XE

[y

x

]− E[y] = E[x]E

[y

x

]− E[y] = −Cov

[x,

y

x

]

Jose A. Mayor Gallego. Universidad de Sevilla

Page 8: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 8

Con objeto de realizar un estudio cuantitativo de este sesgo, ası como del error cuadraticomedio y de la varianza, construiremos los valores,

δy =y − Y

Yδx =

x−X

X

que nos serviran, adoptando la lınea expuesta en David y Sukhatme (1974), para definir lassiguientes cantidades,

Bk[Y R] = Y E

[2k−1∑i=0

(−δx)i(δy − δx)

]

ECMk[Y R] = Y2E

[(δy − δx)2

2k−2∑i=0

(i + 1)(−δx)i

]

con k ≥ 1 entero. Estas cantidades seran utilizadas como aproximaciones del sesgo y del errorcuadratico medio, y con respecto a sus ordenes de aproximacion se verifica el resultado queexponemos a continuacion.

Teorema 1 Bajo diseno muestral MAS(N,n), y suponiendo que la media muestral de X verificax ≥ x0 > 0, se tiene para las cantidades Bk[Y R] y ECMk[Y R],∣∣∣B[Y R]−Bk[Y R]

∣∣∣ ≤ O(n−(k+1))

∣∣∣ECM[Y R]− ECMk[Y R]∣∣∣ ≤ O(n−(k+1))

2

Para un estudio pormenorizado de este resultado, y su demostracion, veanse David y Sukhat-me (1974) y Sukhatme et al. (1984).

Tomando ahora k = 1, y teniendo en cuenta que entre el error cuadratico medio y la varianzaexiste la relacion,

ECM[Y R] = V [Y R] +(B[Y R]

)2

se obtienen facilmente las siguientes aproximaciones.

Teorema 2

B[Y R] =1− f

n

(Y

X2 S2

x −1X

Sxy

)+ O(n−2) = O(n−1)

ECM[Y R] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2) = O(n−1)

V [Y R] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2) = O(n−1)

Jose A. Mayor Gallego. Universidad de Sevilla

Page 9: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 9

2

El resultado anterior es importante por varias razones. Por una parte, nos dice que el sesgopuede ser reducido incrementando el tamano muestral.

Por otra parte, proporciona una expresion del sesgo, aproximada hasta el orden O(n−2).Similares consideraciones se derivan para el error cuadratico medio y la varianza.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 10: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 10

Como una aplicacion interesante, hemos realizado una comprobacion empırica del comporta-miento del sesgo, utilizando una poblacion construida artificialmente, EXP1000, con N = 1000elementos, para los cuales las variables Y y X estan ligadas por la relacion,

Yi = 1000 + 10×Xi + 3× εi, i = 1, . . . , 1000

Los valores de Xi han sido generados de una distribucion exponencial de media µ = 200 y losde εi se han obtenido restando 50 a los valores generados a partir de una distribucion exponencialde media 50.

Para cada uno de los valores n = 10, 15, . . . , 100 hemos simulado 500 veces un muestreoaleatorio simple, MAS(1000, n), y para cada valor de n hemos tabulado el termino guıa delsesgo,

B1 = B1[Y R] =1− f

n

(Y

X2 S2

x −1X

Sxy

)

ası como B = B[Y R] calculado promediando Y R − Y sobre las 500 simulaciones. Tambien hemostabulado la diferencia, en valor absoluto, entre ambas cantidades. De esta forma hemos obtenidolos resultados siguientes,

n B1 B |B −B1|10 94,367097 79,384970 14,98212715 62,593663 67,305330 4,71166720 46,706946 50,874577 4,16763125 37,174917 43,594316 6,41939930 30,820230 26,349465 4,47076535 26,281168 22,712932 3,56823640 22,876871 20,871180 2,00569145 20,229085 20,171039 0,05804650 18,110856 12,119815 5,99104155 16,377760 20,709838 4,33207860 14,933513 18,269774 3,33626165 13,711458 18,450887 4,73942970 12,663982 14,513552 1,84957075 11,756170 13,513885 1,75771580 10,961834 12,005794 1,04396085 10,260949 11,873348 1,61239990 9,637941 10,489407 0,85146695 9,080512 10,106495 1,025983

100 8,578827 9,283448 0,704621

Como puede verse, el comportamiento del sesgo estimado coincide con la expresion teorica, enlo que se refiere a su dependencia del tamano muestral, n.

Tambien la rapida disminucion observada para |B[Y R]−B1[Y R]| parece concordar con el ordenO(n−2) hallado teoricamente. Una grafica de estos valores se muestra en la Figura 2.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 11: Estimadores de razon: una revisi´on

MODELO DE SUPERPOBLACION DE PROPORCIONALIDAD DIRECTA 11

n

10 20 30 40 50 60 70 80 90 100

10

20

30

40

50

60

70

80 u

u

u u u u u u u uee e e e e e e e e

u B[Y R]

e |B[Y R]−B1[Y R]|

FIGURA 2. Sesgo estimado y su diferencia con el termino orden O(n−1).

Con respecto a la comparacion entre el estimador de razon, Y R y el estimador Y = y, que noemplea informacion auxiliar, se tiene,

Teorema 3 Si el tamano muestral es lo suficientemente grande para despreciar los terminos deorden O(n−2), entonces el estimador de razon, Y R es mas eficiente que Y = y si el coeficiente decorrelacion lineal, ρ verifica,

ρ >12

CVx

CVy

donde CVy = Sy/Y denota el cuasicoeficiente de variacion de Y , y analogo para X.

Resultado que se obtiene inmediatamente sin mas que resolver en ρ la inecuacion,

1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)<

1− f

nS2

y

2

Observemos que la anterior condicion para ρ, suele verificarse cuando existe una elevada corre-lacion entre las variables, con lo cual obtendremos mejores resultados con el estimador de razonque con la media muestral simple. Por supuesto, ello presenta el inconveniente del sesgo, aunqueeste puede ser reducido por algunos procedimientos como el aumento del tamano muestral, laaplicacion de tecnicas de tipo jackknife o la estimacion del sesgo, siendo referencias fundamenta-les para el estudio de estas cuestiones, ademas de las citadas, Hansen, Hurwitz y Madow (1953),Cochran (1993) y Hedayat y Sinha (1991).

Jose A. Mayor Gallego. Universidad de Sevilla

Page 12: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 12

Tambien es interesante la comparacion con el estimador de regresion de la media,

Y RG = y +sxy

s2x

(X − x)

En este sentido, se verifica que si, como en el anterior resultado, despreciamos los terminosde orden O(n−2), entonces siempre es mas eficiente el estimador de regresion que el de razon, esdecir, V [Y RG] ≤ V [Y R]. Vease Hedayat y Sinha (1991).

Finalmente anadiremos que tanto el sesgo, como el error cuadratico medio y la varianza deY R, pueden ser estimados mediante,

B[Y R] =1− f

n

(y

x2s2x −

1x

sxy

)

ECM[Y R] =1− f

n

(s2y +

y2

x2s2x − 2

y

xsxy

)

V [Y R] =1− f

n

(s2y +

y2

x2s2x − 2

y

xsxy

)

3.2. Disenos ΠPS

Para estos disenos, suponiendo tamano de muestra fijo, n, se tiene πi = n Xi/T (X), con locual, el estimador de razon adopta la forma,

Y R =1n

∑i∈m

Yi

XiX

Es interesante observar que dicho estimador coincide con el estimador de Horvitz-Thompsonde la media, empleando X como variable auxiliar y probabilidades de inclusion proporcionalesal tamano, siendo pues la estimacion insesgada. El estudio de su varianza se realizara por losmetodos usuales. Por ejemplo, aplicando las expresiones de Yates-Grundy-Sen, obtendremos,

V [Y R] = −X2

2n2

∑i,j∈U

(πij − πiπj)

(Yi

Xi− Yj

Xj

)2

V [Y R] = −X2

2n2

∑i,j∈m

(πij − πiπj)πij

(Yi

Xi− Yj

Xj

)2

Ası, la varianza disminuye cuanto mas ajustada es la relacion de proporcionalidad entre las va-riables Y y X.

4. Estrategias insesgadas y cuasi-insesgadas

En este apartado estudiaremos algunas combinaciones de diseno y estimador que proporcionanestimaciones insesgadas o cuasi-insesgadas, es decir, con sesgo de orden O(n−2). Estas estrategiasse basan, tanto en las particularidades del diseno muestral, como en modificaciones introducidasen la expresion del estimador.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 13: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 13

4.1. Estrategia insesgada basada en el esquema de Lahiri-Midzuno

Lahiri (1951) y Midzuno (1952), independientemente, han descrito el esquema de muestreoconsistente en la seleccion de un elemento, i, con probabilidad proporcional a su tamano, esdecir, pi = Xi/T (X), ∀i ∈ U ; y la seleccion de n − 1 elementos adicionales mediante disenoMAS(N − 1, n− 1) en U − {i}. La importancia de este esquema radica en el siguiente resultado,

Teorema 4 Bajo el diseno muestral originado por el esquema de Lahiri-Midzuno se verifica queY R = (y/x) X es un estimador insesgado de Y .

Demostracion. Estudiemos en primer lugar el diseno muestral resultante. Su espacio muestralesta formado por todas las muestras de tamano n. Para calcular la probabilidad, p(m), de unamuestra del diseno, m, consideremos m∗ = (j1, j2, . . . , jn), muestra ordenada con los mismoselementos de m. Se tiene entonces,

p(m∗) =Xj1

T (X)1

(n− 1)!(N−1

n−1

)y para la muestra m sera,

p(m) =∑

m∗∼m

p(m∗) =∑

i∈m Xi

T (X)1(N−1

n−1

)donde la notacion m∗ ∼ m expresa que la suma se extiende a todas las muestras ordenadas, conlos mismos elementos que la muestra m. Calculemos ahora la esperanza de Y R,

E[(y/x) X] =∑

m∈M

p(m)(y(m)/x(m))X =1

T (X)1(N−1

n−1

) ∑m∈M

nx(m)(y(m)/x(m))X

=1N

1(N−1n−1

) ∑m∈M

∑i∈m

Yi =1N

1(N−1n−1

)T (Y )

(N − 1n− 1

)= Y

2

Para estudiar la varianza de esta estimacion, se pueden seguir varios caminos. Uno de ellosse basa en la tecnica de linealizacion, tomando los terminos lineales del desarrollo de Taylor deY R = (y/x) X en un entorno de (Y ,X),

Y R =y

xX ≈ Y + (y − Y )− Y

X(x−X) = Y + (y −Rx) = Y + z

donde Zi = Yi −R Xi, i ∈ m. Se tiene pues,

V [Y R] ≈ V [z] = − 12n2

∑i,j∈U

(πij − πiπj)(Zi − Zj)2

=∑

i,j∈U

cij(Zi − Zj)2

Jose A. Mayor Gallego. Universidad de Sevilla

Page 14: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 14

siendo,

cij = − 12n2

(πij − πiπj)

Y si tenemos en cuenta que para el diseno que estamos considerando se verifica, vease Fernandezy Mayor (1995),

πi =N − n

N − 1Xi

T (X)+

n− 1N − 1

πij =n− 1N − 1

[N − n

N − 2(Xi + Xj)

T (X)+

n− 2N − 2

]i 6= j

sustituyendo y desarrollando, se obtiene,

cij =N − n

2n2(N − 1)2

[(N − n)

XiXj

(T (X))2+

(n− 1)(1−Xi/T (X)−Xj/T (X))N − 2

]i 6= j

De forma similar, empleando la expresion de Yates-Grundy-Sen para la varianza estimada, sepuede obtener una estimacion de V [Y R].

Otra lınea diferente para el estudio de la varianza, sin emplear tecnicas aproximadas, es laintroducida por Rao y Vijayan (1977). Estos autores consideran la siguiente forma cuadraticapara expresar la varianza, obtenida mediante un calculo directo,

V [Y R] =∑i∈U

αiiY2i +

∑∑i,j∈Ui6=j

αijYiYj

donde,

αii =X

n2(N

n

) (∑m3i

1x(m)

)− 1

N2∀ i ∈ U

αij =X

n2(N

n

) ∑

m3i,j

1x(m)

− 1N2

∀ i 6= j ∈ U

Y aplicando los resultados clasicos sobre estimacion insesgada de formas cuadraticas (veasepor ejemplo Hedayat y Sinha (1991)), obtenemos directamente el siguiente teorema,

Teorema 5 Todo estimador insesgado y no negativo de la anterior varianza, V [Y R], adoptanecesariamente la forma,

V [Y R] = −12

∑∑i,j∈m

αij(m)XiXj

(Yi

Xi− Yj

Xj

)2

Jose A. Mayor Gallego. Universidad de Sevilla

Page 15: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 15

verificando los coeficientes la condicion de insesgadez,

∑m3i,j

αij(m)p(m) = αij ∀ i 6= j ∈ U

2

Como posibles elecciones de αij(m), Rao y Vijayan (1977) sugieren las siguientes,

(a) αij(m) = αij/πij i, j ∈ m

(b) αij(m) = X2

n2x2(m)− X(N − 1)

x(m)Nn(n− 1) i, j ∈ m

En Rao (1966, 1972), Lanke (1974), Rao y Vijayan (1977) y Hedayat y Sinha (1991) puedenencontrarse resultados adicionales relacionados con esta lınea.

4.2. Estrategia insesgada basada en el estimador de Hartley-Ross

Esta estrategia utiliza como diseno muestral el aleatorio simple, MAS(N,n), en combinacioncon un estimador especial definido por Hartley y Ross (1954). Para construir este estimador,consideremos previamente el siguiente estimador, heurıstico, de la media poblacional,

Y′R =

1n

∑i∈m

Yi

XiX = z X

donde Zi = Yi/Xi. Este estimador es sesgado ya que,

B[Y′R] = E[z X]− Y = Z X − Y

= Z X − Z X = −N − 1N

Szx

siendo entonces [−(N − 1)szx/N ] un estimador insesgado de dicho sesgo.

Podemos entonces, sin mas que restar la estimacion insesgada del sesgo, construir el siguienteestimador insesgado de Hartley y Ross para la media poblacional,

Y HR = z X +N − 1

Nszx

= z X +n(N − 1)N(n− 1)

(y − zx)

La varianza de este estimador, ası como su estimacion, adoptan formas muy complicadas,lo que explica que el estimador de Hartley-Ross no se haya popularizado. Para su obtencion,

Jose A. Mayor Gallego. Universidad de Sevilla

Page 16: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 16

Robson (1957) ha empleado el formalismo de “polykays” multivariantes, obteniendo una expresionde V [Y HR] en funcion de medias simetricas poblacionales, a partir de la cual, podemos obtenerun estimador insesgado sin mas que sustituir estas por las correspondientes medias simetricasmuestrales.

Es posible realizar una simplificacion suponiendo que la poblacion es infinita, en cuyo caso seobtiene, empleando la notacion usual,

lımN→∞

V [Y HR] =1n

(σ2

y + Z2σ2

x − 2Zσxy

)+

1n(n− 1)

(σ2

zσ2x + σ2

xz

)≈ 1

n

(σ2

y + Z2σ2

x − 2Zσxy

)aproximacion obtenida tambien, independientemente, por Goodman y Hartley (1958). Estos auto-res proporcionan ademas el siguiente resultado acerca de la comparacion del estimador de Hartleyy Ross y el estimador de razon usual, Y R = (y/x) X,

Teorema 6 Si se ignoran los terminos de orden O(n−2) y superior, el estimador Y HR es maseficiente que el estimador Y R = (y/x) X si y solo si el coeficiente de regresion, β, entre lasvariables Y y X esta mas proximo a Z que R = Y /X. En caso de ser Z = R, ambos estimadoresson igualmente eficientes.

2

Observemos que la condicion propuesta en este teorema no es facil de verificar en la practica,vease Sukhatme et al. (1984). Otras aportaciones relacionadas pueden tambien consultarse enRuiz y Santos (1989), y en Sahoo y Ruiz (1994).

4.3. Estrategia insesgada basada en el estimador de Mickey

Una metodologıa diferente, propuesta por Mickey (1959), se fundamenta en la particion al azarde una muestra aleatoria simple, m, de tamano n, en k grupos, cada uno con l = n/k elementos.Denotando por m1,m2, . . . ,mk a dichos grupos, se definen entonces las cantidades,

y(m−mj), x(m−mj) j = 1, . . . , k

es decir, las medias de Y y X calculadas sobre las submuestras obtenidas omitiendo en m, suce-sivamente, los grupos m1,m2, . . . ,mk.

A partir de las cantidades anteriores, definimos,

y(j)R =

y(m−mj)x(m−mj)

X

j = 1, . . . , k

y(j)M = y

(j)R +

k(N − n + l)N

[y − y

(j)R

x

X

]

Jose A. Mayor Gallego. Universidad de Sevilla

Page 17: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 17

que nos sirven para construir el estimador de Mickey,

Y M =1k

k∑j=1

y(j)M

cuya importancia radica en el siguiente resultado,

Teorema 7 Y M es un estimador insesgado de la media poblacional.

Demostracion. Para probarlo, es suficiente demostrar que para cada j, y(j)M es insesgado respecto

a Y , para ello expresamos dichas cantidades en la forma,

y(j)M =

N − (n− l)N

[y(mj)−

y(m−mj)x(m−mj)

(x(mj)−

NX − (n− l) x(m−mj)N − (n− l)

)]

+n− l

Ny(m−mj)

Por las propiedades del diseno muestral MAS(N,n), sabemos que que si (n− l) unidades sonseleccionadas al azar en m, las l unidades restantes forman una muestra aleatoria seleccionadamediante diseno MAS(N − (n− l), l).

Jose A. Mayor Gallego. Universidad de Sevilla

Page 18: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 18

Ası pues, descomponiendo la esperanza en dos fases, la primera fase, E1, de obtencion de lelementos de entre N − (n − l), supuesto que (n − l) unidades ya han sido seleccionadas; y lasegunda fase, E2, de seleccion de (n− l) elementos a partir de N , obtenemos,

E[y(j)M ] = E2E1[y

(j)M ]

= E2

[N − (n− l)

N

(NY − (n− l) y(m−mj)

N − (n− l)

)+

n− l

Ny(m−mj)

]

= E2

[Y]

= Y

2

4.4. Estrategias cuasi-insesgadas

Ya hemos visto que el estimador de razon, Y R = (y/x) X, en combinacion con el disenomuestral aleatorio simple, da lugar a una estrategia sesgada, en el sentido de que la estimacion loes, siendo el sesgo de orden O(n−1). Denominaremos estrategias cuasi-insesgadas a aquellasque siendo sesgadas, proporcionan estimaciones con sesgo de orden O(n−2) o inferior.

Las estrategias de este tipo, que vamos a considerar estan basadas en el diseno muestralaleatorio simple, MAS(N,n), en combinacion con estimadores especiales, usualmente construidosa partir del estimador Y R = (y/x) X, de forma tal que el sesgo se reduzca en cierto orden deaproximacion.

Ası, el primer estimador que estudiamos se obtiene aplicando una tecnica de tipo jackknife,al estimador Y R = (y/x) X. Para ello, utilizaremos las cantidades introducidas para construir elestimador de Mickey, y definiremos a partir de las mismas el siguiente estimador,

Y J =N − n + l

NkY R − N − n

N

k − 1k

k∑j=1

y(j)R

Observemos que si N es muy elevado, de forma que,

(N − n + l)/N ≈ 1

(N − n)/N ≈ 1

obtenemos la version simplificada,

Y′J = kY R − k − 1

k

k∑j=1

y(j)R

Jose A. Mayor Gallego. Universidad de Sevilla

Page 19: Estimadores de razon: una revisi´on

ESTRATEGIAS INSESGADAS Y CUASI-INSESGADAS 19

que coincide con la forma de jackknife usual, tomando k = n, y por tanto l = 1. Vease Quenoui-lle (1956).

Con respecto a los anteriores estimadores, se tiene el siguiente resultado sobre su sesgo y errorcuadratico medio, cuya demostracion sigue la misma lınea que la realizada para el estimador deMickey.

Teorema 8 El sesgo y el error cuadratico medio del estimador Y J verifican,

B[Y J ] = O(n−2)

ECM[Y J ] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2)

y analogo para Y′J .

2

Este resultado nos dice que, en aproximacion de primer orden, los estimadores Y J e Y′J son

igualmente eficientes que Y R = (y/x) X. Vease Sukhatme et al. (1984).

Otras estrategias cuasi-insesgadas, basadas en diseno MAS(N,n), son las definidas por lossiguientes estimadores,

Estimador de De Pascual (1961),

Y DP = Y R +y − zx

n− 1con Zi =

Yi

Xi

Estimador de Beale (1962),

Y B = Y R

[1 +

(1n− 1

N

)sxy

xy

] [1 +

(1n− 1

N

)s2x

x2

]−1

Estimador de Tin (1965),

Y T = Y R

[1−

(1n− 1

N

)(s2x

x2− sxy

xy

)]

Todos estos estimadores poseen un sesgo de orden O(n−2), y con respecto a su eficiencia, setiene el siguiente resultado,

Teorema 9 Los errores cuadraticos medios de los estimadores de Tin, Beale y De Pascual veri-fican,

ECM[Y T ] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2)

Jose A. Mayor Gallego. Universidad de Sevilla

Page 20: Estimadores de razon: una revisi´on

ESTIMADOR DE RAZON MULTIVARIANTE 20

ECM[Y B] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2)

ECM[Y DP ] =1− f

n

(S2

y +Y

2

X2 S2

x − 2Y

XSxy

)+ O(n−2)

2

Este teorema asegura que, en aproximacion de primer orden, los estimadores de Tin, Beale y DePascual son igualmente eficientes que el estimador de razonY R = (y/x) X, y que el estimador Y J .

En las referencias citadas, y tambien en Williams (1961), Rao (1967), Rao y Beegle (1967)y Rao y Rao (1971) se pueden encontrar comparaciones, tanto analıticas como empıricas, entreestos estimadores. Algunas conclusiones que se desprenden de estos estudios comparativos son,

1. Bajo el modelo de proporcionalidad directa considerado en el enfoque predictivo, con funcionguıa de la varianza v(Xi) = Xi, y tamano muestral no muy reducido, es preferible el empleodel estimador clasico de razon, Y R.

2. El sesgo de Y T es pequeno, y su error cuadratico medio es menor que para el resto de losestimadores, salvo para Y R con v(Xi) = Xi.

3. El estimador de Beale, Y B, no difiere sustancialmente de Y T salvo que n sea muy pequeno.

4. Si lo importante es la reduccion del sesgo, y no necesariamente de error cuadratico medio,Y J y Y M han de ser preferidos al resto de los estimadores.

5. El estimador de Hartley-Ross, Y HR, puede no ser apropiado en ciertas circunstancias, bajoel modelo de proporcionalidad directa considerado. Hartley y Ross (1954), proponen parasu estimador una modificacion basada en la particion en grupos de la muestra.

Ademas de las referencias citadas, veanse tambien Sukhatme et al. (1984), Rao (1988) yHedayat y Sinha (1991).

5. Estimador de razon multivariante

El estimador de razon, Y R = (y/x) X, bajo diseno muestral aleatorio simple, se generaliza, demanera natural, al siguiente estimador de razon multivariante, propuesto por Olkin (1958),

Y MR = yp∑

i=1

wiXi

xi=

p∑i=1

wiY Ri con Y Ri =y

xiXi

siendo Xi1, Xi2, . . . , XiN ; i = 1, . . . , p, p variables auxiliares conocidas, relacionadas con la variablede estudio, Y , con medias poblacionales respectivas Xi, i = 1, . . . , p, y medias muestrales xi, i =

Jose A. Mayor Gallego. Universidad de Sevilla

Page 21: Estimadores de razon: una revisi´on

ESTIMADOR DE RAZON MULTIVARIANTE 21

1, . . . , p. Las cantidades wi son unos pesos que se determinaran en relacion a la eficiencia delestimador.

Al ser combinacion lineal de estimadores sesgados, Y MR tambien lo sera, y su sesgo estara in-fluenciado por la eleccion de los pesos. En este sentido, se tiene el siguiente teorema, cuya de-mostracion se basa en los resultados para el sesgo del estimador de razon univariante bajo disenomuestral MAS(N,n).

Teorema 10 Una condicion necesaria y suficiente para que el estimador Y MR posea sesgo deorden O(n−1) es que

∑pi=1 wi = 1, siendo en tal caso,

B[Y MR] =1− f

n

p∑i=1

wi

(Y

X2i

S2xi −

1Xi

Syxi

)+ O(n−2)

donde S2xi denota la cuasivarianza poblacional de Xi1, . . . , XiN , y Syxi la correspondiente cuasi-

covarianza.2

En lo que sigue, supondremos ya que∑p

i=1 wi = 1, con objeto de controlar el sesgo.

Para el estudio del error cuadratico medio utilizaremos la siguiente expresion, que se obtienemediante un calculo directo,

E[(Y Ri − Y )(Y Rj − Y )

]=

1− f

n

(S2

y −Y

XiSyxi −

Y

XjSyxj +

Y2

Xi XjSxixj

)+ O(n−2)

verificandose el siguiente resultado,

Teorema 11 El error cuadratico medio del estimador multivariante de razon, Y MR, es de ordenO(n−1), siendo ademas,

ECM[Y MR] =1− f

n

p∑∑i,j=1

wiwj

(S2

y −Y

XiSyxi −

Y

XjSyxj +

Y2

Xi XjSxixj

)+ O(n−2)

Demostracion. Al ser∑p

i=1 wi = 1, podemos escribir,

ECM[Y MR] = E

( p∑i=1

wiY Ri − Y

)2 = E

( p∑i=1

wi

(Y Ri − Y

))2

= E

p∑i=1

w2i

(Y Ri − Y

)2+

p∑∑i6=j=1

wiwj

(Y Ri − Y

) (Y Rj − Y

)=

p∑i=1

w2i ECM

[Y Ri

]+

p∑∑i6=j=1

wiwjE[(

Y Ri − Y) (

Y Rj − Y)]

Jose A. Mayor Gallego. Universidad de Sevilla

Page 22: Estimadores de razon: una revisi´on

ESTIMADOR DE RAZON MULTIVARIANTE 22

Y basta aplicar los resultados para el error cuadratico medio del estimador de razon univa-riante, ası como la expresion de E

[(Y Ri − Y )(Y Rj − Y )

], para obtener el resultado propuesto.

2

Planteamos ahora el problema de calcular los pesos de forma que el error sea lo menor posible.Para ello trabajaremos con la aproximacion de primer orden del error cuadratico medio, es decir,

ECM1[Y MR] =1− f

n

p∑∑i,j=1

wiwj

(S2

y −Y

XiSyxi −

Y

XjSyxj +

Y2

Xi XjSxixj

)

que se puede expresar como ECM1[Y MR] = wAw′ siendo w = (w1, . . . , wp), yA = (aij) la matriz de dimension p× p definida como,

aij =1− f

n

(S2

y −Y

XiSyxi −

Y

XjSyxj +

Y2

Xi XjSxixj

)i, j = 1, . . . , p

Observemos que A es simetrica y definida positiva, luego, por la desigualdad de Cauchy gene-ralizada, se tiene,

(ab′)2 ≤ (aAa′)(bA−1b′) ∀a, b ∈ Rp

donde la igualdad se da si y solo si aA = αb siendo α un escalar no nulo. En particular, tomandoa = w, y b = e = (1, . . . , 1), tendremos,

1 = (we′)2 ≤ (wAw′)(eA−1e′)

con lo que (wAw′) toma el valor mınimo si y solo si wA = αe, es decir, w = αeA−1, y a partir dela condicion de normalidad de los pesos, se obtiene el siguiente vector de pesos optimos,

wopt =eA−1

eA−1e′

y con esta eleccion, el termino guıa, es decir, de orden O(n−1) del error cuadratico medio resultaser,

ECM1[Y MR] =1

eA−1e′

Ademas de la fundamental referencia de Olkin, pueden consultarse Sukhatme et al. (1984),donde se realiza un tratamiento exhaustivo del caso p = 2, y Cochran (1993).

Hemos de observar tambien que si la correlacion entre la variable Y y las variables auxiliareses positiva para algunas y negativas para otras, se puede plantear un estimador multivariantemixto basado en una combinacion lineal de estimadores de razon y producto, propuesto porRao y Mudholkar (1967), tomando como base las propiedades del estimador de producto deMurthy (1964).

Jose A. Mayor Gallego. Universidad de Sevilla

Page 23: Estimadores de razon: una revisi´on

ESTIMADOR DE RAZON Y ESTRATIFICACION 23

6. Estimador de razon y estratificacion

En este apartado estudiaremos las formas que adopta el estimador usual de razon cuando seutiliza muestreo estratificado, y mas concretamente, diseno muestral aleatorio simple estratificado,MASE(N,n), consistente en realizar diferentes muestreos aleatorios simples en cada uno de losestratos, siendo N = (N1, . . . , NL) un vector cuyas componentes son los tamanos de los diferentesestratos, y lo mismo para n = (n1, . . . , nL), compuesto por los tamanos de muestra en cadaestrato.

Dependiendo de la metodologıa aplicada, obtendremos dos tipos de estimacion, separada ycombinada.

6.1. Estimacion separada de razon

Teniendo en cuenta la descomposicion usual de la media poblacional como combinacion linealde medias en cada estrato,

Y =L∑

h=1

WhY h

podemos estimar las medias de cada estrato empleando estimadores de razon, obteniendo el esti-mador separado,

Y RS =L∑

h=1

WhY hR

Obviamente, las propiedades de este estimador dependeran de los estimadores de razon utili-zados en los distintos estratos. En particular podra ser sesgado, insesgado o cuasi-insesgado, y sueficiencia, medida por ejemplo en terminos del error cuadratico medio, estara influenciada por laeficiencia de las estimaciones en cada estrato, ya que, por la independencia de las extracciones, setendra,

ECM[Y RS ] =L∑

h=1

W 2h ECM

[Y hR

]En particular, si empleamos los estimadores de razon usuales para el muestreo aleatorio,

Y hR = (yh/xh) Xh = Rh Xk h = 1, . . . , L

obtendremos,

Y RS =L∑

h=1

Whyh

xhXh

Jose A. Mayor Gallego. Universidad de Sevilla

Page 24: Estimadores de razon: una revisi´on

ESTIMADOR DE RAZON Y ESTRATIFICACION 24

que sera sesgado, siendo su sesgo,

B[Y RS ] = E

[L∑

h=1

Whyh

xhXh

]−

L∑h=1

WhY h

= E

[L∑

h=1

Wh

(yh

xhXh − Y h

)]=

L∑h=1

Wh

(E[Rh]E[xh]− E[Rhxh]

)

= −L∑

h=1

Wh Cov[Rh, xh]

y suponiendo para los coeficientes de variacion de xh la acotacion comun CV[xh] = σ[xh]/E[xh] ≤C0, ∀h, obtenemos,

∣∣∣B[Y RS ]∣∣∣ ≤ L∑

h=1

Whσ[Y hR]CV[xh] ≤ C0

L∑h=1

Whσ[Y hR]

que proporciona la siguiente cota,

∣∣∣B[Y RS ]∣∣∣

σ[Y RS ]≤ C0

√L

Podemos pues afirmar que si el numero de estratos es elevado, el sesgo de la estimacion puedellegar a ser apreciable. Ello sugiere el empleo de estimadores insesgados o cuasi-insesgados, sobretodo si los tamanos de muestra en los diferentes estratos no son muy elevados.

Con respecto a error cuadratico medio de la estimacion anterior, tendremos, en primer ordende aproximacion,

ECM1[Y RS ] =L∑

h=1

W 2h

(1nh

− 1Nh

)(S2

yh + R2hS2

xh − 2RhSxyh

)

6.2. Estimacion combinada de razon

Otra posibilidad para reducir el sesgo es emplear el estimador combinado de razon, propuestopor Hansen, Hurwitz y Gurney (1946), y definido como,

Y RC =∑L

h=1 Whyh∑Lh=1 Whxh

X =yest

xestX = Rest X

Este estimador tambien es sesgado, siendo ahora el sesgo,

B[Y RC ] = E[Rest]X − Y

Jose A. Mayor Gallego. Universidad de Sevilla

Page 25: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 25

= E[Rest]E[xest]− E[Restxest]

= −Cov[Rest, xest]

de donde se obtiene,

∣∣∣B[Y RC ]∣∣∣

σ[Y RC ]≤ CV[xest]

es decir, si el coeficiente de variacion de xest es pequeno, el sesgo puede ser despreciable.

Para el error cuadratico medio del estimador combinado tendremos, en primer orden de apro-ximacion,

ECM1[Y RC ] =L∑

h=1

W 2h

(1nh

− 1Nh

)(S2

yh + R2S2xh − 2RSxyh

)Es interesante comparar este error cuadratico medio con el correspondiente del estimador

separado. De esta forma, es inmediato obtener,

ECM1[Y RC ]− ECM1[Y RS ] =L∑

h=1

W 2h

(1nh

− 1Nh

)(S2

xh(R−Rh)2

+ 2(R−Rh)(RhS2xh − Sxyh)

)Como puede verse, la diferencia depende de la variabilidad de las razones, Rh, en los diferentes

estratos, y tambien de las cantidades (RhS2xh−Sxyh). Estas ultimas seran, usualmente, pequenas,

pudiendo ser despreciables si el ajuste al modelo de proporcionalidad directa es muy satisfactorioen todos los estratos. Ası pues, el estimador separado resulta ser mas eficiente que el combinado,a menos que las razones Rh presenten muy poca variabilidad a lo largo de los estratos. VeanseSukhatme et al. (1984), Cochran (1993) y para ejemplos numericos, Fernandez y Mayor (1995).

7. Optimalidad del estimador de razon

Ya hemos visto como, en general, los estimadores de razon no son insesgados en el diseno,esto es, no tienen por que cumplir,

Ed

[Y R

]=∑

m∈M

p(m)Y R(m) = Y

lo que, en principio, los descarta como candidatos a ser considerados optimos. No obstante, sı esposible considerar, bajo un determinado modelo de superpoblacion, la denominada insesgadez enel modelo, segun la definicion que exponemos a continuacion.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 26: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 26

Definicion Dado un diseno muestral, d = (M,p(·)), y un modelo de superpoblacion, S, diremosque el estimador de θ(Y ), θ, es insesgado en el modelo S, si cumple,

Es

[θ − θ(Y )

]= 0 ∀m ∈ M

Por ejemplo, si consideramos el modelo de proporcionalidad directa ya empleado para obtenerel estimador de razon generico,

Yi = βXi + εi

Es[εi] = 0Vs[εi] = σ2v(Xi)Es[εiεj ] = 0, i 6= j

se tendra, con v(x) = x,

Es

[Y R − Y

]= Es

[ ∑i∈m Yi/πi∑i∈m Xi/πi

X − Y

]=∑

i∈m βXi/πi∑i∈m Xi/πi

X − βX = 0

es decir, el estimador de razon generico es insesgado en el modelo, aunque , en general, no lo seaen el diseno. Es obvio que este nuevo concepto de insesgadez se puede considerar mas debil queel usual, en el sentido de que esta supeditado a que el modelo de superpoblacion sea el adecuado.Observemos tambien que, al igual que un estimador puede ser insesgado en el modelo pero no enel diseno, es posible que sea insesgado en el diseno pero no en el modelo. Por ejemplo, en el disenoMAS(N,n), la media muestral, y es un estimador insesgado (en el diseno) de Y , sin embargo,para el modelo de proporcionalidad directa se tiene,

Es[y − Y ] = βx− βX = β(x−X)

que, en general, es distinto de cero.

Bajo este enfoque, que podemos denominar dependiente del modelo es posible obtenerciertas propiedades de optimalidad sobre el estimador de razon, que estudiaremos a continuacion,siguiendo la lınea iniciada en Royall (1970).

Para simplificar la notacion, supondremos que el parametro a estimar es el total poblacional,T (Y ) =

∑i∈U Yi, y que el estimador, T (Y ), se va a buscar en la clase de los estimadores lineales

e insesgados en el modelo.

Observemos que, dada una muestra, m, perteneciente al diseno muestral que estemos emplean-do, T (Y ) admite la descomposicion,

T (Y ) =∑i∈m

Yi +T (Y )−

∑i∈m Yi∑

i∈U−m Xi

∑i∈U−m

Xi =∑i∈m

Yi + β∑

i∈U−m

Xi

Jose A. Mayor Gallego. Universidad de Sevilla

Page 27: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 27

donde la notacion introducida se justifica al ser Es[β] = β, lo que se comprueba facilmente.Ademas, al ser T (Y ) lineal en Yi, i ∈ m, tambien lo sera β, es decir,

β =∑i∈m

αiYi

Dado un diseno muestral, d = (M,p(·)), podemos utilizar la siguiente cantidad,

ECM[T (Y ), d] = EsECMd[T (Y )] = Es

[ ∑m∈M

(T (m,Y )− T (Y )

)2p(m)

]

como medida de la eficiencia del estimador T (Y ). Esta medida involucra tanto el efecto del disenomuestral, como la influencia del modelo de superpoblacion, y en relacion a la misma, se tiene elsiguiente resultado,

Lema Para un diseno muestral cualquiera, d = (M,p(·)), y los estimadores del total,

T ′(Y ) =∑i∈m

Yi + β′∑

i∈U−m

Xi

T ′′(Y ) =∑i∈m

Yi + β′′∑

i∈U−m

Xi

se verifica que si,

Es

[(β′ − β

)2]≤ Es

[(β′′ − β

)2]

∀m ∈ M

entonces,ECM

[T ′(Y ), d

]≤ ECM

[T ′′(Y ), d

]Demostracion. Teniendo en cuenta el modelo de superpoblacion, podemos realizar el siguientedesarrollo,

ECM[T ′(Y ), d

]= Es

[ ∑m∈M

(T (m,Y )− T (Y )

)2p(m)

]

=∑

m∈M

Es

[(T (m,Y )− T (Y )

)2]p(m)

=∑

m∈M

Es

i∈m

Yi + β′∑

i∈U−m

Xi −∑i∈m

Yi −∑

i∈U−m

Yi

2 p(m)

=∑

m∈M

Es

β′

∑i∈U−m

Xi − β∑

i∈U−m

Xi −∑

i∈U−m

εi

2 p(m)

=∑

m∈M

i∈U−m

Xi

2

Es

[(β′ − β

)2]

+ σ2∑

i∈U−m

v(Xi)

p(m)

de donde se deduce inmediatamente el resultado propuesto. 2

Jose A. Mayor Gallego. Universidad de Sevilla

Page 28: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 28

Con respecto a la optimalidad del estimador de razon, se verifica el siguiente resultado funda-mental, en cuya demostracion emplearemos el anterior lema.

Teorema 12 Dado un diseno muestral cualquiera, d = (M,p(·)), sea,

β∗ =∑

i∈m XiYi/v(Xi)∑i∈m X2

i /v(Xi)

y el estimador del total,

T ∗(Y ) =∑i∈m

Yi + β∗∑

i∈U−m

Xi

Entonces se verifica que para cualquier estimador del total, T (Y ), lineal e insesgado en elmodelo,

ECM[T ∗(Y ), d] ≤ ECM[T (Y ), d]

siendo ademas,

ECM[T ∗(Y ), d] = σ2∑

m∈M

(∑i∈U−m Xi

)2∑i∈m X2

i /v(Xi)+

∑i∈U−m

v(Xi)

p(m)

Demostracion. Para la demostracion, nos basaremos en el lema anterior. Sea pues m una mues-tra del diseno, y β lineal en Yi, i ∈ m, esto es,

β =∑i∈m

αiYi

A partir de la condicion Es[β] = β se obtiene la restriccion,

∑i∈m

αiXi = 1

Por otra parte,

Es

[(β − β

)2]

= Es

(∑i∈m

αi(Yi − βXi)

)2

= Es

∑i,j∈m

αiαj(Yi − βXi)(Yj − βXj)

= Es

[∑i∈m

α2i (Yi − βXi)2

]= σ2

∑i∈m

α2i v(Xi)

Jose A. Mayor Gallego. Universidad de Sevilla

Page 29: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 29

que, con la restriccion ya obtenida anteriormente,

∑i∈m

αiXi = 1

alcanza el mınimo para los valores,

αi =Xi/v(Xi)∑

i∈m X2i /v(Xi)

i ∈ m

lo que proporciona precisamente β∗. Hemos demostrado pues que ∀m ∈ M ,

Es

[(β∗ − β

)2]≤ Es

[(β − β

)2]

∀β

y basta tener en cuenta el anterior lema para obtener el resultado de optimalidad enunciado.

Finalmente, la expresion para ECM[T ∗(Y ), d] se obtiene mediante un calculo directo.2

Observemos que para el caso v(x) = x, ya considerado en el enfoque predictivo aplicado alprincipio del tema, se obtiene como estimador optimo,

T ∗(Y ) =∑i∈m

Yi +∑

i∈m YiXi/Xi∑i∈m X2

i /Xi

∑i∈U−m

Xi =y

xT (X)

Este resultado no esta en contradiccion con las buenas propiedades que presenta el estimadorgenerico de razon obtenido en la seccion 3. de esta revision,

TR(Y ) =∑

i∈m Yi/πi∑i∈m Xi/πi

T (X)

en lo que respecta a la estimacion del error. Por otra parte, hay que tener en cuenta que elestimador optimo ha sido buscado en una clase muy especial de estimadores lineales, insesgadospara el modelo, con los inconvenientes de dependencia del mismo que ello supone.

Observemos tambien que para el caso v(x) = x, el error cuadratico medio resulta ser,

ECM[T ∗(Y ), d] = σ2∑

m∈M

(∑i∈U−m Xi)2∑

i∈m X2i /Xi

+∑

i∈U−m

Xi

p(m)

= σ2T (X)Ed

[∑i∈U−m Xi∑

i∈m Xi

]

Jose A. Mayor Gallego. Universidad de Sevilla

Page 30: Estimadores de razon: una revisi´on

OPTIMALIDAD DEL ESTIMADOR DE RAZON 30

Y si denotamos por m∗ la muestra formada por los elementos de la poblacion, tal que,

∑i∈m∗

Xi = maxm∈M

{∑i∈m

Xi

}

el anterior error cuadratico medio sera mınimo para el siguiente diseno muestral intencional,

d∗ = ({m∗}, p(m∗) = 1)

es decir, un diseno con una unica muestra, m∗, que es seleccionada con probabilidad uno. Hemosobtenido pues el siguiente resultado,

Teorema 13 Bajo el modelo de superpoblacion de proporcionalidad directa, con funcion guıa dela varianza v(x) = x, la estrategia muestral (d∗, (y/x) T (X)) es optima para la estimacion deT (Y ).

2

Notemos que el resultado anterior sigue siendo valido si solamente exigimos que v(x) sea nodecreciente, y v(x)/x2 no creciente.

A pesar de su importancia teorica, estos resultados, como afirman Cassel, Sarndal y Wret-man (1977), estan en conflicto con uno de los principios mas extendidos de la Estadıstica como esel de la aleatorizacion. Por otra parte, la estrategia optima anterior es incompatible con el calculoo la estimacion del error.

Como fuentes importantes para profundizar en estas cuestiones, citaremos Royall (1970), Ro-yall y Herson (1973a, 1973b), Royall y Eberhardt (1975), Cassel, Sarndal y Wretman (1977),Bellhouse (1984), Sukhatme et al. (1984) y Chaudhuri y Vos (1988).

Observemos finalmente que es posible plantear el problema complementario de hallar las pro-babilidades de inclusion optimas para que el estimador de razon generico,

TR(Y ) =∑

i∈m Yi/πi∑i∈m Xi/πi

T (X)

sea optimo bajo el modelo de superpoblacion de proporcionalidad directa. Vease Sarndal, Swens-son y Wretman (1992) para un estudio del mismo.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 31: Estimadores de razon: una revisi´on

REFERENCIAS 31

Referencias

[1] Azorın, F. y Sanchez-Crespo, J.L. (1986). Metodos y Aplicaciones del Muestreo. AlianzaUniversidad Textos. Madrid.

[2] Beale, E.M.L. (1962). ‘Some use of computers in operational research’. Industrielle Organi-zation. 31, 27-28.

[3] Bellhouse, D.R. (1984). ‘A review of optimal designs in survey sampling’. The CanadianJournal of Statistics. 12, 53-65.

[4] Cassel, C., Sarndal, C. y Wretman, J. (1977). Foundations of Inference in Survey Sampling.Wiley. New York.

[5] Cochran, W.G. (1978). ‘Laplace’s Ratio Estimator’. Contributions to Survey Sampling andApplied Statistics. H.A. David (ed.). Academic Press. New York.

[6] Cochran, W.G. (1993). Tecnicas de Muestreo. Decima reimpresion. CECSA. Mexico.

[7] Chang, W.-C. (1976). ‘Statistical theories and sampling practice’. On the History of Statis-tics and Probability. D.B. Owen (ed.). Dekker. New York.

[8] Chaudhuri, A. y Vos, J. (1988). Unified Theory and Strategies of Survey Sampling. NorthHolland. Amsterdam.

[9] David, I.P. y Sukhatme, B.V. (1974). ‘On the bias and mean square error of the ratioestimator’. J. Amer. Statist. Assoc. 69, 464-466.

[10] De Pascual, N. (1961). ‘Unbiased ratio estimators in stratified sampling’. J. Amer. Statist.Assoc. 56, 70-87.

[11] Fernandez, F.R. y Mayor, J.A. (1995). Muestreo en Poblaciones Finitas: Curso Basico.E.U.B. Barcelona. (Tambien en P.P.U., (1994)).

[12] Fuller, W.A. (1975). ‘Regression analysis for sample survey’. Sankhya. C37, 117-132.

[13] Goodman, L.A. y Hartley, H.O. (1958). ‘The precision of unbiased ratio-type estimators’.J. Amer. Statist. Assoc. 53, 491-508.

[14] Hald, A. (1990) A History of Probability and Statistics and Their Applications before 1750.Wiley. New York.

[15] Hansen, M.H., Hurwitz, W.N. y Gurney, M. (1946). ‘Problems and methods of the samplesurvey of business’. J. Amer. Statist. Assoc. 41, 173-189.

[16] Hansen, M.H., Hurwitz, W.N. y Madow, W.G. (1953). Sample Survey Methods and Theory.Vol. I y II. Wiley. New York.

[17] Hartley, H.O. y Ross, A. (1954). ‘Unbiased ratio estimators’. Nature. 174, 270-271.

[18] Hedayat, A.S. y Sinha, B.K. (1991). Design and Inference in Finite Population Sampling.Wiley. New York.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 32: Estimadores de razon: una revisi´on

REFERENCIAS 32

[19] Kish, L. y Frankel, M.R. (1974). ‘Inference from complex samples’. J. Roy. Statist. Soc. B36,1-37.

[20] Lahiri, D.B. (1951). ‘A method of sample selection providing unbiased ratio estimates’.Bulletin of the International Statistical Institute. 33, 133-140.

[21] Lanke, J. (1974). ‘On nonnegative variance estimators in survey sampling’. Sankhya. C36,33-42.

[22] Mickey, M.R. (1959). ‘Some finite population unbiased ratio and regression estimators’. J.Amer. Statist. Assoc. 54, 594-612.

[23] Midzuno, H. (1952). ‘On the sampling system with probability proportionate to sum ofsizes’. Annals of the Institute of Statistical Mathematics. 3, 99-107.

[24] Murthy, M.N. (1964). ‘Product method of estimation’. Sankhya. A26, 69-74.

[25] Olkin, I. (1958). ‘Multivariate ratio estimation for finite populations’. Biometrika. 45, 154-165.

[26] Quenouille, M.H. (1956). ‘Notes on bias in estimation’. Biometrika. 43, 353-360.

[27] Rao, C.R. (1965). Linear Statistical Inference and its Applications. Wiley. New York.

[28] Rao, J.N.K. (1967). ‘The precision of Mickey’s unbiased ratio estimator’. Biometrika. 54,321-324.

[29] Rao, J.N.K. y Beegle, L.D. (1977). ‘A Monte Carlo study of some ratio estimators’. Sankhya.B29, 47-56.

[30] Rao, J.N.K. y Vijayan, K. (1977). ‘On estimating the variance in sampling with probabilityproportional to aggregate size’. J. Amer. Statist. Assoc. 72, 579-584.

[31] Rao, P.S.R.S. (1971). ‘Small sample results for ratio estimators’. Biometrika. 58, 625-630.

[32] Rao, P.S.R.S. (1988). ‘Ratio and regression estimators’. Handbook of Statistics 6. Sampling.Krishnaiah y Rao, (Eds.). North Holland. Amsterdam.

[33] Rao, P.S.R.S. y Mudholkar, G.S. (1967). ‘Generalized multivariate estimator for the meanof finite populations’. J. Amer. Statist. Assoc. 62, 1009-1012.

[34] Rao, T.J. (1966). ‘On the variance of the ratio estimator for Midzuno-Sen sampling scheme’.Metrika. 10, 89-91.

[35] Rao, T.J. (1972). ‘On the variance of the ratio estimator’. Metrika. 18, 209-215.

[36] Robson, D.S. (1957). ‘Application of multivariate polykays to the theory of unbiased ratio-type estimators’. J. Amer. Statist. Assoc. 52, 511-522.

[37] Royall, R.M. (1970). ‘On finite population sampling theory under certain linear regressionmodels’. Biometrika. 57, 377-387.

[38] Royall, R.M. y Herson, J. (1973a). ‘Robust estimation in finite populations I’. J. Amer.Statist. Assoc. 68, 880-890.

Jose A. Mayor Gallego. Universidad de Sevilla

Page 33: Estimadores de razon: una revisi´on

REFERENCIAS 33

[39] Royall, R.M. y Herson, J. (1973b). ‘Robust estimation in finite populations II’. J. Amer.Statist. Assoc. 68, 890-894.

[40] Royall, R.M. y Eberhardt, K.R. (1975). ‘Variance estimates for the ratio estimator’. Sankhya.C37, 43-52.

[41] Royall, R.M. y Cumberland, W.G. (1981). ‘An empirical study of the ratio estimator andestimators of its variance’. J. Amer. Statist. Assoc. 76, 66-77.

[42] Ruiz, M. y Santos, J. (1989). ‘Unbiased mean-of-the-ratios estimators’. Statistica. 49, 617-622.

[43] Sahoo, L.N. y Ruiz, M. (1994). ‘Unbiased estimators using auxiliary information in samplesurveys: a review’. Revista de la Academia de Ciencias de Zaragoza. 49, 137-146.

[44] Sanchez-Crespo, J.L. (1980). Curso Intensivo de Muestreo en Poblaciones Finitas. 2a edi-cion. Instituto Nacional de Estadıstica. Madrid.

[45] Sarndal, C. (1984). Inference Statistique et Analyse des Donnees sous des Plans d’Echanti-llonnage Complexes. Presses de l’Universite de Montreal.

[46] Sarndal, C., Swensson, B. y Wretman, J. (1992). Model Assisted Survey Sampling. Springer-Verlag. New York.

[47] Singh, P. y Srivastava, A.K. (1980). ‘Sampling schemes providing unbiased regression esti-mators’. Biometrika. 67, 205-209.

[48] Sukhatme, P.V., Sukhatme, B.V., Sukhatme, S. y Asok, C. (1984). Sampling Theory ofSurveys Applications. Tercera edicion. Iowa State University Press. Ames. Iowa.

[49] Tin, M. (1965). ‘Comparison of some ratio estimators’. J. Amer. Statist. Assoc. 60, 294-307.

[50] Williams, W.H. (1961). ‘Generating unbiased ratio and regression estimators’. Biometrics.17, 267-274.

Jose A. Mayor Gallego. Universidad de Sevilla