guiasjuridicas.es - Documento
El documento tardará unos segundos en cargarse. Espere, por favor.
Datos de panel

Datos de panel

Contabilidad y finanzas

Concepto

Las técnicas de datos de panel se aplican a conjuntos de observaciones correspondientes a distintos individuos (por ejemplo: hogares, empresas, personas...) a lo largo del tiempo (habitualmente años, trimestres o meses). Como consecuencia de las peculiaridades de estas bases de datos, se han desarrollado técnicas específicas de regresión que permitan captar la heterogeneidad entre distintos individuos así como la evolución de un mismo individuo a lo largo del tiempo.

Modelos de efectos fijos

En multitud de ocasiones en el análisis económico se intenta explicar la evolución de una variable yit (por ejemplo: el consumo de gasolina por automóvil a lo largo del tiempo) a través de la evolución de otras variables xit (por ejemplo: renta real per capita, precio real de la gasolina y stocks de automóviles por individuo). Desde el punto de vista del análisis de regresión clásico, el modelo a estimar sería el siguiente:

Ln(Yit) = α + β1Ln (x1t) + β2Ln (x2t) + β3Ln (x3t) + uit

Los coeficientes α, β1, β2 y β3 indican, respectivamente, el término independiente de la regresión y los efectos de cada una de las variables independientes xit sobre la variable dependiente yit. Todas las variables están en logaritmos de tal forma que los coeficientes βi representan elasticidades (cambios porcentuales). Si el ruido de la ecuación, uit, se comportase de forma adecuada (técnicamente, fuera un ruido blanco) la ecuación anterior se puede estimar por la técnica de mínimos cuadrados ordinarios habitual. Los resultados de la ecuación estimada, para un total de 18 países de la OCDE en un período de 19 años, serían los siguientes (los datos se han obtenido del libro de texto Econometric Analysis of Panel Data de Baltagi (2005) y se pueden descargar de la página web: www.wiley.com/go/baltagi3e):

Los valores entre paréntesis indican las desviaciones típicas estimadas asociadas a los coeficientes estimados. Si se construyen los estadísticos t de significatividad individual, dividiendo el valor del coeficiente estimado entre su desviación típica, puede comprobarse fácilmente que todos los coeficientes son significativamente distintos de cero ya que los estadísticos t son claramente superiores a los valores críticos de la distribución que suelen estar alrededor de 2.

Un problema en la regresión anterior es que se está imponiendo de forma implícita que todos los individuos se comportan de la misma forma, es decir, no hay heterogeneidad entre los distintos individuos. Para permitir (y contrastar) la existencia de esta heterogeneidad individual, el ruido de la ecuación de regresión se puede reformular como:

uit = μi + vit

donde μi representa el efecto específico asociado a cada individuo, es decir, recoge la heterogeneidad individual, mientras que vit sería la perturbación que recoge el resto de efectos no asociados a la heterogeneidad individual (su comportamiento debería ser similar al ruido blanco de la ecuación de regresión habitual).

Si suponemos que el término de heterogeneidad μi es fijo para cada individuo (no es una variable aleatoria) entonces se puede modelizar a través de una variable dummy binaria para cada individuo. La estimación de este modelo por MCO es inmediata permitiendo que el término constante para cada individuo, dado por α + μi sea distinto para cada individuo del panel. A la técnica de aplicación de mínimos cuadrados con dummies individuales se le denomina LSDV (Least Squares Dummy Variables en sus siglas inglesas) y es válida cuando se supone que la variable individual μi es fija para cada individuo, es decir, no es una variable aleatoria. A modo de ejemplo, en la ecuación de la gasolina estimada por LSDV para los 18 países de la OCDE, los primeros 4 coeficientes individuales serían los siguientes (en realidad, para evitar la multicolinealidad exacta, hay que imponer que el último coeficiente μi sea igual a cero, por lo cual el término constante del último país de la muestra es α ):

País1: 2.286-0.12; País2: 2.286+0.75; País 3: 2.286+0.10; País 4: 2.286-0.08...

Un sencillo contraste de hipótesis para comprobar si el modelo de efectos fijos es adecuado es comprobar si la hipótesis H0: μ1 = μ2 = ... = 0 se cumple. Este es un contraste de hipótesis lineales que se puede realizar mediante las técnicas habituales en el análisis de regresión (por ejemplo, comparando las sumas de cuadrados residuales de los modelos restringidos y sin restringir). En nuestro ejemplo, el estadístico de contraste, con distribución χn2 donde n es el número de países, viene dado por:

Chi^2(18) = 22.56 [0.208]

Entre corchetes se especifica el p-valor de este contraste y, en este caso, es claramente superior a los niveles de significación habituales (en torno a 0.05) por lo cual no se rechazaría la hipótesis de que los términos de heterogeneidad individuales fueran nulos y la regresión inicial fuera adecuada.

Otra técnica de estimación habitual en los modelos de efectos fijos es la estimación Intra (o Within) la cual realiza una transformación previa del modelo restando a cada observación la media de cada individuo. Esta transformación elimina el efecto μi del modelo. Posteriormente, se aplican mínimos cuadrados ordinarios sobre el modelo transformado para obtener las estimaciones de los parámetros βi las cuales coinciden numéricamente con las obtenidas por LSDV (excepto las estimaciones para μi que, como hemos dicho, desaparece del modelo transformado).

En algunas ocasiones, se realiza otra transformación en el modelo de datos de panel consistente en utilizar como observaciones únicamente la media de cada individuo. En este caso se reducen las observaciones a una por individuo (la media de ese individuo a lo largo de los años) y a la aplicación de mínimos cuadrados sobre este modelo transformado se le denomina estimador Entre (o Between).

Modelos de efectos aleatorios

En muchas ocasiones, no se puede suponer que el efecto de heterogeneidad individual μi es fijo sino que es una variable aleatoria. Por ejemplo, esta es la situación cuando el panel de datos no incluye todos los individuos sino solo una muestra de ellos, por lo cual no tiene sentido estimar un efecto μi para cada individuo ya que no se dispone de información sobre todos ellos. En este caso el efecto de heterogeneidad μi no observable tiene un comportamiento aleatorio en lugar de una variable fija como anteriormente. A este tipo de modelo con datos de panel se le denomina modelo de efectos aleatorios y la técnica de estimación de los parámetros βi depende del comportamiento de la variable aleatoria μi en relación con las variables xit.

Efecto aleatorio μi incorrelacionado con los regresores xit

En este caso la aplicación de mínimos cuadrados es válida aunque, debido a la estructura del ruido μit = μit + vit, hay autocorrelación entre las perturbaciones y se han de aplicar mínimos cuadrados generalizados (MCG o GLS en inglés). Para aplicar esta técnica se han de estimar los parámetros de la estructura de autocorrelación del ruido conjuntamente con los parámetros βi del modelo. Como hay distintas formas de estimar los parámetros de autocorrelación en el ruido del modelo, también hay distintos estimadores MCG posibles entre los cuales destacan el estimador por máxima verosimilitud y el estimador de Balestra-Nerlove.

A modo de ejemplo vamos a estimar por MCG la ecuación de inversión clásica de Grunfeld cuya especificación viene dada por:

Iit = α + β1Fit + β2 Cit + uit

uit = μi + vit

La variable Iit representa la inversión real bruta de la firma i-ésima en el instante t, Fit es el valor real de la firma (en acciones) y Cit es el valor real del stock de capital. Para estimar esta ecuación se dispone de una muestra de 10 grandes firmas sobre un período de 20 años (en este caso vamos a suponer que las firmas son una muestra de todas las empresas de la población). Si se supone que el efecto de heterogeneidad μi es una variable aleatoria incorrelacionada con Fit y Cit las estimaciones MCG, por máxima verosimilitud, vendrán dadas por:

Si hay correlación entre el efecto de heterogeneidad μi y las variables independientes xit entonces la estimación por cualquier tipo de mínimos cuadrados no será consistente y se ha de abandonar la estimación por MCG propuesta anteriormente. Una posibilidad ampliamente utilizada es transformar el modelo tomando diferencias, es decir, restando a cada valor de la variable el valor anterior (Δxit = xit - xi, t-1). Por ejemplo, en el caso anterior de la ecuación de inversión, el modelo transformado sería el siguiente:

ΔIit = β1ΔFit + β2ΔCit + ΔμitΔμit = Δvit.

Hay que observar que, al tomar diferencias, los parámetros βi siguen siendo los mismos del modelo original (salvo el término constante que desaparece). Además, el ruido del modelo en diferencias (Δμit) ya no contiene el término de heterogeneidad μi, por lo cual el ruido del modelo Δμit y las variables independientes Δxit están incorrelacionados y la aplicación de mínimos cuadrados permite obtener estimadores consistentes. La estimación por mínimos cuadrados ordinarios del modelo anterior en diferencias da la siguiente ecuación estimada:

Efecto aleatorio μi correlacionado con los regresores xit

Si hay correlación entre el efecto de heterogeneidad μi y las variables independientes xit entonces la estimación por cualquier tipo de mínimos cuadrados no será consistente y se ha de abandonar la estimación por MCG propuesta anteriormente. Una posibilidad ampliamente utilizada es transformar el modelo tomando diferencias, es decir, restando a cada valor de la variable el valor anterior (Δxit = xit - xi, t-1). Por ejemplo, en el caso anterior de la ecuación de inversión, el modelo transformado sería el siguiente:

ΔIit = β1ΔFit + β2ΔCit + ΔμitΔμit = Δvit.

Hay que observar que, al tomar diferencias, los parámetros βi siguen siendo los mismos del modelo original (salvo el término constante que desaparece). Además, el ruido del modelo en diferencias (Δμit) ya no contiene el término de heterogeneidad μi, por lo cual el ruido del modelo Δμit y las variables independientes Δxit están incorrelacionados y la aplicación de mínimos cuadrados permite obtener estimadores consistentes. La estimación por mínimos cuadrados ordinarios del modelo anterior en diferencias da la siguiente ecuación estimada:

Hay que resaltar que, aunque estuviéramos en el caso anterior de incorrelación entre el efecto μi y los regresores xit, las estimaciones de mínimos cuadrados sobre el modelo en diferencias seguirían siendo consistentes. Es decir, la aplicación de MCO sobre el modelo en diferencias permite obtener de forma general estimadores consistentes al eliminar el término de heterogeneidad μi del modelo para datos de panel. De hecho, si las estimaciones MCG y MCO en diferencias son bastante similares, esto es un indicio de la incorrelación entre el efecto μi y las variables xit ya que, en este caso, ambos estimadores serían consistentes mientras que si existiera correlación solo lo sería el segundo.

Otra opción para estimar cuando hay correlación entre μi y xit es utilizar alguna técnica basada en variables instrumentales. Estas estimaciones parten del uso de variables instrumento que estén muy correlacionadas con los regresores xit e incorrelacionadas con μi. Si se cumplen ambas condiciones, se pueden obtener estimaciones consistentes mediante la aplicación de técnicas similares a mínimos cuadrados utilizando las variables instrumento conjuntamente con las originales. En principio, hay tantas posibilidades de estimación por variables instrumentales como instrumentos disponibles por lo cual, en la práctica, a veces no resulta sencilla la estimación con estas técnicas.

Por último, otra posibilidad de transformación del modelo alternativa a tomar diferencias es la utilización del estimador Intra el cual, como vimos anteriormente, resulta de la aplicación de mínimos cuadrados a un modelo en el que a cada variable se le resta la media temporal. Esta transformación también elimina el efecto μi del modelo, por lo cual la aplicación de mínimos cuadrados en el modelo transformado permite obtener estimadores consistentes. A modo de ejemplo, la estimación Intra de la ecuación de inversión da las siguientes estimaciones:

Donde I*it = Iit - i ; F*it = Fit - i ; C*it = Cit - i.

Paneles dinámicos

En algunas ocasiones, entre las variables independientes se incluye la propia variable dependiente retardada lo cual implica que el modelo en cuestión es un modelo dinámico. Por ejemplo, un modelo con datos de panel dinámicos sencillo vendría dado por la siguiente expresión:

yit = α + β1y1, t-1 + β2x2t + μit

μit = μi + vit

En estos modelos por construcción siempre existe una correlación no nula entre y1, t-1 y μi lo cual invalida la estimación por cualquier tipo de mínimos cuadrados. Una alternativa sería la aplicación de variables instrumentales (buscando variables instrumento para la variable y1, t-1) aunque, en este caso, lo más habitual es utilizar un estimador del tipo método generalizado de momentos (GMM) denominado estimador de Arellano-Bond. Este estimador aprovecha la estructura particular del modelo para buscar el máximo número de instrumentos posibles, dentro de la propia información disponible en el panel de datos, y estimar así de forma consistente y óptima. Los detalles técnicos son relativamente complejos aunque versiones de este estimador están implementadas dentro de las técnicas a aplicar para paneles dinámicos en la mayor parte del software econométrico disponible.

Recuerde que...

  • Modelos de efectos aleatorios: Efecto aleatorio μ iincorrelacionado con los regresores x it y Efecto aleatorio μ icorrelacionado con los regresores x it.
Subir