guiasjuridicas.es - Documento
El documento tardará unos segundos en cargarse. Espere, por favor.
Modelos de duración

Modelos de duración

Explican los determinantes de la duración temporal de una situación concreta antes de cambiar a otro estado.

Contabilidad y finanzas

Concepto

Los modelos de duración (denominados habitualmente en ciencias naturales modelos de supervivencia) tratan de explicar los determinantes de la duración temporal de una determinada situación antes de cambiar a otro estado. Un ejemplo sencillo de este tipo de modelos es la duración del desempleo de un individuo como función de sus características individuales.

Introducción

Los modelos de duración son un caso particular de modelos donde la variable dependiente es la longitud de tiempo que transcurre entre el momento en que se inicia una situación hasta que se termina, o bien tiene lugar la medición antes de la finalización del fenómeno. Por ejemplo, si estamos interesados en estudiar la duración del tiempo que pasa un individuo en desempleo, las mediciones incluirán la duración del tiempo desempleado para cada individuo, así como sus características personales (formación, sexo, estado civil,...). En muchas ocasiones, los fenómenos de duración corresponden a datos censurados ya que, en el momento de la medición del fenómeno, la situación no ha finalizado (un ejemplo evidente sería el caso del desempleo comentado anteriormente, ya que cuando se toman los datos probablemente algunos individuos continúen en desempleo y no se puede conocer la duración completa de ese estado). El objetivo de este análisis es buscar los determinantes que explican el tiempo que tarda el individuo en cambiar su status.

Modelos estadísticos con datos de duración

La mayor parte de modelos con datos de duración utilizan la variable razón de fallo (hazard function), o λ(t), definida como la probabilidad de finalizar la situación en el instante t sabiendo que dicha situación se ha mantenido hasta ese instante (por ejemplo: habiendo estado desempleado hasta el instante t cual es la probabilidad de encontrar empleo entonces).

Un primer problema al analizar este modelo es que la distribución de la variable duración no será habitualmente normal, sino que la distribución será exponencial, si λ(t) se supone constante en el tiempo, u otras distribuciones (Weibull, lognormal, gamma,..) según sea la forma funcional escogida de λ(t). A modo de ejemplo, si se supone que λ(t)= λp(λt)p-1, con λ y p constantes a determinar, la distribución de la duración sería una variable Weibull.

Una vez especificada la forma funcional de λ(t) y la distribución de la variable duración en el tiempo, es posible utilizar el método de máxima verosimilitud para estimar los parámetros de los cuales depende la razón de fallo, o hazard function, λ(t) y, por ende, la distribución de la variable duración. Al estimar hay que tener en cuenta que, como se comentó inicialmente, en muchas ocasiones la distribución de la variable duración está censurada (la variable duración se observa antes de acabar la situación estudiada) y son necesarios aplicar los métodos desarrollados para el censuramiento y truncamiento de variables.

Una extensión directa de estos modelos es permitir que la razón de fallo dependa de las características individuales, es decir λ(t, xi), donde xi es un vector de características que pueden incluir por ejemplo: formación del individuo, sexo, edad, ... En el modelo con duración tipo Weibull la dependencia entre la razón de fallo y el vector de características es exponencial, es decir, para cada individuo λi = f (t,p)eTxi donde t y p son los mismos que anteriormente y xi cambia para cada individuo.

Por supuesto, para estimar estos modelos hay que aplicar técnicas de máxima verosimilitud incluyendo algoritmos de optimización numérica, ya que los modelos no son lineales. Por otro lado, debido a la no linealidad del modelo, los coeficientes βi no tienen la misma interpretación que en el modelo de regresión habitual aunque, en algunas ocasiones, al ser el modelo linealizable en logaritmos pueden tener interpretación de semielasticidades o elasticidades.

Un ejemplo empírico de este tipo de modelos puede ser una regresión que explica la duración de las huelgas en distintos sectores como función de la producción industrial de cada sector. Si se especifica una razón de fallo λi tipo Weibull como la expuesta en el ejemplo anterior, el modelo estimado es:

donde los valores entre paréntesis indican las desviaciones típicas estimadas de los coeficientes.

La duración de la huelga mediana fue de 27.35 días y la media de 39.83.

Con los parámetros estimados en ese modelo, existe evidencia estadística (medida por los contrastes de significatividad) de una influencia de la producción industrial sobre la posibilidad de finalizar la huelga (medida por la razón de fallo λi). Con el modelo estimado podemos decir que un aumento de un 1 % en la producción industrial xi hará incrementarse λi en un 9.35 % lo cual, con el valor de p aproximadamente uno, significa un decrecimiento también del 9.35 % sobre la mediana de la duración de la huelga, es decir, unos 2.6 días.

Una vez estimado el modelo, se puede realizar un análisis de especificación para ver si las hipótesis realizadas inicialmente (por ejemplo: la especificación a priori de λi y la distribución de la variable duración) son adecuadas o no. Desgraciadamente, los residuos aquí no tienen la misma interpretación que en el análisis de regresión habitual, aunque se pueden utilizar contrastes basados en la función de verosimilitud. En este sentido, es habitual realizar contrastes sobre las estimaciones basados en el test de Wald, multiplicadores de Lagrange y ratio o cociente de verosimilitudes, todos los cuales utilizan las estimaciones máximo-verosímiles.

Recuerde que...

  • Los modelos de duración son un caso particular de modelos donde la variable dependiente es la longitud de tiempo que transcurre entre el momento en que se inicia una situación hasta que se termina, o bien tiene lugar la medición antes de la finalización del fenómeno.
  • El objetivo de este análisis es buscar los determinantes que explican el tiempo que tarda el individuo en cambiar su status.
  • La mayor parte de modelos con datos de duración utilizan la variable razón de fallo, definida como la probabilidad de finalizar la situación en ese instante sabiendo que dicha situación se ha mantenido hasta el momento.
  • Para estimar estos modelos hay que aplicar técnicas de máxima verosimilitud, incluyendo algoritmos de optimización numérica, ya que los modelos no son lineales.
Subir