guiasjuridicas.es - Documento
El documento tardará unos segundos en cargarse. Espere, por favor.
Covarianza

Covarianza

La covarianza entre dos variables indica el grado de inercia lineal que existe en la relación entre los valores de ambas.

Contabilidad y finanzas

Concepto

Desde un punto de vista intuitivo, la covarianza entre dos variables indica el grado de inercia lineal que existe en la relación entre los valores de ambas, si es que existiese tal relación. Es importante recalcar que tal inercia es única y exclusivamente de carácter lineal.

Desde un punto de vista formal, la covarianza de las variables X e Y se define como el momento central de órdenes (1;1) de la variable bidimensional (X;Y),m11, y se denota por Sxy:

En la expresión anterior puede apreciarse que la covarianza entre X e Y no es sino la media ponderada de los productos . Nótese que este producto será positivo cuando valores grandes de X (mayores que su media) vengan acompañados por valores elevados de Y (mayores que su media), o cuando valores pequeños de X (inferiores a su media) se den conjuntamente con valores pequeños de Y (menores que su media). Dicho producto será negativo cuando valores de X superiores a su media se hagan acompañar de valores de Y inferiores a la suya, o cuando valores de X menores que su media aparezcan conjuntamente con valores de Y mayores que la suya. De ahí que la covarianza muestre la inercia lineal existente en la relación entre los valores de dos variables.

Cálculo

El cálculo de la covarianza se simplifica si se tiene en cuenta que m11 = a11 - a10 a01 con

es decir, la covarianza se puede expresar como la media del producto menos el producto de las medias.

Su campo de variación es (-Sx Sy; Sx Sy). Efectivamente, como, por la desigualdad de Cauchy-Schwarz se tiene que:

dividiendo por N en ambos lados de la desigualdad, se llega a que S2xy≤ S2xS2y con lo que - Sx Sy ≤ Sxy ≤ Sx Sy

Obviamente, para determinar la intensidad de la inercia lineal existente en el movimiento conjunto de ambas variables no solo es necesario calcular la varianza entre ambas, sino que también se exigirá calcular el correspondiente límite del campo de su campo de variación. Dado que dicho límite varía con cada pareja de conjuntos de datos, sería bueno identificar unos límites que resultasen independientes de las variables entre las cuales se pretende medir la covarianza. Esta solución se denomina coeficiente de correlación lineal.

Interpretación

Como ya se había avanzado anteriormente, un valor de la covarianza distinto de cero puede interpretarse como revelador de cierta dependencia (relación) lineal entre las variables, tanto mayor cuanto más se acerque la covarianza a su valor máximo. Si el valor de la covarianza es negativo, la relación lineal entre ambas variables también tendrá dicho carácter, es decir, a medida que aumenta X disminuye Y, y cuando disminuye X aumenta Y. En otros términos, la recta que representa tal relación tiene pendiente negativa. Por el contrario, si el valor de la covarianza es positivo, la relación lineal entre ambas variables también tendrá dicho carácter, es decir, a medida que aumenta X aumenta Y, y cuando disminuye X también disminuye Y. Es decir, la recta que representa tal relación tiene pendiente positiva.

No obstante, el hecho de que el valor de la covarianza entre dos variables sea distinto de cero no significa que la recta sea la mejor forma de caracterizar la relación entre ambas, pues ello solo es cierto cuando dicho valor se aproxime a los límites del campo de variación anteriormente expuestos. Si no es así, puede que sí o puede que no.

A modo de ejemplo, considérese la nube de puntos expuesta en el gráfico (a). En este caso, la covarianza entre ambas variables es elevada (y positiva, aunque esto no es importante a estos efectos) y, por consiguiente, la recta representa ciertamente bien la relación existente entre ambas.

En el gráfico (b) las variables X e Y, cuyos valores conjuntos vienen representados en la nube de puntos, tienen una covarianza también positiva pero alejada del máximo Sx Sy. Evidentemente, la relación entre ellas es de tipo parabólico (y además funcional) y si pretende representarse dicha relación mediante una recta, dicha relación no quedará bien representada. Sí existe una cierta inercia lineal en el comportamiento conjunto de las variables, pero dicha inercia no representa el tipo de relación real que ambas presentan.

Finalmente, si la covarianza es nula, ello implica ausencia de relación lineal entre las variables. Sin embargo indica solo eso: ausencia de correlación lineal, lo cual no impide que pueda haber una relación de otro tipo. Lógicamente, si dos variables son independientes, lo son bajo cualquier forma de relación y, por lo tanto, bajo la forma lineal, por lo cual su covarianza será nula. Sin embargo, recalcamos de nuevo, el recíproco no tiene por qué ser cierto.

En el gráfico (c) puede verse que la relación entre las variables X e Y es de la forma Y = X2. Por tanto, se trata de una relación parabólica funcional. En este caso, la covarianza es nula. ¿Por qué? Porque no existe relación lineal alguna entre las variables. O mejor dicho, sí existe. Existen dos relaciones lineales: una negativa en la rama izquierda de la parábola y otra positiva en la rama derecha. Pero como ambas son de la misma intensidad, se compensan y anulan la relación lineal general. Por consiguiente, este ejemplo ilustra perfectamente el hecho de que una covarianza nula únicamente implica ausencia de relación lineal entre las variables, pudiéndola haber de otro tipo (incluso funcional).

Propiedades

Véanse a continuación algunas propiedades interesantes de la covarianza:

  • 1) A la covarianza no le afectan los cambios de origen. En efecto, si se generan dos nuevas variables X' e Y', con valores: xi' = xi + a ; yj' = yj + a, siendo a una constante, la covarianza entre las nuevas variables será:

    es decir, la misma que antes de que a ambas variables se le sumara la constante. En otros términos, las variables toman valores más elevados, pero mantienen su inercia lineal conjunta.

  • 2) A la covarianza sí le afectan los cambios de escala. Si se generan dos nuevas variables X' e Y', con valores xi' = axi; yj' = byj la covarianza entre las nuevas variables será:

    es decir, la covarianza queda multiplicada por dichas constantes. Nótese que ello no significa que se haya fortalecido la relación lineal existente entre ambas variables, puesto que los límites de su campo de variación también quedan multiplicados por dichas constantes.

  • 3) Si se divide una distribución de frecuencias en G grupos disjuntos, la covarianza de la distribución se puede descomponer como sigue:

    donde el primer término del lado derecho de la igualdad es la media ponderada de las covarianzas intragrupos, siendo la ponderación el tamaño relativo de cada grupo, y el segundo la covarianza global bajo la suposición de que todos los elementos del grupo adoptan idénticos valores de las variables X e Y: las correspondientes medias del grupo.

    El primero de dichos términos se denomina covarianza intragrupos y el segundo tiene que ver con la covarianza intergrupos, en la medida en que cada uno de ellos viene representado por sus valores medios, recogiendo la ponderación el efecto del tamaño del grupo.

    Por consiguiente, la covarianza total de una distribución bidimensional de frecuencias se puede descomponer en dos partes: una que recoge la covarianza entre los elementos del grupo, suponiendo que todos ellos toman los valores medios de X e Y de su grupo; y otra que considera la disparidad de valores X e Y dentro de cada grupo y agrega las covarianzas de cada uno de ellos ponderadas por su tamaño relativo.

Recuerde que...

  • La covarianza se puede expresar como la media del producto menos el producto de las medias.
  • A la covarianza no le afectan los cambios de origen.
  • A la covarianza sí le afectan los cambios de escala.
  • La covarianza total de una distribución bidimensional de frecuencias se puede descomponer en dos partes.
Subir