guiasjuridicas.es - Documento
El documento tardará unos segundos en cargarse. Espere, por favor.
Frecuencia

Frecuencia

Número total de casos que se repite el valor de una variable, o el número de casos que pertenecen a un intervalo.

Contabilidad y finanzas

Introducción

Una de las funciones principales de la Estadística es la recogida, tabulación y presentación de los datos de una característica determinada de un conjunto de individuos, para después poder extraer conclusiones sobre lo que hay y lo que puede suceder. La recogida de datos puede ser exhaustiva (censo) o, lo que es lo normal, a través de una muestra.

Al plasmar en tablas esta información tomada de la realidad, la variable la distribuiremos en sus diferentes valores si la variable es discreta, o en intervalos si es continua, y asociamos a cada valor o intervalo su frecuencia absoluta, que es el número total de casos que se repite ese valor de la variable, o el número de casos que pertenecen al intervalo. A estas formas de presentación de los datos se les conoce como distribuciones de frecuencias.

Distribuciones unidimensionales

Solo estudiamos una característica de la población.

Distinguimos entre:

a) Frecuencia absoluta: Es el número de veces que aparece un determinado valor en la muestra. Se construye así el par ordenado que representa esta asociación para cada valor i-ésimo de la variable será de la forma (xi, ni), donde:

m=número total de valores distintos que toma la variable en estudio,

xi= valor de la variable, desde i=1 hasta m,

ni= frecuencia absoluta,

N= número total de observaciones.

Propiedad:

• La suma de todas las frecuencias absolutas es igual al número total de observaciones,

b) Frecuencia relativa: Es la proporción que representa la frecuencia absoluta respecto del total de observaciones. Se denota por fi, y se calcula:

Estas frecuencias suelen presentarse en tanto por uno o en porcentajes, para lo que las multiplicamos por cien, y se denota por pi:

pi = fi * 100

Propiedad:

• La suma de todas las frecuencias relativas es igual 1, o igual a 100 si son porcentajes,

Otro tipo importante de frecuencias son las acumuladas, que tendrán sentido cuando la variable estadística sea cuantitativa o cualitativa ordenable. Así, y suponiendo ordenados de menor a mayor los datos según el valor de la variable:

a) Frecuencia absoluta acumulada: Es el número de veces que ha aparecido un valor de la variable menor o igual al de referencia. Se denota por Ni, y para cada valor i-ésimo de la variable vale:

Propiedades:

• La frecuencia absoluta acumulada i-ésima es igual a la frecuencia absoluta acumulada anterior más la absoluta correspondiente a ese valor de la variable:

Ni = Ni-1 + ni

• La última frecuencia absoluta acumulada es igual al número total de observaciones,

b) Frecuencia relativa acumulada: Es la proporción que representa la frecuencia absoluta acumulada respecto del total de observaciones. Se denota por Fi, y se calcula:

o bien:

Estas frecuencias suelen presentarse en tanto por uno o en porcentajes, para lo que las multiplicamos por cien, y se denota por Pi:

Pi = pi * 100

Propiedades:

• La última frecuencia relativa acumulada es igual 1,

• La frecuencia relativa acumulada i-ésima es igual a la frecuencia relativa acumulada anterior más la relativa correspondiente a ese valor de la variable:

Fi = Fi-1 + fi

A continuación se presentan dos ejemplos de estas frecuencias, uno sobre una variable discreta y otro sobre una variable continua, aunque básicamente los cálculos son análogos.

Ejemplo 1 (variable discreta):

Planteamos un estudio sobre el número de ordenadores en los hogares españoles. Para ello se ha seleccionado una muestra de un total de 250 hogares, obteniéndose los siguientes datos:

Número ordenadores en cada hogarFrecuencia absoluta
xini
025
127,5
287,5
352,5
422,5
525
610
TOTALES250

Calculamos:

  • a. Frecuencia absoluta: Columna de la ni.
  • b. Frecuencia relativa y porcentaje: Columna de la fi, y de la pi.
  • c. Frecuencia absoluta acumulada: Columna de la Ni.
  • d. Frecuencia absoluta relativa, y porcentaje absoluto: Columna de la Fi y Pi.
Número ordenadores en cada hogarFrecuencia absolutaFrecuencia relativaPorcentajeFrecuencia absoluta acumuladaFrecuencia relativa acumuladaPorcentaje acumulado
xinifipiNiFiPi
0250,10010,0%250,10010,0%
1280,11211,2%530,21221,2%
2870,34834,8%1400,56056,0%
3530,21221,2%1930,77277,2%
4220,0888,8%2150,86086,0%
5250,10010,0%2400,96096,0%
6100,0404,0%2501,000100,0%
TOTALES2501,000100,0%

Ejemplos (interpretaciones):

  • - n5=22, significa que de la muestra de 250 hogares existen 22 que tienen 4 ordenadores.
  • - f2=0,112 ó p2=11,2 %, significan que en la muestra el 11,2 % de los hogares tienen solo un ordenador en casa.
  • - N5=215, es el número de hogares españoles que tienen 4 ordenadores o menos, es decir, agrega los hogares que tienen 0, 1, 2,3 y 4 ordenadores.

    Así, si quisiéramos calcular los hogares con más de 4 ordenadores, es decir, los que tienen 5 y 6, descontaríamos del total de la muestra (250) los calculados anteriormente, N-N5=250-215=35, luego 35 son los hogares con más de 4 ordenadores.

  • - F4=0,772 o P4=77,2 %, representa que es 77,2 % de los hogares españoles tienen como máximo 3 ordenadores, es decir, tienen 0, 1, 2 o 3.

    Análogamente al ejemplo anterior, podemos calcular el porcentaje de los hogares con más de tres ordenadores, 1-F3=1-0,772=0,228 o 1-P3=1-77,2=22,8 %.

Ejemplo 2 (variable continua):

Cuando la variable es continua o cuando sea discreta tomando esta un número elevado de valores y observaciones, las agrupamos en intervalos para el manejo de los datos, a cambio de esto se produce una pérdida de información sobre los datos. Los intervalos son, por lo general, de esta forma:

[Li-1, Li),

Donde:

Li-1 =extremo inferior del intervalo,

Li al extremo superior.

El intervalo es cerrado por la izquierda y abierto por la derecha, aunque también puede ser al contrario.

Se va a estudiar la altura de un grupo de 300 alumnos. Para ello, la variable altura se ha agrupado en 5 intervalos de la forma siguiente:

Altura en metrosFrecuencia absolutaFrecuencia relativaPorcentajeFrecuencia absoluta acumuladaFrecuencia relativa acumuladaPorcentaje acumulado
[Li-1,Li)nifiipiNiFiPi
[1,50;1,60)320,10710,7%320,10710,7%
[1,60;1,65)480,16016,0%800,26726,7%
[1,65;1,75)930,31031,0%1730,57757,7%
[1,75;1,85)1020,34034,0%2750,91791,7%
[1,85;2,10]250,0838,3%3001,000100,0%
TOTALES3001,000100,0%

Las interpretaciones serían similares a las anteriores, algunos ejemplos son:

  • n2=48, el número de individuos de la muestra que tienen una altura entre 1,60 y 1,65 metros es de 48; que representan el 16,0 % del total de la muestra, como indica f2=0,160 o p2=16 %.
  • P4=91,7 %, representa que el 91,7 % de la muestra mide hasta 1,85 metros, lo que en número son 275 individuos.

Distribuciones bidimensionales

Cuando en una población se estudian dos ó más características a la vez, estamos ante un análisis bidimensional o multidimensional, respectivamente. La tabulación de la información observada se hará mediante las tablas de doble entrada, que recogerán en distintas filas los posibles valores de una variable, por ejemplo la X; y en columnas los de la otra variable, normalmente señalada con la Y; y en las intersecciones las frecuencias conjuntas, que son el número de observaciones que presentan a la vez los valores correspondientes de X e Y, que se denotaran por nij.

Así:

X e Y=Variables objeto de estudio.

xi= los distintos valores de la variable X, toma los valores desde i=1 hasta n.

yj= los distintos valores de la variable Y, toma los valores desde j=1 hasta m.

nij=la frecuencia absoluta conjunta, es el número de observaciones que muestran a la vez los valores xi e yj.

La distribución bidimensional vendrá dada por la terna ordenada (xi,yj,nij), cuya tabulación será a través de las tablas de doble entrada.

X \ Yy1y2yjym-1ym
x1n11n12n1jn1,m-1n1m
x2n21n22n2jn2,m-1n2m
xini1ni2nijni,m-1nim
xx-1nn-1,1nn-1,2nn-1,jnn-1,m-1nn-1,m
xnnn1nn2nn-1,jnn,m-1nnm

Ejemplo 3:

Siguiendo el ejemplo 1, observamos en esos 250 hogares también el número de menores de 16 años que viven en cada uno, y, así construimos la distribución de frecuencias siguiente:

X \ Y0123456
015501112
12595421
21816111514103
34141114910
46544210
54664320
64212100
250

Donde:

X= Nº de ordenadores por hogar.

Y= Nº de menores de 16 años que viven en el hogar.

nij=Frecuencia absoluta conjunta de xi e yj.

Por ejemplo, n35= hay 14 hogares con 2 ordenadores y 4 menores de 16 años.

a) Frecuencias marginales:

Dada una distribución bidimensional, (xi, yj, nij), las distribuciones marginales de frecuencia son cada una de las distribuciones unidimensionales que se deducen obviando la otra dimensión.

Así, las distribuciones marginales serán:

X Y
x1n1. y1n.1
x2n2. y2n.2
xini. yin.i
xn-1nn-1. yn-1n.m-1
xnnn. ynn.m

En nuestro ejemplo:

X Y
025 053
128 153
287 242
353 345
422 434
525 517
610 66
N250 N250

Propiedad:

b) Distribuciones condicionadas:

La distribución condicionada de la variable Y, dado un valor de X=Xi, se define por los valores que toma la variable Y y las frecuencias condicionadas de Y asociadas a dichos valores. Análogamente se definirá una distribución condicionada de la variable X. La distribución de X condicionada a que Y valga un cierto valor se representa por X/Y=y0 o, por el contrario, la distribución de Y condicionada a un valor sobre X será Y/X=x0.

Ejemplo: Con los datos del ejemplo 1, calcularemos la distribución del número de ordenadores X condicionada a que el número de menores de 16 años Y sea igual a 3, es decir, X/y=3.

X / y = 3
01
15
215
314
44
54
62
45

Recuerde que...

  • Distribuciones unidimensionales. Se estudia solo una característica de la población.
  • Distribuciones bidimensionales. Se estudia dos o más características de la población
Subir