Para las variables cuantitativas,
consideraremos dos tipos de gráficos, en función de que para realizarlos se
usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas
diferenciales:
Son
aquellos en los que se representan frecuencias absolutas o relativas. En ellos
se representa el número o porcentaje de elementos que presenta una modalidad
dada.
Diagramas
integrales:
Son
aquellos en los que se representan el número de elementos que presentan una
modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias
acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de
gráficos no tiene sentido para variables cualitativas.
Según hemos visto existen dos tipos
de variables cuantitativas: discretas y continuas. Vemos a continuación las
diferentes representaciones gráficas que pueden realizarse para cada una de
ellas así como los nombres específicos que reciben.
Cuando representamos una variable discreta, usamos el diagrama
de barras cuando pretendemos hacer una gráfica diferencial. Las barras
deben ser estrechas para representar el que los valores que toma la variable
son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la
variable, forma de escalera. Un ejemplo de diagrama de barras así como su
diagrama integral correspondiente están representados en la figura 1.
Ejemplo
Se lanzan tres monedas al aire en 8
ocasiones y se contabiliza el número de caras, X, obteniendose los
siguientes resultados:
Representar gráficamente el
resultado.
Solución: En primer
lugar observamos que la variable X es cuantitativa discreta, presentando
las modalidades:
Ordenamos a
continuación los datos en una tabla estadística, y se representa la misma en la
figura 1.
Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas. |
xi |
ni |
fi |
Ni |
Fi |
0 |
1 |
1/8 |
1 |
1/8 |
1 |
3 |
3/8 |
4 |
4/8 |
2 |
3 |
3/8 |
7 |
7/8 |
3 |
1 |
1/8 |
8 |
8/8 |
|
n=8 |
1 |
|
|
Clasificadas 12 familias por su
número de hijos se obtuvo:
Número de
hijos (xi) |
1 |
2 |
3 |
4 |
Frecuencias
(ni) |
1 |
3 |
5 |
3 |
Comparar los diagramas de barras para frecuencias absolutas
y relativas. Realizar el diagrama acumulativo creciente.
Solución: En primer
lugar, escribimos la tabla de frecuencias en el modo habitual:
Variable |
F.
Absolutas |
F.
Relativas |
F.
Acumuladas |
xi |
ni |
fi |
Ni |
1 |
1 |
0,083 |
1 |
2 |
3 |
0,250 |
4 |
3 |
5 |
0,416 |
9 |
4 |
3 |
0,250 |
12 |
|
12 |
1 |
|
Con las columnas relativas a xi y ni
realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra
en la figura 1.7.
Como puede verse es idéntico (salvo un cambio de escala en el eje de ordenadas)
al diagrama de barras para frecuencias relativas y que ha sido calculado usando
las columnas de xi y fi. El diagrama
escalonado (acumulado) se ha construido con la información procedente de las
columnas xi y Ni.
Figura: Diagramas
de frecuencias para una variable discreta |
|
Cuando las variables son continuas,
utilizamos como diagramas diferenciales los histogramas y los polígonos
de frecuencias.
Un histograma se
construye a partir de la tabla estadística, representando sobre cada intervalo,
un rectángulo que tiene a este segmento como base. El criterio para calcular la
altura de cada rectángulo es el de mantener la proporcionalidad entre las
frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.
El polígono
de frecuencias se construye fácilmente si tenemos representado
previamente el histograma, ya que consiste en unir mediante lineas rectas los
puntos del histograma que corresponden a las marcas de clase. Para representar
el polígono de frecuencias en el primer y último intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia
nula, y se unen por una línea recta los puntos del histograma que corresponden
a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias
tiene en común con el histograma el que las áreas de la gráficas sobre un
intervalo son idénticas. Véanse ambas gráficas diferenciales representadas en la
parte superior de la figura 2.
El diagrama integral para una
variable continua se denomina también polígono de
frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a
partir de los extremos de los intervalos en los que hemos organizado la tabla
de la variable, y en ordenadas por alturas que son proporcionales a las
frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias
absolutas es una primitiva del histograma. Véase la parte inferior de la figura
2, en la que se representa a modo de ilustración los diagramas correspondientes
a la variable cuantitativa continua expresada en la tabla siguiente:
Intervalos |
ci |
ni |
Ni |
|
0 -- 2 |
1 |
2 |
2 |
|
2 -- 4 |
3 |
1 |
3 |
|
4 -- 6 |
5 |
4 |
7 |
|
6 -- 8 |
7 |
3 |
10 |
|
8 - 10 |
9 |
2 |
12 |
|
|
|
12 |
|
|
|
|
|
|
|
Figura 2 : Diagramas diferenciales e integrales para una variable continua. |
La siguiente distribución se
refiere a la duración en horas (completas) de un lote de 500 tubos:
Duración
en horas |
Número de
tubos |
300 --
500 |
50 |
500 --
700 |
150 |
700 --
1.100 |
275 |
más de
1.100 |
25 |
|
Total 500 |
Solución: En primer lugar observamos que la
variable en estudio es discreta (horas completas), pero al tener un
rango tan amplio de valores resulta más conveniente agruparla en intervalos,
como si de una variable continua se tratase. La consecuencia es una ligera
perdida de precisión.
El último intervalo está abierto por el límite
superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo
con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen
una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300
horas1.2.
Antes de realizar el histograma conviene hacer una
observación importante. El histograma representa las frecuencias de los
intervalos mediante áreas y no mediante alturas. Sin embargo
nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas
últimas. Si todos los intervalos tienen la misma amplitud no es necesario
diferenciar entre los conceptos de área y altura, pero en este caso el tercer
intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su
área en un rectángulo de base doble (lo que reduce su áltura a la mitad).
Así será conveniente añadir a la habitual tabla de
frecuencias una columna que represente a las amplitudes ai de
cada intervalo, y otra de frecuencias relativas rectificadas, fi',
para representar la altura del histograma. Los gráficos requeridos se
representan en las figuras 3 y 4.
Intervalos |
ai |
ni |
fi |
fi' |
Fi |
300 -- 500 |
200 |
50 |
0,10 |
0,10 |
0,10 |
500 --
700 |
200 |
150 |
0,30 |
0,30 |
0,40 |
700 --
1.100 |
400 |
275 |
0,55 |
0,275 |
0,95 |
1.100 --
1.300 |
200 |
25 |
0,05 |
0,05 |
1,00 |
|
|
n=500 |
|
|
|
Figura 3: Histograma.
Obsérvese que la altura del histograma en cada intervalo es fi'
que coincide en todos con fisalvo en el intervalo 700 --
1.100 en el que ya que la amplitud de ese
intervalo es doble a la de los demás. |
|
Figura 4: Diagrama
acumulativo de frecuencias relativas |
|
Por otro lado, mirando la figura 2 se ve que sumando frecuencias relativas,
hasta las 900 horas de duración hay
0,10 + 0,30
+ 0,275 = 0,675 = 67,5 % de los tubos.
Esta cantidad se obtiene de modo más directo viendo a
qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas
(figura 4).
Como en total son 500 tubos, el número de tubos con
una duración igual o menor que 900 horas es , redondeando, 338 tubos.
Tabla: Principales
diagramas según el tipo de variable. |
|
Tipo de
variable |
Diagrama |
|
|
V. Cualitativa |
Barras, sectores, pictogramas |
|
|
|
|
V. Discreta |
Diferencial (barras) |
|
Integral (en escalera) |
|
|
|
|
V. Continua |
Diferencial (histograma, polígono
de frecuencias) |
|
Integral (diagramas acumulados) |
|
|