---

Gráficos para variables cuantitativas

Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:

---

Diagramas diferenciales:

Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.

 

---

Diagramas integrales:

Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.

Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.

---

Gráficos para variables discretas

Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente están representados en la figura 1.

---

Ejemplo

Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el número de caras, X, obteniendose los siguientes resultados:

\begin{displaymath}X{\leadsto}\, 2,1,0,1,3,2,1,2
\end{displaymath}


Representar gráficamente el resultado.

---

Solución: En primer lugar observamos que la variable X es cuantitativa discreta, presentando las modalidades:

 

\begin{displaymath}X\in{0,1,2,3}
\end{displaymath}


Ordenamos a continuación los datos en una tabla estadística, y se representa la misma en la figura 1.

 

  

Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsérvese que el diagrama integral (creciente) contabiliza el número de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas.

\includegraphics[angle=0, width=0.8\textwidth]{fig01-06.eps}

 

xi

ni

fi

Ni

Fi

0

1

1/8

1

1/8

1

3

3/8

4

4/8

2

3

3/8

7

7/8

3

1

1/8

8

8/8

 

n=8

1

 

 

---

Ejemplo

Clasificadas 12 familias por su número de hijos se obtuvo:

Número de hijos (xi)

1

2

3

4

Frecuencias (ni)

1

3

5

3

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar el diagrama acumulativo creciente.

---

Solución: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:

Variable

F. Absolutas

F. Relativas

F. Acumuladas

xi

ni

fi

Ni

1

1

0,083

1

2

3

0,250

4

3

5

0,416

9

4

3

0,250

12

 

12

1

 

Con las columnas relativas a xi y ni realizamos el diagrama de barras para frecuencias absolutas, lo que se muestra en la figura 1.7. Como puede verse es idéntico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras para frecuencias relativas y que ha sido calculado usando las columnas de xi y fi. El diagrama escalonado (acumulado) se ha construido con la información procedente de las columnas xi y Ni.

 

  

Figura: Diagramas de frecuencias para una variable discreta

\includegraphics[angle=0, width=0.8\textwidth]{fig01-07.eps}

 

---

Gráficos para variables continuas

Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.

---

Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.

---

El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase. Obsérvese que de este modo, el polígono de frecuencias tiene en común con el histograma el que las áreas de la gráficas sobre un intervalo son idénticas. Véanse ambas gráficas diferenciales representadas en la parte superior de la figura 2.

---

El diagrama integral para una variable continua se denomina también polígono de frecuencias acumulado, y se obtiene como la poligonal definida en abcisas a partir de los extremos de los intervalos en los que hemos organizado la tabla de la variable, y en ordenadas por alturas que son proporcionales a las frecuencias acumuladas. Dicho de otro modo, el polígono de frecuencias absolutas es una primitiva del histograma. Véase la parte inferior de la figura 2, en la que se representa a modo de ilustración los diagramas correspondientes a la variable cuantitativa continua expresada en la tabla siguiente:

Intervalos

ci

ni

Ni

 

0 -- 2

1

2

2

 

2 -- 4

3

1

3

 

4 -- 6

5

4

7

 

6 -- 8

7

3

10

 

8 - 10

9

2

12

 

 

 

12

 

 

 

 

 

 

 

 

Figura  2 : Diagramas diferenciales e integrales para una variable continua.

\includegraphics[angle=0, width=0.5\textwidth]{fig01-08.epsi}

 

 

---

Ejemplo

La siguiente distribución se refiere a la duración en horas (completas) de un lote de 500 tubos:

Duración en horas

Número de tubos

300 -- 500

50

500 -- 700

150

700 -- 1.100

275

más de 1.100

25

 

Total 500

 

---

Solución: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero al tener un rango tan amplio de valores resulta más conveniente agruparla en intervalos, como si de una variable continua se tratase. La consecuencia es una ligera perdida de precisión.

El último intervalo está abierto por el límite superior. Dado que en él hay 25 observaciones puede ser conveniente cerrarlo con una amplitud ``razonable''. Todos los intervalos excepto el tercero tienen una amplitud de 200 horas, luego podríamos cerrar el último intervalo en 1.300 horas1.2.

Antes de realizar el histograma conviene hacer una observación importante. El histograma representa las frecuencias de los intervalos mediante áreas y no mediante alturas. Sin embargo nos es mucho más fácil hacer representaciones gráficas teniendo en cuenta estas últimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de área y altura, pero en este caso el tercer intervalo tiene una amplitud doble a los demás, y por tanto hay que repartir su área en un rectángulo de base doble (lo que reduce su áltura a la mitad).

Así será conveniente añadir a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas rectificadas, fi', para representar la altura del histograma. Los gráficos requeridos se representan en las figuras 3 y 4.

Intervalos

ai

ni

fi

fi'

Fi

300 -- 500

200

50

0,10

0,10

0,10

500 -- 700

200

150

0,30

0,30

0,40

700 -- 1.100

400

275

0,55

0,275

0,95

1.100 -- 1.300

200

25

0,05

0,05

1,00

 

 

n=500

 

 

 

 

Figura 3: Histograma. Obsérvese que la altura del histograma en cada intervalo es fi' que coincide en todos con fisalvo en el intervalo 700 -- 1.100 en el que $f_i{\mbox{$'$ }}= 1/2\, f_i$ya que la amplitud de ese intervalo es doble a la de los demás.

\includegraphics[angle=0, width=0.7\textwidth]{fig01-09.eps}

 

 

Figura 4: Diagrama acumulativo de frecuencias relativas

\includegraphics[angle=0, width=0.8\textwidth]{fig01-10.eps}

 

Por otro lado, mirando la figura  2 se ve que sumando frecuencias relativas, hasta las 900 horas de duración hay

0,10 + 0,30 + 0,275 = 0,675 = 67,5 % de los tubos.

Esta cantidad se obtiene de modo más directo viendo a qué altura corresponde al valor 900 en el diagrama de frecuencias acumuladas (figura 4).

Como en total son 500 tubos, el número de tubos con una duración igual o menor que 900 horas es $
0,675 \times 500= 337,5
$, redondeando, 338 tubos.

 

Tabla: Principales diagramas según el tipo de variable.

Tipo de variable

Diagrama

 

 

V. Cualitativa

Barras, sectores, pictogramas

 

 

 

 

V. Discreta

Diferencial (barras)

 

Integral (en escalera)

 

 

 

 

V. Continua

Diferencial (histograma, polígono de frecuencias)

 

Integral (diagramas acumulados)

 

 

 

 

 

---