Elección de las clases
En cuanto a la elección de las
clases, deben seguirse los siguientes criterios en función del tipo de variable
que se estudia:
Cuando se trate de variables cualitativas o cuasicuantitativas, las clases ci serán de tipo nominal;
En el caso de variables
cuantitativas, existen dos posibilidades:
S
;
Si la variable es continua las clases vendrán definidas
mediante lo que denominamos intervalos. En este caso, las modalidades
que contiene una clase son todos los valores numéricos posibles contenidos en
el intervalo, el cual viene normalmente definido de la forma
o bien
En
estos casos se llamara amplitud del intervalo a las cantidades
y marca de clase ci, a un
punto representativo del intervalo. Si éste es acotado, tomamos como marca de
clase al punto más representativo, es decir al punto medio del intervalo
La marca de clase no es más que una forma abreviada de representar un intervalo mediante uno de sus puntos. Por ello se ha tomado como representante, el punto medio del mismo. Esto está plenamente justificado si se recuerda que cuando se mide una variable continua como el peso, la cantidad con cierto número de decimales que expresa esta medición, no es el valor exacto de la variable, sino una medida que contiene cierto margen de error, y por tanto representa a todo un intervalo del cual ella es el centro.
En el caso de variables continuas, la forma de la tabla estadística es la siguiente:
Elección de números intervalos para variables continuas
El número de
intervalos, k, a utilizar no está determinado de forma fija y por tanto
tomaremos un k que nos permita trabajar cómodamente y ver bien la
estructura de los datos; Como referencia nosotros tomaremos una de los
siguientes valores aproximados:
Por ejemplo si el número de
observaciones que se tiene es n=100, un buen criterio es agrupar las observaciones
en
intervalos.
Sin embargo si se tiene n=1.000.000,
será mas razonable elegir
intervalos, que