jueves, 31 de agosto de 2017

ORGANIZACIÓN DE DATOS AGRUPADOS


DATOS AGRUPADOS

Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos.


Resultado de imagen para datos agrupados animados


• Si no se conocen los intervalos, se pueden determinar de la siguiente manera: 
  1. Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se  determina el rango
  2. Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general se determinan 5 intervalos de lo contrario es ideal que sea un numero impar por ejemplo 5, 7, 9)  obteniéndose así la amplitud o tamaño  de cada intervalo. 
  3. Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer intervalo, se suma a este valor la amplitud para obtener el extremo superior  y así sucesivamente.


Ejemplo: (LIBRO DE SANTILLANA)
En un centro comercial, se consultó la edad a todas las personas que entraban entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:
tablas_de_frecuencias_datos_agrupados.jpg (416×149)
Construye una tabla de frecuencias cuyos datos estén agrupados en ocho intervalos.
1°Para poder construir la tabla de frecuencias lo primero que debemos hacer es calcular el rango.
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.
El dato mayor y el menor lo hemos destacado con color rojo:
Dato mayor - dato menor =  73 - 1 =  72

Por lo tanto; Rango = 72


2. Nos dicen que debemos agruparlo en 8 intervalos o clases, con este dato podemos calcular la amplitud o tamaño de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desean obtener (en este caso son 8).
Amplitud: La amplitud de un intervalo es la diferencia entre el límite superior y el límite inferior. La amplitud(A) de los intervalos puede calcularse mediante la expresión:
tablas_de_frecuencias_datos_agrupados_amplitud.jpg (273×97)
72 / 8 = 9

Por lo tanto la amplitud de cada intervalo será de 9 +1 = 
- El valor de la amplitud se redondea al número inmediato superior de acuerdo a la cantidad de decimales que tienen los datos o según la precisión con que se desea trabajar.
- Puede haber intervalos con distinta amplitud.
- Puede haber intervalos con amplitud indefinida (intervalos abiertos)

3° Ahora podemos comenzar a construir la tabla de frecuencias:
Hay distintas formas de construir los intervalos dependiendo del tipo de variable que estemos trabajando.
a) Variables cuantitativas discretas solo pueden tomar un número finito de valores. Siendo por lo general estos valores los números naturales 1, 2, 3...Un ejemplo son el número de hijos, el número de habitaciones de una vivienda, el número de matrimonios de una persona. Cuando categorizamos variables discretas los límites de clase son idénticos a los límites reales. Por ejemplo, el número de personas que viven en una familia podemos agruparlo, De 1 hasta 2 (0 es imposible no hay ninguna familia sin ningún miembro) De 3 hasta 4, De 5 hasta 7.
b) Variables cuantitativas continuas: Las variables continuas, por el contrario, pueden, tomar un número infinito de valores en cualquier intervalo dado. En este caso los valores se agrupan en intervalos cuyos límites inferior y superior serían los siguientes:
Inferior : Li
Superior: Lsi-1
Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha, es decir que el extremo inferior está incluido en el intervalo, pero el extremo superior no.
Es importante mencionar que las clases o intervalos para las variables continuas pueden ser de tres tipos:
abiertas: clases abiertas tienen límites determinados (a,b), pero los valores que la contienen comprenden valores muy cercanos a estos límites sin comprenderlos a ellos mismos, esto se representa con un intervalo definido entre paréntesis (). Esto quiere decir que esta clase contiene valores desde a hasta b pero no contiene exactamente a ni b solo valores muy cercanos.
cerradas: las clases cerradas, además de los valores que están entre a y b, los contiene a ellos, y se representa con corchetes [a,b].
semiabiertas: pueden contener a o b más los valores que están entre ellos, y se puede representar con un corchete y un paréntesis, por ejemplo, (a,b], en este caso no contiene el valor a y si los valores de  b, además de los valores que están entre estos.

c) Registro discreto de variables continuas: Cuando la variable considerada es continua pero ocurre que la precisión del instrumento de medida se limita a un número finito de datos, existe la opción de construir los intervalos de tal forma que ambos extremos estén incluidos en él. 
Ej 50 a 52, 53 a 55, 56 a 58, 59 al 61 y 62 al 64
Estos serían los límites aparentes de los intervalos.
 Con esta información construiremos la tabla en esta ocasión con el último método explicado.  Registro discreto de variables continuas




Responder las siguientes preguntas:
a) Del total de personas encuestadas, ¿cuántas personas tienen entre 31 y 40 años?

b) Del total de personas encuestadas, ¿cuántas personas tienen 60 o menos años?

c) ¿Cuál es la probabilidad de, que al elegir al azar a un persona consultada, esta tenga entre 11 y 20 años?


d) Si le preguntas a una persona cualquiera ¿Cuál es la probabilidad de que tenga 50 años o menos?



EJERCICIO DE CLASE


Elabora la Tabla de Distribución de Frecuencias para Datos Agrupados, los cuáles corresponden al número de llamadas recibidas al teléfono de emergencia 911, en los últimos 40 días

11,12,14,15,15,16,19,21,21,24, 
25,25,25,26,26,27,29,29,29,30
31,31,31,31,31, 32,32,32,33,33,
33,34,34,34,35,35,36,36,44,51



PROCEDIMIENTO
Los pasos necesarios para la construcción de una tabla de frecuencias para datos agrupados se detallan a continuación:

1. Cálculo del rango o intervalo de clase: Se obtiene la diferencia entre el mayor (H) y el menor (L) valor numérico de todos los datos, la cual nos indicará la distancia mínima  que debe cubrir la suma de los intervalos  de clase.

Rango = (H-L)

2. Elegir el número de clases: Es arbitraria; comúnmente se establecen de 5 a 15 clases dependiendo del número de datos. Sin embargo, seleccione un no. de clases (m), y un ancho de clase (c), de manera que el producto (m)(c), sea un poco mayor o igual que la amplitud o intervalo total.
No. de clases= (m)(c)

3. Elección del límite inferior y superior de la primera o superior de la última clase y cálculo de los límites de las demás clases.

4. Cálculo de los límites reales de cada clase: Recuerde que este valor se obtiene de la siguiente manera:
Para el superior sumando al límite superior del intervalo de clase que se desea obtener ( Ls) el límite inferior del intervalo de clase contiguo superior(Lisig) y el resultado se divide entre dos.

Límite superior real= (Ls+Lisig)/2

Para el inferior sumando al límite inferior de intervalo de clase que se desea obtener (Li) el límite superior del intervalo de clase contiguo anterior (Lsant) y el resultado se divide entre dos.

Límite inferior  real= (Li+Lsant)/2

5. Cálculo de los valores medios de clase (xi) . Si li es el límite inferior de la iésima clase y ls el límite superior, entonces:
                        x= (li + ls)/2
 Es decir, es el punto medio de cada intervalo.

6. Cálculo de las frecuencias absolutas de clase (fi) es igual al número de observaciones que pertenecen a la iésima clase.


7. Cálculo de frecuencias relativas de clase (pi) .

                        pi = f/ número de observaciones
                       
8. Cálculo de las frecuencias acumuladas relativas (Fi)

                        F= p1
                        F2 = F1+ p2
                        F3 = F2+ p3
                        F= F i-1 + pi       (i= 2,3,...,k)

                        donde k es el número total de clases.


9. Cálculo de las frecuencias acumuladas absolutas .  El procedimiento es similar al descrito del punto 7, pero usando frecuencias absolutas en vez de relativas.


Solución:



No hay comentarios:

Publicar un comentario

REPASO

1. Si la probabilidad de que una persona pueda vivir 80 años es de 0.35, considere una muestra de 4 personas y encuentra la probabilidad de ...