datos agrupados 04

25
Datos agrupados G. Edgar Mata Ortiz 4

Upload: edgar-mata

Post on 21-Jan-2017

34.908 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Datos agrupados 04

Datos agrupados

G. Edgar Mata Ortiz

4

Page 2: Datos agrupados 04

IntroducciónEn esta serie de 4 presentaciones se construye una tabla de datos agrupados paso por paso.

El objetivo es mostrar detalladamente las operaciones aritméticas necesarias para resumir un conjunto de datos, agrupándolos en 10 intervalos.

Se incluye el cálculo de intervalos aparentes y reales además de las medidas de tendencia central y dispersión más usuales. Lim. Inferior Lim . Superior

Totales

=

Desv iación media =

=

=

Frecuencias Medidas de tendencia central y dispersión

Clases o categoríasIntervalos

Marcas de clase

ix if ifa ifr ifra i if x i ix x f 2

i ix x f

Page 3: Datos agrupados 04

Datos agrupadosProcedimiento para datos agrupadosEn esta última sección, vamos a calcular algunas medidas de tendencia central y dispersión:- Media aritmética- Desviación media- Varianza- Desviación estándar

s

Page 4: Datos agrupados 04

Datos agrupados1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

1 81 52 81 64 83 79 77 74 79 70 77 77 62 67 812 71 68 71 85 65 91 51 61 80 82 63 91 71 74 783 86 65 66 56 73 75 83 62 70 60 68 86 66 83 754 67 45 78 77 83 65 89 54 60 69 75 66 73 72 685 86 76 48 66 67 74 58 70 60 49 88 56 68 90 756 74 70 85 73 76 66 72 87 69 70 66 70 55 88 707 71 80 70 75 76 69 71 77 72 63 64 56 57 66 808 75 74 90 89 81 64 62 91 61 62 64 58 72 69 599 75 71 79 86 74 74 75 81 67 97 54 73 80 63 70

10 63 67 49 100 66 79 71 77 75 60 66 58 72 57 60

Page 5: Datos agrupados 04

Datos agrupados16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

62 67 79 71 79 65 70 84 62 73 87 65 72 65 9272 59 60 66 63 83 65 87 62 79 89 51 70 70 5654 62 82 78 64 76 71 71 73 53 68 85 77 68 7267 77 42 80 68 64 73 55 79 43 58 74 78 79 5767 66 75 77 66 73 76 70 54 90 61 62 90 81 8166 83 69 72 65 85 74 79 59 72 78 67 81 77 5778 54 77 77 79 75 75 62 73 80 53 89 59 67 7881 65 62 63 85 68 74 75 61 60 62 50 94 77 9165 80 73 81 50 75 89 71 59 79 83 80 92 69 5775 69 60 73 62 83 72 66 85 61 52 86 55 83 80

Page 6: Datos agrupados 04

Datos agrupadosEn las tres presentaciones anteriores se llevaron a cabo los primeros diez pasos.

Se calcularon los intervalos aparentes y reales, las marcas de clase y las frecuencias; absoluta, acumulada, relativa y relativa acumulada.

Lim. Inferior Lim . Superior

Totales

=

Desviación media =

=

=

Frecuencias Medidas de tendencia central y dispersión

Clases o categoríasIntervalos

Marcas de clase

ix if ifa ifr ifra i if x i ix x f 2

i ix x f

Page 7: Datos agrupados 04

Datos agrupados

Marcas de Frecuencia Frecuencia Frecuencia FrecuenciaLímite Límite clase absoluta acumulada relativa rel . acumulada

inferior superior40.5 46.5 43.5 3 3 0.010000 0.01000046.5 52.5 49.5 9 12 0.030000 0.04000052.5 58.5 55.5 23 35 0.076667 0.11666758.5 64.5 61.5 43 78 0.143333 0.26000064.5 70.5 67.5 62 140 0.206667 0.46666770.5 76.5 73.5 63 203 0.210000 0.67666776.5 82.5 79.5 53 256 0.176667 0.85333382.5 88.5 85.5 26 282 0.086667 0.94000088.5 94.5 91.5 16 298 0.053333 0.99333394.5 100.5 97.5 2 300 0.006667 1.000000

Intervalos reales

ݔ � � ݎ� � ݎ

La última frecuencia relativa acumulada debe ser igual a uno.

Page 8: Datos agrupados 04

Datos agrupadosUndécimo paso: Determinar la media aritmética de los datos:

Para este undécimo paso vamos a agregar una columna en la que se multipliquen las marcas de clase por las frecuencias absolutas correspondientes:

En este punto es donde se pierde algo de exactitud.

Marcas de FrecuenciasLímite Límite clase F. absoluta

inferior superior40.5 46.5 43.5 3

Intervalos reales

ݔ �

Page 9: Datos agrupados 04

Datos agrupadosSe pierde algo de exactitud en los cálculos porque:Si se multiplica la frecuencia absoluta por la marca de clase es como si sumáramos todos los datos pero considerando que todos los valores dentro de cada intervalo son iguales a su marca de clase.

Marcas de FrecuenciasLímite Límite clase F. absoluta

inferior superior40.5 46.5 43.5 3

Intervalos reales

ݔ �Los valores encontrados dentro del primer intervalo fueron: 42, 43 y 45. Si los sumamos: 42+43+45 = 130Al multiplicar 43.5x3 = 130.5

Evidentemente no son iguales:130 ≠ 130.5

Se considera que el error no es significativo.

Page 10: Datos agrupados 04

Datos agrupadosUndécimo paso: Determinar la media aritmética de los datos:

Esta pérdida de exactitud es suficientemente pequeña como para permitirnos usar los resultados con confianza.

Si calculamos la media aritméticas sin agrupar datos, sumando uno por uno y dividiendo entre 300 es: 71.18333

En cambio, el resultado que obtenemos al agrupar datos es: 71.36

Page 11: Datos agrupados 04

Datos agrupados

Marcas de Frecuencia Frecuencia Frecuencia Frecuenciaclase absoluta acumulada relativa rel . acumulada

43.5 3 3 0.010000 0.010000 130.5049.5 9 12 0.030000 0.040000 445.5055.5 23 35 0.076667 0.116667 1276.5061.5 43 78 0.143333 0.260000 2644.5067.5 62 140 0.206667 0.466667 4185.0073.5 63 203 0.210000 0.676667 4630.5079.5 53 256 0.176667 0.853333 4213.5085.5 26 282 0.086667 0.940000 2223.0091.5 16 298 0.053333 0.993333 1464.0097.5 2 300 0.006667 1.000000 195.00

Suma = 21408.00Media aritmética: 71.36

ݔ � � ݎ� � ݎ �ݔ

��ҧൌݔ

Page 12: Datos agrupados 04

Datos agrupadosUndécimo paso: Determinar la media aritmética de los datos:

Si calculamos la media aritméticas sin agrupar datos, sumando uno por uno y dividiendo entre 300 es: 71.18333

Aplicando el proceso de datos agrupados la media aritmética fue: 71.36

Existe diferencia pero no es significativa.

Page 13: Datos agrupados 04

Datos agrupadosUndécimo paso: Determinar la media aritmética de los datos:

La media aritmética nos indica el punto medio de los datos, es una medida de tendencia central.

Existen otras medidas de tendencia central como la mediana y la moda.

Consulta el procedimiento para obtenerlas

Page 14: Datos agrupados 04

Datos agrupadosDuodécimo paso: Determinar la desviación media de los datos:

Para estudiar un conjunto de datos no es suficiente con conocer su tendencia central.

Se necesita determinar la dispersión de los datos, es decir, que tanto se alejan de la media aritmética.

Un valor que nos indica esta dispersión es la desviación media de los datos.

Page 15: Datos agrupados 04

Datos agrupadosDuodécimo paso: Determinar la desviación media de los datos:

Esta desviación media es el promedio de las distancias de cada dato respecto a la media, aunque en datos agrupados, ya vimos que se usa la marca de clase para representar todos los datos dentro de un intervalo.

El procedimiento es:

i ix x f

Page 16: Datos agrupados 04

Datos agrupadosDuodécimo paso: Determinar la desviación media de los datos:

i ix x f Diferencia absoluta entre

cadamarca declase y lamedia porla frecuencia absoluta

Page 17: Datos agrupados 04

Datos agrupadosDuodécimo paso: Determinar la desviación media de los datos:

Para los primeros dos intervalos es:

La tabla siguiente incluye esta columna.

43.5 71.36 3 27.86 3 27.86 3 83.58i ix x f

49.5 71.36 9 21.86 9 21.86 9 196.74i ix x f

Page 18: Datos agrupados 04

Datos agrupados

Marcas de Frecuencia Frecuencia Frecuencia Frecuenciaclase absoluta acumulada relativa rel . acumulada

43.5 3 3 0.010000 0.010000 130.50 83.5849.5 9 12 0.030000 0.040000 445.50 196.7455.5 23 35 0.076667 0.116667 1276.50 364.7861.5 43 78 0.143333 0.260000 2644.50 423.9867.5 62 140 0.206667 0.466667 4185.00 239.3273.5 63 203 0.210000 0.676667 4630.50 134.8279.5 53 256 0.176667 0.853333 4213.50 431.4285.5 26 282 0.086667 0.940000 2223.00 367.6491.5 16 298 0.053333 0.993333 1464.00 322.2497.5 2 300 0.006667 1.000000 195.00 52.28

Suma = 21408.00 2616.80Media aritmética: 71.36

Desviación media: 8.72266667

ݔ � � ݎ� � ݎ �ݔ

��ҧൌݔ

ݔ ൌݔ�ҧ�

��௫ҧൌܦ

Page 19: Datos agrupados 04

Datos agrupadosDecimotercer paso: Determinar la varianza y la

desviación estándar de los datos: s2 y sPosteriormente abordaremos el tema de media, varianza y desviación estándar de una muestra y una población.

El procedimiento está dado por:

2

i ix x f

Page 20: Datos agrupados 04

Datos agrupadosDecimotercer paso: Determinar la varianza y la

desviación estándar de los datos: s2 y s

2

i ix x f El cuadradodela diferencia

decadamarca declase y lamedia porla frecuencia absoluta

Page 21: Datos agrupados 04

Datos agrupadosDecimotercer paso: Determinar la varianza y la

desviación estándar de los datos: s2 y sPara los primeros dos intervalos:

Agregamos una columna más a la tabla.

2 2(43.5 71.36) 3 (776.1976)3 2328.5388i ix x f

2 2(49.5 71.36) 3 (477.8596)9 4300.7364i ix x f

Page 22: Datos agrupados 04

Datos agrupadosMarcas de Frecuencia Frecuencia Frecuencia Frecuencia

clase absoluta acumulada relativa rel . acumulada

43.5 3 3 0.010000 0.010000 130.50 83.58 2328.538849.5 9 12 0.030000 0.040000 445.50 196.74 4300.736455.5 23 35 0.076667 0.116667 1276.50 364.78 5785.410861.5 43 78 0.143333 0.260000 2644.50 423.98 4180.442867.5 62 140 0.206667 0.466667 4185.00 239.32 923.775273.5 63 203 0.210000 0.676667 4630.50 134.82 288.514879.5 53 256 0.176667 0.853333 4213.50 431.42 3511.758885.5 26 282 0.086667 0.940000 2223.00 367.64 5198.429691.5 16 298 0.053333 0.993333 1464.00 322.24 6489.913697.5 2 300 0.006667 1.000000 195.00 52.28 1366.5992

Suma = 21408.00 2616.80 34374.12Media aritmética: 71.36

Desviación media: 8.72266667Varianza: 114.5804

Desviación estándar: 10.70422347

Medidas de tendencia central y dispersión

ݔ � � ݎ� � ݎ �ݔ

��ҧൌݔ

ݔ ൌݔ�ҧ�

��௫ҧൌܦ

ሺݔ ൌݔ�ҧሻଶ �

��ଶൌݏݏ ൌ��

Page 23: Datos agrupados 04

Datos agrupadosEn la siguiente diapositiva podemos ver la tabla completa.

En posteriores presentaciones abordaremos el tema de la representación gráfica de los datos.

Además es necesario contextualizar la información para interpretar las tablas y gráficas obtenidas en estas cuatro presentaciones.

Page 24: Datos agrupados 04

Datos agrupadosMarcas de Frecuencia Frecuencia Frecuencia Frecuencia

Límite Límite clase absoluta acumulada relativa rel . acumulada

inferior superior40.5 46.5 43.5 3 3 0.010000 0.010000 130.50 83.58 2328.538846.5 52.5 49.5 9 12 0.030000 0.040000 445.50 196.74 4300.736452.5 58.5 55.5 23 35 0.076667 0.116667 1276.50 364.78 5785.410858.5 64.5 61.5 43 78 0.143333 0.260000 2644.50 423.98 4180.442864.5 70.5 67.5 62 140 0.206667 0.466667 4185.00 239.32 923.775270.5 76.5 73.5 63 203 0.210000 0.676667 4630.50 134.82 288.514876.5 82.5 79.5 53 256 0.176667 0.853333 4213.50 431.42 3511.758882.5 88.5 85.5 26 282 0.086667 0.940000 2223.00 367.64 5198.429688.5 94.5 91.5 16 298 0.053333 0.993333 1464.00 322.24 6489.913694.5 100.5 97.5 2 300 0.006667 1.000000 195.00 52.28 1366.5992

Suma = 21408.00 2616.80 34374.12Media aritmética: 71.36

Desviación media: 8.72266667Varianza: 114.5804

Desviación estándar: 10.70422347

Medidas de tendencia central y dispersión

Intervalos reales

ݔ � � ݎ� � ݎ �ݔ

��ҧൌݔ

ݔ ൌݔ�ҧ�

��௫ҧൌܦ

ሺݔ ൌݔ�ҧሻଶ �

��ଶൌݏݏ ൌ��

Page 25: Datos agrupados 04

Gracias por su atención

[email protected]://licmata-math.blogspot.com/http://www.scoop.it/t/mathematics-learninghttp://www.slideshare.net/licmata/http://www.facebook.com/licemataTwitter: @licemata