mediana y moda para datos agrupados

23
MEDIANA Y MODA PARA DATOS AGRUPADOS Cálculo de la moda para datos agrupados 1º Todos los intervalos tienen la misma amplitud. L i-1 es el límite inferior de la clase modal. f i es la frecuencia absoluta de la clase modal. f i--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. f i-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. a i es la amplitud de la clase. También se utiliza otra fórmula de la moda que da un valor aproximado de ésta: Ejemplo Calcular la moda de una distribución estadística que viene dada por la siguiente tabla: f i [60, 63) 5 [63, 66) 18 [66, 69) 42 [69, 72) 27 [72, 75) 8 100

Upload: jose-martin-pereira-ortega

Post on 01-Jul-2015

3.505 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: MEDIANA Y MODA PARA DATOS AGRUPADOS

MEDIANA Y MODA PARA DATOS AGRUPADOS

Cálculo de la moda para datos agrupados

1º Todos los intervalos tienen la misma amplitud.

L i -1 es el límite inferior de la clase modal.

f i es la frecuencia absoluta de la clase modal.

f i - -1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.

f i -+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

a i es la amplitud de la clase.

También se utiliza otra fórmula  de la moda que da un valor aproximado  de ésta:

Ejemplo

Calcular  la moda de una distribución estadística que viene dada por la siguiente tabla:

fi

[60, 63) 5

[63, 66) 18

[66, 69) 42

[69, 72) 27

[72, 75) 8

100

Page 2: MEDIANA Y MODA PARA DATOS AGRUPADOS

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula  de la moda aproximada  cuando existen distintas amplitudes es:

Mediana

Es el valor  que ocupa el lugar central  de todos los datos cuando éstos están ordenados de menor a

mayor.

La mediana  se representa por Me .

La mediana  se puede hallar sólo para variables cuantitativas .

Cálculo de la mediana

1 Ordenamos  los datos de menor a mayor .

2 Si la serie tiene un número impar de medidas  la mediana  es la puntuación central  de la misma.

Page 3: MEDIANA Y MODA PARA DATOS AGRUPADOS

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie tiene un número par  de puntuaciones la mediana  es la media entre las dos puntuaciones

centrales .

7, 8, 9, 10, 11, 12Me= 9.5

Cálculo de la mediana para datos agrupados

La mediana  se encuentra en el intervalo  donde la frecuencia acumulada  l lega hasta la mitad de la suma

de las frecuencias absolutas .

Es decir tenemos que buscar el intervalo en el que se encuentre   .

L i -1 es el límite inferior de la clase donde se encuentra la mediana.

 es la semisuma de las frecuencias absolutas.

F i -1 es la frecuencia acumulada  anterior a la clase mediana.

a i es la amplitud de la clase.

La mediana  es independiente  de las amplitudes  de los intervalos .

Ejemplo

Calcular  la mediana  de una distribución estadística que viene dada por la siguiente tabla:

fi Fi

[60, 63) 5 5

[63, 66) 18 23

[66, 69) 42 65

[69, 72) 27 92

[72, 75) 8 100

100

Page 4: MEDIANA Y MODA PARA DATOS AGRUPADOS

100 / 2 = 50

Clase modal: [66, 69)

Media aritmética

La media aritmética  es el valor  obtenido al sumar todos los datos y dividir  el resultado entre

el número total dedatos.

 es el símbolo de la media aritmética .

Ejemplo

Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.

Media aritmética para datos agrupados

Si los datos vienen agrupados  en una tabla de frecuencias, la expresión de la  media es:

Ejercicio de media aritmética

Page 5: MEDIANA Y MODA PARA DATOS AGRUPADOS

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la

tabla. Calcula la puntuación media .

xi fi xi · fi

[10, 20) 15 1 15

[20, 30) 25 8 200

[30,40) 35 10 350

[40, 50) 45 9 405

[50, 60 55 8 440

[60,70) 65 4 260

[70, 80) 75 2 150

42 1 820

Propiedades de la media aritmética

1 La suma de las desviaciones  de todas las puntuaciones de una distribución respecto a la  media de la

misma igual a cero.

Las suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:

8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =

= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0

2 La media aritmética  de los cuadrados de las desviaciones de los valores de la variable con respecto a

unnúmero cualquiera se hace mínima  cuando dicho número coincide con la media aritmética .

3 Si a todos los valores de la variable se les  suma un mismo número, la media

aritmética  queda aumentada  en dicho número.

Page 6: MEDIANA Y MODA PARA DATOS AGRUPADOS

4 Si todos los valores de la variable se multiplican  por un mismo número la media

aritmética  quedamultiplicada  por dicho número.

Observaciones sobre la media aritmética

1 La media se puede hallar sólo para variables cuantitativas .

2 La media es independiente  de las amplitudes  de los intervalos .

3 La media es muy sensible a las puntuaciones extremas . Si tenemos una distribución con los siguientes

pesos:

65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.

La media es igual a 74 kg, que es una medida de centralización  poco representativa de la distribución.

4 La media no se puede calcular si hay un intervalo con una amplitud indeterminada .

C)   TRATAMIENTO PARA DATOS AGRUPADOS. Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se agrupan los datos. Pasos para agrupar datos.a. Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor b. Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente

tabla.   

 Tamaño de muestra o No. De datos Número de clasesMenos de 50 5 a 750 a 99 6 a 10100 a 250 7 a 12250 en adelante 10 a 20

 

Page 7: MEDIANA Y MODA PARA DATOS AGRUPADOS

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo. c. Determinar la amplitud de clase para agrupar (C). 

 

  

d.      Formar clases y agrupar datos.Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente. Ejemplo:Los siguientes datos se refieren al diámetro en pulgadas de un engrane. 6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.006.50 6.50 6.50 6.25 6.25 6.50 6.65 7.007.25 6.70 6.00 6.75 6.00 6.75 6.75 7.107.00 6.70 6.50 6.75 6.25 6.65 6.75 7.107.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15

 a) Agrupe datos, considere k=6.b) Obtenga: Histograma, polígono de frecuencias, ojiva y distribución de probabilidad.c)      Obtenga: media, mediana, moda y desviación estándar.Solución:a)      Agrupando datos; 

1.      R= VM - Vm = 7.25 – 6.00 = 1.25            2.     k = 6

            3.                 4.Formando clases. Para formar la primera clase se toma un valor un poco menor que el valor menor encontrado en la muestra; luego,   LI         LS Frecuencia Marca de

claseLímite real inferior

Límite real superior

Frecuencia relativa

Frecuencia Relativa acumulada

5.97 – 6.18 2 6.075 5.965 6.185 2/40 = 0.05 0.056.19 – 6.40 5 6.295 6.185 6.405 5/40=0.125 0.1756.41 – 6.62 7 6.515 6.405 6.625 0.175 0.3506.63 – 6.84 13 6.735 6.625 6.845 0.325 0.6756.85 – 7.06 7 6.955 6.845 7.065 0.175 0.8507.07 – 7.28 6 7.175 7.065 7.285 0.15 1.000Total 40 1.000

  b)      Gráficas:

  

 

Page 8: MEDIANA Y MODA PARA DATOS AGRUPADOS

  

 

a)      Media ( ).

Page 9: MEDIANA Y MODA PARA DATOS AGRUPADOS

  

= Donde:k = número de clasesxi = marca de clase ifi = frecuencia de la clase i

n =  número de datos en la muestra b)      Mediana (Xmed).  

                   

 Donde:Li = límite real inferior de la clase que contiene a la medianaFme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la medianafme = frecuencia de la clase en donde se encuentra la medianaA = amplitud real de la clase en donde se encuentra la medianaA = LRS-LRILRS = límite real superior de la clase que contiene a la medianaLRI = límite real inferior de la clase que contiene a la medianaN = número de datos en la muestra f)   Moda (Xmod).  

 Donde:Li = límite real inferior de la clase que contiene a la moda

d1 =  =

d2 =  =fmo = frecuencia de la clase que contiene a la modafmo-1= frecuencia de la clase anterior a la que contiene a la modafmo+1= frecuencia de la clase posterior a la que contiene a la modaA = amplitud real de la clase que contiene a la modaA = LRS – LRILRS = límite real superior de la clase que contiene a la modaLRI = límite real inferior de la clase que contiene a la moda  g)   Desviación estándar (S). 

Page 10: MEDIANA Y MODA PARA DATOS AGRUPADOS

                         

                            

                   = Donde:xi = marca de clase i

= media aritméticafi = frecuencia de la clase i

                   = número total de datos en la muestra

 1.3 CALCULO DE LA MEDIA MEDIANA Y MODA

Medidas de tendencia central:

La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen como medidas de posición.

Media

La media es el punto en una distribución de medidas, alrededor del cual las desviaciones sumadas son iguales a cero. Es el valor promedio de una muestra o población. La media es muy sensible a mediciones extremas que no estén balanceadas en ambos lados. Se pueden calcular diversos tipos de media, siendo las más utilizadas:

a. Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:

b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica.

La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.

Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.

Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

Mediana

Page 11: MEDIANA Y MODA PARA DATOS AGRUPADOS

Observación u observación potencial en un conjunto que divide el conjunto, de modo que el mismo número de observaciones estén en cada uno de sus lados. Para un número impar de valores, es el valor de en medio; para un número par es el promedio de los dos medios. Para un conjunto con un número par de números, la mediana será el promedio aritmético de los dos números medios.

Ejemplo:

Calcule la mediana para los siguientes datos.

La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22.Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25.

La mediana es 21.

La mediana de una muestra de datos organizados en una distribución de frecuencias se calcula mediante la siguiente fórmula:

Mediana = LRI + [(n/2 - FA)/f] c

donde L es el límite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana.

MODA

La moda es el valor de la observación que aparece con más frecuencia.

Ejemplo:

las calificaciones de un examen de diez estudiantes son:

81, 93, 84, 75, 68, 87, 81, 75, 81, 87.

Como la calificación 81 es la que más ocurre, la calificación modal es 81

La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor.

Cuando dos valores ocurren una gran cantidad de veces, la distribución se llama bimodal, como en dicho ejemplo.

Ejemplo de cálculo de media mediana y moda. Para ejemplificar, tomaremos el ejemplo de autobuses foráneos de la pagina 6.

Clase Intervalo LRI LRS Frec. Absoluta Frec. Relat Frec. Porcentual X fx

LI LS

1 1 2.9 0.95 2.95 8 .16 16 % 1.95 15.60

2 3 4.9 2.95 4.95 11 .22 22 % 3.95 43.45

3 5 6.9 4.95 6.95 10 .20 20 % 5.95 59.50

4 7 8.9 6.95 8.95 10 .20 20 % 7.95 79.50

5 9 10.9 8.95 10.95 5 .10 10 % 9.95 49.75

6 11 12.9 10.95 12.95 6 .12 12 % 11.95 71.70

total 50 1 100 % 319.50

 

Page 12: MEDIANA Y MODA PARA DATOS AGRUPADOS

 

1. MEDIA

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número total de observaciones. 

Ecuación 5-1 Cuando los valores representan una población la ecuación se define como:

Ecuación 5- 2 Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de la población todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como 

Ecuación 5-3 Donde (X) representa la Media para la muestra, (n) el tamaño de la muestra y (Xi) representa cada uno de los valores observados. Esta fórmula únicamente es aplicable si los datos se encuentran desagrupados; en caso contrario debemos calcular la media mediante la multiplicación de los diferentes valores por la frecuencia con que se encuentren dentro de la información; es decir, 

Ecuación 5-4 Donde (Yi) representa el punto medio de cada observación, (ni) es la frecuencia o número de observaciones en cada clase y (n) es el tamaño de la muestra siendo igual a la suma de las frecuencias de cada clase.

Para entender mejor este concepto vamos a suponer que hemos tomado la edad de 5 personas al azar cuyos resultados fueron (22, 33, 35, 38 y 41). Para facilitar su interpretación se han generado tres rangos de edad los cuales se han establecido de 21 a 30 años, de 31 a 40 años y de 41 a 50 años. Si nos fijamos en estos rangos notaremos que los puntos medios son 25, 35 y 45 respectivamente. Los resultados de la organización de estos datos se representan en la tabla [5-1]. 

Page 13: MEDIANA Y MODA PARA DATOS AGRUPADOS

Figura 5-1 Si aplicamos la fórmula para valores agrupados obtendríamos que la media es igual a

 Lo que nos indicaría que el promedio de edad de los encuestados es de 35 años. Si ha estos mismos resultados le aplicamos la ecuación para datos desagrupados (Ecuación 5-3), tomando como referencia cada uno de los valores individuales, obtendríamos que la media es igual a

 Lo que nos indicaría que el promedio de edad para los datos desagrupados es de 34 años aproximadamente. Esta diferencia se debe a que al agrupar los datos se pierde parcialmente la exactitud de los cálculos, principalmente al aumentar el número de datos. Para evitar estos inconvenientes, SPSS nos permite calcular las Medias, como si se trataran de valores desagrupados, aunque tiene algunos procedimientos para valores agrupados. Es importante resaltar que existe una gran variedad de medias como la Media geométrica, la Media ponderada, la Media cuadrática, etc. Por el momento sólo hacemos énfasis en la media aritmética ya que es la más utilizada, aunque se recomienda a los lectores profundizar en estos temas. 

2. MEDIANA

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie ordenada. Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y la otra mitad por encima del mismo. Para determinar la posición de la mediana se utiliza la fórmula 

Ecuación 5-5 Para comprender este concepto vamos a suponer que tenemos la serie ordenada de valores (2, 5, 8, 10 y 13), la posición de la mediana sería: 

 Lo que nos indica que el valor de la mediana corresponde a la tercera posición de la serie, que equivale al número (8). Si por el contrario contamos con un conjunto de datos que contiene un número par de observaciones, es necesario promediar los dos valores medios de la serie. Si en el ejemplo anterior le anexamos el valor 15, tendríamos la serie ordenada (2, 5, 8, 10, 13 y 15) y la posición de la mediana sería, 

 Es decir, la posición tres y medio. Dado que es imposible destacar la posición tres y medio, es necesario promediar los dos valores de la posiciones tercera y cuarta para producir una mediana equivalente, que para el caso corresponden a  (8 + 10)/2 =9. Lo que nos indicaría que la mitad de los valores se encuentra por debajo del valor 9 y la otra mitad se encuentra por encima de este valor. En conclusión la mediana nos indica el valor que separa los datos en dos fracciones iguales con el cincuenta porciento de los datos cada una. Para las muestras que cuentan con un número impar de observaciones o datos, la mediana dará como resultado una de las posiciones de la serie ordenada; mientras que para las muestras con un número par de observaciones se debe promediar los valores de las dos posiciones centrales. 

Page 14: MEDIANA Y MODA PARA DATOS AGRUPADOS

3. MODA

La medida modal nos indica el valor que más veces se repite dentro de los datos; es decir, si tenemos la serie ordenada (2, 2, 5 y 7), el valor que más veces se repite es el número 2 quien seria la moda de los datos. Es posible que en algunas ocasiones se presente dos valores con la mayor frecuencia, lo cual se denomina Bimodal o en otros casos más de dos valores, lo que se conoce como multimodal. En conclusión las Medidas de tendencia central, nos permiten identificar los valores más representativos de los datos, de acuerdo a la manera como se tienden a concentrar. LaMedia nos indica el promedio de los datos; es decir, nos informa el valor que obtendría cada uno de los individuos si se distribuyeran los valores en partes iguales. La Medianapor el contrario nos informa el valor que separa los datos en dos partes iguales, cada una de las cuales cuenta con el cincuenta porciento de los datos. Por último la Modanos indica el valor que más se repite dentro de los datos.

 Medidas descriptivas

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y que nos resumen la información contenida en ella.

   

 Medidas de Posición: Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es decir, en intervalos, que comprenden el mismo número de valores. Los más usados son los cuartiles, los deciles y los percentiles.

 PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%

 CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales, son un caso particular de los percentiles:

Page 15: MEDIANA Y MODA PARA DATOS AGRUPADOS

- El primer cuartil Q 1 es el menor valor que es mayor que una cuarta parte de los datos- El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor que la mitad de los datos- El tercer cuartil Q 3 es el menor valor que es mayor que tres cuartas partes de los datos

 DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles.

    Ejemplo:

Dada la siguiente distribución en el número de hijos (Xi) de cien familias, calcular sus cuartiles.

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n=100

Solución:

1.Primer cuartil:

2.Segundo cuartil:

3.Tercer cuartil:

 Medidas de Centralización

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

 MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Page 16: MEDIANA Y MODA PARA DATOS AGRUPADOS

Si los datos están agrupados utilizamos las marcas de clase, es decir ci en vez de xi.

 MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana  y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.

 MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.

 Medidas de Dispersión

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

MEDIDAS DE DISPERSIÓN ABSOLUTAS

 VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.

Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza:

Si los datos están agrupados utilizamos las marcas de clase en lugar de Xi.

Page 17: MEDIANA Y MODA PARA DATOS AGRUPADOS

 DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza

Para estimar la desviación típica de una población a partir de los datos de una muestra se utiliza la fórmula (cuasi desviación típica):

 RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor.  Re = xmax - xmin

MEDIDAS DE DISPERSIÓN RELATIVAS

 COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo tanto cuanto mayor es CV  mayor es la dispersión y menor la representatividad de la media.

  Medidas de Forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de barras de la distribución, con la distribución normal.

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

Page 18: MEDIANA Y MODA PARA DATOS AGRUPADOS

MEDIDA DE APUNTAMIENTO O CURTOSIS

   Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

   Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

  EJEMPLO 1

El número de diás necesarios por 10 equipos de trabajadores para terminar 10 instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80 días. Calcular la media, mediana, moda, varianza y desviación típica.

SOLUCIÓN:

  La media: suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone:

Page 19: MEDIANA Y MODA PARA DATOS AGRUPADOS

 La mediana: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Sx2=

 La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

 El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

 El coeficiente de variación: cociente entre la desviación típica y el valor absoluto de la media aritmética

CV = 20,67/52,3 = 0,39

  EJEMPLO 2

   El precio de un interruptor magentotérmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística, más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)

Page 20: MEDIANA Y MODA PARA DATOS AGRUPADOS

[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]

Abrir Calculadora Estadística

 

Ir a Calculadora Estadística

 

   Resumen de Fórmulas

Page 21: MEDIANA Y MODA PARA DATOS AGRUPADOS