estadística para investigadores2

8

Click here to load reader

Upload: alirio-tua

Post on 12-Apr-2017

172 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 1

Estadística para investigadores: todo lo que siempre quiso saber

y nunca se atrevió a preguntar

Módulo 2. Estadística Descriptiva:

Medidas de síntesis

Mª Purificación Galindo Villardón

Mª Purificación Vicente Galindo

Universidad de Salamanca

Departamento de Estadística

Page 2: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 2

Índice

Pregunta 1. ..................................................................................................... 4

Pregunta 2. ..................................................................................................... 4

Pregunta 3. ..................................................................................................... 4

Pregunta 4. ..................................................................................................... 5

Pregunta 5. ..................................................................................................... 5

Pregunta 6. ..................................................................................................... 5

Pregunta 7. ..................................................................................................... 6

Pregunta 8. ..................................................................................................... 6

Pregunta 9. ..................................................................................................... 7

Pregunta 10. ................................................................................................... 7

Page 3: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 3

Respuestas a las preguntas más frecuentes con las que se

encuentra un investigador

Page 4: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 4

Pregunta 1.

Un trabajo en el cual sólo aparece la media, sin ninguna medida de dispersión,

¿es un trabajo sin rigor científico?

Una medida de tendencia central debe ir siempre acompañada de una medida de

dispersión que nos permita evaluar su representatividad. En el caso de la media,

la medida de dispersión más utilizada es la desviación típica o desviación estándar,

pero dependiendo de los objetivos del trabajo, puede ser otra (recorrido,

coeficiente de variación, etc.).

Pregunta 2.

¿En qué casos debemos utilizar la media y en cuáles no?

Para calcular la media es necesario sumar sus valores, luego los datos deben ser

cuantitativos. No obstante, aunque pueda calcularse, si hay datos muy grandes o

muy pequeños, puede no ser la medida de tendencia central más adecuada ya que

es muy sensible a datos discordantes (outliers). La medida de dispersión que

utilicemos nos ayudará a decidir si al media es adecuada o no, para sintetizar esos

datos.

Pregunta 3.

¿Puede ser más útil la mediana que la media?

Sí, puede que la mediana sea más útil, si la media no representa bien a los datos.

Page 5: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 5

Pregunta 4.

Si la medida de dispersión nos dice que la media es adecuada, ¿debemos incluir

en la publicación la media en lugar de la mediana, siempre?

No siempre. Depende de lo que se vaya a hacer en el estudio. Por ejemplo, si

después utilizamos un test que compara medianas, podríamos incluir la mediana en

la parte descriptiva y el recorrido intercuartílico.

Pregunta 5.

Unas publicaciones presentan media ± desviación típica, y otras media ± error

estándar. ¿Cuál debo utilizar? ¿Cuál es mejor?

Depende del objetivo del trabajo. Si lo que se pretende es saber si la media

representa bien a sus datos, utilizará media ± desviación típica. Si lo que quiere es

saber si se espera que la media sea estable en el muestreo, o sea, cómo de

parecida será su media a la de otros investigadores que hagan estudios similares,

utilizará media ± error estándar.

Pregunta 6.

En algunas publicaciones aparece media ± 2error estándar, ¿qué significa?

Esta expresión se corresponde con el cálculo del intervalo de confianza para la

media.

Aclaremos esto: Cuando se tienen unos datos procedentes de una muestra se

calcula la media muestral. Obviamente cambiando un solo dato, cambia la media.

Page 6: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 6

Por tanto esa media muestral es una estimación de la verdadera media que es la

que obtendríamos estudiando toda la población. Pero generalmente no se dispone

de la población.

Lo que se hace es, a partir de la media calculada en la muestra, estimar con una

alta fiabilidad, entre qué valores cabe esperar que esté la verdadera media. Eso es

lo que hacemos al calcular media ± 2error estándar

Significa que si le sumas y le restas a la media muestral, 2 veces el valor del error

estándar, se obtienen los extremos de un intervalo que con una alta probabilidad

(concretamente del 95.5%) contendrá a la verdadera media (la media poblacional).

Pregunta 7.

En otras publicaciones aparece media ± 3error estándar, ¿qué significa?

Es la misma idea pero en este caso se obtienen los extremos de un intervalo que

contendrá a la verdadera media (la media poblacional), con una probabilidad del

99%.

Pregunta 8.

¿Y no podría entenderse media ± error estándar de una forma similar?

Sí, en ese caso, se obtienen los extremos de un intervalo que contendrá a la

verdadera media (la media poblacional), con una probabilidad del 68%.

Page 7: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 7

Pregunta 9.

¿Sería correcto escribir en una publicación la mediana acompañada de la

desviación típica?

No. Ya que la desviación típica nos indica si la media es representativa o no. Si no

se utiliza la media, esa información no interesa. Lo apropiado sería escribir la

mediana con el recorrido intercuartílico.

Pregunta 10.

En general, en los box-plot se representa la caja con una raya dentro y unos

bigotes. Pero a veces aparece un rombo pequeño dentro. ¿Qué significa?

Algunos programas representan también la media. Ese rombo, que los manuales

llaman “el diamante”, marca precisamente los extremos del intervalo de confianza

para la media. Si los datos se ajustan a una ley normal (campana) media y mediana

coinciden, pero si tienen otra distribución, aparecen claramente diferenciadas.

Page 8: Estadística para investigadores2

Módulo 2. Estadística descriptiva. Medidas de síntesis 8