Mis grupos son diferentes ¿Cuán diferentes? El tamaño del efecto

Estimados todos, nos vemos de nuevo, para una aventura más en Stats SOS. Espero que estén muy bien y tengan los cinturones bien abrochados y estén preparados para la aventura de hoy.
Quizás se habrán preguntado, “Ok, mis grupos son diferentes en una T-student (ver post) o U de Mann Whitney (ver post), pero ¿cómo se cuán diferentes son?” Bueno, para ello existen ciertas técnicas para averiguarlo. No basta solo con mirar los promediosy decir “¡Ah, hay una gran diferencia entre un promedio o una mediana y otra entonces deben ser muy diferentes”. Para ello veremos un análisis llamado el tamaño del efecto que nos permite comprender con mayor profundidad la diferencia entre dos grupos.
Entonces, la aventura de hoy requiere estar con la mente abierta y bien animados, para lograr cruzar por el camino del tamaño del efecto para que al final de la travesía podamos describir de manera sencilla qué es este análisis.
En ese caso, el tamaño del efecto en sencillo es la magnitud de la diferencia entre los puntajes promedio o medio de un grupo y otro. En sencillo, cuán diferentes son los puntajes promedios (o las medianas de los puntajes) de  dos grupos. Los que no recuerdan qué son promedios o medianas siempre pueden ir a este post para refrescar la memoria.
En este caso, el tamaño del efecto es un complemento de nuestra significación estadística en las comparaciones de medias o medianas. Ahora nos preguntamos, ¿Por qué se necesita esto? Por dos razones muy sencillas: a) Por ejemplo, la T-Student o los análisis de U de Mann Whitney te dicen exactamente que hay diferencias entre dos grupospero no cuán diferentes son.  b) Cuando tenemos grupos muy pequeños (por ejemplo: grupo uno con 10 personas y grupo dos con otras 10  personas) las pruebas designificancia (el valor p) no funcionan de manera adecuada porque estos análisis están diseñados para muestras más grandes. Los que no recuerdan qué es la significanciasiempre pueden volver a este post. 
¡Perfecto! ¿Hasta ahí todo bien? No se angustien, vamos con calma. Creo que dos ejemplos nos podrán ayudar a pasar exitosamente por esta travesía. En este caso, tomaremos ejemplos pasados, para ello, veremos por un lado al ejemplo del post de T-student con muestras independientes y por otro al de U de Mann Whitney.
¡Muy bien vamos al primer ejemplo! En esa aventura comparamos si existía diferencias entre los puntajes de una prueba de bienestar entre hombres y mujeres. Ahí comparamos dos grupos (50 hombres y 50 mujeres) y les tomamos una prueba de bienestar. Finalmente, los resultados salieron significativos y por ende se mostró una diferencia entre hombres y mujeres ¡y fuimos felices! Los que quieren recordar esto siempre pueden volver a este post. 
Pero ahora iremos un poco más lejos y averiguaremos cuán grande son estas diferencias. Para ello veremos primero la tabla que muestra algunos resultados.
Tabla 1:
Untitled
¡Excelente! Ahora que tenemos estos resultados, necesitamos calcular el tamaño del efecto. Para ello, necesitaremos nuestra calculadora de mano o alguna hoja de cálculo como Excel o Numbers (Mac). Pero no nos asustemos, no es una fórmula imposible ni mucho menos. ¿Están preparados? ¡Aquí va!
Fórmula 1: Esta fórmula es la llamada d de cohen, porque Jacob Cohen fue el primero que la propuso para poder calcular cuán diferentes eran dos grupos.
 d de Cohen
Fórmula 2: Esta fórmula muestra cómo calcular la desviación estándar ponderada. Esta se utiliza cuando las desviaciones estándar (o típicas) de nuestros grupos son diferentes.
desviacionstandard
Listo! Aquí tenemos las dos fórmulas, se que pueden verse horribles y espantosas, pero no lo son, nosotros somos valientes aventureros y podemos enfrentar exitosamente este reto. Como ven, para calcular la d de cohen que nos muestra la magnitud del efecto es necesario primero calcular la desviación estándar ponderada. Esta es una especie de desviación estándar general para nuestros dos grupos.
En este caso, asumiremos que el grupo t son hombres y el grupo c son mujeres. Por ello, podemos ver los siguientes valores que sacamos de la Tabla 1:
nt = 50,
nc = 50
st = 4.23031
sc = 5.02975
xt = 14.32
xc = 11.74
Paso 1: Calcula la desviación estándar ponderada
Muy bien, si reemplazamos todos esos valores primero en la fórmula 2 vemos que la desviación estándar ponderada es: 
S ponderada = √((50-1)(4.230312)) + ((50 -1)(5.029752))/50 + 50 = 4.601
No se asusten si ponen estos valores en Excel o Numbers la computadora puede hacer el cálculo por ustedes.
Paso 2: Calcular la de d de Cohen.
¡Listo! Ya que tenemos la primera parte que es la desviación estándar ponderada vamos ala otra fórmula que es la d de cohen que nos dará los tamaños del efecto. Para ello hacemos el siguiente cálculo:
d = (14.32 – 11.74)/4.601 = 0.5607
Ahora, ¿qué diablos significa este número? ¡Muy sencillo Cohen propuso algunas reglas para determinar si una diferencia es pequeña, moderada o grande. El autor planteaba que .20 hacia arriba, es una diferencia pequeña, .50 hacia arriba es una diferencia moderada y .80 hacia arriba es una diferencia grande (Cohen, 1988).
Ojo, pestaña y ceja (1): En cierta literatura es posible que se encuentre otra fórmula donde no se debe calcular una desviación estándar ponderada. Esto se debe a que la primera fórmula que utilizó Cohen asumía que ambos grupos tenían desviaciones estándar iguales. Sin embargo, como vemos en nuestro ejemplo, (y en la mayoría de casos de la vida real) esto no se da. Aparte, en la literatura existen una serie de diferentes fórmulas como la delta de Glass y la g de Hedges que son extensiones o mejorías de la fórmula original de Cohen. Los que tienen curiosidad sobre estas fórmulas siempre pueden dejar un genial comentario al final para poder conversar sobre ello. Por el momento, utilizaremos esta fórmula que suele ser la más convencional pero que además propone una alternativa cuando los puntajes de nuestros grupos tienen desviaciones estándar distintas.
¡Perfecto! Luego de haber hecho el preámbulo, podemos ver que nuestra d = 0.5607, lo cual muestra una diferencia moderada entre los puntajes de bienestar entre hombres y mujeres. 
Ojo, pestaña y ceja (2): El tamaño del efecto está muy relacionado con el poder estadístico. Sin embargo, en esta aventura no veremos este tema. De todos modos, los que están interesados en surcar por esos senderos, siempre pueden dejar un maravilloso comentario en este post.
¿Siguen aquí? ¿Está todo bien? ¡Seguro que sí! Ahora vamos a nuestro segundo ejemplo. En este veremos la diferencia de dos grupos utilizando la U de Mann Whitney y luego de ello calcularemos el tamaño del efecto cuando utilizamos análisis no paramétricos. 
¡Excelente! En este caso, recabamos 27274 personas y comparamos entre hombres y mujeres la percepción de cuánto dinero se necesita para vivir en un mes. En este análisis comparamos 14711 mujeres contra  12563 hombres. En ello vimos que los puntajes no tenían una distribución normal por lo que tuvimos que utilizar la U de Mann Whitney. Al final, encontramos que los hombres mostraban un mediana de 1200 mientras que las mujeres una mediana de 1000 (pongamos dólares) para vivir durante un mes y estas diferencias eran significativas (Ver tabla 3).  Los que quieren recordar este ejemplo siempre pueden volver a este post. 
Tabla 3
significancia
Ahora, ¿Cómo saber si es que esa diferencia es efectivamente grande?
¡Muy sencillo! Tenemos que calcular una nueva fórmula. Dejamos a Cohen descansar y en esta ocasión invocamos la r de Rosenthal (Rosenthal, 1991). ¿Están listo? ¡Aquí va!
Formula 1:
Rosenthal
Como ven, esta fórmula se ve mucho más sencilla. Para ella, necesitamos el valor Z de nuestra U de Mann Whitney y la cantidad de gente (N) del cual se basa todo el análisis.
Ojo, pestaña y ceja (3): Se usa la cantidad de gente de todo el análisis y no de cada uno de los grupos.
En este caso, tenemos una Z = -9.666 y una N = 27274. Si realizamos el cálculo obtenemos lo siguiente:
r= -9.666/√27274 = -0.058
Este valor, según los criterios de Cohen (o también la extensión que hizo Rosenthal) que vimos previamente, muestra que existe un efecto pequeño (Rosenthal, 1991) en las diferencias de puntajes de percepción de dinero necesario para vivir un mes entre hombres y mujeres.
Ojo, pestaña y ceja (4): La r de Rosenthal es muy sensible a la cantidad de gente que se tiene en el estudio (la cantidad de muestra, mientras más grande la muestra menor será el tamaño entre un grupo y otro). ¡No hay que temer con esto! Esto es normal, muestras muy grandes (grupos con cantidades muy grandes de gente), por un lado pueden tener la posibilidad de incluso representar a la población (dependiendo de otros factores como por ejemplo, el tipo de muestreo que se utilice). Por otro, agregar por ejemplo 10 personas más a dos grupos de 28 mil personas y obtener las medianas no generará una diferencia muy potente por eso el efecto suele ser pequeño cuando tienes muestras demasiado grandes.
¡Perfecto! Creo que esto sería todo por hoy, hemos llegado a la meta sanos y salvos :). Espero que esta aventura haya sido agradable para ustedes valientes lectores. Como siempre los invito a dejar un comentario en el post de hoy compartiendo sus impresiones.
Para la siguiente aventura volveremos a las regresiones y nos extenderemos un poco más y veremos temas como mediación y moderación. Ha sido un placer compartir esta aventura con ustedes y los invito a poner “Me gusta” (Like) en la página de Facebook de Stats SOS, así como seguirnos en Twitter.
¡Hasta la próxima aventura! ¡Buenas vibras!
Referencias
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. 2nd. edit., Hillsdale, N.J., Erlbaum (primera edición, 1977 New York: Academic Press).
Field, A. Discovering statistics using SPSS. Sage. UK.
Ledesma, R., Macbeth, G., Cortada de Kohan, N. (2008). Tamaño del efecto: revisión teórica y aplicaciones con el sistema estadístico vista. Revista Latinoamericana de Psicología, 40(3), 425-239.
Rosenthal, R. (1991). Meta- analytic procedures for social research (2nd ed.). Newbury Park, CA: Sage.
Thalheimer, W., & Cook, S. (2002, August). How to calculate effect sizes from published research articles: A simplified methodology. Retrieved November 31, 2002 fromhttp://work-learning.com/effect_sizes.htm.
FUENTE: http://statssos.net/2015/05/28/mis-grupos-son-diferentes-cuan-diferentes-el-tamano-del-efecto/
http://www.adoos.com.uy/post/17041332/psicologo

Comentarios

Entradas populares de este blog

¿Qué es el fotolenguaje?

FODA Matemático: Cómo funciona , paso a paso

La diferencia entre adular y alabar