¿RELACIÓN CAUSA-EFECTO O CAUSA-DEFECTO? CUIDADO CON LAS CONCLUSIONES PRECIPITADAS

Autor: Ansgar Seyfferth

¿El café acorta la vida? ¿Los empleados públicos son mejor pagados que los privados? ¿Las amas de casa son más conservadoras y católicas que las mujeres trabajadores? Preguntas como estas suelen ser mucho más difíciles de responder de lo que puede parecer a primera vista. Y es que la deducción precipitada de una relación causa-efecto de cualquier asociación o correlación es una de las fuentes más extendidas de interpretaciones erróneas, que frecuentemente confunden – o manipulan intencionadamente – a la opinión pública, como ilustraremos con unos ejemplos.

Hay una percepción generalizada que el café perjudica la salud, que parece tener su justificación en la mayor mortalidad (ajustada por edad) de los bebedores de café, nuevamente confirmada el año pasado en un estudio muy amplio. Pero en aparente contradicción con esta tendencia, en el mismo estudio el café se revela como un factor reductor de la mortalidad, cuando en el análisis se incluyen otros hábitos que pueden influir en la mortalidad, como  el consumo de tabaco y de alcohol, la dieta y la práctica de ejercicio físico. Resulta que los bebedores de café tienen mayor tendencia a hábitos poco saludables, por lo que su mayor mortalidad sería más bien debido a dichos hábitos y no al café, que hasta podría (véase el último párrafo de este artículo) contrarrestar en parte el efecto perjudicial de los malos hábitos. Por lo tanto, si la comparativa se lleva a cabo entre personas que salvo su consumo de café tienen los mismos hábitos, los bebedores de café tienen una mortalidad inferior, pero paradójicamente de media su mortalidad es superior, debido al mayor peso relativo de los bebedores de café en los grupos de peores hábitos y por tanto mayor mortalidad.

Otro ejemplo encontramos en una nota de prensa del Instituto Nacional de Estadística sobre la distribución salarial en España, que destacó que los salarios eran más elevados en el sector público que en el privado, lo cual en su momento causó bastante revuelo mediático. Pero una lectura completa de la nota aclara (en el tercer párrafo de la página 3) a que se debe este hecho aparentemente sorprendente: Como cabe esperar, el salario aumenta apreciablemente con el nivel de formación y resulta que en los niveles de estudios superiores hay un mayor peso relativo de los asalariados del sector público, sobre todo de Sanidad y de Educación. Ello explica la diferencia salarial, que por tanto no es atribuible al carácter público o privado del empleo. Desgraciadamente no se incluyó una comparativa de los salarios públicos y privados dentro de cada nivel de formación, que es lo que realmente permitiría sacar conclusiones sobre ventajas salariales de uno u otro sector, pero de la explicación de la nota se deduce que así la diferencia a favor del sector público desaparece y como hemos visto en el ejemplo del café y de la mortalidad, hasta podría invertir su signo. Por tanto, el mero hecho de unos mayores salarios en el sector público en general, nada nos dice de ventajas salariales, pero fue precisamente eso lo que se encargaron de difundir ampliamente algunos medios de comunicación, pasando por alto la verdadera explicación de la diferencia.

Frecuentemente, también los resultados de un sondeo de opinión revelan asociaciones entre determinados condiciones de los encuestados y sus opiniones, convicciones o creencias, como por ejemplo que en España las amas de casa tienden a ser significativamente más conservadores y católicas que otras mujeres. (Véase la nota metodológica al final del artículo citado para la definición del concepto de ama de casa en este contexto.) Pero concluir que estas tendencias políticas y religiosas guardan una relación causal en uno u otro sentido con el hecho de ser ama de casa es precipitado, porque como el propio artículo revela, las amas de casa predominan en franjas de edad más elevadas, en municipios pequeños y en niveles de formación bajos, todo ello factores que pueden influir en el perfil político y religioso y que por tanto podrían estar detrás de las correlaciones detectadas con el perfil político y religioso (como el tabaco, la dieta, etc. en caso de la mortalidad de los bebedores y no bebedores de café; o el nivel de formación en el caso de los salarios de los empleados públicos y privados). Por ello, en un estudio presentado en el XI Congreso Español de Sociología, analizamos los datos de la encuesta incluyendo todos estos potenciales factores de confusión en el análisis. Hallamos que efectivamente los factores mencionados tienen una asociación con el perfil político y religioso, pero que explica sólo parte de las diferencias entre amas de casa y otras mujeres. Es decir, a diferencia de los dos ejemplos anteriores, comparando mujeres de la misma edad, el mismo tamaño de municipio y el mismo nivel de formación, las amas de casa siguen siendo significativamente más conservadoras y más católicas, aunque en menor medida que en la comparativa global, donde los mencionados factores aumentan la diferencia.

Es importante destacar que el análisis no demuestra que la diferencia política y religiosa que persiste tras tener en cuenta edad, hábitat y formación, guarda realmente una relación causal con la condición de ama de casa. Podría responder también a otros factores de confusión de los cuales no disponemos de datos. Lo único que se puede afirmar – con criterio sociológico y no estadístico – es que dicha relación causal es razonable y que no consta otro factor no tenido en cuenta que podría tener un efecto de confusión relevante. Otra cuestión a la que solamente se puede contestar con criterio sociológico – y no estadístico – es la orientación de la relación causal, es decir si el perfil político y religioso es una causa de la elección de ser ama de casa (que parece la opción más verosímil) o más bien una consecuencia de esta dedicación.

De la misma forma, tampoco el estudio de la asociación entre café y mortalidad, citado al principio del artículo, demuestra que estamos realmente ante un efecto protector del café, como sus propios autores dejan claro. Al igual que la correlación positiva entre consumo de café y mortalidad se invierte cuando se tienen en cuenta los mencionados hábitos, convirtiendo el café en un factor reductor de la mortalidad, pueden existir más factores que de incluirse en el estudio supondrían que la asociación se reduzca o que desaparezca o que vuelva a invertirse. Por ejemplo las personas que beben mucho café podrían tener una menor mortalidad por tener una tendencia a ingerir muchos líquidos en general. Se trata de una limitación intrínseca de los estudios observacionales, que solamente se podría evitar asignando los participantes del estudio aleatoriamente a diferentes grupos, a cada una de la cuales le correspondería una determinada dosis de café diaria, como sucede en los ensayos clínicos. Debido a la asignación aleatoria, los grupos serían razonablemente parecidos en lo referente a sus demás hábitos, por lo que desparecerían los sesgos y habría una evidencia mucho más fuerte de que las diferencias observadas entre grupos sean realmente efectos del café. Obviamente se trataría de una fuerte intervención en la vida de los participantes, inviable para un estudio de estas dimensiones.

Anuncios
Esta entrada se publicó en Estadística, Ideología, Sociedad, Sondeos y está etiquetada con , , , , , , , , , en por .

Acerca de Ansgar Seyfferth

Director y cofundador de la filial española de STAT-UP, empresa alemana de consultoría estadística y servicios de data science. Trabaja desde 1995 en Madrid en entornos internacionales, en áreas como la consultoría estadística, matemática, técnica e informática, incluyendo docencia y formación en estos campos, así como en el diseño y la venta de complejos sistemas y soluciones IT. Es Licenciado en Ciencias Físicas y Diplomado en Ciencias Económicas y Empresariales por la Georg-August-Universität Göttingen (Alemania) con un Máster en Ingeniería Matemática por la Universidad Complutense de Madrid. De lengua materna alemana, habla además español y inglés y tiene conocimientos de francés y portugués. Es coautor de varios artículos científicos de diferentes áreas y columnista en el premiado blog Ssociólogos y el Huffington Post. También colabora con la junta directiva del Círculo Hispano-Alemán de Jóvenes Directivos.

7 pensamientos en “¿RELACIÓN CAUSA-EFECTO O CAUSA-DEFECTO? CUIDADO CON LAS CONCLUSIONES PRECIPITADAS

  1. Manel Pons (IERMB)

    Manel Pons Sanvidal • Como bien dices, una cosa son las relaciones causales y otra cosa son las casualidades, o sea, las relaciones espúreas.
    De ejemplos aparte de los que propone el artículo, hay bastantes. Dos que siempre pongo a mis estudiantes son dos artículos del períodico “El Mundo”, publicados con 5 días de diferencia y que hacen referencia a un mismo tema:

    LOS JUBILADOS QUE SIGUEN TRABAJANDO TIENEN MEJOR SALUD (04/11/2009)
    –> http://www.elmundo.es/elmundosalud/2009/11/03/medicina/1257278289.html
    * Investigación con 12.000 participantes
    * Estudio llevado a cabo por científicos de las Universidades de Maryland y de California (EEUU), y publicado en el ‘Journal of Occupational Health Psychology‘ (FI: 2.35)

    SI SE JUBILA ANTES DE LOS 55 AÑOS, REJUVENECERÁ (09/11/2009)
    –> http://www.elmundo.es/elmundosalud/2009/11/06/medicina/1257535592.html
    * Investigación basado con estimaciones personales 14.700 “participantes”, todos ellos empleados de la compañía nacional de gas y electricidad de Francia
    * Estudio recogido por ‘The Lancet‘ (FI: 17.46).

    Es muy divertido ver la cara de los estudiantes e interesante ver la capacidad de análisis crítico que tienen. Las preguntas que siempre les hago: ¿Cómo puede ser que en menos de 5 días de diferencia el mismo períodico haga referencia a dos noticias antagónicas? ¿A qué es debida esta contradicción? ¿Es importante leer la letra pequeña? ¿Detectamos sesgos en ambos estudios?

    Como bien dice el artículo, una cosa es lo que nos dice la estadística y otra cosa es utilizar el sentido común para analizar los datos. Otra cosa que siempre les digo a los estudiantes (y a mis clientes): estadística y sentido común van “cogiditos” de la mano.

    Saludos.

    Responder
    1. Ansgar Seyfferth Autor de la entrada

      Gracias, Manel, que lo de las conclusiones opuestas reflejadas en el mismo medio con pocos días de diferencia es muy bueno 🙂 Diría que si bien en ambos casos puede haber una relación causal, en el primero de los dos parece más razonable que sea más bien al revés de lo que sugiere el artículo (seguir trabajando será más común entre los que siguen estando sanos) y en el segundo se basa en datos de una sola empresa con sus particularidades que no tienen porqué ser extrapolables al conjunto de la población activa.

      Lo único, en el contexto de las relaciones espurias no hablaría de “casualidad”, porque si por ejemplo los bebedores de café tienden a vivir menos, según el citado estudio parece que no es por el café (es decir no hay relación causal), pero tampoco por casualidad, sino porque entre ellos predominan más los hábitos poco saludables. De casualidad hablaría si una correlación se ha producido por azar debido a la composición de la muestra. Supuestamente, cuando la correlación es significativa quiere decir que eso es poco probable, pero no es imposible, sobre todo si un iluminado se dedica a cruzar a ciegas y sin sentido todas las variables de una base de datos con todas hasta que le salga una correlación significativa 😉

      Responder
  2. Pingback: El arte de presentar » La comunicación y presentación de datos estadísticos

  3. Pingback: LA COMUNICACIÓN Y PRESENTACIÓN DE DATOS ESTADÍSTICOS | Comunicaliza

  4. Pingback: LA COMUNICACIÓN Y PRESENTACIÓN DE DATOS ESTADÍSTICOS | Instituto Datakey

  5. Javier

    Ansgar, respecto al efecto directo del café, debería secuenciarse el gen CYP1A2 de lo sujetos para normalizar la variabilidad genética. Las variantes de este gen determinan la intensidad de la respuesta a la cafeína (el tipico “yo no puedo dormir con un único café por la mañana” o “me da igual tomarme tres tazas antes de acostarme”). Como mencionas, así se pone la observación en el contexto de conocimiento adecuado. Un grupo canadiense ha trabajado mucho en este tema concreto.
    http://www.medicinatv.com/noticias/una-variante-genetica-confiere-hasta-un-64-mas-de-riesgo-de-ataque-cardiaco-asociado-al-consumo-elevado-de-cafe-120329

    Responder
    1. Ansgar Seyfferth Autor de la entrada

      Gracias, Javier, por tu interesante comentario. Además sirve para recordar algo importante que si bien es evidente puede caer en olvido cuando se oye que algo es bueno o malo para la salud: que los factores de riego o de protección para la población en general no tienen porqué aplicar para todos los individuos.

      Por cierto, otro reciente ejemplo para los factores de confusión en los estudios observacionales: https://www.linkedin.com/nhome/updates?activity=5972810147959963648

      Responder

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s