En el análisis estadístico uno se encuentra a menudo con detalles curiosos y datos engañosos. Para quien no está acostumbrado a la lectura de los números, su interpretación puede resultar en una percepción distorsionada de la realidad. La paradoja de Simpson es una de estas peculiaridades en las que el escamoteo de las cifras nos deja una idea equivocada de lo que no está y de lo que sí es. La aparición de la paradoja en indicadores sociales es muy frecuente y sus consecuencias son casi siempre desastrosas. GHC
Varianza: Trump y la inmigración criminal
En el análisis estadístico uno se encuentra a menudo con detalles curiosos y datos engañosos. Para quien no está acostumbrado a la lectura de los números, su interpretación puede resultar en una percepción distorsionada de la realidad. La paradoja de Simpson es una de estas peculiaridades en las que el escamoteo de las cifras nos deja una idea equivocada de lo que no está y de lo que sí es. La aparición de la paradoja en indicadores sociales es muy frecuente y sus consecuencias son casi siempre desastrosas. GHC
Texto de Gerardo Herrera Corral 17/03/17
Durante la Guerra Fría, en la Alemania del Este, se acostumbraba decir: “existen mentiras, delitos y estadísticas”. Hoy, vivimos en un mundo anegado por indicadores estadísticos. De éstos se puede aprender mucho; sin embargo, también son la forma más contundente de manipular la opinión pública.
“En un solo día vemos más estadísticas que las que vieron Goethe o Schiller en toda su vida”, comenta Walter Krämer, autor de una nueva versión de Cómo mentir con estadísticas, título que se convirtió en un clásico en la obra de Darrell Huff.
Sabemos que, estadísticamente hablando, el ser humano tiene menos de dos piernas y que tener la cabeza en un horno encendido y los pies en el hielo no representa una alarma para la temperatura promedio de confort en que nos encontramos.
En su campaña presidencial, el empresario y entonces candidato republicano a la presidencia de los Estados Unidos de América, Donald Trump, hizo declaraciones controversiales contra la inmigración. Ahora, como presidente, las declaraciones vienen seguidas de la firma de decretos que se oponen a la inmigración proveniente de países a los que considera fuentes de criminalidad.
La firma del decreto, mediante el cual se prohíbe viajar a los Estados Unidos a ciudadanos de Irak, Irán, Libia, Siria, Somalia, Sudán y Yemen, no es la única de las medidas. Se ha ordenado construir un muro en la frontera sur y se plantea la posibilidad de deportaciones masivas de mexicanos.
La declaración que inició la debacle con nuestro país fue: “cuando México envía a su gente, no envía a los mejores… Están enviando a gente que tiene muchos problemas, y nos trae esos problemas. Están trayendo drogas. Están trayendo crimen. Ellos son violadores. Y algunos, supongo, son buenas personas”.
No conocemos los datos reales de la criminalidad y su relación con la comunidad mexicana en los Estados Unidos, pero sí hemos visto notas periodísticas aquí y allá con datos que parecen demostrar que tal relación es estrecha. Veamos aquí un ejemplo —ficticio, pero muy común— de la formación de percepciones falsas. Los datos que veremos ahora son una muestra típica de datos engañosos con consecuencias devastadoras.
La paradoja de Simpson seguramente ha influenciado la mentalidad del candidato republicano Donald Trump en más de una ocasión. Aunque no contamos con datos precisos, sí es muy común encontrar en la prensa notas como la que mostramos ahora:
En Abilene, Texas, es muy claro que los mexicanos son más propensos al crimen que los estadounidenses de origen europeo. Abilene es una ciudad con 120 mil habitantes de los cuales 20 mil son de origen mexicano. Según las estadísticas de la oficina de policía, en 2003 se perpetraron 280 delitos. De estos, 100 fueron cometidos por mexicanos y 180 por estadounidenses de origen europeo. De esta manera se tiene que hay cinco delitos por cada mil habitantes de origen mexicano y sólo 1.8 por cada mil de origen europeo. Los mexicanos cometen, pues, más del doble de delitos que los americanos de origen europeo.
Para entender mejor los números enunciados en esta nota típica preparamos la Tabla 1, en la que se reparten los 120 mil habitantes y el número de delitos. Con estos números, no es de extrañar que muchos estadounidenses con inclinación por los análisis superficiales adviertan la amenaza que las comunidades de inmigrantes representan. No por nada Donald Trump expresa su incomodidad con los mexicanos en Estados Unidos.
Sin embargo, podemos analizar esta información con más detalle. Veamos, por ejemplo, la distribución geográfica de estos números. Abilene, como cualquier otra ciudad, está dividida en condados y es común que éstos tengan un mayor o menor grado de calidad en la vida de sus habitantes. Las ciudades tienen siempre sectores que agrupan a una parte de la población con mejor o peor condición económica. En Abilene, el condado Callahan está clasificado como el más pudiente, mientras que el condado Taylor cuenta con más mexicanos y menos servicios.
Taylor es un condado con condiciones menos atractivas para los estadounidenses de origen europeo. Lo contrario ocurre en Callahan, que es también más costoso. Los mexicanos no van a vivir a Callahan porque las rentas son caras y los terrenos inaccesibles. Ahí, es todo muy tranquilo, la policía circula con frecuencia, las calles están bien iluminadas y sólo se produce un delito por cada mil habitantes.
La Tabla 2 muestra la distribución estadística de criminalidad en los condados de Abilene. En esta tabla vemos a la población de 120 mil habitantes divididos geográficamente. También vemos la criminalidad en la segunda columna que viene ahora dada por condado. La suma será igual a 280 delitos, que es lo reportado en la ya mencionada nota periodística, pero aquí podemos ver que en Taylor hay 90 delitos de origen mexicano, mientras que en Callahan hay sólo 10 que se deben a los inmigrantes. En cambio, tenemos 90 delitos de miembros de la comunidad europea en Taylor y otros 90 de la misma comunidad en el condado de Callahan. Esto nos dice que en Taylor se dan nueve delitos por cada mil habitantes de cada una de las dos comunidades, mientras que en Callahan ocurre sólo uno por cada mil también de ambos sectores poblacionales.
Puede parecer curioso, pero ahora, la estrecha correlación entre extranjeros —en este caso inmigrantes mexicanos— y delitos ¡ha desaparecido! En el condado de Taylor se dan nueve delitos por cada mil habitantes en ambos grupos: inmigrantes mexicanos y estadounidenses de origen europeo. En el condado de Callahan los delitos por cada mil habitantes es menor, a saber, sólo uno; sin embargo, también es igual entre extranjeros de origen mexicano y estadounidenses de origen europeo.
En el análisis superficial comparamos las estadísticas de un grupo de la población que es económicamente fuerte con otro económicamente en desventaja. En esa mirada rápida hemos comparado peras con manzanas. Es necesario buscar la variable escondida que, en este caso, se trata de la distribución geográfica que está íntimamente relacionada con los ingresos económicos de los grupos sociales. Una vez tomada en cuenta la distribución de la criminalidad en esta variable oculta, la aparente tendencia de los mexicanos a cometer delitos desaparece.
El ambiente en que se vive, las facilidades de transporte, acceso a centros culturales, parques y centros recreativos, etcétera, a menudo influye en los indicadores de todo tipo.
Una explicación adicional para que una parte de la ciudad presente peores índices delictivos es que los que tienen menores ingresos son más fácilmente consignados. Los pobres no sólo son perseguidos con mayor asiduidad, sino que, además, cuentan con menos recursos para su defensa.
Esto que vemos en la criminalidad global, primero, y luego como función de la geografía en sectores pobres y ricos de la población, es lo que se conoce como paradoja de Simpson. Lo que ocurre es que la variable relevante, que en este caso es el nivel económico de los grupos en cuestión, está oculta en los números totales. La verdadera causa de la criminalidad aparece cuando segregamos los datos.
Hace tiempo que H. G. Wells sentenció: “El pensar de manera estadística un día será necesario para una ciudadanía eficiente, tanto como saber leer y escribir”.
Ese día ha llegado. Basta con abrir un diario para darse cuenta de que todo gira alrededor de los datos y sus interpretaciones. Sin embargo, la situación actual en los Estados Unidos nos muestra un analfabetismo moderno que no es, como muchos pensaban hace tiempo, el desconocimiento de las computadoras, sino la ignorancia en el análisis de datos.
Me temo que ahora la falta de entrenamiento y educación estadística es una de las más graves carencias en nuestros sistemas educativos. EstePaís
_____________
Gerardo Herrera Corral es doctor en Ciencias por la Universidad de Dortmund, Alemania, e investigador titular del Departamento de Física del Cinvestav.
Con el inicio de la pandemia, Este País se volvió un medio 100% digital: todos nuestros contenidos se volvieron libres y abiertos.
Actualmente, México enfrenta retos urgentes que necesitan abordarse en un marco de libertades y respeto. Por ello, te pedimos apoyar nuestro trabajo para seguir abriendo espacios que fomenten el análisis y la crítica. Tu aportación nos permitirá seguir compartiendo contenido independiente y de calidad.