domingo, 20 de noviembre de 2011

Y es que los resultados numéricos son estrictamente representativos de lo que representan

       En relación con el día que hoy vivimos en España (elecciones del 20N, para quien no se haya enterado aún), ya Lorenzo Hernández en Ciencia Online y "el profe de física" en Física de Película han abordado el tema de la campaña electoral desde el prisma de la estadística. El primero se centró en algunos datos absolutos y relativos dados durante el debate entre Rajoy y Rubalcaba; y el segundo, en los resultados de algunas encuestas teniendo en cuenta la Teoría de Errores y la desviación típica.

       Hay quien dice que la estadística es la primera de las ciencias inexactas, que es una disciplina inútil, que no tiene sentido... sin embargo yo soy de la opinión de que las cifras no mienten, pero los mentirosos también utilizan cifras. Yo mismo, en Iguanamarina, he escrito en un par de ocasiones acerca de las malas interpretaciones de las estadísticas (una y dos), y en eso me voy a centrar. Y es que los resultados numéricos son estrictamente representativos de lo que representan. Suena obvio, ¿verdad? Lo que quiero decir es que los números son una evidencia; las mentiras, los patinazos y las conclusiones no están en ellos, sino en su inferencia.
 
  • Imaginemos, siguiendo el ejemplo de "el profe de física", que en una encuesta un partido obtuviera un 45'4% de la intención de voto, ¿quiere decir esto que es presumible que se llevase el 45'4% de los votos en unas elecciones si se realizaran en ese momento? Esa es la interpretación que suelen hacer los medios de comunicación, pero la respuesta estricta a la pregunta sería "no". En realidad, y sin tener en cuenta el error y la desviación típica, lo único que demostraría ese resultado es que el 45'4% de los encuestados (no de los electores del país) en ese estudio han dicho (no que tengan intención, porque también pueden mentir) que votarán a ese partido en cuestión.

       Esa visión, desde luego, no vende; incluso habrá quien piense que mi poder de inferencia en ese ejemplo ha sido paupérrimo, pero eso es lo que estrictamente dicen los números. Por eso, los estadistas deben hacer hincapié en los muestreos. Para que una muestra de estudio sea representativa de una población, no basta con salir a la calle y preguntar a las... digamos cien primeras personas que veamos. En primer lugar, debemos establecer un tamaño aceptable de la muestra. En segundo lugar hemos de analizar la población en que se va a hacer la encuesta: qué proporción de hombres y mujeres hay en el país, cuál es la proporción de funcionarios, empresarios, obreros y parados (por decir algunos cargos), cómo se distribuyen las edades... y reflejar esas proporciones en la muestra que vamos a encuestar. En este paso hay que argumentar que el criterio pueda tener alguna relación con el objeto de estudio, por ejemplo: en principio, en un sistema democrático moderno la proporción de sexos no tendría por qué influir en la intención de voto, pero sí la proporción de funcionarios y empresarios, la distribución de edades y el nivel de estudios. E incluso así, los resultados pueden verse viciados.
  • Tener las mañanas libres este año me ha dado la oportunidad de ver en directo bastantes plenos del congreso, y no hace mucho, un diputado del PSOE aseguró que la preocupación por el terrorismo en España ha descendido desde el primer puesto al decimocuarto durante los años de legislatura socialista (o socialdemócrata). Vamos a suponer que ese resultado había sido bien estudiado, es una evidencia. No obstante, la inferencia que hizo el diputado en cuestión fue que eso demostraba que el gobierno había trabajado bien en política interior. Bueno... sí... puede significar eso... o también puede significar que el gobierno ha metido la pata más hasta el fondo en otras trece cuestiones.
       Creo que los dos ejemplos que he puesto pueden representar dos extremos de mi inferencia: uno en el que he sido muy estricto y otro en el que he interpretado una posibilidad más allá, no porque sea más probable, sino igualmente válida. Pero hay otro montón de ejemplos cotidianos en los que las inferencias arbitrarias suelen pasar desapercibidas; pondré otros dos, alejados de la política.
  • Cuando los institutos españoles presentan a las Pruebas de Acceso a la Universidad (PAU) a un número determinado de estudiantes y todos aprueban, consideran que el 100% es un éxito. Ahora bien, la proporción de aprobados en selectividad en 2011 fue de un 89% en todo el país. Aparte de lo que Lorenzo Hernández explica sobre el tamaño de las diferentes muestras, estar por encima de la media de aprobados del país está bien, pero ¿cuál fue la nota media y la varianza de los alumnos de esos institutos? ¿Qué proporción de las mejores notas correspondían a esos institutos? ¿Qué porcentaje de los alumnos de esos institutos estuvieron entre las mejores puntuaciones del país? Y lo que más interesa a los adolescentes, ¿qué proporción de alumnos de esos institutos consiguieron plaza en la carrera que deseaban como primera opción? Ahí hay que buscar el éxito.

  • Saliendo esta vez de las fronteras españolas y mirando cuatro años atrás, el gobierno de Estados Unidos, en 2007, destinó 161 800 millones de dólares a la lucha contra el terrorismo, mientras que otorgaba 2 900 millones de dólares a la investigación y tratamiento de afecciones coronarias. Si tocamos de nuevo la preocupación por el terrorismo, consideramos coherente invertir en seguridad, pero miremos los números: según del Departamento de Estado de EEUU, en 2004 (tres años antes) habían muerto 68 ciudadanos americanos como consecuencia de atentados, mientras que según el Departamento de Salud y Servicios Humanos de EEUU, cada año mueren aproximadamente 450 000 americanos por afecciones coronarias. Extrayendo números, se invirtió 55'8 veces la cantidad de dinero en una causa que mataba a 6 617'6 veces menos personas.
       Así que en este momento, y también en vista de que el sistema electoral español ya de por sí es estadísticamente absurdo (da mayor peso a las Comunidades Autónomas menos pobladas, alimentando así el bipartidismo), solo voy a decir: que gane el mejor... bueno... que gane el menos malo... bueno... que gane el que más votos obtenga.

1 comentario:

BioSamu_ dijo...

No he podido evitar comentar lo que he oído en TVE.

El PP ha conseguido la mayoría absoluta con un millón de votos menos que con los q el PSOE tuvo mayoría relativa en 2008. El PP ha obtenido solo medio millón de votos más que hace 3 años. El PSOE ha perdido 4,5 millones de votos y los partidos minoritarios han ganado en total 2,5 millones de votos...

Y la reflexión de una reportera ha sido que hay que tener en cuenta que muchos votantes del PSOE se habrán quedado en casa ¡¡¡porque hoy ha llovido!!!

Desde luego le recomendaría que leyera este post.

Related Posts Plugin for WordPress, Blogger...