Vibraciones: datos malos, datos dañinos

Perdonen que sea reiterativo hasta bordear el límite de la obsesión. Les había dicho hace unos meses (aquí… y antes aquí, aquí o especialmente aquí) que me iba a olvidar del asunto, pero es que sobre el último post de esta bitácora se han reproducido las diferencias de contabilización de visitas hasta extremos tan inauditos… que no he podido por menos que disparar de nuevo.

Son éstas, por tanto, unas “vibraciones”… molestas, sin paliativos.

Sobre el mismo periodo de tiempo (el que va del 31 de julio, fecha de publicación, hasta ayer 15 de agosto), las visualizaciones del artículo contabilizadas por LinkedIn solo en ella eran más de 2.200, mientras la plataforma en que inquietos reside, WordPress, no llegaba a a contabilizar en total ni 150 visitas.

Oigan… un factor de 15… o_O

WordPress es la plataforma líder en el mundo… líder también en esta plataforma de uso gratuito que es WordPress.com.

Es inconcebible que después de tantos años de liderazgo no sea capaz de ofrecer algo que parece tan simple como contabilizar las visitas a las páginas de uno de los blogs alojados en ella con una razonable fiabilidad.

Pero más allá de esta historia, que no deja de ser una minúscula e intrascendente anécdota personal, me ha parecido una buena muestra de uno de los principales cánceres que lastran y lastrarán los resultados de eso que venimos en denominar con mucho glamour el “big data”. Bueno… de su explotación a base de procesos de aprendizaje automático e inteligencia artificial, de los modelos de predicción de comportamientos o, más allá de ellos, de los modelos prescriptivos que permitan que las máquinas decidan por sí mismas.

Ese cáncer es… la confianza en datos que no se conoce que son inexactos.

En todas las organizaciones somos conscientes de muchos de los problemas que tenemos con nuestros datos, o al menos somos conscientes de que tenemos problemas con ellos… pero sobre muchas otras de nuestras bases de datos, soportadas en plataformas que consideramos robustas y estables, no abrimos la más mínima sospecha: nos acompañan desde hace tantos años soportando nuestras decisiones que rechazamos siquiera dudar de ellos, o minusvaloramos cualquier leve indicación que nos lleve a la duda.

Y la verdad es que, en la mayoría de los casos, no es una praxis desastrosa: el análisis causal se mezcla con la intuición ante resultados anómalos… y la resultante final ha sido suficientemente útil durante toda nuestra vida profesional.

En el caso de mi anécdota personal sobre los números del blog, les reconozco que yo me pasé años confiando ciegamente en las estadísticas de WordPress, hasta que la contabilización de visualizaciones de LinkedIn se puso en marcha y me activó las sospechas. La verdad es que, al margen de lo que me molesta que algo no se haga bien, no se corrija y a nadie parezca importarle, el asunto no pasa de ser algo que ya conozco y que no tiene trascendencia alguna, porque esta bitácora no tiene ninguna dependencia de cifras y los lectores son tan pocos (aunque selectos 😉 ), que sumar unos cientos o restarlos no cambia su ubicación en el universo bloguero… 😆

Pero en el mundo de los algoritmos… eso es otra cosa. Malos datos implican decisiones erróneas.

Porque si un análisis humano de la información puede aflorar datos sospechosos y por tanto inútiles para tomar cualquier decisión, en el análisis de “big data” pueden convertirse en algo peor si no se detectan: ser directamente dañinos porque las decisiones automáticas se basen en información que conduzca directamente al error.

Y sin entender el por qué…

 

Un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios .