De GIGA a GIGO

Hablemos de calidad de los datos bajo el síndrome GIGO

Es evidente que lo difícil a veces es poder contar esa situación descriptiva. No es la primera vez, que me encuentro que el problema es simplemente poder contar/enumerar bien la fiel y pura realidad. Algo que aprendemos en nuestra niñez y con los dedos de la mano, se vuelve en algo tan complicado y tan engañoso a veces que parece mentira.

Un problema de difícil solución pero que decidimos vivir con el, pues es mejor creer saber algo que no saber nada, cobra fuerza ese mejor 1 %  es mejor que un 100% de desconocimiento. Pero esto es muy peligroso. Link covid19-Informe

Fuente: 


Asumiendo ese fallo endémico, esa tasa de error, ¿qué causas pueden ser las que nos impidan contar esos números naturales?. ¿Se puede saber en un momento el 100% de la verdad?.

"Si tuviese que sintetizar, diría que el principal problema de poder contar la realidad de una situación es la inmediatez, tanto en el momento de contarlo como en el tiempo en trasmitir ese conteo." Pongamos varios ejemplos. 

En la fecha de este post, parece complicado poder contabilizar por ejemplo el número de fallecidos por covid-19, aquí Covid19 dejó un enlace que cuenta más causas a este problema.

Pero anotemos otros ejemplos, no tiene que llegar el covid19 para que contabilizar fallecidos sea un problema, pues los propios bancos, empresas de servicios, seguros, etc sufren esa problemática desde hace años y ¿cuantos recibos y cobros se habrán pasado a un muerto?

Otras empresas, conocer la potencia máxima consumida exacta por comunidad o peninsular puede ser un problema, o la demanda de un servicio. 

En todos ellos el problema es entender lo mismo y la inmediatez, el momento de conocer la situación y bajo que criterios claros hay que tener en cuenta una situación para ser contabilizada. 

¿Cómo podríamos solucionar todo esto? Bueno, realmente ya se está solucionando en algunos casos, muy lentamente pero ese es el IOT, sensorizar e interconectar y gobernar los datos, que todos entendamos (lenguaje común) lo mismo por potencia máxima, o por fallecido por causa X. ¿Qué pasaría si tuviésemos un sensor que permitiese detectar y contabilizar automáticamente un evento?

Más pronto que tarde, quizá tengamos que sensorizar nuestro cuerpo para poder hacer una mejor gestión de los recursos necesarios, aunque en procesos de 0 y 1, esos sensores los llamaremos gestores de "validaciones" de situación, o validaciones funcionales que convertiremos en validaciones técnicas. 

Detectar, contabilizar, trasmitir el mensaje a tiempo, tomar la decisión más apropiada a la situación, disponer del medio. En resumen, hacer una gestión más inteligente y sostenible en base a conocimiento, en base a un buen gobierno del dato y entendiendo todos lo mismo ya que democratizamos que es lo que conocemos. Todo esto es posible, pero implica una gran transformación digital y cultural y una buena gestión de datos y uso tecnológico. Si no, alimentaremos nuestros sistemas con basura o ruido y sacaremos conclusiones erróneas o muy lejos de la realidad, de ahí, el sindrome GIGO, del inglés Garbage In, Garbage Out, o lo que es lo mismo, si alimentas a tu sistema con datos-basura, lo que obtendrás será basura.

De nada sirve un algoritmo voraz si le das de comer basurilla ;-) 


Parámetros a tener en cuenta para la calidad en los datos:

- Inmediatez
- Entender lo mismo
- Contabilizar
- Capacidad de computo para ejecución de reglas (sensorizar) 
- Evitar basura en los sistemas para hacer estudios de calidad

Frase

"Las grandes cosas tienen pequeños comienzos" Prometheus

0 comentarios: