Datos obesos - obesidad en datos

Humanizar términos
Puede ser una de las mejores maneras de explicar el mundo tecnológico, al mundo no tecnológico. Así pues, sin más circunloquio vamos allá.

Según la Wikipedia: La obesidad es una enfermedad crónica de origen multifactorial prevenible, la cual se caracteriza por acumulación excesiva de grasa de excesivos datos o hipertrofia general.


Es manido y corta pisado, la situación de encontrar basura y más basura en la información y documentación en empresas, yo diría que es la hipertrofia general que genera esa enfermedad crónica, así pues para la toma de decisiones parece necesario:

  • la limpieza de datos
  • la categorización de los mismos
  • la evaluación de los mismos

La limpieza de datos, el estudio de esos factores, multifactores, que producen la obesidad en datos es fundamental para un crecimiento y buen rumbo en la empresa.

Crear indicadores KPI de obesidad, desviaciones de la media, estudio de outliers en nuestro negocio puede ser de ayuda. Muy recomendable desde ADNENT es el estudio temporal, el análisis de tiempo empleado para una u otra tarea. Un mapa de calor sobre el rendimiento puede ayudar a saber en qué se invierte el tiempo y dinero en nuestro negocio.

Los datos existen, digamos que usted pesa 80kg, pero sobre ese dato, debe hacer un estudio multifactorial para determinar su salud, altura, indice de grasa corporal, colesterol, etc, esto le podrá dar una idea de la desviación sobre su peso y su peso óptimo. 

Las ventas en su empresa pueden ser de 80mill, pero deberá estudiar si sus gastos, materia prima, tiempo en venta, segmentación son óptimos.

Valorar si una cartera es contenciosa en un banco, el índice de morosidad, el volumen de transacciones por categoría de cliente, etc son patrones de medición en un banco RDA, Risk Data Aggregation, esto claro está, para ejes de estudio como el país, ámbito, dominio, entidad.

Existen más de 21 aplicaciones muy complejas para almacenar, transformar, explotar y/o representar la información reconocida como Big Data, por otra parte aún se sigue haciendo un mal uso de ellas produciendo obesidad en los datos, en resumen, desviaciones.

Para terminar, quien asista hoy nos vemos en el Meetup de TensorFlow donde seguro veremos una buena dosis de automatización para la segmentación de imágenes: 20:10 Using U-Nets with TensorFlow for 3D Medical Image Segmentation. Aquí el enlace: Link

IdNombreVersiónEmpresa
1Oracle Warehouse Builder (OWB)11gR1Oracle
2Data ServicesXI 4.0SAP Business Objects Newest version examined
3IBM Information Server (Datastage)8.1IBM
4SAS Data Integration Studio4.4SAS Institute Newest version examined
5PowerCenter Informatica9.5Informatica Newest version examined
6Elixir Repertoire7.2.2Elixir
7Data Migrator7.7Information Builders Newest version examined
8SQL Server Integration Services10.0Microsoft
9Talend Studio for Data Integration5.2Talend
10DataFlow Manager6.5Pitney Bowes Business Insight
11Pervasive Data Integrator10.0Pervasive Software
12Open Text Integration Center (ETL GENIO)7.1Open Text
13Oracle Data Integrator (ODI)11.1.1.5Oracle Newest version examined
14Data Manager/Decision Stream8.2IBM (Cognos)
15Clover ETL3.1.2Javlin
16Centerprise5.0Astera  Newest version examined
17DB2 Infosphere Warehouse Edition9.1IBM
18Pentaho Data Integration4.1Pentaho
19Adeptia Integration Suite5.1Adeptia
20DMExpress5.5Syncsort Newest version examined
21Expressor Data Integration3.7QlikTech Newest version examined

0 comentarios: