Miércoles, 25 Enero 2017 16:30

Minería de datos: información, tendencias y predicciones.

 

MineriaDatos


Durante los últimos años, el desarrollo tecnológico ha provocado que el nivel competitivo de las empresas sea cada vez mayor, éstas buscan constantemente la creación de productos y servicios que se adapten a las necesidades de los consumidores y los usuarios. Gran número de empresas, y sobre todo aquellas que están mejor organizadas, han sabido invertir y aprovechar los grandes beneficios de la minería de datos, una ciencia que, aunque es relativamente nueva, se ha vuelto indispensable en el avance tecnológico.

Como un primer acercamiento, se puede decir que la minería de datos es una ciencia relativamente nueva que es entendida como el proceso de analizar grandes cantidades de información para obtener aquello que permanece oculto pero que es de vital importancia para la mejora de procesos y para el entendimiento sobre lo que la gente requiere, lo que está buscando o lo que necesita. De acuerdo con el doctor Adolfo Guzmán Arenas, investigador del Centro de Investigación en Computación del Instituto Politécnico Nacional (IPN) y miembro del Consejo Consultivo de Ciencias (CCC), “los datos dicen muchas cosas: lo que la gente compra, si es un conjunto de hospitales dicen qué enfermedades existen, cuánto duran, cuáles son las complicaciones, si es un centro grande como el Politécnico, pues nos dice qué estudiantes egresan, si los hijos de madres solteras tienen mejores posibilidades o no, etc”.

El doctor Guzmán Arenas, quien también fuera profesor del departamento de Ingeniería Eléctrica del Massachusetts Institute of Technology (MIT), comentó en entrevista para el CCC que el auge de la minería de datos fue motivado por el abaratamiento de tres cosas: i) el de la computadora: anteriormente procesar datos era demasiado costoso; ii) el disco duro: la capacidad de almacenamiento ha incrementado bastante; y iii) las comunicaciones: con la invención del Internet se acortó tiempo y distancia, lo que facilita la conectividad desde cualquier parte del mundo.

Sobre la diferencia entre la minería de datos y el famoso Big Data, el doctor Guzmán menciona que es prácticamente lo mismo, pero con una ligera diferencia, “Big data son muchos más datos que requieren de varios discos y por consiguiente de varios procesadores.” El abaratamiento de las computadoras, los discos duros de gran capacidad y la evolución de las comunicaciones ha dado pie a que las personas puedan, además de almacenar grandes cantidades de información, entenderla.

Sin embargo, a pesar de que la obtención de información y el entendimiento de los datos cada vez adquiere más valor, la mayoría de las empresas o instituciones que se auxilian de la minería de datos llegan a ella sin planearlo, es decir, pocas son aquellas que de primera instancia recolectan la información de manera sistemática para posteriormente analizarla y usarla a su favor. La mayoría de los casos ocurre de manera inversa, obtienen los datos por alguna otra razón y luego surge la necesidad de analizarlos mediante la minería de datos.

Según el Dr. Guzmán, este proceso puede ser visto de forma sencilla en cuatro pasos esenciales: primero se debe acceder a la información sustantiva de la empresa, mejor conocida como datos operacionales (clientes, productos, tiendas, ventas, vendedores, sucursales, etc.); como segundo paso se lleva a cabo la limpieza de la información; el tercer paso es la conformación de una “bodega de datos” (en inglés data warehouse), constituida por la “información limpia” de la empresa. En este punto los expertos pueden realizar un primer nivel de análisis comúnmente llamado “minería a ojo” y es utilizado en el business analytics o inteligencia de negocios.

Por último, el cuarto paso es la construcción de un cubo de datos, el cual responde a una manera especial de organizarlos. En este paso el nivel de análisis permite identificar tendencias, desviaciones, patrones frecuentes, reglas de asociación, por ejemplo, cuáles son los principales clientes, quienes compran más, qué tienda vende más y cuándo lo hace y un sinfín de cosas.

En México esta ciencia sigue evolucionando; la minería de datos ha crecido más por la necesidad que por la dedicación. El doctor Guzmán explica que “anteriormente había pocos datos y las computadoras eran lentas, por eso se inventó la estadística, el arte de tomar una parte de los datos y predecir el todo, ahora la minería de datos dice… no, no me des una parte, dame todo y voy a predecir mejor porque tengo toda la información”.

La minería de datos tiene tres pilares: i) la base de datos, se debe saber manejar con fluencia; ii) la estadística, se debe saber cuándo una tendencia no es aleatoria, sino que tiene significancia y tiene bastante soporte y; iii) un poco de inteligencia artificial porque se usan predictores.

Es importante mencionar que existen situaciones en las que la minería de datos puede producir errores, a veces éstos no tienen una variable importante, están sesgados o se cree que tal información no sirve, en otras ocasiones los datos se descartan o se limpian mal, pero también a veces el análisis es erróneo o se hacen interpretaciones equivocadas.

Lo que es cierto es que la minería de datos está adquiriendo mayor relevancia entre las empresas y las instituciones, la información que brinda puede ser fundamental para el eficaz manejo de recursos, la mejora de procesos internos, la creación de productos y servicios diseñados para segmentos específicos y el incremento de ingresos.

 

 

Inicio