Como ya lo hemos tratado antes, la internet ha facilitado el acceso a la información y genera grandes cantidades de la misma, lo que ha propiciado una “infoxicacion” como lo llama Alfons Cornellá, investigador en este campo; “Es no poder profundizar en nada, y saltar de una cosa a la otra. Es el resultado de un mundo en donde se prima la exhaustividad («todo sobre») frente a la relevancia («lo más importante»)”, afirma Cornellá en un artículo publicado en su página oficial sobre la infoxicación.
Se calcula que cada día Google procesa cerca de 25 petabytes (un millón de gigabytes) de datos. Por ejemplo en YouTube se sube una hora de vídeo cada segundo y Facebook comparte más de 10 millones de fotografías en los Data warehause (almacenes de datos). Ahora tenemos la información, pero ¿tenemos el conocimiento?
Una de las maneras de llegar a este conocimiento es a través de la minería de datos, nombre que se le da al proceso de extracción de la información dentro de los grandes volúmenes de datos o Big Data (término en inglés) por medio de procesos matemáticos con el fin de llegar a generar un conocimiento.
Ferley Medina Rojas, docente de Ingeniería de Sistemas en la Universidad Cooperativa y docente de Ingeniería de Software en la USCO, precisamente está haciendo su trabajo de doctorado basado en la minería de datos. Para hacer minería de datos según el profesor lo más importante es saber que es lo que se quiere buscar, “tener claro cuál es el objetivo hace más exacto el resultado”.
A través de procesos y métodos cualitativos en donde se trabajan con grandes cantidades de información ayudándose de bases de datos, estadisticas, software, entre otros métodos matemáticos; lo que se hace es analizar y estudiar esta información para llegar a un conocimiento o un resultado, explica el profesor Ferley.
En la minería de datos básicamente lo hace es darle características a los datos, unas ves dadas las características uno puede “entrenar” los datos para que lleguen a cierto resultado evitando procesos esenciales donde se aplican una serie de métodos inteligentes para poder extraer y descubrir patrones de los datos.
Para este proceso de trabajo de minería de datos es importante tener en cuenta:
Modelos de la minería de datos
Cuales son los tipos de datos, el objetivo al que queremos llegar, la manera de explorar y la construcción de un modelo con el que demos explicación al comportamiento de los datos.
La clasificación de los datos
“Agrupa las reglas de asociación, decisión, métodos, funciones, núcleos, vectores para descubrir las relaciones entre los atributos de un conjunto de datos de acuerdo con un porcentaje de error permitido (umbral), descubriendo relaciones de asociación, segmentación, dependencias funcionales y no funcionales entre los diferentes atributos” funcionalidades de la minería de datos, Revista Ingeniería y Región Universidad Surcolombiana.
Predicción de valores en función de datos
Por medio del entrenamiento de los datos se puede encontrar relaciones o guías, esto dando un vale estimado a la función construida apartar de datos que ya conocemos. Genera patrones que de comportamientos para diferentes usos, seguimientos, cálculos, entre otras actividades.
La minería de datos la podemos aplicar a casi todas las actividades y disciplinas que realiza el hombre, puesto que toda actividad humana genera datos por consiguiente se puede llegar a un saber con ellos; medicina, educación, artes, tecnología, economía, el campo, la industrias, etc. Todos ellos contienen características, atributos, variables, patrones en su día a día que por medio de esta disciplina puede hacer mas fácil la toma decisiones del ser humano.
A continuación graficamos el proceso aplicado generalmente para la investigación. Puede ser tomado como guía para sus búsquedas en la web:

Fotografía principal: face.unt.edu.ar