¿Qué es el datamining y para qué sirve?
La minería de datos es un conjunto de técnicas avanzadas para la extracción de información predecible escondida en grandes bases de datos, con el fin de conseguir los objetivos de negocio (Business Intelligence).
El datamining incorpora la utilización de tecnologías basadas en redes neuronales, árboles de decisión, reglas de inducción, análisis de series temporales… y visualización de datos.
Bibliografía recomendada:
Data Mining: The Textbook por Springer. (en inglés)
«Este libro de texto explora los diferentes aspectos de la minería de datos, desde los fundamentos hasta los tipos de datos complejos y sus aplicaciones, capturando la amplia diversidad de dominios problemáticos para cuestiones de minería de datos.
Va más allá del enfoque tradicional en los problemas de minería de datos para introducir tipos de datos avanzados como texto, series de tiempo, secuencias discretas, datos espaciales, datos gráficos y redes sociales.
Hasta ahora, ningún libro ha abordado todos estos temas de manera integral e integrada. Los capítulos de este libro se dividen en una de tres categorías:
Capítulos fundamentales: la minería de datos tiene cuatro problemas principales, que corresponden a la agrupación, clasificación, minería de patrones de asociación y análisis de valores atípicos. Estos capítulos discuten ampliamente una amplia variedad de métodos para estos problemas.
Capítulos de dominio: estos capítulos discuten los métodos específicos utilizados para diferentes dominios de datos, como datos de texto, datos de series de tiempo, datos de secuencia, datos de gráficos y datos espaciales.
Capítulos de aplicaciones: estos capítulos estudian aplicaciones importantes como la minería de transmisiones, la minería web, la clasificación, las recomendaciones, las redes sociales y la preservación de la privacidad. Los capítulos de dominio también tienen un sabor aplicado.
Apropiado para cursos de minería de datos introductorios y avanzados, Data Mining: The Textbook equilibra los detalles matemáticos y la intuición.
Contiene los detalles matemáticos necesarios para profesores e investigadores, pero se presenta en un estilo simple e intuitivo para mejorar la accesibilidad para estudiantes y profesionales de la industria (incluidos aquellos con una formación matemática limitada).
Se incluyen numerosas ilustraciones, ejemplos y ejercicios, con énfasis en ejemplos semánticamente interpretables.»
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking (English Edition) por O’Reilly Media.
«Escrito por los renombrados expertos en ciencia de datos Foster Provost y Tom Fawcett, Data Science for Business presenta los principios fundamentales de la ciencia de datos y lo guía a través del «pensamiento analítico de datos» necesario para extraer conocimiento útil y valor comercial de los datos que recopila.
Esta guía también lo ayuda a comprender las muchas técnicas de minería de datos que se utilizan actualmente.
Basado en un curso de MBA que Provost ha enseñado en la Universidad de Nueva York durante los últimos diez años, Data Science for Business proporciona ejemplos de problemas comerciales del mundo real para ilustrar estos principios.
No solo aprenderá cómo mejorar la comunicación entre las partes interesadas de la empresa y los científicos de datos, sino también cómo participar de manera inteligente en los proyectos de ciencia de datos de su empresa.
También descubrirá cómo pensar analíticamente los datos y apreciará plenamente cómo los métodos de ciencia de datos pueden apoyar la toma de decisiones empresariales.
- Comprenda cómo la ciencia de datos se adapta a su organización y cómo puede usarla para obtener una ventaja competitiva.
- Trate los datos como un activo comercial que requiere una cuidadosa inversión si desea obtener un valor real.
- Aborde los problemas comerciales de forma analítica de datos, utilizando el proceso de minería de datos para recopilar buenos datos de la manera más adecuada.
- Aprender conceptos generales para extraer conocimiento de los datos.
- Aplicar los principios de la ciencia de datos al entrevistar a candidatos para trabajos de ciencia de datos.»