Vasudha Gonapa
La minería de datos es un proceso de descubrimiento de patrones en grandes conjuntos de datos que involucra métodos en la intersección del aprendizaje automático, las estadísticas y los sistemas de bases de datos. La minería de datos es un subcampo interdisciplinario de la informática y la estadística cuyo objetivo general es extraer información (con métodos inteligentes) de un conjunto de datos y transformar la información en una estructura comprensible para su uso posterior. La minería de datos es el paso de análisis del proceso de "descubrimiento de conocimiento en bases de datos" o KDD. Además del paso de análisis en bruto, también involucra aspectos de gestión de datos y bases de datos, preprocesamiento de datos, consideraciones de modelos e inferencias, métricas de interés, consideraciones de complejidad, posprocesamiento de estructuras descubiertas, visualización y actualización en línea.