Búsqueda personalizada
Divestadística SOFTWARE ESTADÍSTICO

 

Descubriendo la información oculta en los datos


Carlos Ilia Herráiz Montalvo
Licenciado en Informática
Director de Sistemas de Información - Agencia Pública Empresarial Sanitaria Alto Guadalquivir


La minería de datos o data minning es una técnica que busca obtener información valiosa que pueda estar oculta entre grandes cantidades de datos.

La complejidad de esta técnica, unido al gran volumen de datos que habitualmente se analizan, requiere del uso de programas informáticos que se pueden adquirir o bien utilizar algún software de uso libre (gratuito) que también existe para estos cometidos.

 

Los programas informáticos comerciales o de pago tienen una gran cantidad de prestaciones que sólo son verdaderamente aprovechadas por usuarios expertos o bien en organizaciones con departamentos dedicados a esta labor. Para comenzar a experimentar en la minería de datos recomendamos utilizar programas gratuitos (software libre), con los que vamos a poder disponer de una gran cantidad de métodos y formas diferentes para el descubrimiento de la información. En la web The Data Mine podemos encontrar una extensa lista de esos programas informáticos.

 

Para iniciarse en este campo destacamos dos paquetes de software libre: Weka y RapidMiner. En este artículo nos vamos a centrar en describir brevemente RapidMiner.

Este programa informático está hecho en un lenguaje de programación (Java), que nos va permitir usarlo prácticamente en cualquier ordenador. Como otros programas informáticos de minería de datos, RapidMiner propone una forma intuitiva de uso para combinar métodos que permitan encontrar la información oculta en los datos. El principal trabajo que debemos realizar para aprender a utilizar este tipo de software es conocer qué métodos ofrece, qué función realiza cada uno y cómo puede relacionarse con otros métodos.

 

Software estadístico. RapidMiner

 

RapidMiner dispone de diferentes recursos y ayudas para dar los primeros pasos con él. Podemos comenzar a explorar los ejemplos que provee cuando pinchamos la opción del tutorial en la aplicación. Son más de 20 proyectos con los que podemos jugar y experimentar a la vez que vamos entendiendo qué información pretende encontrar.

 

Software estadístico. RapidMiner

 

También puede descargarse un extenso manual que se inicia con unos fundamentos técnicos y luego atraviesa las diferentes etapas y elementos que intervienen en la construcción de procesos para el descubrimiento de información útil. Por último, podemos también conocer el uso de la aplicación de una manera más visual mediante los diferentes videos a modo de tutorial que la página web de los creadores de RapidMiner ofrece.

 

Un aspecto interesante de RapidMiner es que, aunque es un software libre, sus fabricantes ofrecen también versiones de pago que mejoran en servicios la versión libre, de tal manera que si tenemos una experiencia positiva con este aplicativo podemos ir avanzando hacia una herramienta más profesional.

 

     Abril de 2011


[ Volver al listado ]