Búsqueda personalizada
Divestadística CINEMA ESTADÍSTICO

 

La convergencia

 

Julia Sánchez-Cantalejo Castañeda

Diplomada en Ciencias y Técnicas Estadísticas
Escuela Andaluza de Salud Pública (Granada)


La minería de datos o data mining es una técnica consistente en la obtención de información relevante que se halla oculta en grandes bases de datos. Dicho mecanismo, mediante el uso de la estadística y la informática, puede resolver cuestiones en ámbitos tan diversos como la ciencia, los negocios o Internet.

 

Cinema Estadístico. La convergencia

En la serie televisiva Numb3rs podemos ver que las matemáticas y la estadística son tremendamente útiles a la hora de encontrar soluciones a problemas de todo tipo. En el capítulo 7 de la segunda temporada, La convergencia, el protagonista hace uso de la minería de datos en un caso complejo e interesante:

 

Siete atracos similares en seis meses. Familias ricas residentes en lujosas viviendas con antigüedades muy valiosas. Delincuentes con pasamontañas y armas que no utilizan. Dos víctimas mortales.

 

Don Epps, jefe de la unidad de delitos del FBI, se enfrenta a un caso lleno de incógnitas. No hay relación aparente entre las siete familias, a excepción de ser todas ricas. Además de su equipo, Don va a necesitar a su hermano, Charlie Epps, el inteligentísimo matemático que protagoniza esta serie.

 

(min 3:40)
Charlie: Usaré la minería de datos [data mining], un sistema para analizar información.
Megan Reeves: La inteligencia militar lo usa para identificar ataques terroristas.
Charlie: Yo diseño un algoritmo basado en esos crímenes y el algoritmo, con esos datos, busca correlaciones.
Don: Bien, te daré todo lo que tengo sobre esas familias.
Megan: Sí... domicilio, colegios, tiendas, restaurantes, personal de servicio...
Charlie: Necesito algo más.
Don: ¿Más que toda esa información?
Charlie: Más. Más de todo. Necesito las estadísticas de delitos del último medio año en el condado.
Megan: ¿Pero tantos datos no añadirán complejidad a la búsqueda?
Charlie: Al contrario, cuantos más datos, más probabilidades de encontrar algo. Es como cuando quieres armar un puzzle: empiezas por unas pocas piezas, las demás están en la caja, todas las piezas que tienes acabarán por encajar en tu puzzle. En la caja están esas piezas y nada más. Pero resolver un problema de la vida real es como armar un rompecabezas cuando todas las piezas que necesitas están mezcladas con piezas de otros rompecabezas. Empiezas por coger unas cuantas fichas de la caja y muchas no encajan. Tienes que revisar la caja entera y separar las piezas que son de tu puzzle. El algoritmo revisa todas las piezas y entresaca aquellas que encajan.
Don: De acuerdo. Bien. Te daré todos esos datos, ¿vale?

 

La idea comienza a dar sus frutos y, a partir de dicho algoritmo, Charlie realiza un análisis de la información hallando un patrón de fechas.

 

(min 10:00)
Charlie: Los días rojos son ataques conocidos, los azules son los días en que tienen que haber ataques pero no los hay. Lo que tenemos que preguntarnos es: ¿cómo sabemos que no los hay?

 

Partiendo de esta suposición y gracias al patrón, calcula que el próximo delito se cometerá aproximadamente en tres días. El FBI descubre que en los días azules unos atracadores con pasamontañas cometieron robos a coches lujosos localizándolos a través de sus móviles. A continuación, un antiguo rival de Charlie plantea una teoría para encontrar la conexión entre las familias, una corriente aparentemente oculta.

 

¿Cómo localizaban y vigilaban a las víctimas? ¿Cuál es el vínculo encontrado a raíz de la teoría de conjuntos? ¿Qué relación hay entre los móviles y los objetos robados? Han de darse prisa, ya se ha cometido otro atraco.

Si quieres descubrir las claves y el resultado final del caso, no te pierdas este apasionante y estadístico episodio de Numb3rs.

 

     Abril de 2011


[ Volver al listado ]