El gran reto de la era del big data: refinar los datos

En la era del big data, los datos se han convertido en el nuevo petróleo. Pero solo serán útiles después de haber sido extraídos y procesados, añade Derrick Harris. Este periodista tecnológico, en una nota publicada en Gigaom, pone de relieve algo que a menudo se pasa por alto cuando se habla de big data: que, al igual que el petróleo, los datos necesitan ser refinados para convertirse en gasoil o en gasolina.

 
En la era del big data, los datos se han convertido en el nuevo petróleo. Pero solo serán útiles después de haber sido extraídos y procesados, añade Derrick Harris. Este periodista tecnológico, en una nota publicada en Gigaom, pone de relieve algo que a menudo se pasa por alto cuando se habla de big data: que, al igual que el petróleo, los datos necesitan ser refinados para convertirse en gasoil o en gasolina.
 
Harris destaca la iniciativa Data for Everyone [Datos para todos], de la empresa Figure Eight, que ha publicado una serie de grupos de datos listos para su análisis. Se trata de datos en los que los empleados de esta empresa han trabajado durante mucho tiempo y que ahora están accesibles para todos aquellos que quieran utilizarlos. 
 
Los analistas de datos emplean el 85 por ciento del tiempo en dar formato a los datos y el 15 por ciento restante en analizarlos, subraya Harris. Data for Everyone es una respuesta a este problema, pues proporciona datos completamente listos para su uso. Incluso los servicios como Infochips o Quandl, que proporcionan grupos de datos, no los muestran formateados, lo que obliga a trabajar en ellos.  
 
«Comenzaremos a ver más mercados de datos de calidad y mejores herramientas para recoger datos», asegura Harris. A menudo la gente y las empresas no cuentan con los medios para recoger los datos y la habilidad de procesarlos, incluso aunque los generen ellos mismos, explica Harris.`
 

 


© Copyright Fundación Germán Sánchez Ruiperez, 2010