Qué es la Ciencia de Datos ?

Ya sabemos qué son los datos, dónde están y su tremenda importancia en la construcción de sociedades inteligentes. Además de la excelente infografía publicada en el Blog de Wikibon este artículo se adentra en la discusión conceptual en torno a qué es la Ciencia de los Datos. En términos generales, Data Science es el conjunto de prácticas sobre almacenamiento, gestión y análisis de conjuntos de datos lo suficientemente grandes que requieren de computación distribuida y recursos de almacenamiento. En la actualidad la mayoría de las fuentes de datos están en internet y relacionadas con las transacciones, pero no hay que ignorar cualquier otro tipo de fuentes. Como dice Mike Loukides “el futuro pertenece a las empresas y personas que puedan transformar datos en productos”. Ahora el problema no es encontrar datos sino saber qué hacer con ellos. La cuestión a la que se enfrenta toda empresa, hoy en día, es cómo usar los datos de forma efectiva. No sólo los datos propios sino de múltiples fuentes, todos los datos que están a disposición y son relevantes. Usar los datos de forma efectiva requiere algo diferente de las tradicionales estadísticas. Lo que diferencia el Big Data de las estadísticas es que la Ciencia de Datos tiene un enfoque holístico que tenga que ver con la recopilación de información, y su conversión a un mensaje manejable que cuente una historia”. Lea el artículo aquí

Anuncios