viernes, 30 de octubre de 2015

“Big data” es una estupidez: dice el CTO de la campaña de Obama

Llámenlo simplemente “data”, dice Harper Reed.

“Big data”, según Harper Reed, es una estupidez. Esta es una opinión bastante sorprendente viniendo del hombre que, como jefe de tecnología de la campaña “Obama for America”, dirigió la parte técnica de la reelección del presidente de los Estados Unidos, en lo que fue aclamado por el gran crecimiento para la política que inició en materia de Big Data.
Reed ayudó a construir una organización de tecnología que encabezó la parte digital de la campaña de Barack Obama, la cual proveyó herramientas esenciales en los esfuerzos por “salir a votar” en un país donde el voto no es obligatorio.
“Big data es un término que usábamos en 2007 porque era difícil almacenar información”. Reed contó en la sesión de apertura del CeBIT en Sydney. “Era literalmente difícil”.
“Era costoso. Costaba miles de millones de dólares. Los que lo hacían, lo hacían muy bien, pero lo hacían en habitaciones cerradas con enormes presupuestos. Y nosotros éramos como una especie de hippies de la computación en un rincón, pensando ‘Tengo demasiada información! Cómo almaceno esto?’”
Las tecnologías para ese problema existen hace bastante ya, dice Reed. Tecnologías como Hadoop, una plataforma creada por Doug Cutting para distribuir información, HBase, que se utiliza para los correr mensajes de Facebook y el documento publicado por los investigadores de Google que esquematizan el sistema de base de datos BigTable de la compañía, significan que manejar grandes cantidades de información es mucho más sencillo.
“Cuando comenzamos a hablar de Big data, se trataba solo de almacenamiento. No tenía que ver con análisis, no había preguntas ni respuestas que hacerse. Solo se trataba de almacenamiento,” dijo Reed.
“Cuando escucho sobre Big data, inmediatamente escucho a Marketing y muchas otras personas diciendo algo como, ‘Bueno, necesitamos invertir en Big data’… Miro alrededor y veo todas estas grandes marcas… y están haciendo cosas realmente grandes pero la verdad es que han entrado en este mundo de Marketing hablando de problemas que están prácticamente resueltos.”
Las compañías que están en el carro de la Big data están ofreciendo realmente plataformas analíticas para obtener respuestas, dijo Reed.
“Creo que eso es realmente lo importante”, dijo Reed. “Estoy simplemente cansado de que lo llamen Big data. Debería ser llamado simplemente data. Y además apuesto que hay pocas personas aquí en este salón que realmente tengan datos que sea grandes. Probablemente tengan grandes cantidades de datos o datos medianos y largos. Pero son realmente los grandes datos los que son todavía verdaderamente un dolor de trasero y es aún difícil.”

Rayin Ghani, el director científico de datos de la campaña, dijo en broma que la cantidad de datos con la que la campaña “Obama for America” tuvo que lidiar era menos de lo que tenía él en su casa. “Tengo más discos duros en mi apartamento que los que la campaña ha registrado”, dijo Ghani.

No hay comentarios: