Big Data y polĂtica
¡Yorokobu gratis en formato digital!
Durante la campaña electoral, Barack Obama sorprendiĂł, en reiteradas ocasiones, con alusiones directas al incremento de profesores de matemáticas (estadĂsticos, analistas de datos…) en el sistema de educaciĂłn norteamericano como garantĂa para la competitividad y la innovaciĂłn en la economĂa.
Sin embargo, su defensa de estas profesiones venĂa de lejos. No era una intuiciĂłn, era una convicciĂłn. En febrero de 2011, un año antes de que comenzaran las campañas (con las primarias de fondo), el presidente Obama presentĂł su propuesta de presupuesto en el que la cifra asignada al área de educaciĂłn era de las pocas donde se veĂa un aumento. El Presidente exigĂa que un total de 77,4 mil millones de dĂłlares fueran invertidos en reformas dirigidas a los temas de ciencia, tecnologĂa, ingenierĂa y matemáticas. Para algunos, este apoyo a la educaciĂłn era tan solo una demostraciĂłn de su adhesiĂłn a polĂticas sociales asistencialistas, pero estaban equivocados. Obama entendĂa, como pocos, la necesidad de reactivar la economĂa del paĂs a travĂ©s de un fuerte y decidido impulso tecnolĂłgico y una cultura cientĂfica basada en las matemáticas como estĂmulo para la creatividad.
La fe y la lealtad de Obama en los matemáticos, ingenieros e informáticos fueron cruciales en su defensa y argumentación sobre cómo conseguirlo. Para algunos era inaudito que el presidente de los Estados Unidos hablara de la necesidad de tener y formar a más profesores, más matemáticos y más ingenieros en un momento en el que la tasa de desempleo no bajaba del 8%.
“HabĂa más imaginaciĂłn en la cabeza de ArquĂmedes que en la de Homero”.
Voltaire
La Cueva
Un dĂa despuĂ©s de su victoria electoral, Obama nos mostrĂł su “secreto”. Solo un medio de comunicaciĂłn, TIME Magazine (que ha vuelto a conceder al Presidente el tĂtulo de “personaje del año”, como ya hiciera en 2008), conocĂa hasta ese momento la que habĂa sido su arma secreta en la consecuciĂłn de los votos electorales clave. El miĂ©rcoles 7 de noviembre, la revista estadounidense publicĂł el artĂculo que revelaba las interioridades de La Cueva.
La Cueva era una sala secreta del cuartel general de campaña en Chicago donde se ponĂa en marcha toda la maquinaria cibernĂ©tica que consiguiĂł el mĂ©todo de análisis, prospectiva, simulaciĂłn y estrategia que garantizĂł su victoria. Como en la pelĂcula El club de la lucha, existĂan unas reglas y las tres primeras tenĂan que ver con mantener en silencio su existencia.
Durante muchos meses, un equipo de informáticos y matemáticos permanecieron encerrados en un recinto aislado al que solo su jefe de campaña, Jim Messina, tenĂa acceso y conocimiento sobre las actividades que allĂ se realizaban.
La campaña de Obama logrĂł construir “la mayor maquinaria polĂtica en los EEUU, con delegaciones establecidas durante más de un año en los Estados decisivos y apuntalada por herramientas digitales pioneras” que jamás se habĂan visto. Ya no se trataba de conseguir informaciĂłn, ni voluntarios, sino de aprovechar la informaciĂłn de la mejor manera posible. NingĂşn dato sobraba y todo era relevante, desde las costumbres del dĂa a dĂa de los votantes hasta dĂłnde iban de vacaciones los indecisos. Todo ello iba alimentando una gigante bĂłveda de datos.
El método
Un gran big data electoral (respondiendo al principio de las “3V”: alta velocidad, alta variabilidad, alto volumen) fue gestionado para identificar patrones de comportamiento e hipĂłtesis de respuesta a los estĂmulos, la acciĂłn y la comunicaciĂłn polĂtica. Datos “fĂsicos” (datos pĂşblicos vinculados a la identidad, el geoposicionamiento, las condiciones socioeconĂłmicas o territoriales y el comportamiento electoral), a los que se añadieron datos de “consumo” (adquisiciones, subscripciones, donaciones, aportaciones…), más datos de “conversaciones” (gracias a la minerĂa de datos de las redes sociales) y, finalmente, datos “experimentales” de la acciĂłn polĂtica en la comunicaciĂłn digital o en la campaña de tierra (puerta a puerta, call centers…).
Todo ello permitiĂł la gestiĂłn de informaciĂłn segmentada en decenas de criterios sobre los votantes, sus gustos y su modo de vida, demostrando que el ganador serĂa quien más compartiera con ellos, afinidades y preocupaciones. Esto, finalmente, fue lo que ayudĂł al equipo de Obama a diseñar un mensaje especĂfico, centrado y dirigido a cierto segmento de la poblaciĂłn, con un mejor y mayor control.
El proceso fue largo y arduo. Durante 18 meses, el equipo de La Cueva se dedicĂł a unificar todas las bases de datos que habĂan empleado los diversos equipos de campaña de Obama en 2008. El resultado fue una gran base de datos que incluĂa desde listas de donantes a datos recogidos por encuestadores y voluntarios -que habĂan ido puerta a puerta durante meses buscando el voto-, o recopilados a travĂ©s de las redes sociales. Esos datos fueron cruzados, comparados y verificados continuamente hasta el Ăşltimo minuto de campaña y hasta el Ăşltimo detalle relacionado con el votante.
“Las matemáticas poseen no solo la verdad, sino cierta belleza suprema. Una belleza frĂa y austera, como la de una escultura”.
Bertrand Russell
Una vez contaban con esa artillerĂa, los tĂ©cnicos comenzaban a testear perfiles de decenas de millones de electores con programas informáticos de predicciĂłn sobre distintas reacciones y motivaciones que podrĂan llevar a una persona a votar por Obama. En ese punto, el gĂ©nero, la edad, el nombre y la raza se convertĂan solo en un primer umbral de la informaciĂłn; los analistas debĂan conocer, tambiĂ©n, el tipo de series de televisiĂłn que veĂan en su tiempo libre, o los medios a travĂ©s de los cuales compartĂan informaciĂłn con sus amigos; es decir, actitudes, gustos y disgustos de su vida en general.
Y aquĂ entrĂł en juego Facebook. A travĂ©s de esta red social, mediante la aplicaciĂłn Are you in, el votante podĂa inscribirse, ya fuera para ayudar, para ser voluntario o simplemente para informarse; daba igual, lo importante era que, al conectarse con Facebook, el usuario daba acceso directo al equipo de Obama no solo a su perfil sino al perfil de todos sus amigos en esa red social. Esto terminĂł por convertir la gran cantidad de datos en un alud gigante de informaciĂłn sobre millones y millones de personas.
Controlar y saber manejar esta información era el mayor reto. Pero una vez más su ejército de nerds encerrados en el cuartel de La Cueva lograron sacar el mejor provecho a cada dato, a cada nombre y a cada Estado, de tal manera que cada nombre y cada dato se convirtieron -potencialmente- en un voto.
El rivalÂ
El equipo de Obama no descubriĂł nada, solo se adaptĂł mejor. Mitt Romney y su equipo usaban una, hasta entonces, buena base de datos denominada ORCA, que alimentaban con los datos que iban consiguiendo en campaña y que tenĂa como principal objetivo conseguir que el dĂa de las elecciones sus simpatizantes fueran a votar. Sin embargo, no funcionĂł del todo y muchos datos se perdieron. No era tan buena, ni tan actualizada, ni conseguĂa encontrar las relaciones entre los activistas que sĂ consiguiĂł la herramienta de Obama.
El equipo del Presidente sĂ innovĂł: de las redes sociales a la estrategia de datos. Como indicaba David Axelrod respecto al cambio de herramientas online: “En 2008, este tipo de campaña usaba la mejor tecnologĂa posible. Pero estamos a años luz de donde estábamos en 2008. Hemos tenido que reinventarnos y pensar en todas las herramientas que estaban disponibles para nosotros -que proporcionan datos más ricos, más medios quirĂşrgicos para hablar con los votantes. Se trata de invertir en personas -son casi mayoritariamente jĂłvenes- que entienden dĂłnde va la tecnologĂa y cuál será su potencial en el año 2016 en comunicaciones, para apuntar al blanco, para la minerĂa de datos, para conseguir la mayor precisiĂłn posible en tĂ©rminos de persuasiĂłn y movilizaciĂłn. […] Sabemos mucho más sobre el electorado que en 2008. PodĂamos hacer juicios más precisos sobre las actitudes de los votantes, sobre lo que era importante para ellos individualmente, sobre quiĂ©n iba participar y quiĂ©n no era probable que participara. AsĂ que tenĂamos gran confianza en nuestros datos. RecibĂ informes cada noche”.
El horizonte
No se puede hablar de Big Data sin hacer referencia a Nate Silver, el estadĂstico que revolucionĂł las predicciones electorales de los medios de comunicaciĂłn y las empresas de sondeos y encuestas con un mĂ©todo basado en la estadĂstica y la probabilidad y no en la mediciĂłn e interpretaciĂłn. La innovaciĂłn real en las pasadas elecciones fue la relevancia de los modelos estadĂsticos por encima de las apreciaciones de los pundits (tertulianos de toda la vida) sobre el desarrollo de las elecciones.
Su mĂ©todo era simple, pero complejo al mismo tiempo: 1. HacĂa la suma de muchas (muchas!) encuestas. 2. Sacaba un promedio, no un promedio simple ya que tenĂa en cuenta tres variables: a. Momento de la publicaciĂłn de la encuesta, b. Margen de error, c. Calidad (el medio que la publicaba, si histĂłricamente habĂa acertado o no…). 3. Estudiaba cada Estado. No se centraba en las encuestas de intenciĂłn de voto a nivel nacional sino de Estado por Estado. Para ello tambiĂ©n se tenĂa en cuenta la elecciĂłn de senadores, la participaciĂłn histĂłrica, la ventaja del candidato, los factores demográficos… todo a travĂ©s de una regresiĂłn lineal. 4. Finalmente, esos datos se introducĂan a modo de algoritmo en un software que ofrecĂa los resultados finales.
Las disciplinas y profesiones estratĂ©gicas para la gestiĂłn eficiente de la polĂtica y de las campañas electorales van a padecer un vuelco: de las ciencias sociales (sociĂłlogos, periodistas, politĂłlogos, asesores de comunicaciĂłn…) a las ciencias exactas (matemáticos, estadĂsticos, analistas de datos, visualizadores gráficos).
España
Nuestro paĂs (y nuestra polĂtica) tiene un gran dĂ©ficit en cultura matemática. Hay buenos profesionales, pero no hay un reconocimiento a la profesiĂłn y nuestra arquitectura de datos pĂşblicos disponibles es muy baja en relaciĂłn a la media europea. No es extraño que seamos uno de los poquĂsimos paĂses que no tiene -todavĂa- legislaciĂłn sobre la transparencia y que el Open Data y el Open Government estĂ©n muy retrasados en su desarrollo. Además, en España, el reto es doble: la producciĂłn de datos brutos y el know how para su análisis. No se trata solo de producir los datos sino de saber analizarlos (cruzarlos, ponderarlos) y convertirlos en informaciĂłn Ăştil para su reconversiĂłn en votos. Cada detalle cuenta. Convertir los datos en comportamientos es la clave, para comprender el fondo de los votantes: “Sin matemáticas no se penetra hasta el fondo de la filosofĂa; sin filosofĂa no se llega al fondo de las matemáticas; sin las dos no se ve el fondo de nada”.
(Bordas-Desmoulin)
¡Yorokobu gratis en formato digital!
Durante la campaña electoral, Barack Obama sorprendiĂł, en reiteradas ocasiones, con alusiones directas al incremento de profesores de matemáticas (estadĂsticos, analistas de datos…) en el sistema de educaciĂłn norteamericano como garantĂa para la competitividad y la innovaciĂłn en la economĂa.
Sin embargo, su defensa de estas profesiones venĂa de lejos. No era una intuiciĂłn, era una convicciĂłn. En febrero de 2011, un año antes de que comenzaran las campañas (con las primarias de fondo), el presidente Obama presentĂł su propuesta de presupuesto en el que la cifra asignada al área de educaciĂłn era de las pocas donde se veĂa un aumento. El Presidente exigĂa que un total de 77,4 mil millones de dĂłlares fueran invertidos en reformas dirigidas a los temas de ciencia, tecnologĂa, ingenierĂa y matemáticas. Para algunos, este apoyo a la educaciĂłn era tan solo una demostraciĂłn de su adhesiĂłn a polĂticas sociales asistencialistas, pero estaban equivocados. Obama entendĂa, como pocos, la necesidad de reactivar la economĂa del paĂs a travĂ©s de un fuerte y decidido impulso tecnolĂłgico y una cultura cientĂfica basada en las matemáticas como estĂmulo para la creatividad.
La fe y la lealtad de Obama en los matemáticos, ingenieros e informáticos fueron cruciales en su defensa y argumentación sobre cómo conseguirlo. Para algunos era inaudito que el presidente de los Estados Unidos hablara de la necesidad de tener y formar a más profesores, más matemáticos y más ingenieros en un momento en el que la tasa de desempleo no bajaba del 8%.
“HabĂa más imaginaciĂłn en la cabeza de ArquĂmedes que en la de Homero”.
Voltaire
La Cueva
Un dĂa despuĂ©s de su victoria electoral, Obama nos mostrĂł su “secreto”. Solo un medio de comunicaciĂłn, TIME Magazine (que ha vuelto a conceder al Presidente el tĂtulo de “personaje del año”, como ya hiciera en 2008), conocĂa hasta ese momento la que habĂa sido su arma secreta en la consecuciĂłn de los votos electorales clave. El miĂ©rcoles 7 de noviembre, la revista estadounidense publicĂł el artĂculo que revelaba las interioridades de La Cueva.
La Cueva era una sala secreta del cuartel general de campaña en Chicago donde se ponĂa en marcha toda la maquinaria cibernĂ©tica que consiguiĂł el mĂ©todo de análisis, prospectiva, simulaciĂłn y estrategia que garantizĂł su victoria. Como en la pelĂcula El club de la lucha, existĂan unas reglas y las tres primeras tenĂan que ver con mantener en silencio su existencia.
Durante muchos meses, un equipo de informáticos y matemáticos permanecieron encerrados en un recinto aislado al que solo su jefe de campaña, Jim Messina, tenĂa acceso y conocimiento sobre las actividades que allĂ se realizaban.
La campaña de Obama logrĂł construir “la mayor maquinaria polĂtica en los EEUU, con delegaciones establecidas durante más de un año en los Estados decisivos y apuntalada por herramientas digitales pioneras” que jamás se habĂan visto. Ya no se trataba de conseguir informaciĂłn, ni voluntarios, sino de aprovechar la informaciĂłn de la mejor manera posible. NingĂşn dato sobraba y todo era relevante, desde las costumbres del dĂa a dĂa de los votantes hasta dĂłnde iban de vacaciones los indecisos. Todo ello iba alimentando una gigante bĂłveda de datos.
El método
Un gran big data electoral (respondiendo al principio de las “3V”: alta velocidad, alta variabilidad, alto volumen) fue gestionado para identificar patrones de comportamiento e hipĂłtesis de respuesta a los estĂmulos, la acciĂłn y la comunicaciĂłn polĂtica. Datos “fĂsicos” (datos pĂşblicos vinculados a la identidad, el geoposicionamiento, las condiciones socioeconĂłmicas o territoriales y el comportamiento electoral), a los que se añadieron datos de “consumo” (adquisiciones, subscripciones, donaciones, aportaciones…), más datos de “conversaciones” (gracias a la minerĂa de datos de las redes sociales) y, finalmente, datos “experimentales” de la acciĂłn polĂtica en la comunicaciĂłn digital o en la campaña de tierra (puerta a puerta, call centers…).
Todo ello permitiĂł la gestiĂłn de informaciĂłn segmentada en decenas de criterios sobre los votantes, sus gustos y su modo de vida, demostrando que el ganador serĂa quien más compartiera con ellos, afinidades y preocupaciones. Esto, finalmente, fue lo que ayudĂł al equipo de Obama a diseñar un mensaje especĂfico, centrado y dirigido a cierto segmento de la poblaciĂłn, con un mejor y mayor control.
El proceso fue largo y arduo. Durante 18 meses, el equipo de La Cueva se dedicĂł a unificar todas las bases de datos que habĂan empleado los diversos equipos de campaña de Obama en 2008. El resultado fue una gran base de datos que incluĂa desde listas de donantes a datos recogidos por encuestadores y voluntarios -que habĂan ido puerta a puerta durante meses buscando el voto-, o recopilados a travĂ©s de las redes sociales. Esos datos fueron cruzados, comparados y verificados continuamente hasta el Ăşltimo minuto de campaña y hasta el Ăşltimo detalle relacionado con el votante.
“Las matemáticas poseen no solo la verdad, sino cierta belleza suprema. Una belleza frĂa y austera, como la de una escultura”.
Bertrand Russell
Una vez contaban con esa artillerĂa, los tĂ©cnicos comenzaban a testear perfiles de decenas de millones de electores con programas informáticos de predicciĂłn sobre distintas reacciones y motivaciones que podrĂan llevar a una persona a votar por Obama. En ese punto, el gĂ©nero, la edad, el nombre y la raza se convertĂan solo en un primer umbral de la informaciĂłn; los analistas debĂan conocer, tambiĂ©n, el tipo de series de televisiĂłn que veĂan en su tiempo libre, o los medios a travĂ©s de los cuales compartĂan informaciĂłn con sus amigos; es decir, actitudes, gustos y disgustos de su vida en general.
Y aquĂ entrĂł en juego Facebook. A travĂ©s de esta red social, mediante la aplicaciĂłn Are you in, el votante podĂa inscribirse, ya fuera para ayudar, para ser voluntario o simplemente para informarse; daba igual, lo importante era que, al conectarse con Facebook, el usuario daba acceso directo al equipo de Obama no solo a su perfil sino al perfil de todos sus amigos en esa red social. Esto terminĂł por convertir la gran cantidad de datos en un alud gigante de informaciĂłn sobre millones y millones de personas.
Controlar y saber manejar esta información era el mayor reto. Pero una vez más su ejército de nerds encerrados en el cuartel de La Cueva lograron sacar el mejor provecho a cada dato, a cada nombre y a cada Estado, de tal manera que cada nombre y cada dato se convirtieron -potencialmente- en un voto.
El rivalÂ
El equipo de Obama no descubriĂł nada, solo se adaptĂł mejor. Mitt Romney y su equipo usaban una, hasta entonces, buena base de datos denominada ORCA, que alimentaban con los datos que iban consiguiendo en campaña y que tenĂa como principal objetivo conseguir que el dĂa de las elecciones sus simpatizantes fueran a votar. Sin embargo, no funcionĂł del todo y muchos datos se perdieron. No era tan buena, ni tan actualizada, ni conseguĂa encontrar las relaciones entre los activistas que sĂ consiguiĂł la herramienta de Obama.
El equipo del Presidente sĂ innovĂł: de las redes sociales a la estrategia de datos. Como indicaba David Axelrod respecto al cambio de herramientas online: “En 2008, este tipo de campaña usaba la mejor tecnologĂa posible. Pero estamos a años luz de donde estábamos en 2008. Hemos tenido que reinventarnos y pensar en todas las herramientas que estaban disponibles para nosotros -que proporcionan datos más ricos, más medios quirĂşrgicos para hablar con los votantes. Se trata de invertir en personas -son casi mayoritariamente jĂłvenes- que entienden dĂłnde va la tecnologĂa y cuál será su potencial en el año 2016 en comunicaciones, para apuntar al blanco, para la minerĂa de datos, para conseguir la mayor precisiĂłn posible en tĂ©rminos de persuasiĂłn y movilizaciĂłn. […] Sabemos mucho más sobre el electorado que en 2008. PodĂamos hacer juicios más precisos sobre las actitudes de los votantes, sobre lo que era importante para ellos individualmente, sobre quiĂ©n iba participar y quiĂ©n no era probable que participara. AsĂ que tenĂamos gran confianza en nuestros datos. RecibĂ informes cada noche”.
El horizonte
No se puede hablar de Big Data sin hacer referencia a Nate Silver, el estadĂstico que revolucionĂł las predicciones electorales de los medios de comunicaciĂłn y las empresas de sondeos y encuestas con un mĂ©todo basado en la estadĂstica y la probabilidad y no en la mediciĂłn e interpretaciĂłn. La innovaciĂłn real en las pasadas elecciones fue la relevancia de los modelos estadĂsticos por encima de las apreciaciones de los pundits (tertulianos de toda la vida) sobre el desarrollo de las elecciones.
Su mĂ©todo era simple, pero complejo al mismo tiempo: 1. HacĂa la suma de muchas (muchas!) encuestas. 2. Sacaba un promedio, no un promedio simple ya que tenĂa en cuenta tres variables: a. Momento de la publicaciĂłn de la encuesta, b. Margen de error, c. Calidad (el medio que la publicaba, si histĂłricamente habĂa acertado o no…). 3. Estudiaba cada Estado. No se centraba en las encuestas de intenciĂłn de voto a nivel nacional sino de Estado por Estado. Para ello tambiĂ©n se tenĂa en cuenta la elecciĂłn de senadores, la participaciĂłn histĂłrica, la ventaja del candidato, los factores demográficos… todo a travĂ©s de una regresiĂłn lineal. 4. Finalmente, esos datos se introducĂan a modo de algoritmo en un software que ofrecĂa los resultados finales.
Las disciplinas y profesiones estratĂ©gicas para la gestiĂłn eficiente de la polĂtica y de las campañas electorales van a padecer un vuelco: de las ciencias sociales (sociĂłlogos, periodistas, politĂłlogos, asesores de comunicaciĂłn…) a las ciencias exactas (matemáticos, estadĂsticos, analistas de datos, visualizadores gráficos).
España
Nuestro paĂs (y nuestra polĂtica) tiene un gran dĂ©ficit en cultura matemática. Hay buenos profesionales, pero no hay un reconocimiento a la profesiĂłn y nuestra arquitectura de datos pĂşblicos disponibles es muy baja en relaciĂłn a la media europea. No es extraño que seamos uno de los poquĂsimos paĂses que no tiene -todavĂa- legislaciĂłn sobre la transparencia y que el Open Data y el Open Government estĂ©n muy retrasados en su desarrollo. Además, en España, el reto es doble: la producciĂłn de datos brutos y el know how para su análisis. No se trata solo de producir los datos sino de saber analizarlos (cruzarlos, ponderarlos) y convertirlos en informaciĂłn Ăştil para su reconversiĂłn en votos. Cada detalle cuenta. Convertir los datos en comportamientos es la clave, para comprender el fondo de los votantes: “Sin matemáticas no se penetra hasta el fondo de la filosofĂa; sin filosofĂa no se llega al fondo de las matemáticas; sin las dos no se ve el fondo de nada”.
(Bordas-Desmoulin)
Muy bueno el artĂculo. Con respecto a Big Data en España querĂa comentarte que soy ingeniero argentino pero vivo en Galicia hace 2 años y actualmente estoy desarrollando un proyecto de análisis social. Se llama Ocean
(en referencia a una metodologĂa de psicologĂa) y realiza un estudio de la personalidad del usuario a partir de los Tweets de su cuenta. Si bien aĂşn está en desarrollo, mi idea es poder realizar estudios cĂłmo por ejemplo Detectar regiones más neurĂłticas que otras (en España o en el mundo).
Un saludos invito a los interesados a visitar mi entendimiento.
Comentarios cerrados.