El Mundial de Fútbol acapara la atención de todo el mundo, incluso en los Estados Unidos, donde los niveles de audiencia superaron aún a los del Super Bowl, a pesar de que este deporte no es el más popular en ese país. Pero también es un campo de experimentación para ver cómo las nuevas tecnologías predicen eventos futuros en base al estudio de grandes cantidades de datos.
En este sentido, y como ya lo hizo Microsoft con Cortana, Google Cloud Plataform se animó a predecir los resultados de los cuartos de final de la Copa del Mundo. Ya lo había hecho con total eficacia durante el Google I/0 el 26 de junio, octavos, cuando indicó qué selecciones tenían más posibilidades de pasar los octavos: Brasil (72%) vs. Chile; Colombia (69%) vs. Uruguay; Holanda (55%) vs. México; Costa Rica (60) vs. Grecia; Francia (92) vs. Nigeria; Argentina (68%) vs Suiza; Alemania (93%); y Bélgica (68%) vs. Estados Unidos. Y había adelantado una final con Brasil y Argentina, con 55% de chances para los anfitriones.
Pero ahora, Google utilizó su infraestructura para realizar los pronósticos de los partidos de cuartos de final: Brasil tendrá un 69 por ciento más de chances de vencer a Colombia; en tanto que Francia es la favorita ante Alemania con 68 por ciento. Por su parte, Holanda cuenta con un 68 por ciento de posibilidades de superar a Costa Rica, mientras que la Argentina posee 81 por ciento de derrotar a Bélgica.
Google, además, reveló la “receta” para llegar a estas conclusiones. Primero, utilizaron los datos del sitio OptaSports sobre la cobertura de las ligas de fútbol profesional y de la fase de groupos del Mundial. De esta forma, pudieron examinar cómo el comportamiento de los jugadores en un partido previo predijo el rendimiento de ellos en partidos siguientes.
También se basó en dos fuentes de datos adicionales: el ránking de energía que fue construido por el ingeniero de BigQuery Jordan Tigani y una medida subjetiva sobre el entusiasmo y el número de fans que viajaron a Brasil de cada equipo, para poder medir la ventaja de jugar como local. Además, utilizaron Google Cloud Dataflow para “digerir” los datos, Google BigQuery para armar las características derivadas, iPyton y Pandas para el modelado, y Google Compute Engine para analizar los datos.
A continuación, el video del Google I/O con las predicciones de Google para octavos de final (avanzar hasta el minuto 25:18).
Fuente: Google Cloud Platform Blog