Estas aquí

Siguenos en Facebook

Infraestructura de red: ayer, hoy y mañana

Infraestructura de red: ayer, hoy y mañana

Este mes hubo dos cortes de fibras que conectaban a los jugadores más allá de la cordillera a los servidores de juego en Chile. En el primero, a principios de mes, la fibra quedó cortada al pasar un camión más alto de lo que correspondía por debajo del puente y llevarse por delante la instalación de dicha fibra junto a otros cables. En el segundo, los arreglos demoraron más de lo usual debido a la falta de permisos por parte de la municipalidad local, ya que el lugar no se encontraba en condiciones para ser visitado por la cuadrilla de reparación. Todo esto, como han de adivinar, significó que la experiencia de miles de jugadores quedó afectada por estos cortes.

Viendo enero en retrospectiva, fue un mes complicado para los jugadores. No solo en cuanto a cortes se trató, también hubo intermitencias de red entre terceros, otro inconveniente con el tráfico hacia el intermediario CABASE, y después otro más que estuvo relacionado con una actualización que hicimos en nuestro sistema y que falló, generando partidas fantasmas.

¿A qué vamos con todo esto?

Una vez un jugador escribió en el foro estas palabras: “La culpa puede no ser de ustedes, pero las consecuencias sí lo son y por tanto deberían buscar una solución con intensidad.”.

Esa frase tiene su buena dosis de razón. En cada uno de los casos antes mencionados, los que sufren las consecuencias son ustedes, quienes lo único que desean es poder jugar con la menor latencia posible y de forma sostenida. Nuestra prioridad número uno es permitirlo. Sin buena conexión, no hay buen juego. Sin buen juego, no hay jugadores. Sin jugadores, no hay LoL.

Afortunadamente ya tenemos procesos implementados con los cuales poder atajar proactivamente aquellos problemas que provocan incrementos de latencia y planes para seguir expandiendo nuestro control sobre la conectividad de nuestros jugadores hacia nuestros servidores de juego (más adelante entraremos en detalle). Lo cierto es que la colaboración entre Riot y la comunidad, por ejemplo, con la ejecución de pruebas de red e información sobre cada situación, es superfluida y ya nos permite diagnosticar con agilidad dónde se encuentra la falla. Gracias a aquellos que son parte de la solución.

Si bien los tiempos de normalización del servicio varían según cada caso, para nosotros no solo es importante continuar brindándoles visibilidad en cuanto detectamos algún fallo sino que también es importante construir una relación transparente entre Riot y la comunidad. Esto se logra ofreciéndoles seguimiento a los inconvenientes a medida que el proceso avanza y, en la medida que no representa un mayor riesgo, hablándoles sobre los motivos externos o internos que están afectando al servicio.

Pero aún hay algo más que podemos hacer: ser más claros y transparentes sobre nuestros planes para continuar mejorando la infraestructura entre Riot y la región; es decir, explicarles cuál es la situación actual y con ello darles el poder del conocimiento para que formen sus propias conclusiones. Actualmente estamos trabajando para que los jugadores actuales puedan gozar de una mejor conectividad a nuestros servidores de juego y para permitirles mejorar la salud de la conexión a miles de nuevos jugadores más.

Empecemos mirando un poco hacia atrás.

 

Servidores y conectividad: hitos del 2015

Cuando cerrábamos el 2014, lo hacíamos con una serie de dificultades que afectaban a jugadores con cierto ISP. En ese momento, y con la intención de ser menos reactivos con nuestras comunicaciones, sostuvimos una sesión de Preguntas y Respuestas que se convirtió en un excelente espacio de intercambio con la comunidad. Sabíamos que el 2015 resultaría un año importante con oportunidades para mejorar nuestra infraestructura de red. Fue así que, durante el 2015:

  • Mejoramos los enlaces de redundancia (tal vez lo hayan leído a Rocofu decir: “el tráfico fue conmutado a un enlace de respaldo”, bueno, por ahí viene el asunto) que conecta a Chile con los países más allá de la cordillera. Esto significa que, en el caso que algo le suceda al enlace principal, los enlaces de redundancia deberían poder proveer a los jugadores rutas alternativas para llegar a nuestros servidores de juego.
  • Reestructuramos nuestro datacenter. Esto le permitió a nuestros ingenieros tener un mayor control en algunas de las rutas que utilizan los jugadores para conectarse, las cuales ahora se encuentran gozando de una mejor latencia y, en casos con inconvenientes, podemos indicarles cuál es el mejor camino para tomar.
  • También hemos cerrado acuerdos de enrutamiento con más ISPs intermediarios. De suma importancia, porque esto nos permite poder decirle a dichos intermediarios cuáles son las rutas más eficientes para aquellos jugadores con tráfico en su dirección. En otras palabras, esos jugadores que iban desde A (su casa) hasta B, pasando por C para llegar recién a nuestro servidor de juego, ahora saltarán de A a B y luego a nuestros servidores.

Al finalizar el año, sabíamos que al camino aún le faltaba un trecho que recorrer.

 

¿Cuál será nuestro foco durante el 2016?

Primero repasemos brevemente cómo funciona la conexión de cada jugador a nuestros servidores de juego (que no es lo mismo que los servidores de inicio de sesión al juego o de la web).

La conectividad hacia los servidores de Chile está en manos de cada ISP; es decir, los routers del ISP “A” de Argentina podrían decidir que la mejor ruta hacia los servidores de LoL es por Estados Unidos o Europa, en vez de las fibras que cruzan la cordillera. Para evitar el uso de rutas con mayor latencia, actualmente Riot contrata un ISP especializado que tiene un PoP (punto de intercambio de tráfico de internet) en Argentina; por lo tanto, Riot depende de los acuerdos que tenga dicha empresa para lograr rutear el tráfico de todos los ISP de los jugadores por el camino más corto o rápido. Ante cortes de fibra, el “ruteo” (la dirección que los routers le indican seguir a la tráfico) a caminos alternativos es manual y ha demostrado ser poco eficiente.

Hace un tiempo, el equipo de ingenieros de red de NA presentó un plan que consistía en construir una red propia de alta velocidad. a la que los jugadores de la mayoría de los ISP en dicha región podían conectarse directamente. De esta manera, ellos ahora pueden controlar el tráfico para asegurar la mejor ruta disponible desde la computadora del jugador hasta el servidor de juegos. Este plan está en la fase final de ejecución en Estados Unidos y otras regiones. En nuestro caso, estamos ejecutando un plan similar para lanzarlo en LAS.

Es importante resaltar que, independientemente de toda nuestra voluntad para hacerlo lo más rápido posible, el plan depende no sólo de cuántos recursos le dediquemos nosotros (dinero, ingeniería y activos), sino de la voluntad de diversos actores externos (por ejemplo los ISP, las facilidades para ingresar equipos de comunicaciones a cada uno de los países, etc.). Por eso, desgraciadamente no nos podemos comprometer a una fecha exacta. No obstante, existe un plan de ejecución con tiempos definidos y este año nos dedicaremos a ejecutarlo.

A grandes rasgos, el plan en el que trabajaremos en este año comprende:

  • Tener un PoP propio en Argentina con acuerdos de intercambio de tráfico, de manera directa o indirecta, con la gran mayoría de los ISPs de Argentina, Paraguay y Uruguay. El enlace de comunicación entre este PoP y los servidores de LoL estará respaldado y la conmutación ante fallas estará a cargo de Riot.
  • Tener un PoP en Chile que haga una función similar al PoP en Argentina con los proveedores chilenos.
  • En una segunda etapa, también se instalará un PoP equivalente en Perú.

 

¿Qué se puede esperar a corto plazo?

¿Cómo afecta esto a la comunidad? En los próximos meses, si llegara a existir algún inconveniente técnico, el equipo de Riot seguirá:

  • Ofreciendo visibilidad lo más pronto posible en los foros cuando algo esté fallando.
  • Trabajar con la comunidad para diagnosticar el inconveniente.
  • Ser transparentes sobre los motivos que causaron las fallas, siempre que no presente un mayor riesgo el hecho de comunicarlo.

Tal como mencionamos antes, uno de los puntos de mejora que tenemos es mejorar la comunicación proactiva. O sea, no solo hablarles de las redes cuando surgen los problemas.

Como dijo el mismo jugador antes citado (muy buena publicación, por cierto, ¡gracias!): “es mucho más fácil ser paciente cuando uno sabe que estamos en el escalón 7 de la escalera de 29 escalones que diseñaron hasta la solución definitiva y no sospechando que no se está haciendo nada hasta que explota la bomba”. No es bueno esperar a que suceda algo para hablar.

Estamos conscientes que tenemos que hacer algo sobre la cadencia en la que se comunican las mejoras en las que trabajamos durante el año y por eso estaremos publicando en una serie de artículos que nos permitirán profundizar en conceptos relacionados a la infraestructura y los esfuerzos que realizamos para conectar a la región. Ya estamos trabajando en el siguiente artículo que nos ayudará a mostrarles cómo se ve la estructura nueva que estamos construyendo (¡prometemos que será más ameno y tendrá más gráficos!).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ver todo de la categoria Noticias