Me gustaría compartir una situación que me encuentro desde el día 2 de enero con la fibra Smart de Digi de 1Gbps. Sé que mi casuística es un poco rara y está lejos del "cliente tipo" de la conexión de esta empresa, pero seguro que si hay alguien con un problema similar al mío, es aquí.
Llevo con la fibra de Digi desde enero de 2022. Salvo un problema puntual (una ONT muerta que tardaron mucho en sustituir), no tengo quejas con el servicio. Uso mi propio router, un firewall FortiGate, y tengo contratado el servicio Conexión Plus para salir del CG-NAT. Mi setup es el habitual en estos casos, mi router conectado directamente a la ONT y negociando el PPPoE con las credenciales que me enviaron por email.
El problema
Pues bien, desde el día 2 de enero a las 4 de la mañana (lo sé porque es cuando me saltaron las alertas en los servidores), empecé a encontrar un comportamiento muy raro: Justo una hora después de que se establezca la conexión PPPoE, se reinicia. En ese reinicio, se me asigna una IP pública distinta. Y, por supuesto, todas las conexiones que estuviesen activas en ese momento, se me caen: VPNs, llamadas, descargas, streamings…
Para más confusión, si conecto el router de Digi en lugar del mío, este comportamiento desaparece: la conexión PPPoE no se reinicia.
He probado otro router (del mismo fabricante, no tengo más) con exactamente el mismo resultado. Y un compañero, también con Digi, y también con el mismo equipamiento de Forti, tiene el mismo problema. Ninguno de los dos hemos tocado nada de la configuración del Forti, simplemente empezó a ocurrir.
Por supuesto, el técnico de Digi no sabe nada de ningún cambio que se haya hecho en su red, pero algo ha debido de pasar, porque mi setup ha estado funcionando sin ningún problema durante dos años… Y, como cabría esperar, ya que con el router de Digi funciona, se lavan las manos.
Si saco algún rato, me gustaría probar a establecer el PPPoE con algún otro dispositivo (no tengo otro router por aquí disponible, pero podría poner un equipo Linux) a ver si se comporta como mi router o como el Digi. También estoy barajando capturar el establecimiento de la conexión PPPoE a ver si hay diferencias.
¿Alguien se ha encontrado esta situación? ¿Ha podido solucionarlo de alguna forma para que no pase? Los que tenéis vuestro propio router con la fibra Smart de Digi, ¿qué router es? ¿Alguna idea de algo que pueda probar, cualquier cosa?
La solución
Al final entre mi compi y yo hemos encontrado el culpable, voy a dejarlo por aquí por si alguien se encuentra un problema similar en el futuro y le sirve. Por algún motivo, justo una hora después de cerrar la conexión PPPoE, la red deja de responder los LCP echo que envía mi router para ver si la conexión sigue activa durante unos segundos (aunque no corta la conexión, simplemente no se reciben LCP reply). A los 20 segundos, más o menos, se "desatasca" y se reciben todos los LCP reply pendientes, y vuelve a responder con normalidad.
En la configuración por defecto, los equipos FortiGate envían un LCP echo cada 5 segundos, y si no se responden 3 seguidos, reinicia la conexión. Como la ventana de "aturullamiento LCP" es de unos 20 segundos, la conexión se reiniciaba a cada hora. Si se configura para que el máximo de LCP echo sin respuesta antes de reiniciar sean 10 en vez de 3, resulta que a los 20 segundos más o menos, la ventana de permisividad supera a la de aturullamiento de la red, y el Forti no reinicia la conexión.
¿Por qué Digi ha pasado a no responder los LCP reply durante unos segundos cada hora? ¿A lo mejor ocurría también antes, pero con una ventana más pequeña que pasaba desapercibida? Supongo que nunca lo sabremos…
¡Muchas gracias a todos por vuestras ideas!