[lacnog] Consultas acerca de Google Cache

Ivan Chapero info en ivanchapero.com.ar
Vie Jun 7 18:01:51 BRT 2013


Estimados,
soy operador de NOC de Argentina en varios ISPs de acceso. Confirmo y
reafirmo la inquietud de Ariel.

Entiendo que Google puede guardar como secreto comercial los detalles del
algoritmo CDN pero como operadores y administradores de los
enlaces deberíamos tener un contacto más fluido y directo ante
la detección de comportamientos erróneos que afectan a los
 clientes detrás del ASN gestionado. Si no vamos a
tener información pública de como opera y se persuade la elección de los
mejores nodos GGC, por lo menos deberíamos contar con una herramienta de
reporte que genere un escalamiento y procesos internos por parte de Google
que terminen reflejando los cambios deseados.

Parece que el trato fluido es con los grandes carriers que disponen colocar
en su backbone un nodo GGC, pero no con los operadores de ISPs de acceso,
que son en definitiva los que aportan sus clientes en el despacho de
contenidos de los caches.

*Pregunta: la alternancia que ven es para un mismo cliente (es decir,
accediendo desde una misma direccion IP) o se da que para algunas
direcciones IP acceden al local y para otras al remoto??
*

Sucede con las IPs de TODO el ASN. Expongo un caso puntual y real para que
se interprete mejor:

- Un ISP multi-homed con TELECOM Arg (TECO) y TELEFONICA Arg (TASA) como
carriers contratados.
- El ISP dispone de ASN y prefijos propios que anuncia por ambos carriers,
prependeando algunos sobre uno y otro link para lograr el load-balance.
- TECO dispone un nodo GGC local de latencia mínima (10-15ms).
- TASA dispone de un nodo GGC indirectamente de su carrier internacional
TIWS, como es un enlace internacional la latencia promedio es 190ms hacia
los hosts de ese nodo.
- Desde la activación del nodo local de TECO, tanto para los prefijos
anunciados sin prepends por TECO (con prepend por TASA) como los
prependeados por el mismo link (sin prepend por TASA) el trafico Youtube
era mapeado de manera estable y sostenida al nodo GGC local. Lo que parece
coherente dado que se estaba disputando el despacho del streaming entre un
host extremadamente nacional y otro internacional.
- Por esta razón el balanceo BGP se tuvo que modificar dramáticamente dado
que, independientemente de los prepends, el 90% del tráfico Youtube
ingresaba por el link de TECO.

- Hace un tiempo de manera extraña, y al menos desde mi extremo
injustificada, en ciertos horarios esta clase de tráfico switchea
bruscamente y se migra al enlace de TASA. Se comienza a ver que para todos
los prefijos el mapeo de la reproducción de Youtube empieza a apuntar a
hosts del nodo GGC de TIWS (salida internacional de TASA).

- Esto produce una terrible saturación sobre el enlace de TASA dado que el
anuncio de rutas estaba acomodado de manera tal que no se contara con esa
importante carga que aporta Youtube por estar ingresando por TECO. Termina
afectando entonces, no solo la performance de Youtube, sino a todas las
conexiones que hacen downstream-traffic por dicho link para las IP del ASN.
Se debe estar encima de las gráficas de consumo para empezar a "patear"
prefijos hacia TECO y así descomprimir TASA, algo poco práctico y que no
escala.



> Si el cache cercano esta en su limite de capacidad o sin disponibilidad
> del video solicitado, la alternativa es lo cache a +200.
>
>
> Rubens
>
>
Rubens, para este caso no es un factor válido (nodo GGC local saturado)
porque al momento de perder el cache de TECO para las IPs del ISP
multi-homed en cuestión se verifica sobre otros ISPs que tiene ÚNICAMENTE a
TECO como carrier y en ese escenario el mismo cache local
sigue sirviendo sin problemas contenidos en casi la totalidad de las
consultas. Parece una disputa entre el cache local de TECO y el
internacional de TIWS que ganan y pierden de manera brusca uno y otro.



>  
>> ¿Tienen idea de cómo funciona el algoritmo de selección de cache de
>> youtube?
>>
>
> https://wwws.cs.umn.edu/tech_reports_upload/tr2011/old_files/11-012.pdf
>
> http://scholarworks.umass.edu/cgi/viewcontent.cgi?article=1178&context=cs_faculty_pubs
>
>
Rubens,
esos docs los tengo presentes pero ya no son válidos y son previos a GGC.
En ese momento la inteligencia del CDN estaba en los DNS dado que las URL
del link del vídeo eran dominios globales únicos que se mapeaban de
manera dinámica a diferentes IPs según de que DNS server venia el pedido de
recursión. Ahora el DNS solo afecta al frontend web del los servicios de
Google pero no al despacho de contenido.

Actualmente en los nodos GGC colocados en los carrires/NAPS se le asignan a
los hosts dominios especiales de resolución única. Siguiendo con el ejemplo
argentino:
- los vídeos servidos desde el nodo local de TECO son del tipo *
r4---sn-uxaxjvh5gbxoupo5-x1xs.c.youtube.com* y mapean (uses el DNS que
uses) a IPs del rango *181.15.96.0/21* (propias de TECO).
- los vídeos servidos desde el nodo internacional de TASA/TIWS son del tipo
r*1---sn-upfn-hp5e.c.youtube.com* y mapean (uses el DNS que uses) a IPs del
rango *208.117.253.0/24* (si bien son de Google se propagan por TIWS
exclusivamente).


Espero exista gente de Google en la lista para que pueda aportar un poco de
certezas o herramientas que a nuestro entender faltan ya que un CDN como
Youtube flapeando de un link al otro no es poca cosa y termina degradando
la experiencia general del usuario, no solo la del sitio en cuestión.

Saludos y gracias por los prontos aportes.

-- 
*Ivan Chapero
Área Técnica y Soporte*
Fijo: 03464-470280 (interno 535) | Móvil:  03464-155-20282  | Skype ID:
ivanchapero
--
Go Banda Ancha - CABLETEL S.A. | Av. 9 de Julio 1163 - 2183 - Arequito -
Santa Fe - Argentina
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://mail.lacnic.net/pipermail/lacnog/attachments/20130607/ddb1ffab/attachment.html>


Más información sobre la lista de distribución LACNOG