Hola, muchos sitios no solo usan 1 solo url para trabajar, ejemplo facebook, ellos usando detras de su operacion otros servidores de cache para mostrar imagenes, videos, adds, etc.
Entonces seria dar de alta:
facebook.com
adsfb.com ==> es un decir, ya que el nombre tienes que sacarlo de tu log.
hdakfb.com ==> es un decir, ya que el nombre tienes que sacarlo de tu log.
Yahoo es otro, este usa un dominio para mostrar imagenes, hotmail debe ser igual.
Lo que hago yo es, entrar a esos sitios y ver todo lo que mi log muestra: /var/squid/logs/access.log
La idea es rastrear todos esos, si lo haces con squidGuard pues rastrear block.log
Es mi forma de hacerlo, que haya una pagina que diga la estructura de un sitio creo que aun no he visto alguna si la hay bienvenida.
Esto lo tendrias que hacer pagina x pagina, pero una vez terminado te vas a sentir agusto, por que raro que ellos cambien seguido esos servicios que manejan.
Saludos.