Se llama caché web a la caché que almacena documentos web (es decir, páginas, imágenes, etcétera) para reducir el ancho de banda consumido, la carga de los servidores y el retardo en la descarga. Un caché web almacena copias de los documentos que pasan por él, de forma que subsiguientes peticiones pueden ser respondidas por el propio caché, si se cumplen ciertas condiciones.[1][2]

Tipos de cachés web

editar

Las cachés web pueden utilizarse de diversas formas. Las cachés de agente de usuario (del inglés User-Agent), como las presentes en los navegadores web, son cachés privados o cachés del lado del cliente, que funcionan solo para un único usuario. También existen paquetes específicos que se instalan como proxy local y actúan como caché además de realizar otras tareas, como por ejemplo Proxomitron.

Los intermediarios en la comunicación cliente-servidor también pueden implementar cachés compartidos (también llamadas proxy-cachés directos) que sirvan páginas a varios usuarios. Los proxy-cachés suelen ser usados por los proveedores de servicios de Internet (ISP), universidades y empresas para ahorrar ancho de banda. La intermediación de estos proxy-cachés difieren de la de los privados en que los clientes no necesitan ser explícitamente configurados para usarlos. Algunos paquetes que pueden ser usados como proxy-cachés son FortiCache de Fortinet, Squid, Microsoft ISA Server, BIG-IP de F5 y Blue Coat.

Las cachés pasarela (llamadas también proxy-cachés inversos o aceleradores web), o cachés del lado del servidor, funcionan a cargo del propio servidor original, de forma que los clientes no distinguen unos de otros. Puede hacerse funcionar conjuntamente varias cachés pasarela para implementar una Content Delivery Network (CDN), como es el caso de Akamai. Paquetes como Varnish Cache pueden usarse para este propósito.

Los intermediarios que funcionan como caché realizan con frecuencia otras tareas, tales como la autenticación de usuarios y el filtrado de contenidos. Varios cachés pueden ser coordinados entre sí con las ayuda de protocolos específicos tales como ICP o HTCP.

Control de los cachés web

editar

El protocolo HTTP define tres mecanismos básicos para controlar las cachés:

  • Frescura, que permite que una respuesta sea usada sin comprobar de nuevo el servidor origen, y puede ser controlada tanto por el servidor como el cliente. Por ejemplo, la cabecera de respuesta Expires facilita una fecha en la que el documento caduca, y la directiva Cache-Control: max-age informa al caché del número de segundos durante los que la respuesta será válida.
  • Validación, que puede usarse para comprobar si una respuesta cacheada sigue siendo buena tras caducar. Por ejemplo, si la respuesta tiene una cabecera Last-Modified, un caché puede hacer una petición condicional usando la cabecera If-Modified-Since para saber si la página cambió.
  • Invalidación, que normalmente es un efecto secundario de otra petición que pasa por la caché. Por ejemplo, si la URL asociada con una respuesta cacheada es solicitada posteriormente mediante una petición POST, PUT o DELETE, la respuesta cacheada quedará invalidada.

Consideraciones legales

editar

Algunas personas se preocupan sobre si el cacheado de páginas web puede suponer una violación de derechos de autor. Por ejemplo, en 1998 la DMCA añadió leyes al código legal de Estados Unidos (17 U.S.C. § 512) que libera a los operadores de sistemas de la responsabilidad legal sobre los derechos de autor relacionados con el cacheo de documentos.

Referencias

editar
  1. Messaoud, S.; Youssef, H. (10 de julio de 2009). «An analytical model for the performance evaluation of stack-based web cache replacement algorithms». International Journal of Communication Systems (en inglés) 23: 1-22. S2CID 46507769. doi:10.1002/dac.1036. Consultado el 8 de mayo de 2025. 
  2. Fountis, Yorgos (4 de mayo de 2017). «How does the browser cache work?». Consultado el 8 de mayo de 2025. 

Bibliografía

editar
  • Luotonen, Ari. Web Proxy Servers (Prentice Hall, 1997) ISBN 0-13-680612-0
  • Nagaraj, S.V. Web Caching and Its Applications (Springer Science & Business Media, 2004). ISBN 1-40208-049-2
  • Rabinovich, Michael y Oliver Spatschak, Web Caching and Replication (Addison Wesley, 2001). ISBN 0-201-61570-3
  • Wessels, Duane. Web Caching (O'Reilly and Associates, 2001). ISBN 1-56592-536-X

📚 Artikel Terkait di Wikipedia

HTCP

en caché de hipertexto (abreviado como HTCP ) se usa para descubrir cachés HTTP y datos almacenados en caché, administrar conjuntos de cachés HTTP y monitorear

Varnish Cache

Varnish Cache es un acelerador de aplicaciones web, también conocido como caché de proxy HTTP inversa. Se instala delante de cualquier servidor HTTP y se

Caché Robson

La memoria caché Robson, también conocida como memoria Flash Robson o Turbo Memory, es una tecnología presentada por Intel el 17 de octubre de 2005 en

HTTP/2

utilizados por las versiones anteriores a HTTP 2.0. El servicio “server push”​ también conocido como “cache push”, se basa en estimaciones para que el

Servidor proxy

querer pasar por el proxy. Y menos si hace de caché y guarda copias de los datos. Incoherencia: si hace de caché, es posible que se equivoque y dé una respuesta

HTTP ETag

es parte de HTTP, el protocolo para la World Wide Web. Es uno de los varios mecanismos que HTTP proporciona para la validación de caché web, y que permite

Protocolo de transferencia de hipertexto

del contenido que pide) o por los intermediarios (ej. como gestionar el cacheo por parte de los proxys) Dependiendo del tipo de mensaje en el que puede

HTTP (P2P)

congestión del lado del servidor son los efectos Slashdot y Flash Crowd. HTTP(P2P) usa cachés de navegadores terciarios de nodos web para ayudar a distribuir objetos