Сайт о телевидении

Сайт о телевидении

» » Яндекс браузер запрет кэширования страницы. Кэширование в HTTP

Яндекс браузер запрет кэширования страницы. Кэширование в HTTP

Описание кэширования. Решение проблем с различными браузерами и описание заголовков ответов сервера, отвечающих за кэширование.

Веб-мастера часто сталкиваются с кэшированием: браузеры и прокси-сервера, пытаясь ускорить работу сайта, стараются сохранить у себя максимально большое количество документов в кэше. Если вы открываете страницу сайта в браузере, потом еще одну, и после этого возвращаетесь на первую, с великой долей вероятности браузер возьмет ее с вашего диска (а то и из оперативной памяти), куда он сохранил страницу при первом посещении.

Понятно, эта операция, как правило, выполняется намного быстрее, чем получение того же документа из сети. Ведь для отображения страницы нужно не только получить HTML код, но и выкачать из сети все сопутствующие документы: CSS-файлы, картинки, скрипты, оформленные в виде отдельных файлов, и т.д. Если вы посмотрите в папки кэша на вашем диске (для IE эта папка обычно находится здесь: «C:\Documents and Settings\имя_пользователя \Local Settings\Temporary Internet Files», для Firefox: «C:\Documents and Settings\имя_пользователя \Local Settings\Application Data\Mozilla\Firefox\Profiles\_случайная_строка_. default\Cache»), то вы заметите, сколько файлов было сохранено вашим браузером.

Конечно же, кэш здорово ускоряет работу, но с другой стороны, кэш может сыграть и отрицательную роль.

Например, если будет кэшироваться страница чата, то пользователи просто не увидят новые сообщения. Веб-мастера часто считают кэш злом, и борются с этим злом в меру своих сил.

Проблема с кешированием в Microsoft Internet Explorer

Internet Explorer кеширует GET-запросы. Те авторы, которые не знакомы с кешированием HTTP, ожидают, что GET-запросы не кешируются, или что кеш может быть обойдён, как в случае нажатия кнопки обновления. В некоторых ситуациях избегание кеширования действительно является ошибкой. Одним из решений является использование метода POST, который никогда не кешируется; однако он предназначен для других операций. Другим решением является использование метода запроса GET, включающего уникальную строку запроса с каждым вызовом, как показано на примере ниже.

Req.open("GET", "xmlprovider.php?hash=" + Math.random());

или установки заголовка Expires на прошедшую дату в вашем скрипте, который генерирует содержимое XML. В PHP это будет так:

// disable IE caching header("Expires: Mon, 26 Jul 1997 05:00:00 GMT"); header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT"); header("Cache-Control: no-cache, must-revalidate"); header("Pragma: no-cache"); ...

Знакомый PHP код? Уверен, вы его писали (как правило, методом Copy-Paste ) в своих наработках. Но! Здесь есть очень существенное «НО»: ни в коем случае не умаляя важности и авторитетности Википедии, отметим лишь тот прискорбный факт, что этот код ОШИБОЧЕН! Хотите убедиться? Легко!

Проверяем кэширование

Итак, запустим Apache со стандартными, дефолтовыми настройками. Здесь и далее мы используем Apache и PHP. Но это ни в коем случае не говорит, что описываемой проблемы и вариантов ее решения нет на платформе других серверов, например, у Microsoft IIS. Итак, запустим Apache. Создайте пустую папку test-cache в корне сервера и поместите туда файл test-1.php со следующим содержанием:

", date("H:i:s"), ""; ?>

Легко увидеть, что в приведенном примере мы пытаемся запретить кэширование по рецепту Википедии, и просто выводим текущее время.

Статья по теме: Недорогой хостинг с индивидуальной конфигурацией

Теперь попробуйте посмотреть вашу папку в браузере. Для этого откройте свой браузер и наберите в адресной строке

Отлично! Теперь кликните по своему файлу test-1.php и запомните время (для примера я разместил окно браузера рядом с часами Windows):

Великолепно! Теперь нажмите в браузере кнопки «Назад» и потом «Вперед»:

Упc! Время не меняется!!! А что это значит? Да только то, что браузер берет страницу из кэша!!! А как же наш энциклопедичный код? Да он не работает!

Обратимся к первоисточникам

В чем же проблема? Проблема в неправильном использовании заголовков ответа. В спецификации RFC2616 кэшированию посвящена целая глава. Но, к сожалению, веб-мастера не часто читают спецификации. Итак, что же обозначают те заголовки, которые мы только что передали? Давайте их посмотрим. Это очень удобно делать с помощью дополнения к браузеру Firefox Web Developer Toolbar : Information. View Response Headers (для IE похожий инструмент называется DevToolbar):

Итак, мы передали следующие заголовки:

Expires: Mon, 26 Jul 1997 05:00:00 GMT - этот заголовок устанавливает время актуальности информации. Мы же пытаемся передать дату в прошлом, полагая, что это заставит браузер каждый раз загружать страницу с сервера. Не заставляет, как мы хорошо заметили на опыте.

Last-Modified: Sat, 26 Jan 2008 17:03:02 GMT - Дата и время изменения информации на странице. Этот заголовок ВООБЩЕ никак не влияет на кэширование (читаем в RFC2616!), разве что может использоваться для запроса с валидаторами. Например, поисковый робот может запросить данные так:

То есть, «дай документ, если он изменился с указанной даты », и сервер должен ответить или 200 («Вот документ, он изменился!» или 304 «Изменений не было». Но чтобы это работало, ваш сервер ДОЛЖЕН передавать заголовок Last-Modified, и не просто передавать, а передавать ПРАВИЛЬНУЮ ДАТУ изменения документа. Но мы сами, своими руками, и бестолковым энциклопедическим кодом полностью разрушили последние надежды на это! То есть, мало того, что мы кэш не запретили, мы еще и поисковикам (а точнее, СЕБЕ) основательно нагадили! Ведь вы передали ТЕКУЩУЮ дату, как дату последнего изменения, помните?

Cache-Control: no-cache, must-revalidate - вот, уже ближе к теме. Именно этот заголовок управляет кэшированием, но не сам, а в совокупности с другими. Сейчас же мы просто передали следующую команду: «использовать информацию следующего запроса без повторной проверки на исходном сервере нельзя» (If the no-cache directive does not specify a field-name, then a cache MUST NOT use the response to satisfy a subsequent request without successful revalidation with the origin server). В основном, в таком виде - это команда не для браузера, а для прокси-сервера.

Статья по теме: Какой выбрать хостинг для сайта на WordPress: советы новичку

Pragma: no-cache - устаревшая конструкция. Это из старой версии протокола HTTP/1.0. Практически все браузеры и прокси ее игнорируют. Итак, мы видим, что ни одна из наших строчек PHP кода реально кэш не запретила. Что же делать? А вот что:

Запрет кэширования

Пересохраните файл test-1.php с новым именем test-2.php и измените его следующим образом:

", date("H:i:s"), ""; ?>

Теперь попробуйте снова открыть нашу тестовую папку //localhost/test-cache/ , щелкните по имени test-2.php и теперь наживайте кнопки «Назад», «Вперед». Время каждый раз меняется! И это говорит о том, что браузер не берет страницу из кэша при переходе вперед/назад, а заново запрашивает ее с сервера. Что, собственно, нам было и нужно. Давайте посмотрим заголовки ответа:

Вот оно! Мы передаем два заголовка:

Cache-Control: no-store - страница содержит приватные данные, сохранять в кэше нельзя! (The purpose of the no-store directive is to prevent the inadvertent release or retention of sensitive information (for example, on backup tapes))

Expires: Sat, 26 Jan 2008 20:31:55 +0300 - актуальность страницы истекает мгновенно, то есть сейчас.

И именно эти заголовки запрещают кэширование в браузере. Но все же более правильно дописать в заголовок Cache-Control инструкции и для прокси-серверов (файл test-3.php):

", date("H:i:s"), ""; ?>

Практическое запрещение кэширования

Таким образом, мы научились выключать кэш. Значит ли это, что нужно приведенный выше код включать во все ваши страницы? Совсем нет! Если вам нужно запретить кэширование во всех файлах папки (а не только для исполняемых php скриптов) можно настроить сервер Apache на передачу нужных нам заголовков. Для этого откройте файл конфигурации сервера Apache и убедитесь что раскомментированы следующие строчки (или раскомментируйте их сами):

LoadModule expires_module modules/mod_expires.so LoadModule headers_module modules/mod_headers.so ... AddModule mod_expires.c AddModule mod_headers.c

Отлично! Теперь просто создайте в своей папке файл.htaccess и впишите в него следующее:

# # Запрещение кеширования в этой папке # Необходимо включение модулей # mod_headers.c и mod_expires.c # # Заголовок Cache-Control Header append Cache-Control "no-store, no-cache, must-revalidate" # Заголовок Expires ExpiresActive On ExpiresDefault "now"

Все! Необходимые заголовки передаются автоматически, и специально из писать в PHP уже не нужно - кэш уже выключен! В этом легко убедится, если посмотреть заголовки, передаваемые при запросе ЛЮБОГО файла этой папки:

Разрешение кэширования

Но, несмотря на то, что подавляющее число веб-мастеров, считают кэш вселенским злом, и пытаются запретить его (и как мы увидели, весьма безуспешно), это не так! Запретив кэширование, вы заставляете браузер каждый раз заново загружать ваши страницы с сервера, и если канал связи у пользователя слабый, то это может привести к заметному замедлению работы с вашим сайтом. Я уже не говорю о том, что это приводит к возрастанию нагрузки на ваш сервер! Если ваша страница или ее часть формируется запросами в БД, вы, к тому же, увеличиваете нагрузку на сервер БД, что крайне негативно может сказаться на производительности вашего сервера в целом. Вы же понимаете, о чем я говорю, например, посмотрите на работу Одноклассники.ру! Некоторые веб-мастера еще и хвастаются, выводя этакую «статистику» внизу страницы: «Страница сформирована за 0.9 сек, выполнено 9 SQL запросов ». Ничего, кроме абсолютно бестолковой архитектуры Веб-приложения, это не показывает!

Не всегда и не для всех сайтов полезно кэширование всех или отдельных страниц. Некоторым это может показаться странным, ведь кэширование снижает нагрузку на сервер, особенно при большой активности и посещаемости посетителей, но только не тем, у кого на страницах сайтов или веб-сервисов слишком часто обновляется контент, а посетители при этом должны всегда получать самую свежую и актуальную информацию при каждой загрузке страниц. К таким веб-ресурсам можно отнести веб-чаты, голосования, игры, новости, счетчики и тому подобные. В этой статье будут представлены методы для запрета кэширования страниц сайта.


Речь здесь не о том, как запретить кэш лишь в браузере, а о том, как запретить кэширование контента на стороне сервера. Многим наверно известны методы запрета кэширования в заголовках HTML-страниц, например упомянутые в Wikipedia, такие как

Кроме того можно использовать и такие

В первой строке указывается рекомендация запрещать кэширование вообще, а вторая строка указывает браузеру, что страница используется в приватном режиме, поэтому ее содержимое не должно кэшироваться. Мета-теги в третьей и четвертой строках указывают на то, что срок хранения в кэше ограничено временем max-age=10800 (что равно 3-м часам) для браузера и для прокси соответственно.

Приведенные выше в пример рекомендации хороши однако лишь для тех владельцев сайтов, у которых нет доступа к PHP-скриптам, и больше подходят для нединамических страниц. Это, как говорится, «последний шанс», и лишь потому, что многие браузеры, да к тому же их многочисленные версии, все меньше и меньше обращают внимание на то, что прописано в HEAD-секциях страниц сайтов. Каждый из них «тянет одеяло на себя» и не все и не всегда придерживаются каких-то стандартов. Другими словами то, что было сказано выше, может не сработать.

Запрет кэширования страниц на PHP

Альтернатива этому - запретить кэширование страниц сайта с использованием PHP-скриптов, а именно при помощи функции header(...); , которая позволяет добавлять в заголовки пакетов HTTP необходимые параметры и директивы. На данный момент последние версии популярных браузеров и соответственно серверы более-менее одинаково обрабатывают эти заголовки HTTP-пакетов. В связи с этим более надежным и гибкими способом запрета кэширования будет применение PHP.

Вот пример простого указания сроков кэширования страниц сайта:

Однако на практике оказалось, что этого может быть недостаточно, и после многочисленных экспериментов с разными браузерами наиболее лучшим вариантом запрета кэширования на PHP будет такой подход:

В некоторых случаях может пригодиться в параметре заголовка использовать дополнительные параметры post-check=0 и pre-check=0

Header("Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0"); ...

Некоторые добиваются запрета кэширования страниц или изображений методом добавления к ссылкам рандомного (случайного) числа, как параметра запроса. Точнее это не запрет, а попытка обмануть браузер, что мол он должен заново загрузить страницу, так как URL уже изменен:

$echo = " Ссылка "; $echo = "";

Правда это не всегда и не на всех версиях и типах браузеров срабатывает, да и может помочь лишь в случаях, когда ссылки генерируются динамически.

Проверка, что кэширование отключено

Проверить, кэшируется ли страница или нет, можно с помощью добавления времени сервера, в которое была сгенерирована конкретная страница, непосредственно в код страницы. Это легко сделать с помощью PHP

Время создания страницы: " . date("H:i:s") . ""; ?>

В строке №6 содержится код date("H:i:s") , который показывает точное серверное время, в которое страница была создана. Таким образом, при каждом запросе к странице, при условии, что кэширование полностью отключено, мы всегда будем видеть абсолютно новое время. Если все же кэширование выполняется, то при частых запросах страница будет содержать одно и то же время.

Запрет кэширования страниц средствами Apache .htaccess

Недавно у меня был случай, произошло так, что на одном из порталов внезапно перестал работать веб-чат. Вернее он работал, ошибок никаких абсолютно не было, но пользователи видели в нем лишь свои сообщения, но не видели сообщений своих собеседников. В попытке исправить ситуацию, я выяснил, что на хостинге обновили серверную конфигурацию Apache вместе с кэширующим прокси Nginx. Затем попытался использовать практически все перечисленные выше методы для отключения кэша, но ничего не помогло. Самой последней надеждой и попыткой было решено прибегнуть к помощи Apache, попробовать использовать файл.htaccess.

Добавив в файл.htaccess, который находился в каталоге скриптов веб-чата, следующие установки, я решил проблему:

Header append Cache-Control "no-store, no-cache, must-revalidate" ExpiresActive On ExpiresDefault "now"

Так что тем, для кого проблема запрета кэширования страниц сайта является актуальной, то рекомендую использовать метод средствами файлов.htaccess сервера Apache. Правда это будет тоже работать лишь при условии, что на вашем хостинге будут загружены и подключены соответствующие модули - mod_expires.so и mod_headers.so . Подключены они или нет, можно будет убедиться при просмотре конфигурационного файла Apache, панели управления на хостинге или, в крайнем случае, обратившись с вопросом к тех.поддержке хостинга.

LoadModule expires_module modules/mod_expires.so LoadModule headers_module modules/mod_headers.so AddModule mod_expires.c AddModule mod_headers.c

Если же эти модули у вас подключены, то вы можете манипулировать и кэшированием отдельных файлов, например добавив в.htaccess такие директивы:

ExpiresActive On ExpiresDefault "now" Header append Cache-Control must-revalidate ExpiresDefault "now"

Кроме того, Вы сможете указывать время ограничения кэширования, например:

ExpiresDefault "access plus 1 month" # или # ExpiresDefault "access plus 4 weeks" # или # ExpiresDefault "access plus 30 days"

Эти варианты директив имеют одинаковый смысл и значение, и будут ограничивать кэширование сроком на 1 месяц. Еще можно будет указывать типы файлов контента со сроком окончания времени кэширования или указанием времени их модификации:

ExpiresByType text/html "access plus 1 month 7 days 12 hours" ExpiresByType image/gif "modification plus 3 hours 15 minutes"

На этом пожалуй пока все. Надеюсь информация будет для Вас полезной. Если же у Вас есть свои наработки, дополнения, то не стесняйтесь, пишите их в комментариях или шлите мне по почте, а я добавлю (после проверки) в эту статью.

Запрет кэширования посредством PHP

Запрет кэширования посредством PHP

Большинство сценариев формируют документы, которые при каждом запуске программы изменяются. Очевидно, если браузер пользователя начнет кэшировать такие документы, ничего хорошего не получиться.

Запретить кэшировать документы браузером и Proxy-серверами можно при помощи средств языка PHP , а именно функции Header().

Для этого надо использовать в начале сценария следующие команды:

Header("Expires: Mon, 26 Jul 1997 05:00:00 GMT"); //Дата в прошлом Header("Cache-Control: no-cache, must-revalidate"); // HTTP/1.1 Header("Pragma: no-cache"); // HTTP/1.1 Header("Last-Modified: ".gmdate("D, d M Y H:i:s")."GMT");

Для полного запрета кэширования приходиться всегда посылать 4 указанных заголовка, и ни один пропустить нельзя - в противном случае не сработает либо браузер, либо Proxy-сервер.

Из книги Разгони свой сайт автора Мациевский Николай

Спецификация кэширования В спецификации RFC-2616 HTTP-кэшированию посвящена целая глава. В ней подробно рассматривается, что означают отдельные заголовки. Давайте остановимся на ключевых моментах.Заголовок Expires устанавливает время актуальности информации. Для ресурсов,

Из книги Реестр Windows автора Климов Александр

Практическое запрещение кэширования Запретить кэширование можно и прямо из конфигурации Apache (подробная конфигурация для оптимальной производительности приводится в восьмой главе). Для этого нам нужны следующие строки:# Проверяем, что подключен mod_headers# Тогда выставляем

Из книги Работа в Интернете автора Макарский Дмитрий

Разрешение кэширования При запрете кэширования мы заставим браузер каждый раз заново загружать документы и ресурсные файлы. В последнем случае это совсем не оптимально и может привести к заметному замедлению работы с сайтом. Давайте рассмотрим, как можно выставить срок

Из книги Эффективное использование C++. 55 верных способов улучшить структуру и код ваших программ автора Мейерс Скотт

Отмена кэширования пароля (Internet Explorer 4 и выше) По некоторым сведениям, эта настройка имеет ограниченное применение. Приведенная информация относится к Internet Explorer версии 4.01 с установленным 2-м пакетом обновлений, к 5 и 5.01 версиям Internet Explorer, работающему под Windows 95, 98, NT 4.0 и Internet

Из книги Создание сайта. Раскрутка сайта. Заработок денег на сайте автора Макс Анатолий

Загрузка и выгрузка файлов посредством FTP Поговорим о том, как можно выгрузить свои файлы на удаленный сервер Интернета, чтобы их потом могли загружать другие, а также рассмотрим еще один способ загрузки файлов на свой компьютер, не связанный с использованием браузеров и

Из книги Сетевые средства Linux автора Смит Родерик В.

Реализация паттерна «Стратегия» посредством указателей на функции Идиома NVI – это интересная альтернатива открытым виртуальным функциям, но с точки зрения проектирования она дает не слишком много. В конце концов, мы по-прежнему используем виртуальные функции для

Из книги Linux: Полное руководство автора Колисниченко Денис Николаевич

Реализация паттерна «Стратегия» посредством класса tr::function Если вы привыкли к шаблонам и их применению для построения неявных интерфейсов (см. правило 41), то применение указателей на функции покажется вам не слишком гибким решением. Почему вообще для вычисления

Из книги Фундаментальные алгоритмы и структуры данных в Delphi автора Бакнелл Джулиан М.

Правило 38: Моделируйте отношение «содержит» или «реализуется посредством» с помощью композиции Композиция – это отношение между типами, которое возникает тогда, когда объект одного типа содержит в себе объекты других типов. Например:class Address {...}; // адрес проживанияclass

Из книги Работа в Интернете. Энциклопедия автора Ташков Петр Андреевич

Из книги Linux глазами хакера автора Флёнов Михаил Евгеньевич

Настройка сервера, предназначенного только для кэширования В небольших сетях часто используются серверы DNS, основная задача которых - кэширование результатов преобразования имен. Сервер такого типа не поддерживает конкретный домен (за исключением домена для обратного

Из книги автора

13.4.1. Настройка кэширования на DNS-сервере Для того, чтобы насладиться такой возможностью, следует в блок options файла named.conf добавить следующие параметры:forward first;forwarders { 81.3.165.35; 81.3.150.2;};Директива forwarders задает заключенный в фигурные скобки список IP-адресов DNS-серверов, которым

Из книги автора

Разрешение конфликтов посредством линейного зондирования Если количество элементов, которые, скорее всего, должна содержать хеш-таблица, известно, можно выделить место для хеш-таблицы, содержащей это количество элементов и небольшое число свободных ячеек "на всякий

Из книги автора

Разрешение конфликтов посредством связывания Если мы готовы использовать дополнительные ячейки, кроме тех, которые требуются самой хеш-таблице, можно воспользоваться другой эффективной схемой разрешения конфликтов - схемой с закрытой адресацией. Этот метод называется

Из книги автора

Разрешение конфликтов посредством группирования Существует разновидность метода связывания для разрешения конфликтов, которая носит название группирования в блоки (bucketing). Вместо помещения связного списка в каждую ячейку, в нее помещается группа, которая по существу

Из книги автора

Загрузка и скачивание файлов посредством FTP Рассмотрим, как можно загрузить свои файлы на удаленный сервер Интернета, чтобы их потом могли загружать другие, а также обсудим еще один способ загрузки файлов на свой компьютер, не связанный с использованием браузеров и

Сколько раз писано и переписано о тэге … Казалось бы, все! Хватит! Закрыли тему! Но нет! Ведь не все сказали! Вернее, кое-где все, но это попробуй найди еще. Потыкайся во всякие Rambler’s и Яndex’ы…

Итак, поговорим о кэшировании. Собственно, для чего оно нужно всем нам, бедным пользователям интернета, как среды обитания. Сокращение трафика — вот она, польза! Ну зачем нам десять раз на день заново качать из сети первую страницу какого-нибудь поискового каталога, когда можно аккуратненько положить ее в кэш и забыть о медленной загрузке для этого сайта? Во-от, именно так и делают. Углубимся в проблему.

Всем известно, что разных версиях протоколов HTTP применяются свои директивы управления кэшированием. Cache-Control — директива протокола HTTP/1.1. А параметры у нее вот такие:

Все перечисленные атрибуты (кроме взаимоисключающих) можно перечислять через запятую. Понимаю, не все ясно, сейчас кое-что поясню.

1. Запрет на кэширование вообще (документ не будет кэшироваться ни proxy-сервером, ни браузером):

2. Документ будет кэшироваться браузером, но не будет кэшироваться proxy-сервером.

3. Документ будет кэшироваться, даже если и не должен, вроде бы, при обычных обстоятельствах.

4. Документ кэшируется, но не сохраняется в архиве.

5. Можно прямо сказать браузеру: «Обнови-ка мне эту страницу». (В параметре max-age указано, на сколько секунд кэшируется документ). Может быть полезно при использовании PHP для програмного обновления страниц.

6.А можно сказать это только прокси-серверу.

В наследство от протокола HTTP 1.0 нам достался очень простой способ управления кэшированием, определяется директивой Pragma. Данная штука является общей директивой заголовка HTTP-сообщения в HTTP/1.0, и других значений, кроме no-cahce, не имеет:

В протоколе HTTP 1.1 данная директива заменена директивой Cache-Control со значением no-cache. Большинство серверов и клиентов поддерживают эту директиву и правильно ее отрабатывают.

Для запрета на кэширование иногда не достаточно применения директив управления кэшированием. Так Netscape кэширует документы или их компоненты даже при наличии директив Cache-Control и Pragma. Для того, чтобы заставить перечитать компонент страницы (он ведь получается с сервера по самостоятельному HTTP-запросу) можно установить директиву Expires.

Вот такой вот получился разговор о кэшировании. А с тэгом META мы еще встретимся. И не раз…

Хорошо Плохо

    Мета теги - это необязательные аттрибуты страницы, размещенные в ее заголовке, которые содержат описание страницы, ключевые слова к ней, некоторую информацию об…