Сайт о телевидении

Сайт о телевидении

» » Поиск страницы в кэше. Что такое кэш в Google Chrome

Поиск страницы в кэше. Что такое кэш в Google Chrome

Решение рассматривается (пока) только для одного сайта - того, на котором мы находимся. Идея появилась в результате того, что один пользователь сделал юзерскрипт, который переадресует страницу на кеш Гугла, если вместо статьи видим «Доступ к публикации закрыт». Понятно, что это решение будет работать лишь частично, но полного решения пока не существует. Можно повысить вероятность нахождения копии выбором результата из нескольких сервисов. Этим стал заниматься скрипт HabrAjax (наряду с 3 десятками других функций). Теперь (с версии 0.859), если пользователь увидел полупустую страницу, с которой можно перейти лишь на главную, в личную страницу автора (если повезёт) и назад, юзерскрипт предоставляет несколько альтернативных ссылок, в которых можно попытаться найти потерю. И тут начинается самое интересное, потому что ни один сервис не заточен на качественное архивирование одного сайта.

Кстати, статья и исследования порождены интересным опросом А вас раздражает постоянное «Доступ к публикации закрыт»? и скриптом пользователя dotneter - комментарий habrahabr.ru/post/146070/#comment_4914947 .

Требуется, конечно, более качественный сервис, поэтому, кроме описания нынешней скромной функциональности (вероятность найти в Гугл-кеше и на нескольких сайтах-копировщиках), поднимем в статье краудсорсинговые вопросы - чтобы «всем миром» задачу порешать и прийти к качественному решению, тем более, что решение видится близким для тех, кто имеет сервис копирования контента. Но давайте обо всём по порядку, рассмотрим все предложенные на данный момент решения.

Кеш Гугла

В отличие от кеша Яндекса, к нему имеется прямой доступ по ссылке, не надо просить пользователя «затем нажать кнопку „копия“». Однако, все кеширователи, как и известный archive.org, имеют ряд ненужных особенностей.

1) они просто не успевают мгновенно и многократно копировать появившиеся ссылки. Хотя надо отдать должное, что к популярным сайтам обращение у них частое, и за 2 и более часов они кешируют новые страницы. Каждый в своё время.

3) поэтому результат кеширования - как повезёт. Можно обойти все такие кеширующие ссылки, если очень надо, но и оттуда информацию стоит скопировать себе, потому что вскоре может пропасть или замениться «более актуальной» бессмысленной копией пустой страницы.

Кеш archive.org

Он работает на весь интернет с мощностями, меньшими, чем у поисковиков, поэтому обходит страницы какого-то далёкого русскоязычного сайта редко. Частоту можно увидеть здесь: wayback.archive.org/web/20120801000000*/http://habrahabr.ru
Да и цель сайта - запечатлеть фрагменты истории веба, а не все события на каждом сайте. Поэтому мы редко будем попадать на полезную информацию.

Кеш Яндекса

Нет прямой ссылки, поэтому нужно просить (самое простое) пользователя нажать на ссылку «копия» на странице поиска, на которой будет одна эта статья (если её Яндекс вообще успел увидеть).

Как показывает опыт, статья, повисевшая пару часов и закрытая автором, довольно успешно сохраняется в кешах поисковиков. Впоследствии, скорее всего, довольно быстро заменится на пустую. Всё это, конечно, не устроит пользователей веба, который по определению должен хранить попавшую в него информацию.

Из живых я нашёл пока что 4, некоторые давно существовавшие (itgator) на данный момент не работали. В общем, пока что они почти бесполезны, потому что заставляют искать статью по названию или ключевым словам, а не по адресу, по которому пользователь пришёл на закрытую страницу (а по словам отлично ищет Яндекс и не только по одному их сайту). Приведены в скрипте для какой-нибудь полезной информации.

Задача

Перед сообществом стоит задача, не утруждая организаторов сайта, довести продукт до качественного, не теряющего информацию ресурса. Для этого, как правильно заметили в комментариях к опросу, нужен архиватор актуальных полноценных статей (и комментариев к ним заодно).

В настоящее время неполное решение её, как описано выше, выглядит так:

Если искать в Яндексе, то подобранный адрес выведет единственную ссылку (или ничего):


Нажав ссылку «копия», увидим (если повезёт) сохранённую копию (страница выбрана исключительно для актуального на данный момент примера):

В Гугле несколько проще - сразу попадаем на копию, если тоже повезёт, и Гугл успел сохранить именно то, что нам надо, а не дубль отсутствующей страницы.

Забавно, что скрипт теперь предлагает «выбор альтернативных сервисов» и в этом случае («профилактические работы»):

Жду предложений по добавлению сервисов и копировщиков (или хотя бы проектов) (для неавторизованных - на почту spmbt0 на известном гуглоресурсе, далее выберем удобный формат).

UPD 23:00: опытным путём для mail.ru было выяснено строение прямой ссылки на кеш:
"http://hl.mailru.su/gcached?q=cache:"+ window.location Знатоки или инсайдеры, расскажите, что это за ссылка, насколько она стабильна (не изменится ли, например, домен 3-го уровня), что значит приставка «g»-cached? Значит ли это кеш Гугла или это кеш движка Gogo?

Есть 2 простых способа, как очистить кэш в Google Chrome. Первый – это полная очистка, а второй – для одного конкретного сайта. Сброс кэша осуществляется в самом браузере Гугл Хром. Поэтому никаких дополнительных программ не нужно.

Что такое кэш? Это временные файлы, которые загружаются браузером и сохраняются на компьютере. Их наличие ускоряет открытие ранее посещенных страниц.

Например, Вы первый раз посетили какой-то сайт, и все картинки, видео, скрипты и стили с него сохранились на ваш компьютер. Когда вы зайдете на него повторно, то все эти файлы уже не будут загружаться – браузер возьмет их из кэша, который хранится на локальном диске C. В результате сайт откроется быстрее, чем в первый раз.

Кэш браузера постоянно увеличивается и через некоторое время может занимать много места. Поэтому, если Вы обнаружили, что на локальном диске C осталось мало свободного места – самое время очистить кэш браузера Chrome. Особенно, если давно этого не делали.

Кстати, очень часто пользователи считают, что кэш и история посещений это одно и то же. Но это совершенно разные понятия. В истории хранится список посещенных ранее вами сайтов, а в кэше – техническая информация (картинки, видео, скрипты, стили), которая ускоряет их загрузку.

Как удалить кэш в Google Chrome?

Очистка кэша в Google Chrome осуществляется очень просто. Чтобы выполнить эту процедуру:

Готово. Вот так просто осуществляется очистка кэша в Chrome. Как видите, ничего сложно тут нет.

Хотя существует более простой способ сбросить кэш в Chrome:


И самый простой способ: нажать Ctrl+Shift+Del, поставить галочку в 4-ом пункте и нажать кнопку «Очистить историю».

Как очистить кэш отдельного сайта в Гугл Хроме?

Теперь рассмотрим, как очистить кэш сайта в Chrome. Данная процедура тоже выполняется очень просто:


Готово. Вот таким образом можно удалить кэш в Chrome для одного отдельного сайта. При необходимости данную процедуру следует проделать и для других сайтов.

На этом все. Теперь Вы знаете, как очистить кэш браузера Google Chrome и легко сможете это сделать. В первую очередь данную процедуру рекомендуется выполнять для сайтов, которые кардинально изменили свой дизайн. Ведь Гугл Хром будет загружать старые файлы, сохраненные на локальном диске C, и Вы не увидите новых изменений. Также желательно периодически (например, раз в месяц) удалять его ради экономии места на компьютере или ноутбуке.

Возможно, сайт был подвергнут блокировке из-за нарушения закона, а может этот сайт просто пока что не отвечает на запрос. Как бы ни была причина, иногда вам нужно взять какую информацию с сайта, который совсем недавно перестал работать или был взломан и лишился всего контента. В большинстве случаев удача может повернуться к вам лицом. Вы можете просмотреть кэшированную версию этого сайта в Google?

Кэшированные сайты: что это?

Для того чтобы быстро отыскать все эти сайты, Google и другие поисковые системы сохраняют внутреннюю копии этих сайтов на серверах. Эти сохраненные файлы и называются кэшем, и Google позволяет их просматривать, если такая копия существует. Раньше этот процесс был очень понятен – вам просто нужно было нажать ссылку, представленную под результатом, выданном в поиске. Сейчас все немного сложнее, но вам не стоит беспокоиться, так как кэшированные сайты по-прежнему существуют.

Смотрим кэш сайта в Гугл :

1. Попробуйте найти что-нибудь. В данном случае, мы будем искать по ключу «кеширование», и предположим, что в коем-то веке Wikipedia ушла в даун.

2. Наведите курсор мыши на результат поиска, но не кликайте.
3. Вы увидите, что рядом справа от результата появится стрелка вправо. Кликните по этой стрелке.
4. Теперь вы можете видеть миниатюру сайта. Вы также увидите ссылку Cached сверху от миниатюры. Можете кликать по этой ссылке.

Таким образом, вы будете перенаправлены к кэшированной версии сайта. И эта версия не обязательно будет содержать актуальные данные. Это просто копия сайта в том состоянии, в котором бот Google последний раз его сканировал, и на самом деле эта страница хранится на сервере Google, и поэтому ссылка будет начинаться с webcache.googleusercontent.com, а не с Wikipedia.org. Google также расскажет вам о том, насколько свежая эта копия.

Иногда бывает так, что на страницах отсутствуют изображения или фоны. Вы можете кликнуть по ссылке в верхней части страницы и увидеть текстовую версию сайта, который вы на данный момент читаете. Иногда это помогает найти необходимую вам информацию. Вы также можете кликнуть по ссылке, которая приведет вас к актуальной странице, если вам вдруг нужно будет сравнить две эти версии.

Если вам нужно найти определенный термин, вы можете воспользоваться сочетанием клавиш Ctrl+F, и просто отыскать его при помощи вашего браузера.

Сайты, которые не кэшируются

У большинства сайтов есть кэшированные копии, но бывают и исключения. Владельцы сайтов могут использовать файл robots.txt для того, чтобы попросить поисковую систему не индексировать сайт, либо удалять кэш. Иногда такое бывает, когда владелец хочет полностью удалить сайт, и не хочет, чтобы где-то появлялся его контент. Ведь существует довольно много сайтов с «черным» контентом или контентом, который не обязательно должен индексироваться (приватные форумы, информация о кредитных картах или сайты с платным доступом к контенту).

Вы можете проследить за тем, как изменялся сайт, воспользовавшись инструментом от Google под названием WebArchive , но функционал этого инструмента также может быть запрещен файлом robots.txt.

Думаю, каждый из вас неоднократно встречал в сети советы очистить кэш браузера . Вполне вероятно, что многие следуют этим советам. Но далеко не каждый знает, что же это такое на самом деле: ; и для чего его нужно чистить? Сегодня подробно об этом расскажу.

Что такое кэш браузера?

Когда в интернете мы открываем и просматриваем веб-страницы сайтов, наш браузер при этом автоматически сохраняет определенные данные с этих страниц на жесткий диск нашего компьютера. Сюда относятся различные элементы дизайна, изображения и картинки, просмотренные видеоролики и т.д. Необходимо это для того, чтобы при следующем обращении к этой веб-странице часть информации загружалась непосредственно с нашего жесткого диска, а не заново с сервера. Это значительно ускоряет время загрузки страниц!

Благодаря тому, что браузер при повторной загрузке страницы какого-либо сайта берет большинство данных из кэша, а не грузит каждый раз все заново – то происходит еще и экономия входящего интернет трафика.

Для чего нужно чистить кэш браузера?

Кэш браузера необходимо периодически очищать. Для этого есть минимум пару причин.

Во-первых, если вы активно посещаете различные сайты в интернете, то на жестком диске скапливается большое количество файлов кэша. Общий размер этих файлов может достигать нескольких гигабайт (правда в некоторых браузерах можно задать фиксированный размер кэша в настройках).

Вторая причина – более важная. Со временем, некоторые сайты могут начать отображаться некорректно. Например, на сайте поменялся дизайн, а ваш браузер продолжает использовать устаревшие данные из своего кэша.

Где хранится кэш браузера?

Каждый браузер хранит свой кэш в определенной папке на жестком диске компьютера. В операционных системах Windows 7, 8 и 10 кэш всех популярных браузеров по умолчанию сохраняется по пути C:\Users\Имя пользователя\AppData\Local каждый в своей папке.

Изначально папка AppData является скрытой, поэтому чтобы войти в нее и увидеть содержимое – необходимо включить в системе отображение скрытых и системных файлов. В Windows 7 для этого в проводнике зайдите в строке меню во вкладку “Сервис” – “Параметры папок” – “Вид”. Здесь снимите галку с пункта “Скрывать защищенные системные файлы” и поставьте маркер в положение “Показывать скрытые файлы, папки и диски”:

Итак, популярные браузеры хранят свой кэш в следующих папках:

Google Chrome

C:\Users\Имя пользователя\AppData\Local\Google\Chrome\User Data\Default\Cache

C:\Users\Имя пользователя\AppData\Local\Google\Chrome\User Data\Profile 1\Cache

Mozilla Firefox

C:\Users\Имя пользователя\AppData\Local\Mozilla\Firefox\Profiles\название профиля.default\cache2\entries

Opera

C:\Users\Имя пользователя\AppData\Local\Opera Software\Opera Stable\Cache

Яндекс Браузер

C:\Users\Имя пользователя\AppData\Local\Yandex\YandexBrowser\User Data\Default\Cache

Internet Explorer

C:\Users\Имя пользователя\AppData\Local\Microsoft\Windows\Temporary Internet Files\

C:\Users\Имя пользователя\AppData\Local\Microsoft\Windows\INetCache\

Как очистить кэш браузера?

Очистить кэш браузера на компьютере очень просто, и времени это займет совсем немного. Находясь в любом браузере, зажмите на клавиатуре три клавиши: Ctrl+Shift+Delete . Дальше выскочит окошко, в котором вам останется только выбрать что именно и за какой период очищать. Тоже самое только со скриншотами я описал в отдельной статье “ ”.

Замечу следующее: после очистки кэша, первое время веб-страницы сайтов будут загружаться чуть медленнее. Причина в том, что все эти страницы будут грузиться прямо с веб-сервера, а кэш-файлы будут создаваться на вашем жестком диске заново.

Чтобы очистить кэш сразу во всех установленных на компьютере браузерах, можно воспользоваться хорошей бесплатной программой .

Иногда, зайдя на (ранее существовавшую) страницу, мы получаем 404 ошибку — страница не найдена. Эта страница удалена, сайт не доступен и т. д., но как просмотреть удалённую страницу ? Попробую дать ответ на этот вопрос и предложить четыре готовых варианта решения этой задачи.

Вариант 1: автономный режим браузера

Для экономии трафика и увеличения скорости загрузки страниц, браузеры используют кэш. Что такое кэш? Кэш (от англ. cache ) — дисковое пространство на компьютере, выделенное под временное хранение файлов, к которым относятся и веб-страницы.

Так что попробуйте просмотреть удаленную страницу из кэша браузера. Для этого — перейдите в автономный режим .

Примечание : просмотр страниц в автономном режиме возможен, только если пользователь посещал страницу ранее и она ещё не удалена из кэша.

Как включить автономный режим работы браузера?

Для Google Chrome , Яндекс.Браузер и др., автономный режим доступен только как эксперимент. Включите его на странице: chrome://flags/ — найдите там «Автономный режим кеша» и кликните ссылку «Включить ».


Включение и выключение автономного режима в браузере Google Chrome

В Firefox (29 и старше) откройте меню (кнопка с тремя полосками) и кликнуть пункт «Разработка » (гаечный ключ) , а потом пункт «Работать автономно ».

Включение и выключение автономного режима в браузере Firefox

В Opera кликните кнопку «Opera», найдите в меню пункт «Настройки », а потом кликните пункт «Работать автономно ».

Как включить или отключить автономный режим в Opera?

В Internet Explorer — нажмите кнопку Alt , (в появившемся меню) выберите пункт «Файл » и кликните пункт меню «Автономный режим ».

Как отключить автономный режим в Internet Explorer 11?

Уточню — в IE 11 разработчики удалили переключение автономного режима. Возникает вопрос — как отключить автономный режим в Internet Explorer 11? Выполнить обратные действия — не получится, сбросьте настройку браузера.

Для этого закройте запущенные приложения, в том числе и браузер. Нажмите комбинацию клавиш Win +R и (в открывшемся окне «Выполнить») введите: inetcpl.cpl , нажмите кнопку Enter . В открывшемся окне «Свойства: Интернет» перейдите на вкладку «Дополнительно ». На открывшейся вкладке найдите и кликните кнопку «Восстановить дополнительные параметры », а потом и появившуюся кнопку «Сброс… ». В окне подтверждения установите галочку «Удалить личные настройки » и нажмите кнопку «Сброс ».

Вариант 2: копии страниц в поисковиках

Ранее я рассказывал , что пользователям поисковиков ненужно заходить на сайты — достаточно посмотреть копию страницы в поисковике, и это хороший способ решения нашей задачи.

В Google — используйте оператор info: , с указанием нужного URL-адреса. Пример:


В Яндекс — используйте оператор url: , с указанием нужного URL-адреса. Пример:


Наведите курсор мыши на (зелёный) URL-адрес в сниппете и кликните появившуюся ссылку «копия ».

Проблема в том, что поисковики хранят только последнюю проиндексированную копию страницы. Если страница удалена, со временем, она станет недоступна и в поисковиках.

Вариант 3: WayBack Machine

Сервис WayBack Machine — Интернет архив, который содержит историю существования сайтов.


Просмотр истории сайта на WayBack Machine

Введите нужный URL-адрес, а сервис попытается найти копию указанной страницы в своей базе с привязкой к дате. Но сервис индексирует далеко не все страницы и сайты.

Вариант 4: Archive.today

Простым и (к сожалению) пассивным сервис для создания копий веб-страниц является Archive.today . Получить доступ к удалённой странице можно, если она была скопирована другим пользователем в архив сервис. Для этого введите URL-адрес в первую (красную) форму и нажать кнопку «submit url ».


После этого, попробуйте найти страницу, используя вторую (синюю) форму.


Рекомендую! Подумал: А что делать, если страница не удалена? Бывает же так, что просто невозможно зайти на сайт. Нашел статью Виктора Томилина , которая так и называется «Не могу зайти на сайт » — где автор не просто описывает 4 способа решения проблемы, но и записал наглядное видео.
в 22:40 Изменить сообщение 12 комментариев