Кэширование внешних накопителей[. Очистка при помощи встроенных средств

Каждый человек, часто пользующийся различными гаджетами так или иначе встречался с понятиями «Кэш» и «Кэширование данных». Может быть он слышал об этих понятиях, может он даже знает, что они означают, но, даже если он слышит о них впервые, он всё равно уже имел опыт использования кэшированных данных, но не знает этого.

В этой статье мы подробно разберёмся в что такое кэшированные данные. Какое применение они нашли в смартфонах, каким целям служат и как с ними взаимодействовать. Можно ли удалять кэш и как это делать. Зачем это нужно делать и что будет если их не удалять.

Так что же такое кэш?

Кэшированные данные или кэш - это промежуточный буфер с быстрым доступом, в котором содержится информация, которая в любой момент может быть запрошена. Иными словами, кэш - это данные, которые сохраняются устройством в физической памяти с возможностью дальнейшего быстрого доступа.

Для того, чтобы понять это, рассмотрим кэширование на конкретном примере. Допустим, вы являетесь пользователем какой-либо социальной сети, зайдя в свою ленту новостей, вы увидели там новую красивую картинку с изображением горного пейзажа, но эта картинка очень долго не могла загрузиться.

Когда она наконец загрузилась, и вы налюбовались ей, то вы закрыли социальную сеть на своём смартфоне и ушли на некоторое время. Спустя час, вы снова открыли социальную сеть и в ленте новостей снова увидели эту же самую картинку. В этот раз картинка загрузилась гораздо быстрее.

Ускорение загрузки картинки во второй раз как раз и обусловлено кэшированием данных. Дело в том, что при первой загрузке картинка загружалась из интернета, что и потребовало время, но после того, как картинка загрузилась, устройство оставило о ней некоторые данные в виде кэша.

Эти данные и были использованы при второй загрузки. Что и привело к её ускорению. Этот пример кэширования данных очень часто встречается на практике, но обычно его не замечают.

Для чего используется кэширование данных

Как стало понятно из приведённого выше примера, кэширование данных приводит к увеличению скорости загрузки уже просмотренных страниц. Однако социальные сети в смартфоне далеко не единственный пример кэширования данных.

Кэш есть у каждого приложения, он также способствует его ускоренной загрузке.

Проблемы кэширования данных

Помимо неоспоримых плюсов у кэширования данных есть также и минусы. Главным минусом является то, что кэш занимает в памяти устройства. Эта проблема наиболее актуальна для смартфонов, не обладающих большими запасами памяти. Пользователь устройства может и не заметить, как у него закончится память.

Для смартфонов с большим запасом памяти кэширование данных может привести к тому, что приложения будут тормозить. Для решения этой проблемы можно очистить кэш приложения.

Как осуществляется удаление кэша приложения

Существует два метода, позволяющие избавиться от кэшированных данных приложения.

  1. Ручной метод.
  2. Автоматический метод.

Чтобы воспользоваться ручным методом, нужно зайти в настройки приложения, кэш которого хотите удалить, и путём нехитрых манипуляций очистить его кэш, однако у этого метода есть существенный недостаток, который заключён в том, что могут остаться другие кэшированные данные в другом месте.

Самый универсальный метод - это автоматический метод для того, чтобы им воспользоваться нужно скачать специализированное приложение, которых полно в интернете. Приложение само найдёт все источники кэшированных данных и удалит их. Этот метод не обладает существенными минусами, кроме того, что придётся устанавливать новое приложение.

К чему может привести удаление кэша

Удаление кэшированных данных не приведёт ни к каким страшным последствиям, оно лишь освободит место в памяти устройства.

Единственным отрицательным последствием является то, что скорость загрузки приложений может снизиться, но это продлится не долго, до того момента, когда создастся новый кэш.

Подведение итогов

Из всего сказанного выше становится ясно, что кэш или кэшированные данные - это данные, которые ваше устройство сохранило в своей памяти , чтобы увеличить скорость загрузки приложений.

Однако, память устройства не безгранична, и нужно следить за тем, чтобы кэшированные данные не занимали слишком много места. Для того, чтобы этого не случалось надо регулярно проводить чистку памяти устройства от мусора, что положительно сказывается на его стабильности и работоспособности.

Удаление кэшированных данных не способно каким-либо образом навредить системе, разве что замедлить загрузку приложений до создания новых кэшированных данных. В целом удаление кэша является полезной процедурой, которую нужно периодически проводить, чтобы поддерживать стабильность работы устройства.

Удаление кэша приложения может помочь в решении проблемы, связанной с работой этого приложения.

Компьютерная индустрия занята беспрестанными поисками путей повышения производительности. Принимая как лозунг высказывание, что быстрее - это всегда лучше, инженеры тем не менее ищут способы увеличить производительность, не переусложняя при этом конструкцию и не слишком взвинчивая себестоимость устройств.

Компьютер, состоящий из самых разных по принципам работы и назначению устройств, можно с достаточно вескими основаниями назвать "гнездом раздора". Ну никак его подсистемы и узлы не хотят согласованно работать на общее благо. Если процессор вырывается вперед, от него отстает память, а о дисковых накопителях и говорить не приходится. И заставить всех бежать со скоростью, задаваемой лидером, чрезвычайно сложно.

Кэширование - один из технических приемов, направленных на согласование работы разных по скорости устройств, используемый в компьютере многократно и на самых разных уровнях. Хотя реализация кэширования в том или ином конкретном случае может быть весьма сложной, его идея очень проста. Внутри компьютера кэш представляет собой место, где временно хранится программная информация, адреса или данные.

Поскольку компьютерные вычисления носят ярко выраженный итерационный характер (то есть некоторая последовательность действий повторяется раз за разом с минимальными изменениями), кэширование обеспечивает весьма эффективный метод повышения производительности, предоставляя системе возможность сохранять часто требуемые данные в ближайшей промежуточной кэш-памяти, доступ устройства к которой происходит быстрее и легче, чем к основной памяти.

Кэширование чтения в жестких дисках Все ведущие производители, такие, например, как Seagate, признают технику кэширования особенно эффективной в отношении накопителей на жестких дисках. Связано это с тем, что скорость винчестеров в тысячи и даже миллионы раз меньше, чем у твердотельных элементов оперативной памяти на материнской плате компьютера.

Так как компьютер обычно обращается к дисковым накопителям последовательно, то есть последовательность запросов в какой-то мере предсказуема, производительность дисковой подсистемы можно существенно поднять, если считывать дополнительные данные в кэш-память еще до того, как компьютер обратится за ними. И необходимые данные будут тогда выданы из твердотельной памяти в несколько тысяч раз быстрее, чем если бы их пришлось считывать с диска.

Тесты показывают, что когда компьютер обращается за данными по некоторому адресу, в 80-90 процентах случаев следующий запрос коснется данных, расположенных вслед за ними. К сожалению, попытки поднять производительность за счет использования кэширования все же носят рискованный характер. Дополнительная информация считывается с диска на основании пусть и больших, но все-таки не стопроцентных шансов на успех, то есть на то, что они пригодятся в дальнейшем.

Итак, кэширование чтения основано на предсказании следующих обращений к диску за данными (обычно расположенными непосредственно вслед за только что прочитанными) и помещении их в быстродействующую память перед тем, как они потребуются системе. Поскольку программа, отвечающая за кэширование, считывает информацию в память до того, как за ней обратятся, такой механизм часто называют буфером с упреждающим чтением (read look-ahead buffer). С точки зрения еще более существенного повышения производительности не имеет смысла размещать кэш-буфер и соответствующую программу в основной памяти компьютера, так как тогда она потребует часть вычислительных ресурсов центрального процессора. Дисковый накопитель сам способен справиться с упреждающим кэшированием, не отвлекая компьютер на хлопоты, связанные с управлением кэш-памятью.

По этим причинам сегодня все жесткие диски, включая винчестеры для мобильных, настольных и высокопроизводительных систем, поддерживают кэширование чтения, используя усовершенствованную концепцию. Например, при размещении на накопителе большего числа чипов памяти, что оборачивается возможностью держать в готовности большее количество данных, не дожидаясь их считывания с диска после получения запроса. Другими словами, при установке на печатную плату контроллера накопителя не 64, а 128 килобайт памяти появляется возможность загодя прочитать и приготовить к выдаче вдвое большее количество информации. И, до тех пор пока компьютер будет продолжать запрашивать последовательно записанные на диск данные, они будут моментально выдаваться ему из кэша.

Сегодня, когда большинство производителей использует от 128 до 512 килобайт кэш-памяти, компания Seagate в своих наиболее производительных накопителях Barracuda и Cheetah увеличила ее объем до полновесного мегабайта (предусмотрев возможность ее наращивания в четыре раза), а винчестеры Elite рекордной емкости (23 гигабайта) сразу оснащает 2 мегабайтами кэша. Это необходимо с учетом тех приложений, для которых предназначены указанные жесткие диски - для рабочих станций и серверов класса "хай-энд", мини- и суперкомпьютеров. В каждом из этих случаев постоянно требуется прочтение большого количества данных при максимальной скорости передачи. Настолько быстро, насколько только возможно.

Адаптивное кэширование Каждый раз, когда компьютер обращается за данными, которые уже находятся в кэше, запрос называется "попаданием в кэш". Если же запрошенных данных в кэше не оказалось и накопитель должен привести в действие свою механику и прочитать их с дисков, говорят о "промахе". О том, насколько эффективно работает программа (или алгоритм) кэширования, легче всего судить по соотношению попаданий и промахов. Сравнивая число попаданий с числом промахов, получают так называемый "рейтинг попаданий" для примененной схемы кэширования.

Применение стратегий, известных как адаптивное и сегментированное кэширование, помогает минимизировать частоту осечек.

Вот, к примеру, как работает сегментированный кэш. Предположим, что на винчестере установлено 800 килобайт кэш-памяти. Простая стратегия кэширования предполагает, что все эти 800 килобайт будут заполняться считываемыми в порядке упреждения данными.Если никакая часть из этих данных не будет востребована системой при следующем обращении, всех их придется удалить из кэша. Это промах. Замечу, что такое происходит сплошь и рядом при работе современных многозадачных систем, в которых за данными к диску обращаются поочередно несколько прикладных программ, причем каждая из них интересуется информацией, записанной на диске в совершенно другом месте.

Представим теперь, что кэш-память разделена на два сегмента по 400 килобайт каждый. Накопитель расценивает их как два абсолютно независимых кэш-буфера. Теперь данные для одного приложения можно записывать в первый 400-килобайтный сегмент, а для второго - во второй 400-килобайтный сегмент. Данные для обеих программ будут выдаваться из кэш-памяти, соотношение попаданий и промахов улучшится раза в два, если не больше. Именно поэтому в своих винчестерах Seagate применяет кэш-буферы, разделенные на два или четыре сегмента фиксированного размера. Наращивать их число свыше четырех инженеры из Seagate считают неоправданным, кроме исключительных случаев.

Второй путь улучшения рейтинга попаданий называется адаптивным кэшированием. В действительности термин адаптивное кэширование описывает два различных метода повышения эффективности. В соответствии с первым реализуется адаптивная сегментация, которая позволяет контроллеру винчестера управлять числом независимых сегментов, организуемых в кэш-памяти. Второй тип адаптивного кэширования подразумевает использование адаптивного алгоритма.

Предположим снова, что на винчестере установлен 800-килобайтый кэш-буфер с упреждающим чтением и этот буфер разделен на четыре сегмента по 200 килобайт. Предположим также, что запущенное на компьютере приложение запрашивает данные, которых нет ни в одном из четырех сегментов. Накопитель должен смириться с промахом и прочитать их со своих дисковых пластин, а заодно решить, куда их поместить в кэш-памяти. Чтобы принять такое решение, ему предстоит определить, какой из четырех сегментов лучше очистить. Разумеется, нежелательно помещать новые данные в сегмент, информация из которого вскоре может быть затребована, так как это приведет к повторному ее считыванию и перезагрузке кэша. Адаптивный алгоритм принимает решение о том, данные из какого сегмента скорее всего больше не понадобятся, основываясь на собственном анализе предыдущего использования данных.

В кэшировании наиболее приятно то, что оно предлагает относительно недорогой и простой способ согласования быстродействия компьютера и периферийных устройств. Хорошо реализованное кэширование помогает увеличить производительность сразу на несколько порядков.

Роман Соболенко,по материалам Seagate

Недавно у меня был достаточно горячий конфликт с популярным PHP пакетом для электронной коммерции. В результате мне захотелось рассказать об одной распространенной ошибке в архитектуре веб приложений.

Пакет с которым я работал, интенсивно использовал кэширование. Он не мог отдавать более 10 страниц в секунду, если не были включены некоторые «опциональные» настройки кэша. Очевидно что с такой производительностью они на самом деле не опциональны, а обязательны.

Я думаю, что когда у Вас есть такой замечательный инструмент как memcached, так и хочется использовать его для решения любой проблемы с производительностью. Но во многих случаях он не должен быть первым инструментом который Вы пытаетесь использовать. И вот почему:

- Кэширование может работать не для всех пользователе й - Вы открываете страницу - она загружается быстро. Но так ли это для всех пользователей? Кэширование очень часто позволяет оптимизировать время загрузки для большинства посетителей, но часто в реальности Вам надо чтобы страница загружалась быстро для всех без исключения (если следовать принципу six sigma). На практике запрос может промахиваться мимо кэша всегда для одного и того же пользователя, что еще более усугубляет ситуацию (Прим. переводчика : Я знаю совершенно реальный случай, когда в электронном магазине кэш срабатывал для 99% процентов пользователей и не работал для 1% посетителей имевших длинную историю покупок, как результат магазин работал медленно как раз для активных покупателей).

- Кэширование может уводить Вас в сторону от решения проблемы - Вы смотрите на наиболее медленно загружающуюся страницу и пытаетесь ее оптимизировать. Но хитрость здесь в том, что в реальности проблема с производительностью может лежать в другой области (опять six sigma). Вы «залечиваете» проблему кэшируя, например, страницу целиком, но сама проблема с производительностью никуда не уходит и остается скрытой (Прим. переводчика : с тем чтобы всплыть на других страницах еще и еще и еще раз).

- Управление кэшем в реальности непростая задача - Вы когда-нибудь боролись с "убеганием кэша " или с ситуацией когда большое количество элементов кэша инвалидируются одновременно?

Альтернативный подход

Кэширование должно рассматриваться как бремя без которого многие приложения не могут жить. Вы должны пытаться избегать этого бремени до тех пор, пока не исчерпаете весь арсенал легко применимых способов оптимизации.

Что это за способы?

Перед тем как вводить оптимизацию убедитесь что Вы прошлись по этому достаточно простому списку:

- Вы понимаете план исполнения каждого запроса? Если нет, установите long_query_time=0 и используйте команду mk-query-digest, чтобы получить полный список запросов. Выполните для каждого из них EXPLAIN, проанализируйте план исполнения.

Вы используете SELECT * чтобы потом использовать только небольшой набор столбцов? Или вы выбираете из БД много строк, но используете только некоторые из них? Если это так - то вы выбираете слишком много данных, ограничивая оптимизацию уровня СУБД, такую например как использование индексов.

Знаете ли Вы сколько именно запросов Вы используете для генерации одной страницы? Все ли они действительно необходимы? Можно ли какие-то из этих запросов превратить в один запрос или вообще убрать? (Прим. переводчика : Очень распространенная проблема. Реально знаю случай когда на странице отображался список учеников в классе, а затем в цикле для каждого ученика запрашивалась дополнительная информация, включая название класса. После переделки количество запросов сократилось с 61 до 3-х).

Думаю что как вывод можно сказать: «Оптимизация очень редко уменьшает сложность приложения. Старайтесь избегать усложнения, за счет оптимизации только того, что действительно надо оптимизировать» - цитата со слайда Джастина - instrumentation-for-php .

С точки зрения долговременной перспективы, многим приложениям следует сохранять архитектуру простой и не поддаваться соблазну решать проблемы так «как это делают реальные пацаны».

Прим. переводчика : Совершенно реальный диалог произошедший не так давно:
- Так у нас проблемы с производительностью, надо добавить кэширование, вертикальное партиционирование и NoSQL DB для логинов
- Парни - я тут посмотрел EXPLAIN - у Вас fullscan запрос на 4,000 строк, я попробовал создать индекс- все ускорилось в 26 раз.

Несколько замечаний к переводу

1. Термин cache stampeding - я перевел как убегание кэша (был соблазн перевести как «просрачивание», но это было бы неправильно). Если коротко, это ситуация, когда например определенный запрос выполняется достаточно долго и результаты этого запроса кэшируются, когда затем эти данные рано или поздно уходят из кэша, и одновременно рендерится 10 страниц на которых эти данные нужны, то в БД отправляется 10 медленных запрсов, вместо одного. Обычно с этим борются пере запрашивая данные до того как они будут выкинуты из кэша. см например
2. Хочу обратить внимание, что в статье не говорится что кэшировать данные не надо. Их надо кэшировать, но только после того как Вы попробуете несколько простых способов оптимизации запросов к БД. Иными словами начинать надо с простого.

Вероятно, многие пользователи компьютеров и мобильных устройств хоть иногда, но сталкивались с таким понятием, как «кэшированные данные». Что это такое, многие, откровенно говоря, просто себе не представляют. Однако, пользуясь советами по ускорению любого устройства, имеющего операционную систему, они точно знают, что кэш надо чистить. Отчасти это действительно так, однако далеко не все данные подлежат удалению. Бывает, что без них некоторые программы, установленные на устройстве, попросту не будут работать.

Что значат «кэшированные данные» в общем понимании?

Итак, рассмотрим общее понятие. Грубо говоря, этот термин описывает сохраняемые в компьютерной или мобильной системе данные для ускорения последующего доступа к некоторым приложениям или сайтам в интернете за счет загрузки информации, вызов которой обычным способом требует большего времени.

Чтобы было понятнее, можно привести пример, как используются кэшированные данные. Что это такое, например, в случае посещения пользователем какой-нибудь интернет-страницы, на которой он смотрит фотографии? Это есть их копии в виде миниатюр, которые сохраняются в специальной папке на жестком диске компьютера или на внутреннем накопителе мобильного устройства. При повторном входе на страницу пользователю не приходится ждать, пока загрузится весь контент (например, графика, видео и, вообще, мультимедиа), поскольку все элементы на страницу добавляются как раз из каталога кэша.

в телефоне?

Но это было только общее обоснование. С интернетом все понятно. Посмотрим теперь, что такое кэшированные данные приложений в телефоне (имеются в виду апплеты, отличные от веб-браузеров).

Собственно, эта информация несколько похожа по сути на сохраняемые данные из интернета, только большей частью она связана с сохранением настроек или специфичного контента любой программы, с которой работает операционная система. Для того чтобы было немного понятнее, далее рассмотрим несколько примеров.

Примеры использования кэша

Посмотрим на некоторые основные типы данных, которые можно или нельзя удалять. В первом случае это касается любых приложений, инсталлированных в системе, если только для их полнофункциональной работы не предусмотрено использование дополнительного кэша, который отличается от системного.

А вот со специальным содержимым кэша, который довольно часто нужно копировать в телефон или планшет самостоятельно или же дополнительно загружать из интернета, дело обстоит несколько иначе.

Самый простой пример - игровые кэшированные данные. Что это может быть? Да все, что угодно: дополнительные текстуры, графика, видео, аудио или даже параметры самой игры. Такую информацию, как уже понятно, удалять нельзя ни в коем случае, поскольку потом игра просто не запустится или выдаст ошибку, гласящую, что для старта не хватает того-то и того-то.

То же самое касается некоторых музыкальных приложений для мобильных устройств. В качестве примера возьмем FL Studio Mobile. Даже собственный инсталлятор приложения не имеет всего, что необходимо для работы секвенсора. Иными словами, устанавливается только основная программная оболочка.

Что такое кэшированные данные приложений в телефоне относительно программ этого типа? Это наборы инструментов, эффекты, настройки взаимодействия с другими апплетами, параметры поддержки определенных форматов аудио и т. д. Как правило, такой кэш сохраняется в специальной папке obb, которая находится на внутреннем накопителе, если не указано, что ее можно разместить на съемной карте памяти. Места такая информация занимает порядочно, но без нее приложение окажется нефункциональным (чего стоит только одна программная оболочка, в которой нет ни инструментов, ни эффектов?).

Очистка кэша на мобильном девайсе стандартными средствами

Что такое кэшированные данные в телефоне, мы немного разобрались. Теперь посмотрим на вопросы очистки такого содержимого, поскольку оно имеет свойство замедлять работу системы.

В любом Android-девайсе имеется два инструмента очистки кэша. Первый предназначен для удаления данных для всех приложений, второй позволяет почистить кэш только для одного отдельно взятого апплета.

Если нужно удалить весь используется меню настроек, в котором выбирается раздел памяти. При тапе на строке кэшированных данных система выдает предупреждение о том, что вся информация будет удалена. Просто соглашаемся и дожидаемся завершения очистки.

Теперь еще несколько слов о том, что такое кэшированные данные приложений в плане их удаления для отдельно выбранного апплета. Найти по ним информацию можно в том же разделе памяти, но с переходом к меню приложений.

Далее нужно просто выбрать нужный апплет, а после входа в его меню снизу тапнуть по кнопке очистки кэша. В общем-то, и первый, и второй метод выглядят несколько неудобными, поскольку в этом случае может производиться так называемое удаление из разных источников. Поэтому лучше использовать специальные программы.

Использование оптимизаторов и чистильщиков

Сегодня таких программ по аналогии со стационарными компьютерными системами создано немало. В тех же хранилищах Play Market или AppStore их можно найти даже не десятки, а сотни.

Кэшированные данные (что это, уже понятно) могут удаляться и для всей системы, и для каждого выбранного апплета.

Что касается самих программ, наиболее предпочтительными выглядят приложения узкой направленности и апплеты, предназначенные для общей оптимизации. Первые представлены такими программами, как App Cache Cleaner, Auto Cahe Cleaner и т. д.

Среди оптимизаторов особо можно выделить мобильные версии CCleaner, All-in-one Toolbox, и многие другие. Что именно использовать, это уже вопрос собственных предпочтений, ведь каждая такая программа имеет и свои плюсы, и минусы.

Вместо итога

Вот и все насчет понимания термина «кэшированные данные». Что это такое, думается, большинству пользователей уже ясно. Однако к вопросу очистки такой информации нужно подходить крайне осторожно, поскольку для некоторых типов программ, как было сказано выше, она может оказаться необходимой в работе. Но как показывает практика, лучше все же обратиться к утилитам общего действия. В них инструмент очистки кэша является обязательным модулем. А при их использовании заодно можно еще и ускорить систему.

Кэширование используется для ускорения доступа к оперативной памяти, диску и другим видам запоминающих устройств. Кэширование представляет собой накопление данных в доступном хранилище, с целью их быстрого извлечения по мере надобности.

В качестве кэша используются разные устройства: для уменьшения среднего времени доступа к оперативной памяти – быстродействующая статическая память; для ускорения доступа к данным на диске – буферы в оперативной памяти. Виртуальная память также является одним из вариантов реализации принципа кэширования данных. В этом случае оперативная память выступает в роли кэша по отношению к внешней памяти (диску), и кэширование используется для частичной замены оперативной памяти диском за счет перемещения временно неиспользуемого кода и данных на диск с целью освобождения места для активных процессов. Содержимое стандартной кэш-памяти представляет собой совокупность записей о загруженных в нее элементах данных из основной памяти (рис.5.26.). Каждая запись об элементе данных включает:

Значение элемента данных;

Адрес элемента данных в основной памяти;

Дополнительную информацию, используемую для реализации алгоритма замещения данных в кэше (признак модификации и признак действительности данных).


При каждом обращении к основной памяти по физическому адресу просматривается содержимое кэш-памяти с целью определения требуемых данных. Поиск в кэш-память осуществляется по содержимому – по взятому из запроса значению поля адреса в оперативной памяти. Если данные обнаруживаются в кэш-памяти, произошло кэш-попадание (cache-hit ), то они считываются и результат передается источнику запроса. Если нужные данные отсутствуют, произошел кэш-промах (cache-miss ), то они считываются из основной памяти, передаются источнику запроса и одновременно с этим копируются в кэш-память.

Эффективность кэширования и среднее время доступа к данным в системе зависят от вероятности попадания в кэш. Поэтому использование кэш-памяти эффективно только при высокой вероятности кэш-попадания. Вероятность обнаружения данных в кэше зависит от следующих факторов: от объемов кэша и кэшируемой памяти, от алгоритма замещения данных в кэше, от особенностей выполняемой программы и времени ее работы, от уровня мультипрограммирования и других особенностей вычислительного процесса. В большинстве реализаций кэш-памяти процент кэш-попаданий выше 90%, это объясняется наличием у данных объективных свойств: пространственной и временной локальности.

Временная локальность характеризуется признаком: если произошло обращение по некоторому адресу, то следующее обращение по тому же адресу с большой вероятностью произойдет в ближайшее время. Пространственная локальность характеризуется признаком: если произошло обращение по некоторому адресу, то с высокой степенью вероятности в ближайшее время произойдет обращение к соседним адресам.



В начале работы системы каждый запрос к основной памяти выполняет последовательно следующие действия: просмотр кэша, фиксацию промаха, чтение данных из основной памяти, передачу результата источнику запроса и копирование данных в кэш. Используя свойство временной локальности данные, считанные из основной памяти, размещаются в кэш-памяти, предполагая, что скоро понадобятся. По мере заполнения кэша, возрастает вероятность обращения к уже использованным данным, которые содержатся в кэше и могут быть считаны.

При выполнении программы высока вероятность выбора команд из памяти последовательно из соседних ячеек, поэтому в кэш-память загружается не одна запрошенная команда, а целый фрагмент программы, то есть используется свойство пространственной локальности. Аналогично если программа ведет обработку некоторого массива данных, то ее работа значительно ускорится путем загрузки в кэш части или всего массив данных. При этом учитывается высокая вероятность того, что значительное число обращений к памяти будет выполняться к адресам массива данных.

В процессе работы содержимое кэш-памяти постоянно обновляется, так как периодически происходит вытеснение данных. Вытеснение означает объявление свободной определенной области кэш-памяти. Если вытесняемые данные не были изменены, производится сброс бита действительности. Если вытесняемые данные за время нахождения в кэше были изменены (модифицированы) дополнительно производится копирование данных в основную память. Алгоритм замены данных в кэш-памяти существенно влияет на ее эффективность, поэтому он должен быть максимально быстрым и обеспечивать максимально возможную вероятность кэш-попаданий.

Наличие в памяти двух копий данных (в оперативной памяти и в кэше) порождает проблему согласования данных. Если происходит запись в основную память по некоторому адресу, а содержимое этой ячейки находится в кэше, то в результате соответствующая запись в кэше становится недостоверной. Существует два подхода к решению этой проблемы:

1.Сквозная запись (write through ). При каждом запросе к основной памяти и при записи в нее просматривается кэш. Если данные по запрашиваемому адресу отсутствуют, то запись выполняется только в основную память. Если же данные, к которым выполняется обращение, находятся в кэше, то запись выполняется одновременно в кэш и основную память.

2.Обратная запись (write back ). При возникновении запроса к памяти выполняется просмотр кэша. Если запрашиваемых данных отсутствуют, то запись выполняется только в основную память. В ином случае запись производится только в кэш-память, при этом в описателе данных делается специальная отметка (признак модификации), которая указывает на то, что при вытеснении этих данных из кэша необходимо переписать их в основную память.

В некоторых алгоритмах замещения предусматривается первоочередная выгрузка модифицированных данных, которые могут выгружаться при освобождении места в кэш-памяти для новых данных и в фоновом режиме, когда система не очень загружена.

Алгоритм поиска и алгоритм замещения данных в кэше зависят от способа отображения основной памяти на кэш-память. Используются следующие схемы отображения:

1.Случайное отображение . Элемент оперативной памяти и его адрес размещается в произвольном месте кэш-памяти. Критерием поиска в кэше является адрес оперативной памяти из запроса. Для поиска запрошенных данных используется алгоритм ассоциативного поиска , при котором сравнения с записями кэша выполняются параллельно. Признак (адрес данных в оперативной памяти), по которому выполняется сравнение, называется тегом (tag ). Вытеснение устаревших данных происходит только в случае, полного заполнения кэш-памяти. Выбор данных на выгрузку осуществляется среди всех записей кэша и основывается на приемах, аналогичных алгоритмам замещения страниц. Электронная реализация схемы приводит к удорожанию памяти, поэтому ассоциативная кэш-память используется в случаях, когда для обеспечения высокого процента попадания достаточно небольшого объема памяти.

2.Детерминированное отображение . Элемент основной памяти всегда отображается в одно и то же место кэш-памяти. Кэш-память разделена на строки, каждая из которых имеет свой номер и предназначена для хранения одной записи об одном элементе данных. Между номерами строк кэш-памяти и адресами оперативной памяти устанавливается соответствие «один ко многим»: одному номеру строки соответствует несколько адресов оперативной памяти. Отображение осуществляется при помощи специальных функций, например, путем простого выделения нескольких разрядов из адреса оперативной памяти, которые интерпретируются как номер строки кэш-памяти.

Для поиска данных в кэше используется прямой доступ к записи по номеру строки, полученному путем обработки адреса оперативной памяти из запроса. Но в найденной строке могут находиться данные из любой ячейки оперативной памяти, младшие разряды адреса которой совпадают с номером строки, поэтому дополнительно выполняется проверка. Для выполнения проверки каждая строка кэш-памяти дополняется тегом, содержащим старшую часть адреса данных в оперативной памяти. При совпадении тега с соответствующей частью адреса из запроса констатируется кэш-попадание. Если произошел кэш-промах, то данные считываются из оперативной памяти и копируются в кэш. Если строка кэш-памяти, в которую должен быть скопирован элемент данных из оперативной памяти, содержит другие данные, то они вытесняются из кэша.

3.Комбинированное отображение . В современных процессорах кэш-память строится на основе соединения обоих подходов. В этом случае произвольный адрес оперативной памяти отображается на некоторую пронумерованную группу адресов, и поиск в кэше производится в два этапа:

По номеру группы, полученному из адреса оперативной памяти из запроса;

В пределах группы путем ассоциативного просмотра всех записей в группе на случай совпадения старших частей адресов оперативной памяти.

При промахе данные копируются по свободному адресу из однозначно заданной группы. Если свободных адресов в группе нет, то выполняется вытеснение данных по определенным алгоритмам.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: