Синхронизирует ли gcsfuse все данные с системой, в которой он смонтирован?

Сценарий:

  • Я установил диск gcsfuse в свой док-контейнер, чтобы я мог хранить и читать данные из Google Cloud Storage
  • Докер-контейнер имеет только несколько гигабайт памяти, но у меня может быть терабайт данных в Google Cloud Sorage

Вопрос:

Загружает ли gcsfuse все данные из облачного хранилища Google или получает файлы только при попытке их прочитать? И наоборот, после записи данных на подключенный диск эти данные сохраняются локально или отправляются в GCS и удаляются из локального хранилища?

Общая проблема, если я задаю не тот вопрос

Я обеспокоен тем, что подключенный диск gcsfuse может привести к тому, что все хранилища контейнеров будут израсходованы, даже если данные на самом деле хранятся в Google Cloud. Я пытаюсь оценить, является ли это законной проблемой, или gcsfuse создан для обработки подобных ситуаций.

Для тех из вас, кто собирается сказать мне "просто читать в документы"

Да, я пытался. Если эта информация содержится в документах, то она закопана достаточно глубоко или достаточно неоднозначно, что, вероятно, стоит поставить здесь под вопрос.

1 ответ

Решение

gcsfuse не загружает все данные в корзине. Он хранит все файлы, которые были записаны, но не закрыты локально. Для не загрязненных файлов операции чтения выполняются непосредственно из GCS и не требуют локального хранилища.

Другие вопросы по тегам