Синхронизирует ли gcsfuse все данные с системой, в которой он смонтирован?
Сценарий:
- Я установил диск gcsfuse в свой док-контейнер, чтобы я мог хранить и читать данные из Google Cloud Storage
- Докер-контейнер имеет только несколько гигабайт памяти, но у меня может быть терабайт данных в Google Cloud Sorage
Вопрос:
Загружает ли gcsfuse все данные из облачного хранилища Google или получает файлы только при попытке их прочитать? И наоборот, после записи данных на подключенный диск эти данные сохраняются локально или отправляются в GCS и удаляются из локального хранилища?
Общая проблема, если я задаю не тот вопрос
Я обеспокоен тем, что подключенный диск gcsfuse может привести к тому, что все хранилища контейнеров будут израсходованы, даже если данные на самом деле хранятся в Google Cloud. Я пытаюсь оценить, является ли это законной проблемой, или gcsfuse создан для обработки подобных ситуаций.
Для тех из вас, кто собирается сказать мне "просто читать в документы"
Да, я пытался. Если эта информация содержится в документах, то она закопана достаточно глубоко или достаточно неоднозначно, что, вероятно, стоит поставить здесь под вопрос.
1 ответ
gcsfuse не загружает все данные в корзине. Он хранит все файлы, которые были записаны, но не закрыты локально. Для не загрязненных файлов операции чтения выполняются непосредственно из GCS и не требуют локального хранилища.