Алгоритм / метод для экономии затрат на запуск прокси-фильтра на AWS EC2

Я пытаюсь настроить Squid Proxy в сочетании с механизмом фильтрации контента DansGuardian на EC2. Я буду фильтровать трафик от мобильных клиентов (IOS/Android) через этот отфильтрованный прокси, но это может означать, что большой объем трафика будет проходить через мою систему, поскольку мне придется перенаправлять весь трафик через DNS, что может означать много Amazon EC2 стоит! Существует ли известный метод / стандарт, в котором я могу направлять только известный черный список трафика через этот прокси экономически эффективным способом? Вещи, которые я исследовал, включают создание черных списков на устройстве и фильтрацию прямо там, но это может означать, что я должен продолжать возвращаться и изменять (добавлять или удалять сайты), и это в любом случае неосуществимо.

1 ответ

Я думаю, что вы должны попробовать противоположную стратегию. Я не знаю, как DansGuardian обрабатывает трафик, занесенный в черный список, но держу пари, что будет сложно извлечь эту информацию из DansGuardian и передать ее мобильным клиентам.

Вместо этого вы можете отправить клиентам список известных хороших сайтов с высоким трафиком и высокой пропускной способностью. Вы можете создать этот список, читая журналы Squid, чтобы увидеть, что разрешено, затем агрегировать его (например, сайты с наибольшим количеством байтов или самые популярные сайты каждый день) и обновлять "список разрешений". Вы можете закодировать список разрешений в файл proxy.pac, и клиенты будут это читать. Я знаю, что proxy.pac поддерживается iOS, и теперь он может иметь встроенную поддержку в Android, не уверен.

Эта архитектура не будет на 100% эффективна, но она может срезать наихудшие полосы пропускания и сэкономить вам много денег.

Другие вопросы по тегам