Exim mainlog кодировка символов

В моей установке exim4 я продолжаю получать как основной кодированный код UTF-8, так и расширенный основной журнал с кодировкой ANSI, содержащий такие строки, как "tämä" (правильно в UTF-8) и "t\xe4\m\xe4" (ANSI). Последние экранированные маркировки являются однобайтовыми кодами, экранирование сделано для ясности ("tämä" кодируется как 74 EC 6D EC в байтах). Конечно, по умолчанию сегодня UTF-8, и большинство линий просто в порядке.

Проблема в том, что это сбивает с толку fail2ban, потому что он ожидает, что файл журнала будет закодирован согласованным образом. I cannot, however, select either ANSI or UTF-8 because both encodings exist in the log file.

I wonder if there a way to filter out the ANSI characters before logging the strings to /var/log/exim/mainlog?

As for the culprit it might be an ancient piece of spamming software on a Windows machine or some old mass mailing application. Anyhow, roughly 35-45% of the log lines seem to be contaminated with ANSI on a daily basis.

0 ответов

Другие вопросы по тегам