Как я пролистываю двоичные файлы, которые выглядят как текст?

Question

Как я пролистываю двоичные файлы, которые выглядят как текст?

У меня есть двоичные файлы, которые должны быть текстовыми (это экспортированные журналы), но я не могу открыть их с меньшим количеством (это выглядит некрасиво - это выглядит как двоичный файл). Я обнаружил, что могу открыть его с помощью vi и могу отследить его (вы увидите реальные журналы), но я действительно хотел бы просмотреть их (без необходимости открывать каждый с помощью vi, а затем выполнить поиск). Есть ли способ для меня это сделать?

76

grep text binary parsing

Источник

Robyn Smith 05 ноя '11 в 15:03

5 ответов

Другие вопросы по тегам grep text binary parsing

Axel Knauf 05 ноя '11 в 15:48 2011-11-05 15:48 · Answer 1 · 2011-11-05 15:48

Ты можешь использовать grep в любом случае, для поиска по файлу - его не волнует, является ли входной файл действительно текстовым или нет. От "man grep":

    -a, --text
          Process a binary file as if it were text; this is equivalent to the --binary-files=text option.

   --binary-files=TYPE
          If  the  first few bytes of a file indicate that the file contains binary data, assume that the file is
          of type TYPE.  By default, TYPE is binary, and grep normally outputs either a one-line  message  saying
          that a binary file matches, or no message if there is no match.  If TYPE is without-match, grep assumes
          that a binary file does not match; this is equivalent  to  the  -I  option.   If  TYPE  is  text,  grep
          processes  a  binary  file  as  if  it  were  text; this is equivalent to the -a option.  Warning: grep
          --binary-files=text might output binary garbage, which can have nasty side effects if the output  is  a
          terminal and if the terminal driver interprets some of it as commands.

Пожалуйста, отметьте слова предостережения в конце второго абзаца. Возможно, вы захотите перенаправить результаты из grep в новый файл и проверить это с помощью vi / less.

Mike Scott 05 ноя '11 в 15:09 2011-11-05 15:09 · Answer 2 · 2011-11-05 15:09

Труба это через strings, который удалит весь двоичный код, оставив только текст.

41

Источник

Mike Scott 05 ноя '11 в 15:09

quanta 05 ноя '11 в 16:07 2011-11-05 16:07 · Answer 3 · 2011-11-05 16:07

Дать bgrepпопытка ( оригинальный релиз / более поздняя версия)

6

Источник

quanta 05 ноя '11 в 16:07

MLSC 17 июн '14 в 14:43 2014-06-17 14:43 · Answer 4 · 2014-06-17 14:43

Вы можете использовать эти три команды:

grep -a <sth> file.txt
cat -v file.txt | grep <sth>
cat file.txt | tr '[\000-\011\013-\037\177-\377]' '.' | grep <sth>

5

Источник

MLSC 17 июн '14 в 14:43

Steven Penny 18 июл '15 в 00:19 2015-07-18 00:19 · Answer 5 · 2015-07-18 00:19

Начиная с Grep 2.21, двоичные файлы обрабатываются по-разному:

При поиске двоичных данных grep теперь может обрабатывать нетекстовые байты в качестве ограничителей строки. Это может значительно повысить производительность.

Итак, что происходит сейчас, так это то, что с двоичными данными все нетекстовые байты (включая переводы строк) обрабатываются как разделители строк. Если вы хотите изменить это поведение, вы можете:

использование --text, Это гарантирует, что только переводы строк являются символами конца строки
использование --null-data, Это гарантирует, что только нулевые байты являются ограничителями строки