Описание тега utf-8
UTF-8 - это многобайтовая кодировка набора символов Unicode, состоящая из одного или нескольких байтов. В отличие от некоторых других кодировок, таких как UTF-16, кодировка UTF-8 совместима с 7-разрядными символами ASCII и может быть в некоторой степени обработана приложениями, которые знают только байты.
Полная поддержка UTF-8 для поиска, сопоставления, анализа слов и т. Д. Требует поддержки таких концепций Юникода, как символы, нормализация, дополнительные символы и т. Д. Многие проблемы приложений и ОС связаны со "специальными символами", такими как европейские буквы с акцентированием или иероглифы, такие как используемые в японском или китайском, происходят из несовпадающих кодировок символов.
Связанные теги: unicode