Символы ASCII запрещены в интернационализированном доменном имени (IDN)
Не могли бы вы предоставить доказательство (например, в разделе RFC), что 7-битные символы ASCII (например, обычный старый ASCII-пробел, код 0x20), которые ранее были недопустимыми, по-прежнему запрещены в ИДИ?
2 ответа
Как насчет RFC5894, раздел 3. http://tools.ietf.org/html/rfc5894
IDNA2008 принимает модель включения. Предполагается, что кодовая точка недействительна для использования IDN, если только она не включена как часть правила, основанного на свойствах Unicode, или, в редких случаях, включена отдельно в виде исключения.
И в разделе 3.1:
IDNA2008 делит все возможные кодовые точки Unicode на четыре категории: ПРОТОКОЛ-ДЕЙСТВИТЕЛЬНЫЙ, КОНТЕКСТНОЕ ПРАВИЛО, НЕОБХОДИМОЕ, ЗАКЛЮЧЕНО и НЕ УКАЗАНО.
И теперь в разделах 2 и 3 RFC5892 указаны допустимые кодовые точки. http://tools.ietf.org/html/rfc5892
В частности:
2.1. позволяет заметку "LetterDigits" , которая не говорит о пунктуации...
2.2. запрещает "нестабильные" вещи, которые являются спорными или переменными или еще не подтверждены.
2,3. запрещает "IgnorableProperties", включая Default_Ignorable_Code_Point, White_Space и Noncharacter_Code_Point
2,4. запрещает "IgnorableBlocks", включая диакритические знаки и символы форматирования
2.5. в частности, разрешает "LDH", который является обычным ASCII, разрешенным DNS старой версии в Unicode {002D, 0030..0039, 0061..007A}
2.6. определяет "Исключения", которые охватывают определенные символы, отмеченные в Юникоде как один из запрещенных классов, которые, тем не менее, необходимы для того или иного языка
2,7. через 2.10. охватывает еще более непонятные случаи и будущие доказательства для вещей, которые меняют статус по мере развития Unicode.
Не могли бы вы предоставить доказательство (например, в разделе RFC), что 7-битные символы ASCII (например, обычный старый ASCII-пробел, код 0x20), которые ранее были недопустимыми, по-прежнему запрещены в ИДИ?
Цитата RFC 5564, раздел 2.3.2:
Символ пробела строго запрещен в доменных именах, поскольку он является управляющим символом. Вместо этого дефис (Al-sharta, т.е. u+02D) предлагается в качестве разделителя между арабскими словами, чтобы избежать путаницы, которая может иметь место, если слова вводятся без разделителя.
Допустимо использовать дефис для разделения слов в пределах одной и той же метки доменного имени.