Символы ASCII запрещены в интернационализированном доменном имени (IDN)

Не могли бы вы предоставить доказательство (например, в разделе RFC), что 7-битные символы ASCII (например, обычный старый ASCII-пробел, код 0x20), которые ранее были недопустимыми, по-прежнему запрещены в ИДИ?

2 ответа

Решение

Как насчет RFC5894, раздел 3. http://tools.ietf.org/html/rfc5894

IDNA2008 принимает модель включения. Предполагается, что кодовая точка недействительна для использования IDN, если только она не включена как часть правила, основанного на свойствах Unicode, или, в редких случаях, включена отдельно в виде исключения.

И в разделе 3.1:

IDNA2008 делит все возможные кодовые точки Unicode на четыре категории: ПРОТОКОЛ-ДЕЙСТВИТЕЛЬНЫЙ, КОНТЕКСТНОЕ ПРАВИЛО, НЕОБХОДИМОЕ, ​​ЗАКЛЮЧЕНО и НЕ УКАЗАНО.

И теперь в разделах 2 и 3 RFC5892 указаны допустимые кодовые точки. http://tools.ietf.org/html/rfc5892

В частности:

2.1. позволяет заметку "LetterDigits" , которая не говорит о пунктуации...

2.2. запрещает "нестабильные" вещи, которые являются спорными или переменными или еще не подтверждены.

2,3. запрещает "IgnorableProperties", включая Default_Ignorable_Code_Point, White_Space и Noncharacter_Code_Point

2,4. запрещает "IgnorableBlocks", включая диакритические знаки и символы форматирования

2.5. в частности, разрешает "LDH", который является обычным ASCII, разрешенным DNS старой версии в Unicode {002D, 0030..0039, 0061..007A}

2.6. определяет "Исключения", которые охватывают определенные символы, отмеченные в Юникоде как один из запрещенных классов, которые, тем не менее, необходимы для того или иного языка

2,7. через 2.10. охватывает еще более непонятные случаи и будущие доказательства для вещей, которые меняют статус по мере развития Unicode.

Не могли бы вы предоставить доказательство (например, в разделе RFC), что 7-битные символы ASCII (например, обычный старый ASCII-пробел, код 0x20), которые ранее были недопустимыми, по-прежнему запрещены в ИДИ?

Цитата RFC 5564, раздел 2.3.2:

Символ пробела строго запрещен в доменных именах, поскольку он является управляющим символом. Вместо этого дефис (Al-sharta, т.е. u+02D) предлагается в качестве разделителя между арабскими словами, чтобы избежать путаницы, которая может иметь место, если слова вводятся без разделителя.

Допустимо использовать дефис для разделения слов в пределах одной и той же метки доменного имени.

Другие вопросы по тегам