При просмотре онлайн сегодня, я столкнулся со следующим URL:
http://d§.cc/
Так или иначе это работает. В Firefox 3.6/Mac, браузер, кажется, интерпретирует URL как:
http://xn--d-jca.cc/
В Safari 5/Mac, не изменяется URL, когда я перешел к нему.
Я всегда понимал, что § символ (знак раздела), среди других, недопустим в URL. К кавычке RFC 1738:
Таким образом, только буквенно-цифровой индикатор, специальные символы "$ - _. +! *, '()", и зарезервированные символы, используемые в их зарезервированных целях, может использоваться незакодированный в URL.
Действительно ли это - причуда кодировки символов? И, как/где я могу зарегистрировать свой собственный § URL?
Это - Интернационализировавшее доменное имя или IDN. Кодирование его использует, назван punycode.
Многие крупные регистраторы находятся в бизнесе продажи доменных имен IDN, включая GoDaddy, но когда я зарегистрировал свое тщеславие IDN (ə .tv), я нашел, что Name.com был легче. Они стоят того же как "регулярных" доменов.
Вот список допустимых символов IDN - остерегаются, однако, этого, многие из этих символов не отобразятся правильно во всех шрифтах, поэтому если Вы будете на рынке для IDN, удостоверяются, что Вы тестируете его в наиболее часто используемых шрифтах на Ваших целевых платформах прежде, чем сделать покупку.
Это называют IDN (Интернационализировавшее Доменное имя). Это не имеет никакого отношения к URIs, это - функция DNS (Система доменных имен), которая разрешает человекочитаемые имена DNS такой как www.example.com
в IP-адреса такой как 127.0.0.1
.
Поскольку первоначально Система доменных имен была только для ASCII, IDN был представлен назад совместимым способом: имена DNS, которые содержат символы неASCII, кодируются на имена DNS, которые содержат только символы ASCII с помощью алгоритма под названием Punycode, который специально предназначен, чтобы быть эффективным для типов строк, которые обычно содержатся в имени DNS и все еще быть несколько человекочитаемыми даже в закодированной форме.
Основная цель IDN, поскольку имя подразумевает, чтобы позволить зарегистрировать доменные имена на языках кроме английского языка. Однако побочный эффект состоит в том, что теперь все символы Unicode включая символы, которые действительно не имеют никакого отношения к неанглийским языкам, могут использоваться в доменных именах.