В этой статье отражены ключевые проблемы, с которыми сталкиваются операторы
национальных реестров, принимая решение о начале регистрации многоязычных доменов
в своем домене.
Неопределенность длины многоязычного домена
Максимальная длина доменного имени согласно RFC 1035 составляет 63 символа.
Многие реестры накладывают ограничения на минимальную длину - 3 символа, определенную
RFC 1535. Максимальная длина доменного имени на национальном языке зависит от
длины полученного при преобразовании представления домена в ASCII-символах.
Невозможно ввести ограничение на максимальную длину многоязычного домена априори,
так как длина домена в ASCII-символах зависит от кодов символов национального
алфавита, их количества и на каком месте они стоят. Например, символ кириллицы
"щ" после перекодировки с помощью алгоритма ACE будет представлен
тремя ASCII символами: y1a, при этом в составе ASCII-домена есть префикс xn--,
в этом случае рекомендации RFC 1535 неактуальны. Из-за того, что максимальную,
также как и минимальную, длину доменного имени на национальном языке четко определить
нельзя, у реестров и регистраторов возникают дополнительные трудности в объяснении
различия правил регистрации доменов на латинице и на национальном языке: почему
r.ru нельзя зарегистрировать, а щ.ru - можно.
Ограничения на языки и символы доступные для регистрации
Существует несколько вариантов ограничений на языки и символы, доступные для
использования при регистрации многоязычных доменов:
Доменное имя должно включать только символы национального языка, признанного
государственным.
В соответствии с этими правилами работают реестры национальных доменов Японии
(JP) и Кореи (KR). Norid - оператор реестра национального домена Норвегии
(NO) планирует начать регистрацию доменов на языках, которые имеют официальный
статус норвежских. Только символы языков Bokmеl, Nynorsk, Northern Sami,
Southern Sami и Lule Sami будут доступны при регистрации имен, это значит,
что заявки на других языках не будут приняты. Регистрировать домены только
на государственном языке собираются реестры Португалии, Литвы, Венгрии.
Доменное имя должно включать только символы определенных национальных
языков.
Это почти такой же подход, как и предыдущий, только поддерживается множественность
языков. Заявка на регистрацию доменного имени на определенном языке должна
соответствовать правилам, установленным для этого языка. Реестр королевства
Люксембург (.LU) планирует начать регистрацию в 2004 году, но еще не определился
с набором допустимых языков, официальными считаются французский, немецкий
и люксембургский.
Ограничение на домены кодовой страницей
Группы символов различных алфавитов распределены по категориям, так называемым
кодовым страницам. Существуют кодовые страницы для латиницы, кириллицы,
греческого алфавита и др. Соответственно реестр может ограничить набор символов
определенными кодовыми страницами. Например, для жителей многих европейских
стран, которые используют схожие символы латиницы, будет удобнее разрешение
регистрации всех символов из этой кодовой страницы.
DENIC - оператор реестра национального домена Германии (DE) начнет регистрацию
многоязычных доменов 1 марта 2004 года не только на немецком, но и на всех
европейских языках, символы которых входят в таблицы Unicode:
- Latin-1 Supplement
- Latin Extended-A
Таким образом, к 26 символам латиницы будут добавлены 92 новых символа доступных
для регистрации.
Выбор правил регистрации не является окончательным и ограничения могут быть
изменены в процессе работы. Например, NASK - реестр домена Польши (PL), начал
регистрацию с доменов на польском языке, поэтапно увеличив количество доступных
для регистрации символов немецким, греческим, еврейским и арабским алфавитами,
смешение алфавитов запрещено. Таким же образом планирует начать регистрацию
реестрЧехии (CZ).
Выбор стратегии открытия регистрации
Открытие регистрации многоязычных доменов второго уровня, как и начало регистрации
в новых доменах первого уровня, возможно по разным сценариям. Самым простым
для реестра и регистраторов, также как для киберсквоттеров, является метод FCFS
(first come, first served) - первый пришел, первый зарегистрировал, когда регистрация
новых доменных имен становится доступна в определенный момент и осуществляется
в заявительном порядке. Такой путь выбрали большинство европейских реестров,
в том числе DENIC - оператор реестра национального домена Германии (DE) и NASK
- реестр домена Польши (PL).
Второй распространенный способ - приоритетная регистрация (Sunrise Period),
которая дает преимущественное право владельцам товарных знаков на национальном
языке зарегистрировать доменное имя, совпадающее с товарным знаком, соответственно
открытие свободной регистрации откладывается до завершения периода приоритетной
регистрации.
Реестр может начать регистрацию доменов с лотереи или аукциона наиболее привлекательных
доменов.
Дополнительная особенность открытия регистрации многоязычных доменов - решение
реестром вопроса о наличии преимущества в регистрации многоязычного домена у
владельцев существущих ASCII-транслитерированных доменов. Реестр Исландии (IS)
в настоящий момент планирует начать регистрацию многоязычных доменов с Sunrise
периода для владельцев ASCII-транслитерированных доменов, которые имеют приоритет
в регистрации соответствующего домена на исландском языке.
Для языков романской группы разработан механизм Bundles, посредством которого
резервируются или блокируются реестром все домены, схожие по написанию с доменом
в заявке, полученной на регистрацию. При этом имя и его варианты хранятся в
предопределенных изменяемых таблицах. Система либо убирает такие домены из регистрационного
пула, либо дает владельцу имени права зарегистрировать его варианты.
Правовые вопросы
С открытием регистрации многоязычных доменов реестры должны быть осторожны
с предметом договора между регистрантом (владельцем домена) и реестром/регистратором.
Указание одного имени домена может быть не достаточно, так как существует несколько
форм домена, по крайней мере две: многоязычная и в ASCII символах, а при использовании
механизма bundles их может быть намного больше.
Таким образом, реестр/регистратор может заключать договор только на Unicode
форму домена, только на ASCII форму или обе сразу. Так .DE реестр определил
предметом договора с будущим владельцем многоязычного домена Unicode форму домена,
напротив реестр .PL принимает на регистрацию только ASCII форму домена, Unicode
форма домена не хранится в базе данных этого реестра, все преобразования осуществляются
регистраторами.
Многоязычные домены в WHOIS
В настоящее время служба Whois работает с доменами только в ACSII-кодировке,
но нет веских аргументов против использования Unicode в запросах и ответах.
Существует много вариантов предоставления конечным пользователям ответа Whois-сервиса
в Unicode, но они не являются стандартными и не всегда совместимы с существующими
Whois-клиентами. IETF разрабатывает протокол IRIS, который стандартизует представление
Unicode доменов в Whois-сервисе.
Ссылки:
Об открытии IDN-регистрации
в национальных доменах Европы и Азии
Материалы 20 конференции CENTR
Руководящие принципы ICANN при внедрении многоязычных доменов
Регистрация многоязычных доменов в домене PL