Исторические предпосылки появления системы IDN
Глобализация Интернета привела к началу использования символов национальных алфавитов на веб-страницах. В то же время написание доменных имен долгое время оставалось неизменным. Система DNS с момента ее зарождения на территории США в 80-х годах прошлого века поддерживает всего 37 ASCII символов: буквы латинского алфавита, 10 цифр и знак дефиса.
В конце 90-х годов, когда Интернет вышел за пределы США и быстро распространился по всему миру, в Сеть пришли пользователи, не знающие английский язык, для которых языковой барьер представляет серьезную проблему при работе с интернет-ресурсами. Стало очевидно, что пришло время внести изменения и в систему доменных имен.
В первую очередь необходимость предоставить пользователям возможность написания доменов на родном языке возникла в странах азиатского и тихоокеанского регионов, где проживает около двух третей всего населения планеты. Именно иероглифическая система письма, принципиально отличающаяся от европейских языков, и серьезные трудности с использованием английского алфавита населением этих стран впервые поставили вопрос о необходимости доработки системы доменных имен.
Обсуждение "мультилингвистичности" доменных имен в международной корпорации ICANN, управляющей адресацией в Интернете, ведется едва ли не с момента основания этой организации в 1998 году. Интернациональность глобального информационного пространства диктует появление нелатинских интернет-адресов, написанных китайскими иероглифами, арабской вязью и кириллическими символами. В России, помимо решения проблемы языкового барьера, использование русскоязычных доменов призвано помочь избежать разночтений в наборе сложных, неоднозначных для латинской транскрипции слов.
Разработка международных стандартов
В 1999 году в составе IETF (Internet Engeniging Task Force) для подготовки требований и стандартов использования доменных имен, включающих в себя символы национальных алфавитов, была создана рабочая группа IDN (Internationalized Domain Name). Для осуществления регистрации многоязычных доменных имен необходимо было найти решение, которое, с одной стороны удовлетворяло бы всем существующим стандартам и было работоспособным, а с другой – поддерживало бы большое количество национальных алфавитов и кодировок.
Исследования проводились в двух направлениях. Одна технология заключалась в преобразовании доменного имени, содержащего символы национальных алфавитов, в имя, состоящее только из ASCII-символов, на стороне сервера (DNS, proxy, web), другая - в использовании дополнительного программного обеспечения на клиентской машине для перекодировки многоязычного домена и дальнейшей работы всех систем Интернета с именем, содержащим только ASCII-символы.
Тестирование предложенных группой IETF IDN технологий и разработка дополнительного как серверного, так и клиентского программного обеспечения осуществлялись несколькими компаниями. Эти компании начали тестовую регистрацию доменов в своих локальных базах данных, некоторые из них открыли альтернативные домены первого уровня, например, РУ, КОМ, НЕТ, ОРГ.
В итоге IETF было предложено осуществлять преобразование доменных имен с национальными символами, представленных в кодировке UNICODE (UTF), в представления - имена, содержащие только ASCII-символы. Это решение, во-первых, удовлетворяет требованиям существующей на сегодняшний день системы DNS, во-вторых, обеспечивает уникальность доменных имен, и, в-третьих, обеспечивает независимость от кодировок для различных платформ и операционных систем.
8 марта 2003 года были опубликованы долгожданные стандарты для многоязычных доменных имен и уже через полмесяца произошло их окончательное утверждение ICANN. Стандарты IETF IDN подробно и однозначно описывают фундаментальные принципы системы многоязычных доменных имен:
Важным аспектом принятых стандартов является их полная универсальность и независимость. Ни один из них не регламентирует собственно процесс регистрации. Все организационные мероприятия находятся в ведении администратора того или иного домена. Официальное принятие стандартов явилось важной вехой на пути разработки и претворения в жизнь идеи использования символов национальных алфавитов в именах доменов.
Развертывание системы многоязычных доменов: проблемы и перспективы их решения
20 июня 2003 года ICANN официально объявила о развертывании системы многоязычных доменов, а в конце 2005 года создала консультативный комитет по совершенствованию многоязычной системы доменных имен (IDN). В декабре 2005 года в рамках Ванкуверской конференции ICANN было проведено рабочее заседание по вопросам развертывания IDN.
Представители ряда компаний, уже работающих с IDN-доменами, поделились своим опытом и высказались в поддержку создания таких доменов, в которых и обозначение домена верхнего уровня также было бы написано на национальном языке. Набирать адрес иванов.ru неудобно, так как требуется переключение раскладки клавиатуры. Сейчас в ICANN уже прорабатывается вопрос создания нелатинских аналогов национальных доменных зон.
По мнению многих специалистов, только после начала использования доменных имен с нелатинскими символами в национальных доменах можно говорить о запуске IDN в доменах общего пользования. С оригинальным решением выступил представитель корпорации VeriSign. Суть его предложения заключается в следующем: пусть домен *.ком будет полным отражением домена *.com со всем его содержимым. При этом остается только одна проблема: как преобразовать TLD в символы национального алфавита? Использовать ли транслитерацию, перевод или что-то еще. ICANN достаточно благосклонно отнеслась к этой идее, так как она является отличным решением, которое позволяет ввести TLD на национальных языках и избежать появления "альтернативного" Интернета, то есть введения дополнительных корневых серверов для каждого такого TLD.
Многоязычные домены шагают по планете
Администраторы национальных доменов верхнего уровня (ccTLD) самостоятельно решают вопрос открытия регистрации доменов с символами национальных алфавитов в вверенных им доменных зонах. Раньше всех к развертыванию IDN приступили в Китае (CN), Японии (JP) и на Тайване (TW). Администраторы этих национальных доменов вместе с администраторами доменов общего пользования INFO и ORG при поддержке ICANN разработали Руководящие принципы, определяющие общий порядок работы при внедрении многоязычных доменов.
Около 1,5% всех зарегистрированных в мире доменов – это многоязычные домены (в абсолютных цифрах – около 1 млн доменов). Сегодня доменные имена с символами национальных алфавитов регистрируются более чем в 40 доменных зонах как общего пользования (COM, NET, ORG, BIZ, INFO), так и национальных (Южная Корея (KR), Германия (DE), Австрия (AT), Швейцария (СН), Китай (СN), Португалия (РТ), Кокосовые острова (СС), Тувалу (ТV), Бразилия (BR), Греция (GR), Гонконг (НК), Сингапур (SG), Польша (PL), Швеция (SE), Литве (LT) и др.). Список доменов, в которых возможна регистрация многоязычных доменных имен, постоянно расширяется.
В январе 2005 года в домене ORG началась регистрации доменных имен, содержащих умляуты. Внедрение поддержки немецкого языка стало первым этапом программы IDN в домене ORG. К настоящему времени в этом домене запущена поддержка еще 10 языков: датского, венгерского, исландского, корейского, латышского, литовского, норвежского, польского, шведского и тамильского. В скором времени планируется внедрение поддержки других языков.
В зоне INFO было зарегистрировано 15000 многоязычных доменов в первый день после начала регистрации на немецком языке. В доменах COM и NET наибольшее количество многоязычных доменов зарегистрировано на корейском, немецком и китайских языках. В этих зонах услуги по регистрации доменов на национальных языках предлагают более 100 регистраторов.
Стоит отметить, что на первых порах внедрения IDN обострилась проблема фишинга - разновидности сетевого мошенничества, при котором пользователей заманивают на фальшивые сайты, повторяющие дизайн сайта-оригинала, и выуживают у них пароли и закрытую информацию. С появлением многоязычных доменов фишеры стали регистрировать доменные имена, совпадающие с именами известных компаний, в которых часть латинских букв была заменена на буквы национальных алфавитов. Для борьбы с этой тенденцией в ICANN создали специальную рабочую группу, которая рекомендовала запретить регистрацию доменов, содержащих одновременно символы разных алфавитов.
IDN верхнего уровня
Благодаря принятым мерам угрозу фишинга удалось несколько снизить и сегодня развитие IDN идет полным ходом. В ближайших планах ICANN - внедрение многоязычных ccTLD. Корпорация уже ввела 11 новых доменов верхнего уровня в корневую зону системы DNS. В октябре 2007 года начался первый этап их тестирования. Аналог домена Example.test стал доступен пользователям на 11 национальных языках: арабском, персидском, традиционном и упрощенном китайском, хинди, греческом, корейском, идише (еврейском языке), японском, тамильском и русском.
Набрав интернет-адрес Example.test на родном языке, пользователь попадет на специальный сайт IDNwiki, на котором размещена подробная информация о том, как принять участие в тестировании и оставить о нем свой отзыв. Русскоязычным пользователям для тестирования был делегирован домен http://пример.испытание.
В дальнейшем ICANN планирует расширить границы эксперимента, добавив в корневую зону новые IDN верхнего уровня. Кроме того, в скором времени у пользователей появится возможность создавать веб-страницы с собственным именем, написанном на их родном языке (например, Example.test/yourname).
"Мы находимся на самой захватывающей стадии процесса развития IDN", - заявил в начале эксперимента президент ICANN Пол Туми. Он считает, что система интернационализированных доменных имен "станет одним из наиболее существенных изменений в Интернете со времен его появления".
Инициатива ICANN, направленная на переход к полноценному использованию доменов на национальных языках, активно поддерживается мировым сообществом. В ноябре 2007 года на Форуме по управлению Интернетом, проходившем в Рио-Де-Жанейро, представители ICANN, ЮНЕСКО и Международного Союза Электросвязи (МСЭ) решили объединить усилия по внедрению IDN, признав многоязычность ключевым элементом современного Интернета.
Ряд экспертов считает, что переход к системе интернационализированных доменов может оказаться неэффективным. Скептики утверждают, что практически ни один компьютер не способен правильно отображать символы всех языков мира из-за отсутствия достаточного количества установленных шрифтов. В результате пользователи во многих случаях будут видеть бессмысленный набор символов вместо правильного доменного имени. ICANN признает существование этой проблемы и предпринимает шаги по ее решению.
Вместе с тем, нельзя не отметить, что корпорация весьма серьезно подготовилась к начавшемуся в 2007 году тестированию новой системы. В частности, группа исследователей изучала, как появление в корневой зоне IDN повлияет на функциональность DNS в целом. Эти исследования продолжаются и сейчас. Кроме того, в 2003 году для gTLD и ccTLD регистратур была разработана инструкция по внедрению многоязычных доменных имен. В ходе тестирования системы предполагается ее поэтапная доработка. Также была создана специальная база данных, в которую будут заноситься таблицы символов, используемых в IDN. В 2008 году планируется утвердить политику в области многоязычных доменных имен. Наконец, в настоящее время обсуждаются обозначения будущих доменов верхнего уровня.
ICANN принимает активное участие в мероприятиях, посвященных внедрению IDN, а также оказывает консультации всем заинтересованным в этом вопросе лицам. Конечно, для полноценного использования IDN корпорации предстоит решить еще целый ряд проблем, в частности избавиться от неконвертируемых символьных таблиц и устранить зависимость отображения символов от версии кодировки Unicode. Несмотря на это уже сегодня можно с уверенностью утверждать, что многоязычному Интернету – быть.