Редактирование:
URL
(раздел)
Материал из Ньюпедии — свободной энциклопедии
Перейти к навигации
Перейти к поиску
Внимание:
Вы не вошли в систему. Ваш IP-адрес будет общедоступен, если вы запишете какие-либо изменения. Если вы
войдёте
или
создадите учётную запись
, её имя будет использоваться вместо IP-адреса, наряду с другими преимуществами.
Анти-спам проверка.
Не
заполняйте это!
== Кодирование URL == Появление адресов URL стало существенным нововведением в Интернете. Однако, с момента его изобретения и по сей день, стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в ASCII).: латинские буквы, цифры и лишь некоторые знаки препинания. В URL также нельзя использовать символы Юникода в чистом их виде. Иными словами, если мы захотим использовать в URL символы кириллицы, или иероглифы, или, скажем, специфические символы французcкого языка, то нам придётся кодировать URL. В русскоязычной Википедии нам ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида: <nowiki>http://ru.wikipedia.org/wiki/Микрокредит</nowiki> кодируется в URL как: <nowiki>http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82</nowiki> Каждый символ кодируется в Юникоде (UTF-7). При этом интрепретация URL зависит от кодировки, т. е. кодироватся должны не символы как таковые, а байты, их представляющие. Например, на запись символа кириллицы в UTF-8 расходуется 6 байт (включая символ %): М -> D0 и 9C и -> D0 и B8 к -> D0 и BA р -> D0 и 80, и т. д. Перед каждым кодом, согласно спецификации URL, ставится знак процента (%). Иные распространённые, но недопустимые в URL символы кодируются в таком соответствии: " # $ % & ' * , : ; < > ? [ ^ ` { | } %22 %23 %24 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме используемой в английском языке латиницы, то URL со словами на других языках (даже европейских) утрачивают способность восприниматься людьми. Это входит в грубое противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. ''International Resource Identifier'') — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда-либо идентификаторы IRI заменить столь широкоупотребительные URL (и URI в целом).
Описание изменений:
Пожалуйста, учтите, что любой ваш вклад в проект «Ньюпедия» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см.
Ньюпедия:Авторские права
).
НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!
Отменить
Справка по редактированию
(в новом окне)
Навигация
Действия на странице
Статья
Обсуждение
Читать
Править
Править код
История
Действия на странице
Статья
Обсуждение
Ещё
Инструменты
Персональные инструменты
Вы не представились системе
Обсуждение
Вклад
Создать учётную запись
Войти
Навигация
Заглавная страница
Рубрикация
Индекс А — Я
Избранные статьи
Случайная страница
Текущие события
Поиск
Участие
Сообщить об ошибке
Портал сообщества
Форум
Свежие правки
Новые страницы
Справка
Пожертвования
Инструменты
Ссылки сюда
Связанные правки
Служебные страницы
Сведения о странице
Получить короткий URL