URL страницы сайта: ЧПУ, транслитерация, слеш в конце

Опубликовано:
Автор:

Задался вопросом каким должен быть URL страницы современного сайта, но обобщенного ответа найти не удалось. Единого стандарта по этому вопросу не существует, мнения разные, а требования к URL со временем меняются.

Сформулирую общие требования к адресам страниц сайта, которые считаю эффективными и удобными. Комментарии будут ниже. Обращаю внимание, что моё мнение может не совпадать с другими.

 

1. URL должен быть как можно короче.

2. URL должен отражать структуру сайта, например, /quotes/tags/war.

3. Расширения (.htm, .html, .php и прочее) в URL не включать.

4. Кириллица в адресах сайта допускается, но не приветствуется.

5. Вместо числовых идентификаторов предпочтительней использовать ключевые слова, например, /quotes/tags/war.

6. Ключевые слова в адресе сайта могут быть на английском, если слова короткие и широко известные, в остальных случаях используется транслитерация.

7. В конце URL не должно быть слеша.

 

Комментарии

ЧПУ (человекопонятный урл, от англ. friendly url) — это адрес страницы сайта (URL) в понятном для пользователя виде. В этих требованиях я исхожу главным образом из ЧПУ.

1. URL должен быть как можно короче

Если URL можно сделать короче без какого-либо ущерба, то лучше его сделать короче. Я полагаю, с этим никто не будет спорить.

2. URL должен отражать структуру сайта

Это основано на правилах ЧПУ, которые призывают избегать использование аргументов в адресе страницы и использовать понятные для обычного человека адреса. Например адрес dibit.ru/phone?os=mac&color=black лучше заменить на dibit.ru/phone/mac/black. Кроме плохой читаемости, присутствует также сложность с аргументами, которые могут передаваться в разном порядке и приводить к дублям страниц, которые нежелательны для продвижения.

Здесь можно сказать больше, но я не буду дублировать написанное во многих источниках. Единственное, что отмечу, что структура сайта – понятие абстрактное, не обязательно повторять структуру файлов сайта, следует исходить из удобства для пользователя.

3. Не включать в URL страницы расширения .htm, .html, .php и прочие

В прошлом SEO-специалистами рекомендовалось добавлять расширение к адресам сайтов. Было важно показать поисковым системам, что это физически существующие файлы, которым поисковые системы отдавали предпочтение.

В настоящее время подавляющее большинство страниц в Интернете не являются файлами, а формируются движками сайтов, что поисковые системы понимают и принимают.

Основные аргументы можно сформулировать так:

  • Ссылки вида dibit.ru/iphone обычному пользователю понятней (он не разбирается в расширениях) и легче запоминаются, чем ссылки с расширением, например, dibit.ru/iphone.html.
  • Расширение .html – это дополнительно 5 лишних символов.
  • Страницы, в адресе которых нет .html, индексируются также хорошо, как и с расширением.

В настоящий момент все еще встречаются сайты с расширениями в адресах страниц, но их очень мало. Справедливо отметить, что сделано это не от безграмотности, а значит есть и другое мнение.

4. Кириллица в адресах сайта допускаются, но не приветствуется

Пока символы кириллицы в адресах сайтов конвертируются в коды, считаю использование таких адресов не дружественными для пользователя. Меня всегда пугают такие ссылки ru.wikipedia.org/wiki/%D0%97%D0%BD%D0%B0%D0%BD%D0%B8%D0%B5

5. Вместо числовых идентификаторов предпочтительней использовать ключевые слова

Не всегда возможно использовать короткие и всем понятные ключевые слова в адресе страницы. Я не считаю, что имеет смысл категорически отказываться от адресов с цифровыми идентификаторами, например, /images/123, но делать это нужно с пониманием и отдавать предпочтения URL с ключевыми словами. Здесь следует отметить, что длинный, но читаемый URL может оттолкнуть пользователя и работать хуже, чем числовой, но структурированный. Сравните dibit.ru/quotes/1460 и dibit.ru/quotes/ni-bogu-svechka-ni-chyortu-kocherga

Кроме того, что никогда нельзя быть уверенным в постоянности предпочтений поисковых систем, нельзя забывать, что понятные ключевые слова в URL страницы позволяют пользователю предположить содержание материала только по виду ссылки. Короткая и читаемая ссылка уже сама по себе подталкивает к щелчку (к действию).

6. Ключевые слова могут быть на английском или транслитерацией

В ключевых словах адреса страницы я предпочитаю использовать английские слова, если они короткие и широко известные. Особенно охотно я это делаю в адресах тегов (разделах) материалов или технических статьях. Мне представляется, что английские слова лучше читаются, чем транслитерация, которая иногда может быть совсем непонятной.

Важно отметить, что транслитерация может быть различна и Яндекс может это делать не так как Google.

Будьте осторожны, в Интернете есть популярные транслитераторы, которые утверждают, что конвертируют по Яндексу, но в действительности этого не делают; наверное, по этой причине не дают ссылки на регламент Яндекса. Всегда сверяйте конвертер с документацией Яндекса: yandex.ru/support/nmaps/app_transliteration.html

7. В конце URL не должно быть слеша

В свое время достаточно обсуждаемая тема. Если коротко, то оба варианта допустимы и со слешем, и без него – все дело в личном предпочтении. Мое предпочтение заключается в том, что слеш – это разделитель, и в конце адреса он не имеет смысла.

Можете провести свое исследование изучив стандарты, например, RFC 1738 - Uniform Resource Locators (URL), но не ограничиваясь этим.

Можно сделать по какому-нибудь примеру, например, Яндекса, см. карту сайта yandex.ru/blog/sitemap.xml

Можно исходить из URL с параметрами:

https://google.com/search?q=key
https://yandex.ru/search/?q=key

Первый пример без слеша, второй — со слешем (и как мы можем видеть у Яндекса "раздвоение личности").

Для справки. Современные движки добавляют в заголовки link c атрибутом rel="canonical", что исключает нежелательные для поисковых систем дубли страниц, но если вы хотите абсолютного однообразия, то можно обеспечить редирект с URL со слешем на URL без слеша.

Для NGINX это выглядит так:

rewrite ^/(.*)/$ /$1 permanent;

Комментарии (1)

URL страницы сайта: ЧПУ, транслитерация, слеш в конце

Адреса страниц с расширением .php — это отсталый Битрикс. Никакого продуманного подхода в этом нет.