Всё правильно сказал.
Наличие дублей страниц в индексе поисковых систем — проблема повсеместная. Сталкиваюсь с этим чуть ли не каждый рабочий день, с каждым новым клиентом.
А ведь решается всё за полсекунды, господа вебмастеры. Четыре строки в .htaccess — и вот вам наглядный profit.
RewriteCond %{HTTP_HOST} ^idinaxyu.ru
RewriteRule (.*) http://www.idinaxyu.ru/$1 [R=301,L]
RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /index.php\ HTTP/
RewriteRule ^index.php$ http://www.idinaxyu.ru/ [R=301,L]
1. Прописываем главный домен с WWW.
2. Ставим редирект с /index.php на /.
(Код допиливается своими руками в случае необходимости.)
С уважением, Иващенко —
И без SEO-консультаций дублей в индексе не будет
Обычно в robots.txt мы используем достаточно стандартные структуры —
Allow: /bitrix
Disallow: /search/
Однако, бывает попадается и интересненькое —
Disallow: /*?action*
Disallow: /catalog/$
Disallow: /catalog/c61/*PAGEN*
В данном случае первой строкой мы закрываем от индексации любые битриксовские «действия». Синтаксис достаточно простой — звёздочками подменяем любое количество любых символов.
То есть любая страница, адрес которой включает в себя ?action, к примеру, /index.php?action=refresh, индексироваться «Яндексом» не будет.
Вторая строка уже интереснее. Тут мы запрещаем к индексации отдельный каталог, при этом разрешая индексацию его подкаталогов. (В отличие от синтаксиса Disallow: /catalog/, который бы запретил индексацию как /catalog/, так и /catalog/podcatalog/ и т.д.)
Ну и в третьей строке мы соединяем, так сказать, полученные знания. Мы запрещаем к индексации все страницы, содержащие в адресе фразу «PAGEN», которые находятся в каталоге /catalog/c61/.
С уважением, Иващенко —
И наш интернет-магазин детской одежды в плюсе
- Сайт доступен только по одному домену (С или БЕЗ www).
- Нет дубликатов главной страницы в лице «/index.php», «/index.html» и т.п.
- Корректно настроена и работает 404 ошибка сервера.
- На сайте корректно настроены и работают ЧПУ.
- В категориях прописан мета-тэг rel=’canonical’.
- Присутствует файл robots.txt.
— Прописана директива «Host» и она соответствует домену сайта.
— Прописана директива «Crawl-delay» со значением не меньше двух.
— Закрыты от индексации навигационные и дублирующие страницы. - Присутствует карта сайта sitemap.xml.
— В ней выдаётся наиболее полный список страниц сайта.
— Прописаны приоритеты для важных страниц. - Сайт добавлен в
— Яндекс.Вебмастер, Яндекс.Справочник
— Google Webmaster Tools
— Яндекс.Метрику или Google Analytics
С уважением, Иващенко —
И все сайты работают верно
Так вышло, что на выходных мне выпало посмотреть телевизор. Это было воскреснее утро, канал «СТС». Начинался фильм «Железный человек-2».
И вот знаете что мне понравилось? Реклама. Всего одна реклама за весь фильм, но зато насколько таргетированная: это был трейлер фильма «Мстители», выходящего в следующем месяце.
А эти самые «Мстители» — логическое продолжение сюжетной линии всего «Железного человека», да и в придачу «Халка», «Тора», «Первого мстителя» и многих других неплохих фильмов.
В общем, «Тора» и «Первого мстителя» на этой неделе я уже посмотрел. Жду выхода «Мстителей», а значит реклама оказалась вполне себе высоко-таргетированной. Profit.
С уважением, Иващенко —
И всё будет «в тему»