В цій статті я постараюсь викласти короткі замітки про оптимізацію сайту під Google та Yandex.
Яндекс індексує сайти з допомогою робота Yandex/1.01.001 (основний індексуючий робот ). Керувати індексацією можна за допомогою User-Agent у файлі robots.txt, а також тегом
На сьогоднішній день ця пошукова система має практично досконалі алгоритми пошуку і тому робота для оптимізації ускладнюється з кожним його апдейтом. Продовження »
1,114 переглядів | Автор:
Юрко | Теґи:
SEO,
оптимізація
Мета-теги – HTML-або XHTML-теги, призначені для надання структурованих метаданих про веб-сторінку. Мета-теги розміщуються всередині тега head в (x)HTML-документі, як правило, після тега TITLE. Мета-теги використовуються для вказівки опису сторінки, ключових слів та інших даних.
У тега meta допустимі чотири атрибуту: content, http-equiv, name і scheme. З них тільки обов’язковий лише атрибут content. Продовження »
748 переглядів | Автор:
Юрко | Теґи:
meta-tags,
SEO
В минулій статті на цю тему Я розказав, що собою являє robots.txt. В цій статті Я розкажу як оптмізувати даний файл для блогу.
Ось robots.txt який рекомендований розробниками WordPress:
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /feed
Disallow: /comments
Disallow: /category/*/*
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Allow: /wp-content/uploads
# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*
# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*
# Internet Archiver Wayback Machine
User-agent: ia_archiver
Disallow: /
# digg mirror
User-agent: duggmirror
Disallow: /
Sitemap: http://www.yourdomain.com/sitemap.xml
Для Яндекса може бути корисно ще таке
User-agent: Yandex
Crawl-delay: 5
Можна деколи додати ще
3,760 переглядів | Автор:
Юрко | Теґи:
robots.txt,
SEO,
Блог
1. Вилучити / category / з шляху в адресі WordPress:
За замовчуванням категорії в WordPress відображаються так: httр: / / www.wordpress.com / blog / category / wordpress
Але якщо потрібно максимально вкоротити адрес то використовуєм даний метод. Вписуємо наступний код.
RewriteRule ^category/(.+)$ httр://www.yourblog.com/$1 [R=301,L]
Тепер категорії будуть виглядати так: httр: / / www.wordpress.com / blog / wordpress
2. Стиснення статичних даних:
Цей код зменшить обсяг переданих даних між сервером і користувачем за рахунок їх стиснення.
AddOutputFilterByType DEFLATE text/html text/plain text/xml application/xml application/xhtml+xml text/javascript text/css application/x-javascript
BrowserMatch ^Mozilla/4 gzip-only-text/html
BrowserMatch ^Mozilla/4.0[678] no-gzip
BrowserMatch bMSIE !no-gzip !gzip-only-text/html
3. Перенаправить користувача на сторінку-заглушку:
На час робіт на сайті бажано перенаправляти користувачів на тимчасову сторінку-заглушку.
Замініть у рядку 2 vashastorinka.html на назву вашого файлу.
І в рядку 3 впишіть свій IP, щоб вас не перенаправляти на цю заглушку.
302-редірект використовується щоб пошукові системи не проіндексували вміст тимчасової сторінки.
RewriteEngine on
RewriteCond %{REQUEST_URI} !/vashastorinka.html$
RewriteCond %{REMOTE_ADDR} !^123\.123\.123\.123
RewriteRule $ /vashastorinka.html [R=302,L]
4. Захист блогу від хотлінків:
Хотлік – це використання файлів розміщених на вашому сайті на сторінках інших сайтів з метою заощадити свій серверний трафік.
Для боротьби з цією напастю допоможуть наступні рядки в. htaccess
RewriteEngine On
#Replace ?mysite\.com/ with your blog url
RewriteCond %{HTTP_REFERER} !^http://(.+\.)?mysite\.com/ [NC]
RewriteCond %{HTTP_REFERER} !^$
#Replace /images/nohotlink.jpg with your "don't hotlink" image url
RewriteRule .*\.(jpe?g|gif|bmp|png)$ /images/nohotlink.jpg [L]
5. Блокування спамерів в WordPress через. htaccess:
Часто спам-боти заходять з однакових IP адрес. Наступний прийом допоможе блокувати доступ з цих адрес. Просто внесіть адреса спамера у рядку 3.
Можна розширити список заблокованих адрес додавши рядок deny from xxx.xx.xxx.xxx.
order allow,deny
deny from 200.49.176.139
allow from all
2,136 переглядів | Автор:
Юрко | Теґи:
.htaccess,
SEO
robots.txt – файл обмеження доступу роботам до вмісту на http-сервері. Файл повинен знаходитися у корені сайту (тобто мати шлях щодо імені сайту /robots.txt). При наявності декількох субдоменів файл повинен розташовуватися в кореневому каталозі кожного з них. Даний файл доповнює стандарт Sitemaps, який є прямо протилежною цілі: полегшувати роботам доступ до вмісту. Продовження »
2,992 переглядів | Автор:
Юрко | Теґи:
robots.txt,
SEO