Sovet№3 вътрешния създаване оптимизация
Sovet№3 Вътрешна оптимизация: Създаване на robots.txt
![Sovet№3 вътрешна оптимизация на създаването (Съвет) Sovet№3 вътрешния създаване оптимизация](https://webp.images-on-off.com/26/784/290x290_uq8g20zlrr5zuxlqdegz.webp)
Предполагам, че аз не откривам Америка казва, че индексирането на сайта ви е много важно файла robots.txt С две думи, това, което тази за управление на файлове индексирането на сайта. Така че сега на езика на елфите)) файла robots.txt на е създаден специално за ботове за търсене да индексира сайтове. Файлът се записва в правилата на сканирането на вашия блог / сайт, т.е. robots.txt «казва" ботове, които може да индексира сайта. Например, защо Googlebot да знаете информацията на административния отдел? Или влезте форма? Първият робот търси файла TXT и прочетете той работи в рамките на вашата околна среда, и по-специално забранява.
За да забраните индексирането в Yandex и Google една страница, че е подходящо да се използва мета роботи тагове. Файлът robots.txt се използва за конфигуриране на световната индексирането.
Като цяло, достатъчно, за да отидат около темата, ние се пристъпи към подготовката и преглед на robots.txt
На Съвета. Ако вашият сайт на WordPress или други CMS по принцип силни различия в robots.txt на обектите там. Можете да оцените досиетата на неговите конкуренти и съответните на вашия сайт / блог, добавяйки към домейна /robots.txt например, ми роботи файл може да бъде видян на линка по - gtalk.kz/robots.txt pridelnyh Но бъдете внимателни!
Правила за съставяне на robots.txt
Ако някога ви се отвори файл, най-вероятно да се досетите как да го направи.
Общата схема е както следва:
Сега по-подробно. Първата стъпка е да се избере, които са предназначени да се произнесе. Изпълнението на тази функция е директива на потребителски агент. След това поле е името на робота, или "*" - следните правила за всички лодки. Частичен списък на търсачките и техните ботове име:
Забрани - забрана за индексиране на файлове, директория и т.н. Обучението е на противоположната Забрани позволи (не разбирам всички ботове!) - Googlebot разбира, Yandex - не.
Мисля, че, например, всичко ще си дойде на мястото:
- Забранете всички роботи да индексира сайта. Пълна забрана на сайта от търсачките.
- User-Agent: *
Disallow: /
- User-Agent: *
- User-Agent: *
Забрани:
- User-Agent: Googlebot
Забрани: User-Agent: Yandex
Disallow: /
Между правила за различни робота оставите празен ред!
- Близо указател на всички роботи: WP-включва, WP-администратор и WP-login.php файл в главната директория на сайта.
- User-Agent: *
Disallow: / WP-включва /
Disallow: / WP-администратор /
Disallow: / WP-login.php
- User-Agent: *
- User-Agent: *
Disallow: / собствен сайт
- User-Agent: *
Disallow: * / емисия
Символът "*" означава (включително празна) последователност от знаци.
директива Водещ се поддържа само от Yandex и информира робота, на която на мястото на две основни огледала - с или без WWW. Той се използва за залепване домени. Формат на записа:
Обикновено, те пишат, че толкова погрешно:
User-Agent: *
Disallow: / CSS /
Водещ: www.example.com
И това е - надясно (за добавяне на правила за Yandex)
User-Agent: *
Disallow: / CSS /
User-Agent: Yandex
Disallow: / CSS /
Водещ: www.example.com
Не бих казал така, Yandex все още намира параметър домакин. Но това е по-добре да не се експериментира на сайта на живо))
И накрая, регламентите на проучването. Не забравяйте да добавите сайта. Изпълнението се осъществява по следния начин:
User-Agent: Yandex
Disallow: /
Също така аз препоръчвам:
Е, и сега няма да бъде трудно да се разбере в примерите по-долу.
А сега да разгледаме някои недвижими robots.txt
Преглед moegorobots.txtfayla.
User-Agent: *
Забрани: /wp-login.php
Забрани: /wp-register.php
Disallow: / собствен сайт
Забрани: * / собствен сайт
Disallow: * / емисия
Disallow: / * *?
Disallow: / WP-съдържание /
Disallow: / WP-администратор /
Disallow: / WP-включва /
Забрани: /xmlrpc.php
Позволете: / WP-съдържание / качване /
User-Agent: Yandex
Забрани: /wp-login.php
Забрани: /wp-register.php
Disallow: / собствен сайт
Забрани: * / собствен сайт
Disallow: * / емисия
Disallow: / * *?
Disallow: / WP-съдържание /
Disallow: / WP-администратор /
Disallow: / WP-включва /
Забрани: /xmlrpc.php
Позволете: / WP-съдържание / качване /
Водещ: gtalk.kz
Файлът robots.txt за Joomla
Мисля, че след като прочетете всичко по-горе, можете да намерите тук, мисля за него като домашна работа;)
Standard файл Joomla
По принцип много добре обмислено, разработчиците, тъй като WordPresse robots.txt отсъства))
User-Agent: *
Disallow: / администратор /
Disallow: / кеш /
Disallow: / компоненти /
Disallow: / снимки /
Disallow: / включва /
Disallow: / инсталация /
Disallow: / език /
Disallow: / библиотеки /
Disallow: / медии /
Disallow: / модули /
Disallow: / плъгини /
Disallow: / шаблони /
Disallow: / TMP /
Disallow: / xmlrpc /
Но не можах да устоя и направи промени.
User-Agent: *
Disallow: / администратор /
Disallow: / кеш /
Disallow: / компоненти /
Disallow: / включва /
Disallow: / език /
Disallow: / библиотеки /
Disallow: / медии /
Disallow: / модули /
Disallow: / плъгини /
Disallow: / шаблони /
Disallow: / TMP /
Disallow: / xmlrpc /
User-Agent: Yandex
Disallow: / администратор /
Disallow: / кеш /
Disallow: / компоненти /
Disallow: / включва /
Disallow: / език /
Disallow: / библиотеки /
Disallow: / медии /
Disallow: / модули /
Disallow: / плъгини /
Disallow: / шаблони /
Disallow: / TMP /
Disallow: / xmlrpc /
Водещ: gtalk.kz
Ако е възможно, добавете друг карта на сайта. Съветвам ви да използвате Comp Xmap - може би една от най-популярните.
Преглед блогъри Robot.txt файлове.
Сега малко поучителен преглед. Съществува мнение, че robots.txt е подобно на много, така че просто го копирате. Нека да разгледаме всички блогове / сайтове в платформата WordPress.
Аз не го съветва, но аз прегледахме robots.txt политика на файла, или е направено нарочно))
Пич просто отбеляза Яша, или го е направил по различен начин, кой знае. Един от малкото, които използват Позволете и отвори достъп до снимките на своя блог.
Следният файл е особено ме poraboval:
Да, да, моите приятели, в един ред. По принцип, сложи целия сайт в индекса е едва ли разумен, не ви съветвам да го направи, и се съгласявате, така че изглежда много по-хубав:
Следващият пример е блог Dimoksa - dimox.name
Какво общо има това да се направи за себе си? Например, линия 7: Disallow: /download-manager.php - забрана за сканиране изтегляне-manager.php файл, този файл е отговорен за изтегляне от блога Dimoksa. Какво означава Disallow: / jexr / честно казано не знам. Но изглежда има някои важни или лични файлове :)
User-Agent: *
Disallow: / WP-включва /
Disallow: / WP-администратор /
Забрани: /wp-login.php
Забрани: /wp-register.php
Забрани: /xmlrpc.php
Забрани: /download-manager.php
Disallow: / * коментирам-за цялата страница *
Disallow: / * ср = *
Disallow: / jexr /
User-Agent: Yandex
Disallow: / WP-включва /
Disallow: / WP-администратор /
Забрани: /wp-login.php
Забрани: /wp-register.php
Забрани: /xmlrpc.php
Забрани: /download-manager.php
Disallow: / * коментирам-за цялата страница *
Disallow: / * ср = *
Disallow: / jexr /
Водещ: dimox.name
Така че в края на краищата да се консолидират кое е добро и кое е лошо в примерите