Створення файлу

створення

  • Створення файлу Robots.txt. Роль файлу sitemap.xml
  • Як зробити свою пошукову систему
  • Як переглянути файли сайту

Текстовий документ, що знаходиться в основній директорії ресурсу, називається Robots.txt. Зміст файлу включає інструкції для роботів-пошуковиків. Основними його можливостями є заборона конкретних сторінок веб-сайту до індексації, а також вказівка ​​його головного дзеркала. Крім того, Robots.txt вказує шлях до файлу sitemap.xml.

Головною перевагою файлу Robots.txt є можливість закриття індексації деяких сторінок ресурсу. Якщо такі сторінки відкриті, пошукова система намагатиметься самостійно їх закрити. Однак може статися і казус, який полягає у випадковому закритті пошуковою системою потрібних сторінок.

А зараз розглянемо додаткові директиви, які використовуються файлом Robots.txt

Host – застосовується лише у разі наявності кількох дзеркал ресурсу. Ця директива визначає основне дзеркало, яке буде показано користувачам у результатах пошукової видачі.

Sitemap – команда, яка допомагає роботу-пошуковику визначити місцезнаходження файлу, що містить карту веб-сайту.

Crawl-delay – застосовується з метою паузи між завантаженням сторінок ресурсу. Ця директива є корисною у разі наявності на сайті безлічі сторінок. Приклад застосування: Crawl-delay: 7 – пауза складатиме сім секунд.

Request-rate – використовується для позначення періодичності завантаження сторінок роботом-пошукачем. Приклад застосування: Request-rate: 1/7 – завантаження однієї сторінки відбувається за сім секунд.

Visit-time – полягає у визначенні проміжку часу, колиРобот має можливість завантажувати сторінки. Потрібно пам'ятати, що час має виставлятися за Грінвічем. Приклад застосування Visit-time: 0200-0400.