Поради щодо Web-розробки Десять (або трохи більше) файлів, необхідних для кожного Web-сайту - Як
Існує кілька стандартних файлів, які повинні бути, але не завжди присутні в кожному Web-сайті. Як правило, це питання виключно зручності, а не технічної необхідності, але, забуваючи про них, ви шкодите своєму сайту. Якщо користувачі навмання намагаються звертатися по різних URL, то буде краще, якщо вони будуть знаходити те, що шукали, в основному. У цій статті ми коротко розглянемо кожен із стандартних файлів.
Як саме користувач отримує доступ до того чи іншого ресурсу, залежить від Web-сервера та архітектури вашого Web-програми. При використанні "традиційних" серверів типу Apache, що працюють зі статичними ресурсами, ресурси, як правило, є звичайними файлами на сервері. Але в іншому випадку вони можуть бути записами в базі даних, рядками файлу конфігурації, класами якогось серверного процесу і т.д. У цій статті йтиметься про те, що, зрештою, отримає користувач, а не про те, як саме це буде реалізовано.
Є одна річ, яку необхідно пам'ятати при створенні власної сторінки 404.html (або при використанні механізму, що підтримується вашим Web-сервером, для заміни стандартного повідомлення "сторінка не знайдена"). Дуже часто розробники роблять помилку, використовуючи так звану "м'яку" сторінку 404. Іншими словами, сервер перенаправляє користувача до сторінки, яка повертається із заголовком "200 OK". Як правило, ця сторінка просто містить текст “сторінка не знайдена”, часто навіть не згадуючи про помилку 404. Не робіть цього! Завжди чітко інформуйте своїх користувачів (а також їхні браузери та інші програми) про те, що сталося, використовуючи точні заголовки відповідей.
Якісно зроблена сторінка about.html повинна містити короткий огляд вашого сайту, можливо, інформацію про те, навіщо ви його створили, чим він цікавий, а також кілька посилань для зворотного переходу до основних розділів сайту. Ця сторінка не потребує ніякого просунутого оформлення і, як правило, її не містить. Зробіть її досить лаконічною, щоб користувач міг швидко перейти до важливіших речей, що представлені на вашому сайті.
Зрозуміло, різні матеріали можуть мати різних правовласників. У цьому випадку нехай на головній сторінці пояснюється, як визначати різниці такого роду для різних сторінок. Також, у разі потреби, можна згадати і про захист торгових марок.
До того ж не забудьте переконатися, що так само працюватиме потворне розширення .htm, яке раніше використовувалося у Windows. А якщо вистачить терпіння, можна змусити index.cgi перенаправляти користувача до головної сторінки.
Проте, якщо деяку інформацію в RSS додавати можна завжди, просто візьміть і зробіть це. Наприклад, в index.rss можна помістити свого роду "приманку", розповівши при цьому, чим може бути корисним повний вміст стрічки. Або хоча б пояснити, чому RSS не потрібно для вашого сайту.
Якщо ви плануєте збирати будь-яку інформацію про користувачів, навіть якщо це лише імена для входу в систему або логін для обліку трафіку, обов'язково повідомте їм, як ви збираєтеся її використовувати. Юридичні питання, що виникають навколо творців та користувачів сайтів, дуже складні, а я не юрист, і тим більше – не ваш юрист. Але можу сказати, що користувачі будуть почуватися спокійніше, знаючи, що ви подумали про конфіденційність даних. До речі, цілком можливо, що сенс проконсультуватися з юристом з приводувикористання інформації про користувачів.
Якщо ви не бажаєте, щоб усі матеріали на вашому веб-сайті автоматично індексувалися, вкажіть це у файлі robots.txt. Насправді навіть якщо ви хочете, щоб індексувалося все - явно напишіть про це. Директива стандарту винятків для роботів (Robots Exclusion Standard) не є обов'язковою для слідування. Тому, якщо вам дуже не хочеться, щоб якісь ресурси були проіндексовані, або взагалі не розміщуйте їх на Web-сайт, або захищайте відповідними правами доступу. Але всі основні системи сканування слідують інструкціям у файлі robots.txt. Отже, вказуйте ваші побажання явно.
Спосіб подання карти сайту не дуже добре стандартизовано. Існують загальні корисні рекомендації, але наскільки детальною буде карта залежить від того, наскільки динамічним є вміст вашого сайту. Окрім того, доступність інформації залежить від призначення сайту. Наприклад, не слід вказувати користувачам про існування певного матеріалу X, якщо вони не мають до нього доступу. Тому вирішуйте самі, але намагайтеся все ж таки надати карту сайту в якомусь вигляді.
Для багатьох сайтів карта – це лише спосіб зручного розташування інформації для роботів, наприклад пошукових сервісів. Зокрема, Google запропонував угоду на додаток до robots.txt. Коротко: створюється файл XML, де описуються всі матеріали даного сайту; він відіграє роль "списку включень" на додаток до "списку виключень" файлу robots.txt.
Є речі, які відбуваються поза Webом. Наприклад, якщо навігація на вашому сайті не виправдовує надій або ж користувачі не здатні оцінити його елегантний дизайн, то, принаймні, вони повинні мати можливість зв'язатися з вами через електроннупошту.