Управління вмістом сайту по FTP
Є думка щодо того, як має бути влаштована CMS, щоб наповнювати сайт було легко і приємно.
Уявіть, ви пишете статтю у Ворді. Зберігайте. Запускаєте FTP клієнт (не web-based). На сервері створюєте папку під статтю. У неї завантажуєте ордівський файл і картинки.
Решта движок сайту робить сам: перетворює DOC в HTML, змінює розмір картинок, записує все, що потрібно, в основу.
Плюси – швидкість (уникаємо веб-інтерфейсів) та простота (не потрібно вчитися).
Як монетизувати сайт →
Матеріали на тему
В принципі, можливо, використовуючи docbook або odf
Серйозних технічних перешкод взагалі немає. Я ось думаю, може десь ідея з керуванням вмістом FTP вже реалізована?
Складно буде перетворювати DOC/ODF/OOXML на HTML, так, як хоче користувач. Імхо це основна проблема WYSIWYG
У мене чиста ідея, не обтяжена земними труднощами :)
Хоча насправді складне форматування не часто потрібне. А якщо проблема із перетворенням DOC, я готовий навіть зберігати текст із ворда в HTML. Підчистити код потім цілком у людських силах.
Робив знайомий 2001 року публікацію новин на сайт за допомогою RTF-файлів. Можна було не виходячи із ворду публікувати на сайт. Взагалі дуже зручна річ була, важко сказати чому не прижилася. Технічні проблеми виникали з деякими видами нумерації, таблицями з об'єднаними осередками, але це весь час зустрічалося лише кілька разів. А в решті вистачало фільтрації: закритий перелік дозволених тегів та атрибутів, решта чистилася, щоб стиль сайту не порушувати.
Я гадаю, що реалізації є. Треба пошукати. Ідеально було б модуль Drupal зробити :)
Тільки ось що простіше для звичайної домогосподарки? Веб-інтерфейс зполем «Завантажте ордівський файл» чи FTP?
Є ще така штуковина як WebDAV, з якою багато ОС можуть працювати стандартними методами. В тій же вінді WebDAV ресурс підключається в кілька кліків. На відміну від FTP, WebDAV має більш просунуте розмежування прав, і, якщо не помиляюся, тобто ще й історія змін. Це все на рівні протоколу, а так, то, звичайно, ще залежить від реалізації сервера.
Ну я знаю, що на box.net є плагін для нового word який дозволяє зберігати файл на сервак туди. Далі справа парсингу - щохвилини перевіряти наявність файлу і перетворювати на статтю. Але у мене вже справа звички. Плюс простіше напевно вставити XML-RPC інтерфейс і працювати з MS Live Writer
Ще краще, не потрібно возитися з FTP-клієнтом.
Але я півроку тому пробував пару блогових клієнтів, вони були не надто розвинені: картинки не вміли завантажувати, української орфографії не було.
Хочеться одну програму, яка "від і до" робить. Може для oowriter'а щось їсти. Ну і штуки для MS подивлюся, дякую.
"Уявіть, ви пишете статтю у Ворді. Зберігаєте. Запускаєте FTP-клієнт (не web-based). На сервері створюєте папку під статтю. У неї завантажуєте ордівський файл і картинки."
Мені здається, простіше "пишіть статтю у Ворді. Зберігаєте. І відправляєте на потрібне мило". Ну а двигун буде періодично пошту моніторити просто і при нових листах робити всю роботу.
До речі, я ворд дуже зацінив. Раніше, коли з новим розумівся, локально блог вів. І здавалося, що це добре. А ворд здавався інструментом для ламерів.
Але зараз, коли звичайна робота це коли потрібно протестувати десятки варинтів чогось і скрізь принтскрини, принтскрини, принтскрини - швидкий паст просто вВордівський документ став просто незамінним.
Є в ньому і хороше, і погане. Те, що HTML списки робить, як bull nbsp nbsp nbsp - просто ганьба. А, наприклад, робота зі стилями та можливості автозаміни службових символів (^p, ^t) мені подобаються.
Таке у plone є.
Дякую, подивлюсь при нагоді. Але поки що з пайтоном щось складається :(
Даремно. Хоче мені plone - страшний монстр. Віддаю перевагу pylons.
До речі, ніхто не мав досвіду налаштування XML-RPC, щоб можна писати на сайт через Windows Live Writer/BlogJet ?
> Уявіть, ви пишете статтю у Ворді Ага, а потім треба лише натиснути кнопку "Publish to web". І в результаті вийде MS Sharepoint :)
Ех, якби придумати як видерти або використовувати модуль Dreamweaver для очищення Word-файлів від сміття. Там його грамотно реалізовано, але, на жаль, відкритого API я не знайшов.
А Tidy на вордівських файлах не працює?
Працює. Але щоб вичистити всі MsoNormal, потрібно довго писати правила. Якщо хтось таке робив, киньте заслання, будь ласка.
А я не знав про Tidy. Подивлюся, дякую.
Стилі ворда чистяться за допомогою парочки regexp'ів. Тут нема проблеми.
Загалом ні в чому немає проблеми, потрібен розумний скрипт, який сам зробить із сирих матеріалів сторінку сайту. Щоб такий скрипт написати, талант не потрібний. Жодних особливих знань не потрібно. Просто посидіти деякий час.
Розбираючись як скрапити хтмл за допомогою пхп (до речі, не підкажіть за допомогою чого Ви це робите?), натрапив на класи, які можна використовувати при очищенні ордівського тексту: http://www.phpclasses.org/browse/package/ 1020.html http://www.phpclasses.org/browse/package/1352.html
Ось знайшов свій PHP-код дворічної давності. Не впевнений як регулярний вислів, та й взагалі. Але на одному сайті досі працює. function msword2html($t) // Залишаємо тільки «хороші» теги $t = strip_tags($t, '
О дякую. А то з приводу "парочки регекспів" трохи недооцінили вміння ворда вставляти несподіване сміття. А дуже жорстко теж вичищати не можна - деяке форматування може виявитися важливим.
Загалом, робота значно більша, ніж на годину і тому готові класи набагато кращі.
Ми робили схожий движок, .doc-файли через .net-адмінку на сайт, і він не виправдав себе.
Виявилося надзвичайно багато дрібних проблем із розбиранням файлу, чищенням від зайвої розмітки та додаванням функцій. Проблеми із таблицями, картинками, списками. І при цьому для кількох браузерів. Дуже важко обслуговувати. Можливо, у новому форматі .docx стало краще, не знаю.
Найсмішніше, що від движка довелося відмовитися, оскільки люди чекають саме веб-інтерфейсу, а такій системі треба почуватися.
Комусь потрібен веб-інтерфейс, а я ось скуштував :)
Такий спосіб опублікування матеріалів прийнятний для новин, це так. І те, незрозуміло, як бути із заголовком новини, і як зробити її анонс. Ще варіант - публікація постів у блог; блогер, наскільки я знаю, приймає листи: заголовок — у назву посту, текст — у текст, можна було б таку функцію прикрутити до якогось движка, для тих, кого блогер чимось не влаштовує.
У ворді є механізм стилів. З його допомогою можна робити чудеса розмітки. І ще у ворді є можливість створювати шаблони.
Це лише сервіс, чи можна якось вихідники отримати?
fogmaker, дякую за посилання!
Одне посилання не в тему ставить, друге підписується хитрим анкором і першого хвалить.Куди котиться світ.
Блін, чувак, ну кільни ти лінку, якщо не в тему вона тобі здалася. Чого ентропію примножувати? А за вихідниками – велкам в асю.
зи. світ - це охуенна штука. нікуди він не котиться. все добре. а питання твоє риторичне лузерством віддає. ага.
Вибачте, але це перекручення. Дуже сильна збочення. Чи не простіше поставити FCKEditor (не працює в опері, але дуже хороший) чи TinyMCE? Генерують цілком пристойний код, з ворда вставляти текст вміють із збереженням стилів та чищенням сміття. А вже потім обробити safeHTML. А скопіювати текст із вікна ворда у вікно браузера не дуже складно.
Знаєте, чому після того, як спробуєш соулсик, нічим іншим музику не хочеться качати? Тому що не потрібно скористатися веб-інтерфейсом.
Знаєте, чому CLI багатьом сучасним користувачам подобається більше GUI.
Не знаю. Не пробував. І навіть не хочеться. Бо музику качаю рідко. Майже завжди з одного сайту. І з незручностей лише банер на полекрані. А взагалі відношення до файлообмінних мереж дуже не хороше.
На хабрі кілька тижнів тому був піст. Про те, як у командному рядку зробити з купки картинок галерею. Так, рішення гарне. Але, по-перше, до нього потрібно додуматися. По-друге, якщо знадобиться вдруге, то треба десь зберігати. По-третє, навіщо? якщо й так щодня користуєшся bridge, де це вбудовано.
Командний рядок хороший там, де потрібно що-небудь виконати з особливими параметрами, або операція виконується раз на рік і писати під цю справу оболонку немає сенсу.
Ось і говорю, що іноді було б зручно наповнювати сайт без використання веб-інтерфейсу. Зрозуміло, що все має бути продумано, щоб не повзло. Але коли немає мети охопити багатотисячну армію користувачів із різним софтом, завданняцілком вирішувана.
Вже займався пошуком матеріалу у цій справі. Тут знайшов кілька цікавих посилань.
На початку: DOC файл з картинками та всім іншим на борту
Наприкінці: Готова HTML сторінка, з "вийнятими" з доки малюнками, збереженими на сервері.
Ну що ж. Коли набереться пристойна інформація, то займуся створенням класу.
Питання: Я так розумію, малюнки в файлі Doc перекладаються в певний формат? base32/64? Як їх звідти дістати?
Маслаков Олександре, я б працював не з DOC, а з RTF. А може навіть із MHTML (веб-сторінка в одному файлі).