Перевірка контенту на плагіат - Сервіси, програми, алгоритми - Блог SEO купця
Сервіси
1.Антиплагіат — Хоча проект і орієнтований насамперед на ВНЗ, що позначається на характері індексу, для SEO іноді може послужити службу.
2.CopyScape — Один із найкращих пошуковиків плагіату. Хоч і буржуйський сервіс, але досить непогано визначає скопіпіжений контент українською мовою. З мінусів: З джерел тексту розуміє лише URL; у безкоштовній версії може перевірити лише 10 сторінок (на добу?). Подальші запити пропонується сплатити за таксі Only $0.05 per search. Оплату приймає карткою Visa, що дуже зручно. Є кнопка для відлякування крадунів, сенс якої, щоправда, не зовсім зрозумілий: Крадуть зазвичай в автоматичному режимі.
3.Quote Finder - Дуже своєрідний сервіс як по дизайну, так і практичної функціональності. Існує думка, що використовує ресурси попереднього сервісу.
4.Plagiarism Checker — Чудова штука, хоч і використовує лише базу Google. «Плюс цього інструменту в тому, що він автоматично копіює, укладаючи в лапки і розділяючи OR (”або”), дві різні фрази із зазначеної веб-сторінки та шукає їх у Гуглі. Та ще й виключає при цьому зазначену сторінку мінусом. Дешево й сердито. Точніше, безкоштовно та сердито.» При знаходженні плагіату дозволяє відразу сформувати і відправити Google Alerts.
5.ArticleChecker — Схожий на попередній сервіс, але більш гнучкий у варіантах плагіату.
6.Istio — Хоч і декларується пошук копій, користі від цього немає.
7.PasteIt — Російськомовний сервіс з диким юзабіліті: Пропонується перевірити унікальність контенту по заданому URL в одній із трьох пошукових систем: Google, Яндекс, Рамблер. Якоїсь результативності невиявлено.
8.Plagium — Видає повне марення як результат перевірки.
9.DupeCop - Це взагалі, що таке і як цим користуватися?
10.PlagiarismDetect - Не перевіряв. Для буржунету.
11.Iplagiarismcheck - Для неукраїнських.
12.iThenticate — Комерційна база із 10 тис великих зарубіжних газет, журналів та збірників статей. Має бути круто.
13.Turnitin - Комерційна база пошуку в західних наукових академічних виданнях. Напевно, круто.
Програми
1.Double Content Finder - ПЗ із сайту біржі контентуTextBroker. Підтримується ручне введення тексту, завантаження з файлу або URL-адреси. З тестовим завданням не впоралася.
2.Advego Plagiatus - Програма від творців біржі контенту AdVego. Дуже сумнівна по функціоналу. Як результат, видає якісь невідомі % унікальності контенту без вказівки джерела копії.
3.Детектор плагіату - Перевіряє по базі Яндекса. Для використання потрібна реєстрація в Yandex XML
4.Плагіат-Інформ - Автори якбе натякають, що це серйозна програма, але на сайті не вдалося знайти навіть інформацію за ціною.
Більше нічого примітного не знайшов.
Виходячи зі зробленого огляду, дійшов висновку, що більш-менш тямущої системи перевірки на плагіат ще не зроблено. Принаймні у відкритому доступі. — Жоден із описаних сервісів та програм не знайшли всіх дублів тексту, зокрема оригінальне джерело тексту. Я вже не кажу про рерайт... На масову перевірку текстів здатний лишеДетектор плагіату, та й у ньому я поки що не впевнений - не перевіряв. А ось так, щоби взяти весь сайт і перевірити — такого немає. Хіба що в надрах команди розробниківпошукових систем Пересічному користувачеві доведеться все робити руками.
Методи перевірки плагіату
Що стосується способів, то тут все не так просто, як може здатися. З найпростіших можу відзначити, що пошуковий запит з двох комбінацій, що складаються з трьох слів, що йдуть, дозволяють з 40% ймовірності виявити вихідний текст. Опис більш просунутих алгоритмів можна знайти на сайтах:
Ну, і як жарти, цитую опис псевдоісторичної наукової праці А. Т. Фоменко:
Надалі планую розвинути тему захисту своїх праць від крадіжки та покарання за вже здійснене та виявлене крадіжку контенту.