Перевірка контенту на плагіат - Сервіси, програми, алгоритми - Блог SEO купця

Сервіси

1.Антиплагіат — Хоча проект і орієнтований насамперед на ВНЗ, що позначається на характері індексу, для SEO іноді може послужити службу.

2.CopyScape — Один із найкращих пошуковиків плагіату. Хоч і буржуйський сервіс, але досить непогано визначає скопіпіжений контент українською мовою. З мінусів: З джерел тексту розуміє лише URL; у безкоштовній версії може перевірити лише 10 сторінок (на добу?). Подальші запити пропонується сплатити за таксі Only $0.05 per search. Оплату приймає карткою Visa, що дуже зручно. Є кнопка для відлякування крадунів, сенс якої, щоправда, не зовсім зрозумілий: Крадуть зазвичай в автоматичному режимі.

3.Quote Finder - Дуже своєрідний сервіс як по дизайну, так і практичної функціональності. Існує думка, що використовує ресурси попереднього сервісу.

4.Plagiarism Checker — Чудова штука, хоч і використовує лише базу Google. «Плюс цього інструменту в тому, що він автоматично копіює, укладаючи в лапки і розділяючи OR (”або”), дві різні фрази із зазначеної веб-сторінки та шукає їх у Гуглі. Та ще й виключає при цьому зазначену сторінку мінусом. Дешево й сердито. Точніше, безкоштовно та сердито.» При знаходженні плагіату дозволяє відразу сформувати і відправити Google Alerts.

5.ArticleChecker — Схожий на попередній сервіс, але більш гнучкий у варіантах плагіату.

6.Istio — Хоч і декларується пошук копій, користі від цього немає.

7.PasteIt — Російськомовний сервіс з диким юзабіліті: Пропонується перевірити унікальність контенту по заданому URL в одній із трьох пошукових систем: Google, Яндекс, Рамблер. Якоїсь результативності невиявлено.

8.Plagium — Видає повне марення як результат перевірки.

9.DupeCop - Це взагалі, що таке і як цим користуватися?

10.PlagiarismDetect - Не перевіряв. Для буржунету.

11.Iplagiarismcheck - Для неукраїнських.

12.iThenticate — Комерційна база із 10 тис великих зарубіжних газет, журналів та збірників статей. Має бути круто.

13.Turnitin - Комерційна база пошуку в західних наукових академічних виданнях. Напевно, круто.

Програми

1.Double Content Finder - ПЗ із сайту біржі контентуTextBroker. Підтримується ручне введення тексту, завантаження з файлу або URL-адреси. З тестовим завданням не впоралася.

2.Advego Plagiatus - Програма від творців біржі контенту AdVego. Дуже сумнівна по функціоналу. Як результат, видає якісь невідомі % унікальності контенту без вказівки джерела копії.

3.Детектор плагіату - Перевіряє по базі Яндекса. Для використання потрібна реєстрація в Yandex XML

4.Плагіат-Інформ - Автори якбе натякають, що це серйозна програма, але на сайті не вдалося знайти навіть інформацію за ціною.

Більше нічого примітного не знайшов.

Виходячи зі зробленого огляду, дійшов висновку, що більш-менш тямущої системи перевірки на плагіат ще не зроблено. Принаймні у відкритому доступі. — Жоден із описаних сервісів та програм не знайшли всіх дублів тексту, зокрема оригінальне джерело тексту. Я вже не кажу про рерайт... На масову перевірку текстів здатний лишеДетектор плагіату, та й у ньому я поки що не впевнений - не перевіряв. А ось так, щоби взяти весь сайт і перевірити — такого немає. Хіба що в надрах команди розробниківпошукових систем Пересічному користувачеві доведеться все робити руками.

Методи перевірки плагіату

Що стосується способів, то тут все не так просто, як може здатися. З найпростіших можу відзначити, що пошуковий запит з двох комбінацій, що складаються з трьох слів, що йдуть, дозволяють з 40% ймовірності виявити вихідний текст. Опис більш просунутих алгоритмів можна знайти на сайтах:

Ну, і як жарти, цитую опис псевдоісторичної наукової праці А. Т. Фоменко:

Надалі планую розвинути тему захисту своїх праць від крадіжки та покарання за вже здійснене та виявлене крадіжку контенту.