Парсинг Proxy - SEO форум - оптимізація та просування сайтів
Привіт всім. Хотілося б поділитися своїм досвідом зі збирання та перевірки паблік Proxy. Здебільшого користуюся покупними, але іноді доводиться вдаватися до парсингу паблика.
1. ПарсингСофтіна якої я користуюсяProxyGrab 0.6Докладніше:
Завантажуємо текстовий файл списку посилань на проксі аркуші

Посилання для збору HTTP проксі:
Посилання до збору SOCKS
Завантажили текстовик, тиснемоStart. Бачимо результати парсингу:

Пограбували з усіх посилань, зберігаємо. Виділяємо список і тиснемоSave

Тут же у програмі можна видаляти биті посилання з бази, видаляти посилання з яких не грабує. Як бачите, зграбилося близько 19к проксей. До архіву з ProxyGrab я додав свої текстовики з базами посилань. Ви можете завжди додавати нові посилання або видаляти биті, тримаючи свою базу в актуальному стані.
2. Вилучаємо дублікатиЧасто в паблік аркушах миготять однакові проксі і ми видалимо дублікати. Софт яким я користуюсяUAI

Завантажили проксі, видаляємо дублі
3. Перевірка Proxy
Для перевірки можуть використовуватись як онлайн, так і десктоп чекери.
Т.к. будемо перевіряти паблік проксі, то можна без побоювання користуватися паблік чекерами:
http://www.checker.freeproxy.ru/checker/ http://www.onlinechecker.freeproxy.ru/ http://proxydb.ru/Proxytools/Proxychecker.aspx http: //site-control.ru/servise/ http://proxyfree.ru/
Найкращий: http://hideme.ru/proxy-checker/ але тут без преміум доступу перевіряє до 100 штук.
Стаття не претендує на оскар. Можливо, вона комусь буде корисна. Критика вітається! Про десктоп софтін додам трохи пізніше. Іду посправам