Парсинг Proxy - SEO форум - оптимізація та просування сайтів

Привіт всім. Хотілося б поділитися своїм досвідом зі збирання та перевірки паблік Proxy. Здебільшого користуюся покупними, але іноді доводиться вдаватися до парсингу паблика.

1. ПарсингСофтіна якої я користуюсяProxyGrab 0.6Докладніше:

Завантажуємо текстовий файл списку посилань на проксі аркуші

proxy

Посилання для збору HTTP проксі:

Посилання до збору SOCKS

Завантажили текстовик, тиснемоStart. Бачимо результати парсингу:

парсинг

Пограбували з усіх посилань, зберігаємо. Виділяємо список і тиснемоSave

форум

Тут же у програмі можна видаляти биті посилання з бази, видаляти посилання з яких не грабує. Як бачите, зграбилося близько 19к проксей. До архіву з ProxyGrab я додав свої текстовики з базами посилань. Ви можете завжди додавати нові посилання або видаляти биті, тримаючи свою базу в актуальному стані.

2. Вилучаємо дублікатиЧасто в паблік аркушах миготять однакові проксі і ми видалимо дублікати. Софт яким я користуюсяUAI

парсинг

Завантажили проксі, видаляємо дублі

3. Перевірка Proxy

Для перевірки можуть використовуватись як онлайн, так і десктоп чекери.

Т.к. будемо перевіряти паблік проксі, то можна без побоювання користуватися паблік чекерами:

http://www.checker.freeproxy.ru/checker/ http://www.onlinechecker.freeproxy.ru/ http://proxydb.ru/Proxytools/Proxychecker.aspx http: //site-control.ru/servise/ http://proxyfree.ru/

Найкращий: http://hideme.ru/proxy-checker/ але тут без преміум доступу перевіряє до 100 штук.

Стаття не претендує на оскар. Можливо, вона комусь буде корисна. Критика вітається! Про десктоп софтін додам трохи пізніше. Іду посправам