29 Май 2020

Обновление по рекапче на google.com

Обновление информации по поводу ReCaptcha на google.com

Данная статья является продолжением вчерашней статьи.

Две проблемы:
Сегодня мы заметили не самые лучше результаты по качеству решений рекапчи на google.com, есть две беды
1) Большой процент нераспознанных капч. К сожалению, если работник отказался от решения капчи или у из-за плохой прокси капча у него не прогрузилась полностью, то решена она уже не будет - мы не передадим её другому работнику, т.к. при повторной загрузке она даст 100% невалидный токен.
2) Низкий процент валидныйх токенов (40-60%)


Решение:
С первой проблемой мы пока ничего не можем поделать, но мы полностью возвращаем средства за неразгаданные капчи.
А вот со второй проблемой мы сегодня много воевали и пришли к некоторым выводам:
1) Прокси можно не слать,  но с ними процент корректных токенов выше
2) Куки нужно использовать, но не брать куки нашего работника, а присылать нам куки Вашего парсера, что бы работник решал капчу с ними.

Если слать прокси и куки, то процент валидных токенов поднимается до 100%!
Итак, что нужно дополнительно слать к тому, что было вчера:

1) cookies
 Присылайте капчу с параметром
"cookies" Cтрока. Двоеточие отделяет название куки от содержимого, точка с запятой - разделяет куки.
Пример:
cookies=ANID:AHWqTUkiE1lX;NID:204=SbYHJRGMb4wtUG2


2) Proxy
"proxy" Строка. Формат: логин:пароль@123.123.123.123:3128
"proxytype" Строка. Тип вашего прокси-сервера: HTTP, HTTPS, SOCKS4, SOCKS5.
Пример:
proxy=login:pass@123.123.123.123:3128
proxytype=HTTP

 

 

Важно отметить:
1) Как получить куки от google.com, если я взаимодействую с иным сайтом и парсер не заходил на google.com до момента получения капчи?
Допустим, вы парсите выдачу по домену www.google.sm и у вас нет кук от google.com. Просто перед тем как начать парсить, зайдите на https://google.com и сохраните полученные куки. В момент, когда получите капчу - пришлите нам эти куки.
2) Если у Вас не сработал токен или мы не решили капчу, то нельзя пытаться решить капчу на этой же странице. Вы должны вернуться в поиск и снова получить капчу из поиска. Попытки пройти капчу  на той же странице 100% не закончатся успехом, а IP-адреса будут заблокированы в google


Прямой эфир!
Кстати, вы можете следить за новостями по этой проблеме в "прямом эфире" на форуме:
https://captchaforum.com/threads/google-search-obnovlenie-ot-18-maya-2020.683/#post-1521

Этот сайт использует cookie. Файлы cookie запоминают вас, поэтому мы можем предоставить вам персонализированные услуги. Подробнее.