Обновление по reCAPTCHA на google.com
Обновление информации по поводу reCAPTCHA на google.com
Данная статья является продолжением вчерашней статьи.
Две проблемы
Сегодня мы заметили не самые лучше результаты по качеству решений reCAPTCHA на google.com, есть две беды
- Большой процент нераспознанных капч. К сожалению, если работник отказался от решения капчи или у из-за плохой прокси капча у него не прогрузилась полностью, то решена она уже не будет - мы не передадим её другому работнику, т.к. при повторной загрузке она даст 100% невалидный токен.
- Низкий процент валидныйх токенов (40-60%)
Решение
С первой проблемой мы пока ничего не можем поделать, но мы полностью возвращаем средства за неразгаданные капчи.
А вот со второй проблемой мы сегодня много воевали и пришли к некоторым выводам:
- Прокси можно не слать, но с ними процент корректных токенов выше
- Куки нужно использовать, но не брать куки нашего работника, а присылать нам куки Вашего парсера, что бы работник решал капчу с ними
Если слать прокси и куки, то процент валидных токенов поднимается до 100%!
Итак, что нужно дополнительно слать к тому, что было вчера:
-
cookies
Присылайте капчу с параметром
"cookies" Cтрока. Двоеточие отделяет название куки от содержимого, точка с запятой - разделяет куки.
Пример:
cookies=ANID:AHWqTUkiE1lX;NID:204=SbYHJRGMb4wtUG2 -
Proxy
"proxy" Строка. Формат: логин:пароль@123.123.123.123:3128
"proxytype" Строка. Тип вашего прокси-сервера: HTTP, HTTPS, SOCKS4, SOCKS5.
Пример:
proxy=login:[email protected]:3128
proxytype=HTTP
Важно отметить
- Как получить куки от google.com, если я взаимодействую с иным сайтом и парсер не заходил на google.com до момента получения капчи?
Допустим, вы парсите выдачу по домену www.google.sm и у вас нет кук от google.com. Просто перед тем как начать парсить, зайдите на https://google.com и сохраните полученные куки. В момент, когда получите капчу - пришлите нам эти куки. - Если у Вас не сработал токен или мы не решили капчу, то нельзя пытаться решить капчу на этой же странице. Вы должны вернуться в поиск и снова получить капчу из поиска. Попытки пройти капчу на той же странице 100% не закончатся успехом, а IP-адреса будут заблокированы в google
Прямой эфир!
Кстати, вы можете следить за новостями по этой проблеме в "прямом эфире" на форуме:
https://captchaforum.com/threads/google-search-obnovlenie-ot-18-maya-2020.683/#post-1521