Блог проекта

13
Август

Google не принимает часть ответов на ReCaptcha

Описание проблемы

  В начале июля несколько клиентов, независимо друг от друга, пожаловалась нам о том что часть токенов для прохождения ReCaptcha, которые они получают от нас, не принимается сайтами, где проходится капча. Мы провели ряд экспериментов и выявили, что при верификации ответа на ReCaptcha, Google.com может вернуть вот такую ошибку:

{"success":false,"error-codes":["incorrect-captcha-sol"]}

 

  Этой проблеме подвержен не только наш сервис решения капч RuCaptcha.com, но и обычные люди, которые проходят рекапчу на каком-либо сайте, но сайт не принимает ответ на капчу от них.

В API ReCaptcha нет описания данной ошибки. Доподлинно нам не известны её причины, но некоторые зависимости мы смогли найти.

 

От чего зависит получение incorrect-captcha-sol

Появление incorrect-captcha-sol, по нашим наблюдениям, происходит по двум факторам:


1) Очень плохой IP
У Google, видимо, есть рейтинг для каждого IP-адреса. Если Вы решаете ReCaptcha без ошибок и не более 50 капч в сутки, то этот IP будет считаться хорошим.
Если Вы делаете что либо из этого списка:

  • совершаете много ошибок при решении

  • открываете капчу но не прорешиваете её до конца

  • решаете больше двух капч в минуту

То Ваш IP либо банится вообще, либо начинает получать такие токены, которые при дальнейшей проверке получают incorrect-captcha-sol

2) Плохие cookie
Помимо рейтинга IP, у Google есть рейтинг пользователей. Каждому, кто заходил на google.com или на страницу с установленной ReCaptcha, присваиваются свои cookie. Google анализирует Ваши действия в сети и оценивает насколько Вы похожи на живого человека или на робота. Если пользователь с одним набором cookie целый день решает капчи, даже если это делается с разных IP, то это, скорее всего, робот и такой пользователь будет решать капчи до зелёной галочки, но при дальнейшей проверке его ответа Google будет возвращать
{"success":false,"error-codes":["incorrect-captcha-sol"]}
Самое обидной в этом то, что при авторизации в гугловом почтовике gmail.com, Google проассоциирует Вас с Вашими прошлыми действиями и, если хоть один раз в прошлом посчитал Вас роботом, то теперь у Вас в 3 из 4 случаев не будет приниматься решение ReCaptcha.
 

Как RuCaptcha борется с incorrect-captcha-sol

 Для снижения количества “плохих” токенов  в ответах на капчи заказчиков, мы регулярно чистим куки в приложении работников, а также следим за качеством IP-адресов работников. Про это расскажем чуть подробнее.

 Да, некоторая часть наших работников имеет “очень плохие” IP-адреса, решая с которых ReCaptcha они получают токены, которые при последующей верификации получают incorrect-captcha-sol. Для борьбы с этим, мы раз в час выдаём тестовую ReCaptcha для каждого уникального IP-адреса и верифицируем ответ на неё в google.com. Если мы получили  incorrect-captcha-sol, то мы перестаём выдавать капчи для решения с этого IP и данный пользователь может решать капчи только через прокси (прокси, в свою очередь, также регулярно проверяются).

 Таким образом мы снижаем процент “плохих” ответов до 1-3%. К сожалению, прошли те времена, когда мы с гордостью говорили, что все 100% ответов на ReCaptcha от нашего сервиса верные.

 

Возвраты за плохие решения

С июля мы включили приём reportbad на ReCaptcha. Поэтому для сокращения издержек на капчу, Вы можете настроить автоматическое уведомление нас о том, что полученный от нас токен не прошёл верификацию, как это сделать описано у нас в API\Reportbad.

Каждый час мы собираем статистику по жалобам на работников и возвращаем средства за те капчи, которые были разгаданы "плохим" работником.


 

Похоже, гугл считает мой IP\куку плохим. Я нигде не могу пройти капчу, что мне делать?

Да, множество простых людей столкнулись с проблемой, что они не могут пройти авторизацию\регистрацию на сайтах, где установлена ReCaptcha. Что с этим делать мы расскажем в следующей новости. Следите за обновлениями на нашем блоге!

03
Июль

Автозаработок на капче

Хорошая новость для работников!
Теперь на RuCaptcha.com можно зарабатывать ничего при этом не делая. Достаточно лишь один раз скачать последнюю версию нашего клиента RuCaptchaBot-X, запустить её и указать свой API KEY для авторизации в программе (взять его можно на  странице програмы
После авторизации программа подумает десяток секунд и в нижнем левом углу появится значение "Score".
Если Score будет 0.9  это означает что Вы счасливчик. Score 0.9 получают лишь 5% работников. Всё что Вам нужно - оставить программу запущенной и подключенной к интернету и она будет зарабатывать сама.
Если Score будет 0.3 или Выше - всё ещё можно считать себя счастливчиком. Вы будете зарабатывать меньше, чем те у кого score 0.9, но всё равно запущенная программа будет работать и приносить доход.
Если Score будет 0.1  значит, к сожалению, Вы оказались в большинстве (у 91% работников score=0.1). При  score = 0.1 программа не будет зарабатывать сама, можно её выключать или нажать на старт и начать зарабатывать, вводя капчу.


От чего зависит Score и зачем это вообще нужно
Score это оценка Вашего IP-адреса в сервисе ReCaptcha (rEcaptcha, не rUcaptcha). Если Ваш score выше 0.1, то мы присылаем Вам задачи от recaptcha, программа их решает без Вашего участия и присылает нам ответ на них. За это Вам и начисляется баланс.


Как повысить Score?
Честно говоря - мы не знаем. В основе score лежит IP-адрес Вашего компьютера. Возможно, если он поменяется, то score станет лучше. Иногда помогает перезагрузка модема, иногда помогает переключение на мобильный интернет.


Сколько можно заработать со score 0.3 или 0.9
Пока у нас мало заказчиков, кому нужно решать задания от recaptcha. И те работники, кто имеют score 0.3 зарабатывают от 50 до 150 рублей за 24 часа. Но в любой момент заказчиков может стать больше и Вы будете зарабатывать больше.


Что делать, если score = 0.1 и смена IP не помогает?
Вам остаётся только зарабатывать на решении обычных ReCaptcha, где нужно выбирать картинки, и надеяться, что Score повыситься сам собой.

21
Июнь

ReCaptcha V3 решение

ReCaptcha V3

  Мы уже больше трёх недель занимаемся ReCaptcha V3 и сегодня мы готовы показать Вам наши результаты.

Для начала немного вводной информации:
  Как Вы знаете, ReCaptcha V3 не просит что-либо решить, а лишь даёт сайту информацию о качестве пользователя, который её проходил. И, что особенно важно, у одного пользователя для разных сайтов будет разная оценка. Оценка, которую выдаёт google.com пользователю находится в пределах от 0.1 до 0.9
Мы провели серию экспериментов и выяснили, что если пользователь на каком-либо сайте получает 0.1, то с вероятностью в 90% он такую же оценку получит и на остальных сайтах.

Как устроено решение от RuCaptcha.com:
  Каждому работнику мы даём тестовую капчу и смотрим его score. Когда от заказчика приходит капча с требованием минимального score, то капчу мы выдаём только работникам, score которых подходит под заданный параметр. 80-90% полученных  решений в итоге имеют нужный score на том сайте, где Вы проходите ReCaptcha V3


Как загрузить капчу V3:
Загрузить капчу можно вот таким запросом:
 

Загрузка капчи аналогична  загрузке ReCaptchaV2, но добавляются новые параметры:

version=v3
указывает что это рекапча третьей версии

action=verify
указывает как именно называется action на проходимой странице

min_score=0.3
указывает какой минимальный min_score должен будет получить ответ
 

Цена:
На время тестирования цену поставили такую же как и на ReCaptcha V2


Возврат средств за неработающие токены:
  Тут всё сложнее. Когда заказчик жалуется на обычную графическую капчу, то мы можем решить её ещё раз и понять правильно ли она была решена или нет.
Когда заказчик жалуется на решение ReCaptcha V2, то мы можем посчитать статистику по жалобам на работников, вычислить работника который косячит и вернуть средства за все решения, которые он предоставил всем заказчикам.
  А вот с ReCaptcha V3 ответы одного работника для двух разных сайтов могут быть разными. Для одного сайта у него рейтинг будет 0.1, а для другого 0.5
Что мы делаем:
Помимо стандартной жалобы reportbad
http://rucaptcha.com/res.php?key=YOUR_API_KEY&action=reportbad&id=CAPTCHA_ID
Которую нужно отправлять, если сайт не принял токен, появляется параметр, указывающий что ответ работника подошёл: reportgood
http://rucaptcha.com/res.php?key=YOUR_API_KEY&action=reportgood&id=CAPTCHA_ID
При отправке его, мы добавим работника на некоторое время в WhiteList для Вашего аккаунта и изначально Ваши капчи будут получать работники из Вашего whitelist
  В будущем, скорее всего, мы будем делать возвраты за reportbad только при условии что заказчик шлёт reportgood.
В данный момент возвратов за reportbad нет, но в будущем будут, наверное.


Какой min_score лучше запрашивать?
  Сейчас min_score бывает только трёх вариантов: 0.1, 0.3 и 0.9. Те сайты, которые уже используют ReCaptcha V3 и которые мы протестировали - принимают не только 0.9, но и 0.3; score=0.1 никто из протестированных не принимает. Поэтому мы советуем изначально запрашивать 0.3 и только если более 50% токенов не подходит - тогда запрашивать 0.9. Стоит отметить, что работников, имеющих score 0.3  в два раза больше, чем работников со score 0.9

28
Март

Discount-тарифы на ReCaptcha для биткоин-кранов.

 Недавно мы писали о том, что нам нужно загрузить работников рекапчей. И вот наше решение данной задачи:
  Чтобы у работников было больше работы, мы вводим специальные discount-тарифы на рекапчу для ограниченного списка доменов. Discount-тарифы имеют пониженный приоритет: в случаях, если на сервисе скапливается очередь из рекапч, мы перестаём принимать discount-рекапчу. Таким образом мы собираемся сильно повысить онлайн работников, не повышая при этом цену за рекапчу для основных клиентов.  Отдельно хотим заметить что мы с этих капчи ничего не заработаем, только увеличиваем таким образом онлайн работников, чтобы сервис был более качественным.

28
Март

Почему мы не хотим делать систему приоритетных аккаунтов.

Очень редко, но иногда у нас случаются такие ситуации, когда мы не успеваем решать все приходящие к нам капчи и тогда наш сервис возвращает ERROR_NO_SLOT_AVAILABLE в ответ на загрузку капчи. Особенно это актуально для ReCaptcha V2, с обычными капчами такой проблемы не было уже пару лет.  

Многие наши заказчики просят нас сделать систему приоритетов, когда бы они могли платить повышенную ставку за то что мы бы принимали капчи от них и не принимали бы капчи от других пользователей.  Мы же уверены, что такая система приоритетов сильно навредит сервису: да, мы больше заработаем, но так у нас будет меньше мотивации делать сервис качественным.

Чтобы решать больше капч нужно иметь больше работников онлайн, а чем больше работников онлайн, тем меньше каждому из работников достаётся капчи и всё дольше им приходится ждать получения очередного задания.  А чем дольше работники ждут новое задание, тем меньше работников онлайн. Поэтому единственный способ увеличить работников онлайн - дать им больше работы.

В течении суток мы опубликуем новость о том, как мы собираемся увеличить объём рекапчи для работников и тем самым увеличить количество работников онлайн.

 

27
Март

Цена на "большие капчи" снижена до цены стандартной капчи

Мы понижаем стоимость на "Большие" капчи до уровня простых капч.


У нас было правило, согласно которому, "если сумма высоты и ширины капчи больше или равна 400 пикселям, то стоимость распознания 1000 таких капч - 50 рублей". Данное правило было введено в связи с тем, что именно такой размер имеют капчи типа SolveMedia, а их тяжело разгадывать нашим работникам. Для примера свежие образцы такой капчи:
   


Сегодня (на самом деле 2 недели назад) мы приравняли "Большие" капчи к обычным капчам. Цена  на них будет от 18 до 44 рублей за 1000 решений в зависимости от текущей загрузки сервиса.

Для работников вознаграждение за распознание такой капчи остаётся повышенной.

05
Март

Увеличение скорости распознавания капч-картинок

Один из заказчиков исследовал нестандартное использование нашего сервиса  и написал по нашей просьбе статью о своём исследовании. Приводим её как есть:
Недавно рукапча опубликовала статью https://rucaptcha.com/blog/for_webmaster/100percent о том, как работает их “100% распознавание”. Если посмотреть на логику работы этого алгоритма, то можно заметить, что при помощи него можно повышать скорость распознавания, что особенно актуально при работе с решением капч “solve media”.

Если поставить в настройках
Минимальное количество попыток = 2
Минимальное количество совпадений = 1


То капча будет выдана сразу двум работникам и как только кто-то из них ответит, его ответ сразу же будет отдан нам.
Для меня важно получить ответ как можно быстрее, поэтому я решил провести тестирование, поможет ли использование “100% распознавания” в ускорении решения капчи и не приведёт ли это к падению качества распознавания

08
Февраль

100% распознавание. Как правильно настроить и сколько это стоит.

“100% распознавание”. Как правильно настроить и сколько это стоит.

В нашем сервисе есть функционал “100% распознавания”, его название мы всегда пишем в кавычках, т.к. это, на самом деле, не гарантированное 100% решение капч.

Пожалуйста, прочтите эту статью ДО того, как включить режим “100% распознавания”. Неправильные настройки могут привести к остановке расшифровки капч  или чрезмерной трате средств на Вашем аккаунте.

При включении “100% распознавания” каждую Вашу капчу будут решать несколько человек и за каждое решение одним человеком мы списываем как за решение 1 капчи. Т.е. если Вашу капчу решали двое работников, то с баланса спишется как за 2 капчи. В большинстве случаев включение режима “100% распознавания” не имеет смысла. Если капча распознана неверно - Вы просто пришлёте жалобу на неё и новую капчу, после чего работники сервиса перепроверят решение и средства вернутся (если капча действительно была разгадана неверно), а новая капча распознается скорее всего верно. Поэтому включайте этот режим только если он Вам действительно нужен