Блог проекта

21
Июнь

ReCaptcha V3 решение

ReCaptcha V3

  Мы уже больше трёх недель занимаемся ReCaptcha V3 и сегодня мы готовы показать Вам наши результаты.

Для начала немного вводной информации:
  Как Вы знаете, ReCaptcha V3 не просит что-либо решить, а лишь даёт сайту информацию о качестве пользователя, который её проходил. И, что особенно важно, у одного пользователя для разных сайтов будет разная оценка. Оценка, которую выдаёт google.com пользователю находится в пределах от 0.1 до 0.9
Мы провели серию экспериментов и выяснили, что если пользователь на каком-либо сайте получает 0.1, то с вероятностью в 90% он такую же оценку получит и на остальных сайтах.

Как устроено решение от RuCaptcha.com:
  Каждому работнику мы даём тестовую капчу и смотрим его score. Когда от заказчика приходит капча с требованием минимального score, то капчу мы выдаём только работникам, score которых подходит под заданный параметр. 80-90% полученных  решений в итоге имеют нужный score на том сайте, где Вы проходите ReCaptcha V3


Как загрузить капчу V3:
Загрузить капчу можно вот таким запросом:
 

Загрузка капчи аналогична  загрузке ReCaptchaV2, но добавляются новые параметры:

version=v3
указывает что это рекапча третьей версии

action=verify
указывает как именно называется action на проходимой странице

min_score=0.3
указывает какой минимальный min_score должен будет получить ответ
 

Цена:
На время тестирования цену поставили такую же как и на ReCaptcha V2


Возврат средств за неработающие токены:
  Тут всё сложнее. Когда заказчик жалуется на обычную графическую капчу, то мы можем решить её ещё раз и понять правильно ли она была решена или нет.
Когда заказчик жалуется на решение ReCaptcha V2, то мы можем посчитать статистику по жалобам на работников, вычислить работника который косячит и вернуть средства за все решения, которые он предоставил всем заказчикам.
  А вот с ReCaptcha V3 ответы одного работника для двух разных сайтов могут быть разными. Для одного сайта у него рейтинг будет 0.1, а для другого 0.5
Что мы делаем:
Помимо стандартной жалобы reportbad
http://rucaptcha.com/res.php?key=YOUR_API_KEY&action=reportbad&id=CAPTCHA_ID
Которую нужно отправлять, если сайт не принял токен, появляется параметр, указывающий что ответ работника подошёл: reportgood
http://rucaptcha.com/res.php?key=YOUR_API_KEY&action=reportgood&id=CAPTCHA_ID
При отправке его, мы добавим работника на некоторое время в WhiteList для Вашего аккаунта и изначально Ваши капчи будут получать работники из Вашего whitelist
  В будущем, скорее всего, мы будем делать возвраты за reportbad только при условии что заказчик шлёт reportgood.
В данный момент возвратов за reportbad нет, но в будущем будут, наверное.


Какой min_score лучше запрашивать?
  Сейчас min_score бывает только трёх вариантов: 0.1, 0.3 и 0.9. Те сайты, которые уже используют ReCaptcha V3 и которые мы протестировали - принимают не только 0.9, но и 0.3; score=0.1 никто из протестированных не принимает. Поэтому мы советуем изначально запрашивать 0.3 и только если более 50% токенов не подходит - тогда запрашивать 0.9. Стоит отметить, что работников, имеющих score 0.3  в два раза больше, чем работников со score 0.9

28
Март

Discount-тарифы на ReCaptcha для биткоин-кранов.

 Недавно мы писали о том, что нам нужно загрузить работников рекапчей. И вот наше решение данной задачи:
  Чтобы у работников было больше работы, мы вводим специальные discount-тарифы на рекапчу для ограниченного списка доменов. Discount-тарифы имеют пониженный приоритет: в случаях, если на сервисе скапливается очередь из рекапч, мы перестаём принимать discount-рекапчу. Таким образом мы собираемся сильно повысить онлайн работников, не повышая при этом цену за рекапчу для основных клиентов.  Отдельно хотим заметить что мы с этих капчи ничего не заработаем, только увеличиваем таким образом онлайн работников, чтобы сервис был более качественным.

28
Март

Почему мы не хотим делать систему приоритетных аккаунтов.

Очень редко, но иногда у нас случаются такие ситуации, когда мы не успеваем решать все приходящие к нам капчи и тогда наш сервис возвращает ERROR_NO_SLOT_AVAILABLE в ответ на загрузку капчи. Особенно это актуально для ReCaptcha V2, с обычными капчами такой проблемы не было уже пару лет.  

Многие наши заказчики просят нас сделать систему приоритетов, когда бы они могли платить повышенную ставку за то что мы бы принимали капчи от них и не принимали бы капчи от других пользователей.  Мы же уверены, что такая система приоритетов сильно навредит сервису: да, мы больше заработаем, но так у нас будет меньше мотивации делать сервис качественным.

Чтобы решать больше капч нужно иметь больше работников онлайн, а чем больше работников онлайн, тем меньше каждому из работников достаётся капчи и всё дольше им приходится ждать получения очередного задания.  А чем дольше работники ждут новое задание, тем меньше работников онлайн. Поэтому единственный способ увеличить работников онлайн - дать им больше работы.

В течении суток мы опубликуем новость о том, как мы собираемся увеличить объём рекапчи для работников и тем самым увеличить количество работников онлайн.

 

27
Март

Цена на "большие капчи" снижена до цены стандартной капчи

Мы понижаем стоимость на "Большие" капчи до уровня простых капч.


У нас было правило, согласно которому, "если сумма высоты и ширины капчи больше или равна 400 пикселям, то стоимость распознания 1000 таких капч - 50 рублей". Данное правило было введено в связи с тем, что именно такой размер имеют капчи типа SolveMedia, а их тяжело разгадывать нашим работникам. Для примера свежие образцы такой капчи:
   


Сегодня (на самом деле 2 недели назад) мы приравняли "Большие" капчи к обычным капчам. Цена  на них будет от 18 до 44 рублей за 1000 решений в зависимости от текущей загрузки сервиса.

Для работников вознаграждение за распознание такой капчи остаётся повышенной.

08
Февраль

100% распознавание. Как правильно настроить и сколько это стоит.

“100% распознавание”. Как правильно настроить и сколько это стоит.

В нашем сервисе есть функционал “100% распознавания”, его название мы всегда пишем в кавычках, т.к. это, на самом деле, не гарантированное 100% решение капч.

Пожалуйста, прочтите эту статью ДО того, как включить режим “100% распознавания”. Неправильные настройки могут привести к остановке расшифровки капч  или чрезмерной трате средств на Вашем аккаунте.

При включении “100% распознавания” каждую Вашу капчу будут решать несколько человек и за каждое решение одним человеком мы списываем как за решение 1 капчи. Т.е. если Вашу капчу решали двое работников, то с баланса спишется как за 2 капчи. В большинстве случаев включение режима “100% распознавания” не имеет смысла. Если капча распознана неверно - Вы просто пришлёте жалобу на неё и новую капчу, после чего работники сервиса перепроверят решение и средства вернутся (если капча действительно была разгадана неверно), а новая капча распознается скорее всего верно. Поэтому включайте этот режим только если он Вам действительно нужен

20
Июль

Рукапча для Zennoposter'а

Команда ZennoArt подготовила хороший текст по работе с РуКапчей в Зеннопостере при решении рекапчи и мы решили опубликовать его у нас, дабы те, кто работает с ЗенноПостером могли обращаться к статье как к инструкции.
 
 

10
Март

Как обойти Invisible ReCaptcha при помощи капча-сервиса

Не так давно Google дополнил функционал капчи ReCaptcha v2 невидимой капчей.
Её образец можно увидеть по ссылке:
https://www.google.com/recaptcha/api2/demo?invisible=true

Теперь пользователю зачастую даже не нужно нажимать галочку “я не робот”, сама капча появляется в невидимом слое, дополнительно смещённым на 10 000 px выше начала страницы и не видна пользователю.  Прохождение капчи запускается только в момент отправки формы. Если куки пользователя хорошие, то он даже не заметит, что капча была. Если куки не очень хорошие, то при отправке формы он тут же получит по центру экрана стандартную рекапчу, где нужно выбрать несколько изображений.

19
Октябрь

Новый функционал: ответы на текстовые вопросы \ текстовые капчи

В работу введены два новыйх метода:
textinstructions=%TEXT%
Текст, который будет показан работнику. Может содержать в себе инструкции по разгадке капчи. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.
textcaptcha=%TEXT%
Текстовая капча. Картинка при этом не загружается вообще, работник получает только текст и вводит ответ на этот текст. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.

 

Теперь Вы можете присылать в сервис короткие текста с вопросом, а работники по возможности будут на них отвечать.

В данный момент мы уже столкнулись с рядом проблем по этим методам.
1) Языки. Часть вопросов приходит на Испанском, Французском и других языках. Но несмотря на то, что есть работники говорящие на этом языке, мы о них не знаем и показываем задачу случайному работнику.
2) Необходимость "гуглить" что бы ответить на вопрос.
В случае, если данные методы будут востребованы и будут пользоваться спросом, мы выпустим дополнения к этим методам, повышающим стоимость распознавания и правильность распознавания.

07
Сентябрь

Автоматизация распознания кассовых чеков

Мы специализируемся на распознании капч, таких маленьких надоедливых картинок с  текстом. У нас на сервере постоянно находится от 300 до 1000 работников, которые в режиме реального времени разбирают все поступающие картинки за 4-10 секунд. Распознание текста с чека похоже на распознание капчи, но распознание информации с кассовых чеков мы выделили в отдельный инструмент: все данные раскладываются в свои поля, проводится валидация ИНН и каждое распознание проверяется модераторами.

Какие данные вернёт сервер:


ИНН магазина: 007327067461
Дата продажи: 2015-09-06
ОПЛАЧЕНО (с учётом скидок): 262.600

Товары (артикул/количество/общая стоимость)
64860 | молоко нежвозр 3,2% 950г д/дет | 3.000 | 111.000
3442 | сайра натур.245г морскаярадуга | 1.000 | 43.500
63597 | сыр костромской 45% кошкинское | 0.398 | 79.200
76405 | козинак подсолнеч.тимоша | 0.372 | 28.980

 

Общая схема распознания чека:
1) Вы загружаете изображение чека и получаете ID
2) Случайный работник получает чек и вводит данные с него
3) 2 случайных работника проводят проверку введённых данных
4) Вы по ID обращаетесь к серверу за результатом распознания
Образец ответа сервера: txt дока тут

API загрузки чека и получения ответа:

Адрес загрузки чека: http://rucaptcha.com/in_invoice.php
Адрес получения ответа: http://rucaptcha.com/res_invoice.php

 

Загрузка чека:


Загрузка чека возможна в двух форматах:
multipart и base64

 

Пример загрузки в формате multipart:

<form method="post" action="http://rucaptcha.com/in_invoice.php" enctype="multipart/form-data">
<input type="hidden" name="method" value="post">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Файл капчи:
<input type="file" name="file">
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут

Пример загрузки капчи в формате base64:

<form method="post" action="http://rucaptcha.com/in_invoice.php">
<input type="hidden" name="method" value="base64">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Тело файла капчи закодированное в base64:
<textarea name="body">BASE64_FILE</textarea>
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут
BASE64_FILE - Тело файла закодированное в base64. Не забудьте дополнительно закодировать тело в URLEncode, иначе тело картинки придет битым.
 

В ответ на загрузку чека система вернёт:
OK|123
Где 123 - ID чека в системе, к которому потом нужно будет обратиться за ответом, а OK - означает успешную загрузку.
 

Получение ответа на чек:

Ответ на чек получается GET-запросом:

http://rucaptcha.com/res_invoice.php?key=YOUR_APIKEY&action=get&id=ID
YOUR_APIKEY - Ваш KEY, длинной 32 символа, взять тут
ID - ID ранее загруженного чека

Ответ приходит в формате JSON

Запрашивать отвте на чек следует через минуту с момента загрузки. В случае, если ответ ещё не готов, следует повторять запрос через каждые 10-30 секунд.

 

Стоимость распознания чеков

В данный момент стоимость распознавания весьма низка, всего 3 рубля 57 копеек за 1000 символов в ответе
Стоимость распознания чека из образца выше - 0,741 рубля (74 копейки)

 

Если у Вас возникли сложности с интеграцией или какие-либо вопросы, свяжитесь с нами через поддержку или по телефону +7 (495) 215-19-11

30
Апрель

Распознавание ReCaptcha, выберите изображения похожие на

Не так давно у знаменитой своими зверствами рекапчи появился новый тип капчи, где нужно указать изображения, похожие на что-либо.
Мы, как всегда, оперативно готовы к новым типам капчи.
Если прислать нам вот такую картинку, с дополнительным параметром

id_constructor=23


То наши работники внимательно изучат каждое изображение и укажут по каким картинкам нужно будет кликнуть.
Формат ответа:
OK|click:3/8/9/

Что означает, что для правильного ответа нужно кликнуть на 3, 8 и 9 картинки

Стоимость распознавания 1000 подобных капч - 90 рублей.
А вот так выглядит интерфейс работника:

 

Если у Вас есть потребности в аналогичных конструкторах - свяжитесь с поддержкой.

23
Июль

Распознание оцифрованных анкет

RuCaptcha это не только расшифровка капч. Но и оцифровка всевозможных бланков, анкет и опросных листов.
Вы можете самостоятельно создавать шаблоны, по которым будут распознаваться Ваше изображение.

 

Допустим, у Вас есть огромное количество опросных листков вот такого вида:

Вы в интерфейсе сервиса rucaptcha.com создаёте шаблон, в котором указываете в каких полях нужно вписать ответ, в каких выбрать ответ из существующих, а какие поля предствалены чекбоксом. После чего, Вы посредством нашего API присылаете нам эти изображения, с указанием по какому шаблону их распознавать. У работника открывается изображение и поля для заполнения\выбора ответа\чекбоксы.

Пример интерфейса работника по этому изображению:

В ответ на загруженное изображение сервер вернём Вам ID загруженного изображения. Через 20-30 секунд к серверу можно обратиться за ответом на этот ID, если ответ ещё не готов, попытку можно повторить через пару секунд. Изображения можно загружать в несколько потоков. В данный момент сервер способен распознавать примерно 3000 таких изображений в минуту.

Пример ответа сервера на изображение выше:
num:141070|amiability:5|competence:4|exterior:5|reklam:Посоветовали знакомые/Из интернета/|frequency:Раз в год|sex:муж|date:16.08.1985
num, amiability, competence - обозначают соответсвующие поля и задаются в шаблоне. Значения после двоеточий - ответы работников.

Стоимость одного распознавания, формируется исходя из количества и типов полей для заполнения. Т.к. сейчас идёт тестирование и обкатка функционала, окончательную стоимость мы сказать пока не можем. Ориентировочная стоимость за распознание изображения из примера - 40 копеек. Если у Вас есть желание использовать этот функционал, свяжитесь с  нами по email: support@rucaptcha.com или телефону +7 (495) 215-19-11, мы предоставим Вам доступ к конструктору шаблонов и предоставим баланс для тестирования функционала.

А пока, для тестирования функционала, мы предоставили своего рода "игрушку", куда Вы можете загрузить визитную карточку, и через пол минуты получить её расшифровку.

16
Июль

Тестирование увеличение цены за длинные капчи

В нашем сервисе есть некоторая проблема, которую мы хотим решить, но как именно она будет решена мы пока не знаем.
Дело в том, что вот такие капчи:

И вот такие:

Сейчас стоят у нас одинаково. И работники, естественно, уже очень давно возмущаются такой несправедливости. Ведь на вторую капчу тратишь времени в 2-3 раза больше.
На днях мы опробуем систему увеличения цена за большое кол-во символов в капче. По правилу:
Количество символов в ответе <= 8, стоимость распознания страндартная
Количество сиволов в ответе >8 и <=16, стоимость распознавания увеличена в 2 раза
Количество сиволов в ответе >16, стоимость распознавания увеличена в 3 раза

08
Июль

Разгрузка системы от кривых капч.

 

Иногда случается у вебмастеров беда - когда софт вместо нормальной капчи начинает получать что-то не то и шлёт это нам. Всякое бывает:
Например Google заблокировал по IP и вместо капчи отдаёт такое:

Например Google заблокировал по IP и вместо капчи отдаёт такое
Или что-то пошло не так

Или это капча, но совершенно непонятно как на неё отвечать, а вебмастер шлёт и шлёт её

 

Что бы избавить работников от неоплачиваемой работы, мы стали хешировать все входящие капчи и записывать хеши тех капч, на которые мы не дали ответ больше двух раз в течении часа. Такая капча банится на ближайший час. Модераторы периодически смотрят список заблокированных капч и некоторые вносят в вечный бан.

И сейчас, если приходит забаненная капча, мы сразу же отдаём ответ ERROR_CAPTCHA_UNSOLVABLE

Тем самым, мы повышаем качество и скорость работы сервиса.

01
Июль

Защита ключа от подбора.

Т.к. в интернете есть множество софта для подбора ключей к антикапче. И есть множество сайтов с продажей ключей от антикапчи, то мы ввели ограничение на кол-во обращений с неправильными ключами.

Если с одного IP пришло больше 5 обращений с разными, неверными ключами, то IP банится на 1 час, и при попытке прислать изображение  на распознание или проверить баланс, мы отдаём IP_BANNED
Помимо этого, Вы можете настроить с каких IP-адресов могут поступать обращение с Вашим ключом. Что 100% защитит Вас от кражи ключа.

В данный момент наш сервис  уже занимает 40% рынка антикапчи в России, а объявлений о продаже ключей  от нашего сервиса мы досих пор не находили. Значит, мы всё делаем правильно.