Блог проекта rucaptcha.com

Опубликованно: 2017-03-10 14:55:11

 

Не так давно Google дополнил функционал капчи ReCaptcha v2 невидимой капчей.
Её образец можно увидеть по ссылке:
https://www.google.com/recaptcha/api2/demo?invisible=true

Теперь пользователю зачастую даже не нужно нажимать галочку “я не робот”, сама капча появляется в невидимом слое, дополнительно смещённым на 10 000 px выше начала страницы и не видна пользователю.  Прохождение капчи запускается только в момент отправки формы. Если куки пользователя хорошие, то он даже не заметит, что капча была. Если куки не очень хорошие, то при отправке формы он тут же получит по центру экрана стандартную рекапчу, где нужно выбрать несколько изображений.

Читать

Опубликованно: 2015-10-19 15:19:13

 

В работу введены два новыйх метода:
textinstructions=%TEXT%
Текст, который будет показан работнику. Может содержать в себе инструкции по разгадке капчи. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.
textcaptcha=%TEXT%
Текстовая капча. Картинка при этом не загружается вообще, работник получает только текст и вводит ответ на этот текст. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.

 

Теперь Вы можете присылать в сервис короткие текста с вопросом, а работники по возможности будут на них отвечать.

В данный момент мы уже столкнулись с рядом проблем по этим методам.
1) Языки. Часть вопросов приходит на Испанском, Французском и других языках. Но несмотря на то, что есть работники говорящие на этом языке, мы о них не знаем и показываем задачу случайному работнику.
2) Необходимость "гуглить" что бы ответить на вопрос.
В случае, если данные методы будут востребованы и будут пользоваться спросом, мы выпустим дополнения к этим методам, повышающим стоимость распознавания и правильность распознавания.

Читать

Опубликованно: 2015-09-07 18:38:19

 

Мы специализируемся на распознании капч, таких маленьких надоедливых картинок с  текстом. У нас на сервере постоянно находится от 300 до 1000 работников, которые в режиме реального времени разбирают все поступающие картинки за 4-10 секунд. Распознание текста с чека похоже на распознание капчи, но распознание информации с кассовых чеков мы выделили в отдельный инструмент: все данные раскладываются в свои поля, проводится валидация ИНН и каждое распознание проверяется модераторами.

Какие данные вернёт сервер:


ИНН магазина: 007327067461
Дата продажи: 2015-09-06
ОПЛАЧЕНО (с учётом скидок): 262.600

Товары (артикул/количество/общая стоимость)
64860 | молоко нежвозр 3,2% 950г д/дет | 3.000 | 111.000
3442 | сайра натур.245г морскаярадуга | 1.000 | 43.500
63597 | сыр костромской 45% кошкинское | 0.398 | 79.200
76405 | козинак подсолнеч.тимоша | 0.372 | 28.980

 

Общая схема распознания чека:
1) Вы загружаете изображение чека и получаете ID
2) Случайный работник получает чек и вводит данные с него
3) 2 случайных работника проводят проверку введённых данных
4) Вы по ID обращаетесь к серверу за результатом распознания
Образец ответа сервера: txt дока тут

API загрузки чека и получения ответа:

Адрес загрузки чека: http://rucaptcha.com/in_invoice.php
Адрес получения ответа: http://rucaptcha.com/res_invoice.php

 

Загрузка чека:


Загрузка чека возможна в двух форматах:
multipart и base64

 

Пример загрузки в формате multipart:

<form method="post" action="http://rucaptcha.com/in_invoice.php" enctype="multipart/form-data">
<input type="hidden" name="method" value="post">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Файл капчи:
<input type="file" name="file">
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут

Пример загрузки капчи в формате base64:

<form method="post" action="http://rucaptcha.com/in_invoice.php">
<input type="hidden" name="method" value="base64">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Тело файла капчи закодированное в base64:
<textarea name="body">BASE64_FILE</textarea>
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут
BASE64_FILE - Тело файла закодированное в base64. Не забудьте дополнительно закодировать тело в URLEncode, иначе тело картинки придет битым.
 

В ответ на загрузку чека система вернёт:
OK|123
Где 123 - ID чека в системе, к которому потом нужно будет обратиться за ответом, а OK - означает успешную загрузку.
 

Получение ответа на чек:

Ответ на чек получается GET-запросом:

http://rucaptcha.com/res_invoice.php?key=YOUR_APIKEY&action=get&id=ID
YOUR_APIKEY - Ваш KEY, длинной 32 символа, взять тут
ID - ID ранее загруженного чека

Ответ приходит в формате JSON

Запрашивать отвте на чек следует через минуту с момента загрузки. В случае, если ответ ещё не готов, следует повторять запрос через каждые 10-30 секунд.

 

Стоимость распознания чеков

В данный момент стоимость распознавания весьма низка, всего 3 рубля 57 копеек за 1000 символов в ответе
Стоимость распознания чека из образца выше - 0,741 рубля (74 копейки)

 

Если у Вас возникли сложности с интеграцией или какие-либо вопросы, свяжитесь с нами через поддержку или по телефону +7 (495) 215-19-11

Читать

Опубликованно: 2015-04-30 14:59:33

 

Не так давно у знаменитой своими зверствами рекапчи появился новый тип капчи, где нужно указать изображения, похожие на что-либо.
Мы, как всегда, оперативно готовы к новым типам капчи.
Если прислать нам вот такую картинку, с дополнительным параметром

id_constructor=23


То наши работники внимательно изучат каждое изображение и укажут по каким картинкам нужно будет кликнуть.
Формат ответа:
OK|click:3/8/9/

Что означает, что для правильного ответа нужно кликнуть на 3, 8 и 9 картинки

Стоимость распознавания 1000 подобных капч - 90 рублей.
А вот так выглядит интерфейс работника:

 

Если у Вас есть потребности в аналогичных конструкторах - свяжитесь с поддержкой.

Читать

Опубликованно: 2014-07-23 19:43:06

 

RuCaptcha это не только расшифровка капч. Но и оцифровка всевозможных бланков, анкет и опросных листов.
Вы можете самостоятельно создавать шаблоны, по которым будут распознаваться Ваше изображение.

 

Допустим, у Вас есть огромное количество опросных листков вот такого вида:

Вы в интерфейсе сервиса rucaptcha.com создаёте шаблон, в котором указываете в каких полях нужно вписать ответ, в каких выбрать ответ из существующих, а какие поля предствалены чекбоксом. После чего, Вы посредством нашего API присылаете нам эти изображения, с указанием по какому шаблону их распознавать. У работника открывается изображение и поля для заполнения\выбора ответа\чекбоксы.

Пример интерфейса работника по этому изображению:

В ответ на загруженное изображение сервер вернём Вам ID загруженного изображения. Через 20-30 секунд к серверу можно обратиться за ответом на этот ID, если ответ ещё не готов, попытку можно повторить через пару секунд. Изображения можно загружать в несколько потоков. В данный момент сервер способен распознавать примерно 3000 таких изображений в минуту.

Пример ответа сервера на изображение выше:
num:141070|amiability:5|competence:4|exterior:5|reklam:Посоветовали знакомые/Из интернета/|frequency:Раз в год|sex:муж|date:16.08.1985
num, amiability, competence - обозначают соответсвующие поля и задаются в шаблоне. Значения после двоеточий - ответы работников.

Стоимость одного распознавания, формируется исходя из количества и типов полей для заполнения. Т.к. сейчас идёт тестирование и обкатка функционала, окончательную стоимость мы сказать пока не можем. Ориентировочная стоимость за распознание изображения из примера - 40 копеек. Если у Вас есть желание использовать этот функционал, свяжитесь с  нами по email: support@rucaptcha.com или телефону +7 (495) 215-19-11, мы предоставим Вам доступ к конструктору шаблонов и предоставим баланс для тестирования функционала.

А пока, для тестирования функционала, мы предоставили своего рода "игрушку", куда Вы можете загрузить визитную карточку, и через пол минуты получить её расшифровку.

Читать

Опубликованно: 2014-07-16 11:31:56

 

В нашем сервисе есть некоторая проблема, которую мы хотим решить, но как именно она будет решена мы пока не знаем.
Дело в том, что вот такие капчи:

И вот такие:

Сейчас стоят у нас одинаково. И работники, естественно, уже очень давно возмущаются такой несправедливости. Ведь на вторую капчу тратишь времени в 2-3 раза больше.
На днях мы опробуем систему увеличения цена за большое кол-во символов в капче. По правилу:
Количество символов в ответе <= 8, стоимость распознания страндартная
Количество сиволов в ответе >8 и <=16, стоимость распознавания увеличена в 2 раза
Количество сиволов в ответе >16, стоимость распознавания увеличена в 3 раза

Читать

Опубликованно: 2014-07-08 22:07:56

 

 

Иногда случается у вебмастеров беда - когда софт вместо нормальной капчи начинает получать что-то не то и шлёт это нам. Всякое бывает:
Например Google заблокировал по IP и вместо капчи отдаёт такое:

Например Google заблокировал по IP и вместо капчи отдаёт такое
Или что-то пошло не так

Или это капча, но совершенно непонятно как на неё отвечать, а вебмастер шлёт и шлёт её

 

Что бы избавить работников от неоплачиваемой работы, мы стали хешировать все входящие капчи и записывать хеши тех капч, на которые мы не дали ответ больше двух раз в течении часа. Такая капча банится на ближайший час. Модераторы периодически смотрят список заблокированных капч и некоторые вносят в вечный бан.

И сейчас, если приходит забаненная капча, мы сразу же отдаём ответ ERROR_CAPTCHA_UNSOLVABLE

Тем самым, мы повышаем качество и скорость работы сервиса.

Читать

Опубликованно: 2014-07-01 22:21:37

 

Т.к. в интернете есть множество софта для подбора ключей к антикапче. И есть множество сайтов с продажей ключей от антикапчи, то мы ввели ограничение на кол-во обращений с неправильными ключами.

Если с одного IP пришло больше 5 обращений с разными, неверными ключами, то IP банится на 1 час, и при попытке прислать изображение  на распознание или проверить баланс, мы отдаём IP_BANNED
Помимо этого, Вы можете настроить с каких IP-адресов могут поступать обращение с Вашим ключом. Что 100% защитит Вас от кражи ключа.

В данный момент наш сервис  уже занимает 40% рынка антикапчи в России, а объявлений о продаже ключей  от нашего сервиса мы досих пор не находили. Значит, мы всё делаем правильно.

 

Читать