Блог проекта rucaptcha.com

Опубликованно: 2015-10-19 15:19:13

 

В работу введены два новыйх метода:
textinstructions=%TEXT%
Текст, который будет показан работнику. Может содержать в себе инструкции по разгадке капчи. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.
textcaptcha=%TEXT%
Текстовая капча. Картинка при этом не загружается вообще, работник получает только текст и вводит ответ на этот текст. Ограничение - 140 символов. Текст необходимо слать в кодировке UTF-8.

 

Теперь Вы можете присылать в сервис короткие текста с вопросом, а работники по возможности будут на них отвечать.

В данный момент мы уже столкнулись с рядом проблем по этим методам.
1) Языки. Часть вопросов приходит на Испанском, Французском и других языках. Но несмотря на то, что есть работники говорящие на этом языке, мы о них не знаем и показываем задачу случайному работнику.
2) Необходимость "гуглить" что бы ответить на вопрос.
В случае, если данные методы будут востребованы и будут пользоваться спросом, мы выпустим дополнения к этим методам, повышающим стоимость распознавания и правильность распознавания.

Читать

Опубликованно: 2015-09-07 18:38:19

 

Мы специализируемся на распознании капч, таких маленьких надоедливых картинок с  текстом. У нас на сервере постоянно находится от 300 до 1000 работников, которые в режиме реального времени разбирают все поступающие картинки за 4-10 секунд. Распознание текста с чека похоже на распознание капчи, но распознание информации с кассовых чеков мы выделили в отдельный инструмент: все данные раскладываются в свои поля, проводится валидация ИНН и каждое распознание проверяется модераторами.

Какие данные вернёт сервер:


ИНН магазина: 007327067461
Дата продажи: 2015-09-06
ОПЛАЧЕНО (с учётом скидок): 262.600

Товары (артикул/количество/общая стоимость)
64860 | молоко нежвозр 3,2% 950г д/дет | 3.000 | 111.000
3442 | сайра натур.245г морскаярадуга | 1.000 | 43.500
63597 | сыр костромской 45% кошкинское | 0.398 | 79.200
76405 | козинак подсолнеч.тимоша | 0.372 | 28.980

 

Общая схема распознания чека:
1) Вы загружаете изображение чека и получаете ID
2) Случайный работник получает чек и вводит данные с него
3) 2 случайных работника проводят проверку введённых данных
4) Вы по ID обращаетесь к серверу за результатом распознания
Образец ответа сервера: txt дока тут

API загрузки чека и получения ответа:

Адрес загрузки чека: http://rucaptcha.com/in_invoice.php
Адрес получения ответа: http://rucaptcha.com/res_invoice.php

 

Загрузка чека:


Загрузка чека возможна в двух форматах:
multipart и base64

 

Пример загрузки в формате multipart:

<form method="post" action="http://rucaptcha.com/in_invoice.php" enctype="multipart/form-data">
<input type="hidden" name="method" value="post">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Файл капчи:
<input type="file" name="file">
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут

Пример загрузки капчи в формате base64:

<form method="post" action="http://rucaptcha.com/in_invoice.php">
<input type="hidden" name="method" value="base64">
Ключ от учетной записи:
<input type="text" name="key" value="YOUR_APIKEY">
Тело файла капчи закодированное в base64:
<textarea name="body">BASE64_FILE</textarea>
<input type="submit" value="загрузить и получить ID">
</form>

YOUR_APIKEY - Ваш key, длинной 32 символа, взять тут
BASE64_FILE - Тело файла закодированное в base64. Не забудьте дополнительно закодировать тело в URLEncode, иначе тело картинки придет битым.
 

В ответ на загрузку чека система вернёт:
OK|123
Где 123 - ID чека в системе, к которому потом нужно будет обратиться за ответом, а OK - означает успешную загрузку.
 

Получение ответа на чек:

Ответ на чек получается GET-запросом:

http://rucaptcha.com/res_invoice.php?key=YOUR_APIKEY&action=get&id=ID
YOUR_APIKEY - Ваш KEY, длинной 32 символа, взять тут
ID - ID ранее загруженного чека

Ответ приходит в формате JSON

Запрашивать отвте на чек следует через минуту с момента загрузки. В случае, если ответ ещё не готов, следует повторять запрос через каждые 10-30 секунд.

 

Стоимость распознания чеков

В данный момент стоимость распознавания весьма низка, всего 3 рубля 57 копеек за 1000 символов в ответе
Стоимость распознания чека из образца выше - 0,741 рубля (74 копейки)

 

Если у Вас возникли сложности с интеграцией или какие-либо вопросы, свяжитесь с нами через поддержку или по телефону +7 (495) 215-19-11

Читать

Опубликованно: 2015-04-30 14:59:33

 

Не так давно у знаменитой своими зверствами рекапчи появился новый тип капчи, где нужно указать изображения, похожие на что-либо.
Мы, как всегда, оперативно готовы к новым типам капчи.
Если прислать нам вот такую картинку, с дополнительным параметром

id_constructor=23


То наши работники внимательно изучат каждое изображение и укажут по каким картинкам нужно будет кликнуть.
Формат ответа:
OK|click:3/8/9/

Что означает, что для правильного ответа нужно кликнуть на 3, 8 и 9 картинки

Стоимость распознавания 1000 подобных капч - 90 рублей.
А вот так выглядит интерфейс работника:

 

Если у Вас есть потребности в аналогичных конструкторах - свяжитесь с поддержкой.

Читать

Опубликованно: 2014-07-23 19:43:06

 

RuCaptcha это не только расшифровка капч. Но и оцифровка всевозможных бланков, анкет и опросных листов.
Вы можете самостоятельно создавать шаблоны, по которым будут распознаваться Ваше изображение.

 

Допустим, у Вас есть огромное количество опросных листков вот такого вида:

Вы в интерфейсе сервиса rucaptcha.com создаёте шаблон, в котором указываете в каких полях нужно вписать ответ, в каких выбрать ответ из существующих, а какие поля предствалены чекбоксом. После чего, Вы посредством нашего API присылаете нам эти изображения, с указанием по какому шаблону их распознавать. У работника открывается изображение и поля для заполнения\выбора ответа\чекбоксы.

Пример интерфейса работника по этому изображению:

В ответ на загруженное изображение сервер вернём Вам ID загруженного изображения. Через 20-30 секунд к серверу можно обратиться за ответом на этот ID, если ответ ещё не готов, попытку можно повторить через пару секунд. Изображения можно загружать в несколько потоков. В данный момент сервер способен распознавать примерно 3000 таких изображений в минуту.

Пример ответа сервера на изображение выше:
num:141070|amiability:5|competence:4|exterior:5|reklam:Посоветовали знакомые/Из интернета/|frequency:Раз в год|sex:муж|date:16.08.1985
num, amiability, competence - обозначают соответсвующие поля и задаются в шаблоне. Значения после двоеточий - ответы работников.

Стоимость одного распознавания, формируется исходя из количества и типов полей для заполнения. Т.к. сейчас идёт тестирование и обкатка функционала, окончательную стоимость мы сказать пока не можем. Ориентировочная стоимость за распознание изображения из примера - 40 копеек. Если у Вас есть желание использовать этот функционал, свяжитесь с  нами по email: support@rucaptcha.com или телефону +7 (495) 215-19-11, мы предоставим Вам доступ к конструктору шаблонов и предоставим баланс для тестирования функционала.

А пока, для тестирования функционала, мы предоставили своего рода "игрушку", куда Вы можете загрузить визитную карточку, и через пол минуты получить её расшифровку.

Читать

Опубликованно: 2014-07-16 11:31:56

 

В нашем сервисе есть некоторая проблема, которую мы хотим решить, но как именно она будет решена мы пока не знаем.
Дело в том, что вот такие капчи:

И вот такие:

Сейчас стоят у нас одинаково. И работники, естественно, уже очень давно возмущаются такой несправедливости. Ведь на вторую капчу тратишь времени в 2-3 раза больше.
На днях мы опробуем систему увеличения цена за большое кол-во символов в капче. По правилу:
Количество символов в ответе <= 8, стоимость распознания страндартная
Количество сиволов в ответе >8 и <=16, стоимость распознавания увеличена в 2 раза
Количество сиволов в ответе >16, стоимость распознавания увеличена в 3 раза

Читать

Опубликованно: 2014-07-08 22:07:56

 

 

Иногда случается у вебмастеров беда - когда софт вместо нормальной капчи начинает получать что-то не то и шлёт это нам. Всякое бывает:
Например Google заблокировал по IP и вместо капчи отдаёт такое:

Например Google заблокировал по IP и вместо капчи отдаёт такое
Или что-то пошло не так

Или это капча, но совершенно непонятно как на неё отвечать, а вебмастер шлёт и шлёт её

 

Что бы избавить работников от неоплачиваемой работы, мы стали хешировать все входящие капчи и записывать хеши тех капч, на которые мы не дали ответ больше двух раз в течении часа. Такая капча банится на ближайший час. Модераторы периодически смотрят список заблокированных капч и некоторые вносят в вечный бан.

И сейчас, если приходит забаненная капча, мы сразу же отдаём ответ ERROR_CAPTCHA_UNSOLVABLE

Тем самым, мы повышаем качество и скорость работы сервиса.

Читать

Опубликованно: 2014-07-01 22:21:37

 

Т.к. в интернете есть множество софта для подбора ключей к антикапче. И есть множество сайтов с продажей ключей от антикапчи, то мы ввели ограничение на кол-во обращений с неправильными ключами.

Если с одного IP пришло больше 5 обращений с разными, неверными ключами, то IP банится на 1 час, и при попытке прислать изображение  на распознание или проверить баланс, мы отдаём IP_BANNED
Помимо этого, Вы можете настроить с каких IP-адресов могут поступать обращение с Вашим ключом. Что 100% защитит Вас от кражи ключа.

В данный момент наш сервис  уже занимает 40% рынка антикапчи в России, а объявлений о продаже ключей  от нашего сервиса мы досих пор не находили. Значит, мы всё делаем правильно.

 

Читать