Обход голосовой капчи: Распознавание речи из аудио в текст

24.05.2023

обход аудио капча
Сервис RuCaptcha внедрил в API поддержку распознавания текста по аудиозаписи. Поддерживается распознавания речи из аудиозаписей длинной до 1 мегабайта. Метод можно использовать для обхода аудио капчи, включая решение reCAPTCHA audio.

Работники в процессе распознавания не участвуют. Распознавание речи происходит с использованием программного обеспечения.

Программное обеспечение — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных. Это позволяет постоянно улучшать качество распознавания.

Программное распознавание аудиофайлов отличается быстрой скоростью ответа и подходит для предзаписанных аудиофайлов большого размера.

Аудио распознавание позволяет преобразовывать в текст аудиофайлы следующих характеристик:

Максимальный размер файла составляет 1 мегабайт
Максимальная длительность записи не ограничена

Какие языки в аудио распознаёт RuCaptcha? Модель распознавания поддерживает:

Английский
Французский
Немецкий
Греческий
Русский
Португальский

Какие форматы поддерживаются для распознавания аудио? Модель поддерживает:

Сервис работает через API. Всё, что нужно для работы, вы можете найти в документации.

Как распознать аудио в текст

Аудиозапись может быть преобразована в текст с помощью API RuCaptcha.

Чтобы распознать аудио, необходимо выполнить 2 запроса:

Отправить файл на распознавание.
Получить результат.

Отправка запроса

Для отправки запроса нужно отправить всего четыре параметра:

параметр	описание
key	Ключ API.
method	`audio` - указывает на метод распознавания аудио.
body	Строка base64, содержащая закодированный аудио файл в формате mp3
lang	Язык аудио. Поддерживаемые языки: `'en'`: Английский `'fr'`: Французский `'de'`: Немецкий `'el'`: Греческий `'pt'`: Португальский `'ru'`: Русский

Отправить запрос нужно к файлу in.php.

Пример:

language Copy

{
    "key":"xxxxx",
    "method":"audio",
    "body":"",
    "lang":"pt",
    "json":1
}

Если аудио файл успешно принят в обработку, должен вернуться ответ, содержащий id запроса.

Пример:

language Copy

{
    "status":1,
    "request":"5"
}

Если отправка файла завершилась ошибкой, должен вернуться ответ с ошибкой. Перечень всех ошибок с описанием собран в списке.

После отправки запроса нужно подождать 15-20 секунд пока файл обработается и затем можно выгрузить распознанный текст отправив HTTP GET запрос к API по URL res.php.

Получение распознанного текста

Чтобы выгрузить результат нужно передать id отправленного ранее запроса, это значение из параметра request.

Отправить запрос нужно к файлу res.php. Для отправки запроса нужно отправить всего три параметра:

параметр	описание
key	ключ API
action	`get` - означает запрос на возврат результата
id	ID запроса, переданное файлом `in.php`

Пример запроса:

language Copy

{
    "key":"xxxxx",
    "action":"get",
    "id":5
}

Если обработка файла завершена, должен вернуться ответ.

Примера ответа:

language Copy

{
    "status": 1,
    "request": "hello world"
}

Если распознавание файла не завершено, должен вернуться ответ CAPCHA_NOT_READY.

Если обработка файла завершилась ошибкой, должен вернуться ответ с ошибкой.

Цена

Цена за 1000 запросов завершившихся успешно составляет 35 ₽.

Полезные ссылки

Распознавание речи (speech-to-text — STT) — это процесс преобразования речи в текст. Сервис распознавания позволяет преобразовать аудиозапись в текст. Перед началом использования API ознакомьтесь с документацией.

Примеры работы с API на языках программирования:

FAQ

Каталог программ

Блог

How-to

Демо капч

Обход голосовой капчи: Распознавание речи из аудио в текст

Как распознать аудио в текст

Отправка запроса

Получение распознанного текста

Цена

Полезные ссылки