Обход голосовой капчи: Распознавание речи из аудио в текст

обход аудио капча
Сервис 2Captcha внедрил в API поддержку распознавания текста по аудиозаписи. Поддерживается распознавания речи из аудиозаписей длинной до 1 мегабайта. Метод можно использовать для обхода аудио капчи, включая решение reCAPTCHA audio.

Работники в процессе распознавания не участвуют. Распознавание речи происходит с использованием программного обеспечения.

Программное обеспечение — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных. Это позволяет постоянно улучшать качество распознавания.

Программное распознавание аудиофайлов отличается быстрой скоростью ответа и подходит для предзаписанных аудиофайлов большого размера.

Аудио распознавание позволяет преобразовывать в текст аудиофайлы следующих характеристик:

  • Максимальный размер файла составляет 1 мегабайт
  • Максимальная длительность записи не ограничена

Какие языки в аудио распознаёт ruCaptcha? Модель распознавания поддерживает:

  • Английский
  • Французский
  • Немецкий
  • Греческий
  • Русский
  • Португальский

Какие форматы поддерживаются для распознавания аудио? Модель поддерживает:

  • mp3

Сервис работает через API. Всё, что нужно для работы, вы можете найти в документации.

Как распознать аудио в текст

Аудиозапись может быть преобразована в текст с помощью API ruCaptcha.

Чтобы распознать аудио, необходимо выполнить 2 запроса:

  • Отправить файл на распознавание.
  • Получить результат.

Отправка запроса

отправка запросы на решение аудио капчи

Для отправки запроса нужно отправить всего четыре параметра:

параметр описание
key Ключ API.
method audio - указывает на метод распознавания аудио.
body Строка base64, содержащая закодированный аудио файл в формате mp3
lang Язык аудио. Поддерживаемые языки:
'en': Английский
'fr': Французский
'de': Немецкий
'el': Греческий
'pt': Португальский
'ru': Русский

Отправить запрос нужно к файлу in.php.

Пример:

{
    "key":"xxxxx",
    "method":"audio",
    "body":"",
    "lang":"pt",
    "json":1
}

Если аудио файл успешно принят в обработку, должен вернуться ответ, содержащий id запроса.

Пример:

{
    "status":1,
    "request":"5"
}

Если отправка файла завершилась ошибкой, должен вернуться ответ с ошибкой. Перечень всех ошибок с описанием собран в списке.

После отправки запроса нужно подождать 15-20 секунд пока файл обработается и затем можно выгрузить распознанный текст отправив HTTP GET запрос к API по URL res.php.

Получение распознанного текста

получение ответа в виде текста

Чтобы выгрузить результат нужно передать id отправленного ранее запроса, это значение из параметра request.

Отправить запрос нужно к файлу res.php. Для отправки запроса нужно отправить всего три параметра:

параметр описание
key ключ API
action get - означает запрос на возврат результата
id ID запроса, переданное файлом in.php

Пример запроса:

{
    "key":"xxxxx",
    "action":"get",
    "id":5
}

Если обработка файла завершена, должен вернуться ответ.

Примера ответа:

{
    "status": 1,
    "request": "hello world"
}

Если распознавание файла не завершено, должен вернуться ответ CAPCHA_NOT_READY.

Если обработка файла завершилась ошибкой, должен вернуться ответ с ошибкой.

Цена

Цена за 1000 запросов завершившихся успешно составляет 35 ₽.

Полезные ссылки

Распознавание речи (speech-to-text — STT) — это процесс преобразования речи в текст. Сервис распознавания позволяет преобразовать аудиозапись в текст. Перед началом использования API ознакомьтесь с документацией.

Примеры работы с API на языках программирования:

FAQ