Уведомление об использовании файлов cookie

Этот сайт использует cookie. Файлы cookie запоминают вас, поэтому мы можем предоставить вам персонализированные услуги. Подробнее.

Looking for international version of our service? Go to 2captcha.com

Обход голосовой капчи: Распознавание речи из аудио в текст

обход аудио капча
Сервис 2Captcha внедрил в API поддержку распознавания текста по аудиозаписи. Поддерживается распознавания речи из аудиозаписей длинной до 1 мегабайта. Метод можно использовать для обхода аудио капчи, включая решение reCAPTCHA audio.

Работники в процессе распознавания не участвуют. Распознавание речи происходит с использованием программного обеспечения.

Программное обеспечение — нейронная сеть, которая обучена распознавать речь на определенном языке. Для обучения моделей используются массивы данных. Это позволяет постоянно улучшать качество распознавания.

Программное распознавание аудиофайлов отличается быстрой скоростью ответа и подходит для предзаписанных аудиофайлов большого размера.

Аудио распознавание позволяет преобразовывать в текст аудиофайлы следующих характеристик:

  • Максимальный размер файла составляет 1 мегабайт
  • Максимальная длительность записи не ограничена

Какие языки в аудио распознаёт ruCaptcha? Модель распознавания поддерживает:

  • Английский
  • Французский
  • Немецкий
  • Греческий
  • Русский
  • Португальский

Какие форматы поддерживаются для распознавания аудио? Модель поддерживает:

  • mp3

Сервис работает через API. Всё, что нужно для работы, вы можете найти в документации.

Как распознать аудио в текст

Аудиозапись может быть преобразована в текст с помощью API ruCaptcha.

Чтобы распознать аудио, необходимо выполнить 2 запроса:

  • Отправить файл на распознавание.
  • Получить результат.

Отправка запроса

отправка запросы на решение аудио капчи

Для отправки запроса нужно отправить всего четыре параметра:

параметр описание
key Ключ API.
method audio - указывает на метод распознавания аудио.
body Строка base64, содержащая закодированный аудио файл в формате mp3
lang Язык аудио. Поддерживаемые языки:
'en': Английский
'fr': Французский
'de': Немецкий
'el': Греческий
'pt': Португальский
'ru': Русский

Отправить запрос нужно к файлу in.php.

Пример:

{
    "key":"xxxxx",
    "method":"audio",
    "body":"",
    "lang":"pt",
    "json":1
}

Если аудио файл успешно принят в обработку, должен вернуться ответ, содержащий id запроса.

Пример:

{
    "status":1,
    "request":"5"
}

Если отправка файла завершилась ошибкой, должен вернуться ответ с ошибкой. Перечень всех ошибок с описанием собран в списке.

После отправки запроса нужно подождать 15-20 секунд пока файл обработается и затем можно выгрузить распознанный текст отправив HTTP GET запрос к API по URL res.php.

Получение распознанного текста

получение ответа в виде текста

Чтобы выгрузить результат нужно передать id отправленного ранее запроса, это значение из параметра request.

Отправить запрос нужно к файлу res.php. Для отправки запроса нужно отправить всего три параметра:

параметр описание
key ключ API
action get - означает запрос на возврат результата
id ID запроса, переданное файлом in.php

Пример запроса:

{
    "key":"xxxxx",
    "action":"get",
    "id":5
}

Если обработка файла завершена, должен вернуться ответ.

Примера ответа:

{
    "status": 1,
    "request": "hello world"
}

Если распознавание файла не завершено, должен вернуться ответ CAPCHA_NOT_READY.

Если обработка файла завершилась ошибкой, должен вернуться ответ с ошибкой.

Цена

Цена за 1000 запросов завершившихся успешно составляет 35 ₽.

Полезные ссылки

Распознавание речи (speech-to-text — STT) — это процесс преобразования речи в текст. Сервис распознавания позволяет преобразовать аудиозапись в текст. Перед началом использования API ознакомьтесь с документацией.

Примеры работы с API на языках программирования:

FAQ