Речевые технологии
Область нашей компетенции
Распознавание речи
Система преобразует входной речевой сигнал в слова, понятные человеку, или в связанный граф слов (латтисы), предназначенный для дальнейшей обработки автоматизированными системами.
Поиск ключевых слов
Не является полным распознаванием речи, а находит только заданные пользователем ключевые слова. Каждое найденное вхождение ключевого слова выделяется в речевом сигнале метками его начала и конца.
Распознавание дикторов
Позволяет ответить на вопрос не «что было сказано», а «кем было сказано». Системы распознавания дикторов разделяются на две категории: определение личности из заданного ограниченного списка людей (идентификация дикторов) или подтверждение личности говорящего (верификация дикторов).
Идентификация языка
Система определяет язык, на котором было произнесено сообщение. У нас реализованы различные подходы — фонотактический и акустический. Они могут быть использованы как раздельно (для повышения производительности), так и совместно (для повышения точности).
Определение параметров речи
Позволяет определить длительность речи в сигнале, качество речевого сигнала, пол диктора, возрастную категорию (взрослый, ребенок), наличие в сигнале специфических сигналов (шум, автоинформатор, гудки и др.).
Транскрипция текста
Построение фонетической транскрипции слов (текста) с помощью формализованных лингвистических правил в заданном фонетическом алфавите. Может быть реализовано для различных языков.
NVIDIA GPU
Аппаратная поддержка алгоритмов распознавания слитной речи, идентификации языков и распознавания дикторов.
Xilinx FPGA
Аппаратно реализованный на Virtex-5 алгоритм идентификации дикторов.
Простое и открытое API
Предоставляется открытое внешнее REST API, также комплексы поддерживают XML-RPC API.
Сделано в России
Все программное обеспечение разработано нашими силами, мы являемся собственниками исходных кодов, работаем в России (Москва). Имеем сертификаты ФСБ, ФСТЭК, МО РФ.