Skip to content

alphacep/voice_perception

 
 

Repository files navigation

voice_perception

Alt text

Система речевой аналитики на базе Vosk
Основные фукнции

  1. Распознавание звонков
  2. Диаризация моно звонков
  3. Определение эмоций по фразам
  4. Построение отчетов по звонкам
  5. Поиск звонков по тексту
  6. Автотематизация

Установка

  1. Установить БД postgres и запустить инициализирующий скрипт initial.sql

  2. Скопировать файл .env_example в .env и настроить параметры подключения к БД:

DSN=postgresql://user:pass@server:port/db_names
APIURL=http://nginx/api/file/
TRANSCRIPT_NUM_WORKERS=4
TRANSCRIPT_NUM_THREADS=4
ASR_MODEL_NAME=v2_ctc

Доступные модели ASR (модель по умолчанию - v2_ctc):

  • v3_ctc
  • v3_rnnt
  • v3_e2e_ctc
  • v3_e2e_rnnt
  • v2_ctc
  • v2_rnnt
  • v1_ctc
  • v1_rnnt

Скачать файл в text_processor/ruword2tags/ по ссылке в load.txt

Сборка Docker образов

Для автоматической сборки Docker образов используйте команду:

docker-compose up --build

Single node. GigaAM

Запустить через

docker-compose up -d

Загрузка аудио

в файле load.curl есть пример запроса для подгрузки новых аудио
Так же в интерфейсе реализована форма загрузки через web

Пример интерфейса

Основной интерфейс просмотра звонков Alt text

Интерфейс графических отчетов Alt text

Интерфейс поиска по тексту Alt text

В проекте используются модели Vosk, DeepPavlov, I.Koziev

Присоединяйтесь к сообществу https://t.me/voiceperception

API Ключи (Постоянные токены)

Система API ключей позволяет создавать постоянные токены для аутентификации сервисов без необходимости использовать временные JWT токены.

Генерация API ключей

  1. Войдите в систему как пользователь
  2. Перейдите в меню "Профиль"
  3. Нажмите "Create New API Key"
  4. Заполните имя и описание ключа
  5. Скопируйте сгенерированный ключ (вида vpak_<64_hex_символов>) - он показывается только один раз!

Использование для transcript_server

  1. Создайте API ключ через веб-интерфейс
  2. Добавьте его в .env файл как TRANSCRIPT_API_KEY=vpak_скопированный_ключ
  3. Перезапустите transcript_server

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 99.0%
  • Other 1.0%