voice_perception

Система речевой аналитики на базе Vosk
Основные фукнции

Распознавание звонков
Диаризация моно звонков
Определение эмоций по фразам
Построение отчетов по звонкам
Поиск звонков по тексту
Автотематизация

Установка

Установить БД postgres и запустить инициализирующий скрипт initial.sql
Скопировать файл .env_example в .env и настроить параметры подключения к БД:

DSN=postgresql://user:pass@server:port/db_names
APIURL=http://nginx/api/file/
TRANSCRIPT_NUM_WORKERS=4
TRANSCRIPT_NUM_THREADS=4
ASR_MODEL_NAME=v2_ctc

Доступные модели ASR (модель по умолчанию - v2_ctc):

v3_ctc
v3_rnnt
v3_e2e_ctc
v3_e2e_rnnt
v2_ctc
v2_rnnt
v1_ctc
v1_rnnt

Скачать файл в text_processor/ruword2tags/ по ссылке в load.txt

Сборка Docker образов

Для автоматической сборки Docker образов используйте команду:

docker-compose up --build

Single node. GigaAM

Запустить через

docker-compose up -d

Загрузка аудио

в файле load.curl есть пример запроса для подгрузки новых аудио
Так же в интерфейсе реализована форма загрузки через web

Пример интерфейса

Основной интерфейс просмотра звонков

Интерфейс графических отчетов

Интерфейс поиска по тексту

В проекте используются модели Vosk, DeepPavlov, I.Koziev

Присоединяйтесь к сообществу https://t.me/voiceperception

API Ключи (Постоянные токены)

Система API ключей позволяет создавать постоянные токены для аутентификации сервисов без необходимости использовать временные JWT токены.

Генерация API ключей

Войдите в систему как пользователь
Перейдите в меню "Профиль"
Нажмите "Create New API Key"
Заполните имя и описание ключа
Скопируйте сгенерированный ключ (вида vpak_<64_hex_символов>) - он показывается только один раз!

Использование для transcript_server

Создайте API ключ через веб-интерфейс
Добавьте его в .env файл как TRANSCRIPT_API_KEY=vpak_скопированный_ключ
Перезапустите transcript_server

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
backend_api		backend_api
docker_build		docker_build
docs		docs
file_api		file_api
nginx		nginx
tag_server		tag_server
text_processor		text_processor
transcript_server		transcript_server
voxblink2_samresnet34_ft		voxblink2_samresnet34_ft
web		web
.env.example		.env.example
.env_example		.env_example
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
default		default
docker-compose.yml		docker-compose.yml
initial.sql		initial.sql
load.curl		load.curl
start.bat		start.bat
start_minimal.bat		start_minimal.bat
test_auth_setup.py		test_auth_setup.py
test_mentor_management.py		test_mentor_management.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

voice_perception

API Ключи (Постоянные токены)

Генерация API ключей

Использование для transcript_server

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

voice_perception

API Ключи (Постоянные токены)

Генерация API ключей

Использование для transcript_server

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages