В
контактных центрах точность распознавания зависит от:
- формата записи (WAV/mp3, mono/stereo)
- настроек сжатия
- используемых гарнитур
При работе
с диктофонами-бейджами точность распознавания зависит от
- наличия диктофона (закреплен на груди, а не лежит на столе)
- внешних шумов (производство, кондиционеры, автомобили)
- какофонии (множество голосов в одном пространстве)
- от того на сколько внятная, громкая и поставленная речь у сотрудника
Если ваша цель - распознать и перевести в текст лекцию, записанную на видеокамеру где-то в ВУЗе, то скорее всего полнотекстовое распознавание покажется вам не идеальным.
Несмотря на заявленную точность в 97% даже лучших движков, на практике это пока осуществимо только в идеальных акустических условиях и полученный текст часто вызывает недоумение или улыбку.
Если ваша цель - анализ речи сотрудников и клиентов, то вам будет достаточно точности распознавания в 50% и даже менее.
Пример:Из 100 слов "здравствуйте", сказанных сотрудником в разных диалогах, платформа правильно определила только 50. В этих же диалогах, помимо приветствия, сотрудник должен был по стандарту представиться по имени и произнести фразу "мое имя". Он сделал это только в 50 диалогах. Но платформа правильно распознает только половину случаев и в статистике покажет 25.
Таким образом руководитель все равно увидит, что представляется по имени сотрудник в два раза реже, чем здоровается. Пропорции сохраняются.
Видео с работой платформы и статистикой смотрите
здесьДиктофон-бейдж записывает все голоса сотрудников и клиентов. Вы можете услышать о чем был диалог. При распознавании речи платформа отдаст приоритет голосу сотрудника т.к. он ближе всего к микрофону.
В статистику сотрудников, которые говорят достаточно тихо, может попадать речь клиентов, если в какой-то момент времени они говорили громче, но такими ситуациями можно пренебречь, как погрешностью. Это справедливо еще и потому, что клиент почти никогда не произносит слова, на основании которых формируется статистика сотрудника.
* если ваш сотрудник ссылается на то, что платформа не распознает слова, которы он "очень часто" произносит, попросите его сделать это в вашем присутствии 10 раз. А потом проверьте сколько слов было распознано и показано в платформе