понедельник, 1 октября 2012 г.

Идентификация по характеристикам речи

Идентификация человека по голосу-один из традиционных способов распознования,интерес к этому методу связан и с прогнозами внедрения голосовых интерфейсов в опреционные системы.Голосовая идентификация бесконтакна и существуют системы ограничения доступа к информации на основании частотного анализа речи.

Рассмотрим на примере технологий VoiceKey и VoiceNet, разработанных в компании «Центр речевых технологий».
Идентификация или верификация в технологиях VoiceKey и VoiceNet осуществляется по парольным фразам длительностью от 5 секунд или фрагментам спонтанной речи продолжительностью более 16 секунд. Обе технологии используются в качестве индивидуальных характеристик голоса положения резонансных максимумов в спектре голоса, что обеспечивает надежную работу в условиях шумов и незначительных изменений эмоционального состояния человека. Но если VoiceKey ориентирован на сигналы микрофонного качества, то VoiceNet изначально адаптирован к работе с телефонными каналами.


Итак, что же дают эти технологии?
- Возможность удаленной идентификации (сравнения с конкретным эталоном) или верификации (поиска в базе эталонов) клиентов.
- Сложность или даже невозможность для злоумышленника имитировать голос с помощью магнитофона. Во-первых, системы идентификации способны контролировать сразу несколько признаков, отличающихся от тех, что используются в речеслуховой системе, во-вторых, при воспроизведении записанной речи через миниатюрные громкоговорители в сигнал вносятся искажения, препятствующие идентификации говорящего.
- Невозможность идентификации человека, находящегося под угрозой насилия, поскольку эмоциональное состояние говорящего оказывает существенное влияние на характеристики голоса и речи.
-  Возможность повышения надежности аутентификации за счет одновременного использования технологий идентификации по голосу и распознавания речи (произнесенного пароля).
Конечно, логическим продолжением достоинств технологий распознавания личности по голосу являются и некоторые их недостатки, которые нельзя обойти вниманием.
- Голос, в отличие от папиллярных узоров пальцев или ладоней, меняется с возрастом. Таким образом, клиентам придется периодически обновлять хранящийся в системе эталон речи.
- На голос оказывает влияние физическое и эмоциональное состояние человека в момент речевого акта. Так, например, система может не узнать человека, если он находится в состоянии алкогольного опьянения или у него во рту жевательная резинка, или он только что установил рекорд в беге.
- Надежность работы системы в значительной степени зависит от качества канала передачи речевого сигнала к системе идентификации, в частности, от таких его характеристик, как частотный диапазон, уровень нелинейных искажений, отношение сигнал/ шум, неравномерность частотной характеристики. Наивысшая надежность работы обеспечивается в том случае, когда эталон голоса клиента и его запрос поступают по одному и тому же каналу, например, телефонному.
В рамках одной короткой статьи невозможно раскрыть все особенности технологий, используемых для идентификации личности по голосу и особенностям речи. Но даже краткий перечень предоставляемых возможностей позволяет убедиться, что преимущества их очевидны. 

Комментариев нет:

Отправить комментарий