img

تفاصيل البطاقة الفهرسية

Small group speaker identification with common password phrases

مقال من تأليف: Rosenberg, Aaron E. ; Siohan, Olivier ; Parthasarathy, S. ;

ملخص: Cet article etudie les performances d'un systeme d'identiAcation du locuteur en mode dependent du texte pour un petit ensemble de locuteurs. Une telle application de reconnaissance du locuteur s'avare utile dans des applications base d'agents o une reponse personalisee une commande generale comme ``lire mes messages'' est souhaitable. Une phrase commune tous les locuteurs est utilisee comme mot de passe, chaque locuteur disposant de son modele acoustique de phrase represente par un modele de Markov cach (HMM). Differentes methodes d'estimation de modeles sont etudiees: l'une fondee sur un critere du maximum de vraisemblance (MLE), l'autre sur un critere du minimum d'erreurs de classiAcation (MCE). Pour chaque locuteur, 3 repetitions de la phrase mot de passe provenant d'une session unique sont utilisees comme donnees d'apprentissage. Le modele MLE de chaque locuteur est estim partir des donnees d'apprentissage associees, alors que le modele MCE est construit partir de toutes les phrases d'apprentissage du groupe de locuteurs. Dans une autre serie d'experiences, des phrases d'apprentissage supplementaires, provenant soit des locuteurs du groupe, soit de locuteurs externes au groupe, sont utilisees pour estimer les modeles. Les resultats experimentaux montrent que les taux d'erreurs d'identiAcation sont multiplies par 2 lorsque l'on passe d'un ensemble de 5 locuteurs un ensemble de 10 locuteurs. Les taux d'erreurs d'identiAcation en ensemble ouvert et ferm sont reduits de 25% lorsque MCE est utilis la place de MLE, alors que les taux de fausse


لغة: إنجليزية