img

تفاصيل البطاقة الفهرسية

Experiments in spoken document retrieval using phoneme n-grams

مقال من تأليف: Ng, Corinna ; Wilkinson, Ross ; Zobel, Justin ;

ملخص: dans les systemes recherche d'information vocale, la reconnaissance de la parole est appliquee a une collection pour obtenir certaines information qui correspond aux contraintes des requetes. Ces information peuvent etre des mots ou des composants de mots. On a explore la recherche basee sur phoneme de "n-grams". L'utilisation de ces phonemes concerne le probleme du "vocabulaire exterieure", et l'utilsation du concept de "n-gram" permet le matching approximatif dans un environnement imprecis de transcription. Les experiences (c'est-a-dire, les tests) on permit d'explorer beaucoup d'aspects, comme par example, "word boundary information", elimination des points d'arret, expansion des requetes, variation de la longueure des sequence de phonemes, et la combinaison des n-grams. Pour un mot donne, on peux associer des requetes a la parole en utilisant la representation phonetique des mots. Cela a permis de decider les aspects important dans la recherche, comme par example, la reconnaissance ou le processus de matching. Nos resultat experimentals ont montre qu'il y a une deterioration dans l'efficacite de la rechere, mais pour des cas particulier de matching, cela n'etait pas important parce que la sequencee des phonemes est correcte. Dans les cas ou les suite de phoneme sont directement reconnues, il etait important de selectionner une bonne approache de matching. La combinaison de n-grams de different longueures (3-grams and 4-grams) on permit d'ameliorer l'efficacite de la methode de recherche. Dans le cas general, la recherche basee sur le phoneme n'est pas efficace quand celle ci est comparee a la methode qui est basee sur les mots. Cette methode (qui est basee sur le phoneme) est interessante dans les situations ou les methodes basees sur les mots ne some pas utilsable.


لغة: إنجليزية