Disambiguating the senses of non-text symbols for Mandarin TTS systems with a three-layer classifier
مقال من تأليف: Yu, Ming-Shing ; Huang, Feng-Long ;
ملخص: Plusieurs sortes de caractére de non-texte apparaissent souvent dans les textes. L'expression orale de ces caractéres peut être changé selon les sens de textes. Ce travail propose un classeur de trois-couches (TLC, three-layer classifier) qui peut efficacement résoudre le probléme ambigu de ces non-texte caractéres dans le mandarin TTC systéme. Ces trois couches sont empoyées en ordre. La premiére couche est composée en deux éléments: le tableau de modéle et l'arbre de décison. Si cette couche peut désambiguïser les sens de caractére prévu, la tâche de désambiguïté va arrêter. Sinon les deux couches suivantes va être déclenché. Selon le théorém de Bayesian, la deuxiéme couche adopte la méthode de vote pour calculer le score de désambiguïté. On analyse et compare tous les propriétés des caractéres de non-texte pour arriver la meilleure précision. Ces propriétés peut changer l'efficacité de la méthode de vote. D'aprés l'algorithme de confiance, la troisiéme couche peut exploiter un modéle de remplacement pour améliorer la performance. L'expérience montre que l'approche proposée ici peut avoir une très bonne assimilation même avec très peu de données. Les précisions d'entraînement et d'essai sont respectivement 99.8% et 97.5%
لغة:
إنجليزية