مقاله


کد مقاله : 13940826114525400

عنوان مقاله : استخراج و مدل‌سازي واحدهاي آوايي وابسته به بافت براي بهبود دقت بازشناسي گفتار پيوسته با روش دسته‌بندي واج‌ها

نشریه شماره : 5 فصل بهار - تابستان 1384

مشاهده شده : 341

فایل های مقاله : 220 KB


نویسندگان

  نام و نام خانوادگی پست الکترونیک مرتبه علمی مدرک تحصیلی مسئول
1 محمد بحرانی bahrani@ce.sharif.edu مدرس دکترا
2 حسین ثامتی sameti@sharif.edu استادیار دکترا

چکیده مقاله

در اين مقاله براي بهبود دقت يک سيستم بازشناسي گفتار پيوسته فارسي، روش وابسته به بافت مناسبي پيشنهاد شده است. به دليل بعضي محدوديت‌هاي موجود در سيستم بازشناسي، از ايدة واحدهاي آوايي چندگانه براي استخراج واحدهاي آوايي وابسته به بافت استفاده گرديده است. بر اساس اين ايده هر واج به چند نوع گوناگون دسته‌بندي مي‌شود و هر دسته جداگانه مدل‌سازي مي‌گردد. دسته‌بندي واج‌ها به صورت بي‌نظارت و با استفاده از الگوريتم k-means انجام شده است و براي محاسبه مركز دسته‌ها روش كارايي پيشنهاد شده است. تعداد دسته مناسب براي هر واج با توجه به حجم داده‌هاي آموزشي آن واج و دقت بازشناسي واج در هنگام به‌کارگيري مدل‌هاي مستقل از بافت، حدس زده شده و سپس با روش‌هاي مبتني بر سعي و خطا، تعداد دسته بهينه براي هر واج تعيين شده است. سپس هر دسته به عنوان يک واحد آوايي وابسته به بافت مدل‌سازي گرديده است. با استفاده از اين مدل‌ها حدود 22 درصد کاهش در نرخ خطاي کلمات حاصل شده است.