در تصديق هويت گوينده، سيستم هويت شخصي را که با سيستم تماس برقرار کرده است، بررسي کرده و تعيين ميکند که وي همان شخص مدعي است و يا دروغ ميگويد. در اين مقاله از برنامهنويسي ژنتيک بهعنوان روشی برای مدلسازي گويندگان استفاده شد. با توجه به زمان زياد آموزش مدلها توسط برن چکیده کامل
در تصديق هويت گوينده، سيستم هويت شخصي را که با سيستم تماس برقرار کرده است، بررسي کرده و تعيين ميکند که وي همان شخص مدعي است و يا دروغ ميگويد. در اين مقاله از برنامهنويسي ژنتيک بهعنوان روشی برای مدلسازي گويندگان استفاده شد. با توجه به زمان زياد آموزش مدلها توسط برنامهنويسي ژنتيک، ايده بهرهمندي از فشردهسازي دادههاي آموزشي، بهمنظور کاهش زمان آموزش مدلها مطرح گرديد و بدين ترتيب زمان لازم برای مدلسازی گويندگان با استفاده از برنامهنويسي ژنتيک در حدود 20 برابر کاهش داده شد. آموزش چندين درخت برنامهنويسي ژنتيک بهعنوان مدل هر گوينده، ايده ديگري است که بهمنظور بهبود دقت تصديق هويت گوينده در اين مقاله مطرح شده است. در اين روش، دادههاي آموزشي به تعداد کمي خوشه تفکيک شده و بهازاي هر خوشه، يک درخت برنامهنويسي ژنتيک آموزش داده ميشود. بدين ترتيب يک گوينده با چندين درخت برنامهنويسي ژنتيک مدل ميشود. با استفاده از روش پيشنهادي، کارايي برنامهنويسي ژنتيک براي تصديق هويت گوينده از 50% به حدود 92% افزايش پيدا کرده است. نتايج حاصل از عملکرد برنامهنويسي ژنتيک با کارايي روشهاي تمايزي ديگري مثل شبکههای عصبي MLP و LVQ و نيز روشهاي غير تمايزي مانند LBG، GMM، GMM-UBM و VQ-MAP مقايسه گرديد و مشاهده شد که برنامهنويسي ژنتيک کارايي بهتري را نسبت به ديگر روشها نتيجه ميدهد.
پرونده مقاله
این مقاله به پیادهسازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار میپردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع همپوشان با پریود صحیح و تحریک چندباندی و روش تولید سازهای برای زبان فارسی پیادهسازی شده و بهمنظور بهبود در کیفیت خروجی از قدرت فشر چکیده کامل
این مقاله به پیادهسازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار میپردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع همپوشان با پریود صحیح و تحریک چندباندی و روش تولید سازهای برای زبان فارسی پیادهسازی شده و بهمنظور بهبود در کیفیت خروجی از قدرت فشردهسازهای گفتاری استفاده شده است. بهعبارت دیگر در ایده مطرحشده در این مقاله برای رفع مشکلات تولیدکنندههای گفتار از فشردهسازهای موجود استفاده شده است. به این ترتیب که از فشردهساز STRAIGHT برای هموارسازی طیفی در تولیدکننده پیوندی و از فشردهساز پیشگویی خطی با تحریک ترکیبی در تولید گفتار به روش سازهای بهره گرفته شده است. نتایج ارزیابیها نشان داده که استفاده از این فشردهسازها به کاهش ناپیوستگیها در تولیدکننده پیوندی و افزایش معیارهای قابلیت فهم و طبیعیبودن در تولیدکننده سازهای کمک کرده است.
پرونده مقاله
مدل مخلوط گاوسي (GMM)، روشي ساده و مؤثر براي مدلکردن آماري فضاي ويژگيهاست که بهطور گسترده در کاربرد تشخيص زبان مورد استفاده قرار گرفته و از الگوريتم بيشينهسازي اميد رياضي براي آموزش پارامترهاي اين مدل استفاده ميشود. در اين مقاله با توجه به مشکلي که در آموزش مدل GMM چکیده کامل
مدل مخلوط گاوسي (GMM)، روشي ساده و مؤثر براي مدلکردن آماري فضاي ويژگيهاست که بهطور گسترده در کاربرد تشخيص زبان مورد استفاده قرار گرفته و از الگوريتم بيشينهسازي اميد رياضي براي آموزش پارامترهاي اين مدل استفاده ميشود. در اين مقاله با توجه به مشکلي که در آموزش مدل GMM وجود دارد، مدلي جديد با نام PAW-GMM ارائه شده است. در اين مدل، قدرت هر مؤلفه از مدل GMMدر تمايز يک زبان از ساير زبانها، براي تعيين وزن هر مؤلفه در نظر گرفته ميشود. مدل PAW-GMM بهدليل در نظر گرفتن خواص تمايزي مؤلفههاي مخلوط گاوسي، سبب افزايش دقت سيستمهاي تشخيص زباني ميشود که از اين مدل بهعنوان جايگزين مدلGMM استفاده ميکنند. همچنين يکي از مشکلاتي که در سيستم
GMM-PSK-SVMکه يکي از بهترين سيستمهاي تشخيص زبان است وجود دارد، پيچيدگي محاسباتي بالا خصوصاً با اضافهشدن تعداد زبانهاست. از اين رو سيستم UBM-PSK-SVM ارائه شده است که با ثابت نگه داشتن دقت سيستم GMM - PSK - SVM، سبب کاهش پيچيدگي محاسباتي آن شده و در نتيجه قدرت تعميم به زبانهاي بالاتر را افزايش ميدهد. آزمايشهاي صورتگرفته بر روي 4 سيستم تشخيص زبان مختلف با استفاده از دادههاي مربوط به 4 زبان انگليسي، فارسي، فرانسوي و آلماني دادگان OGI، کارايي تکنيکهاي ارائهشده را نشان ميدهد.
پرونده مقاله