فشرده سازی گفتار با نرخ بيت متغير براساس مدل تخمين خطی و سيکلهای آوايي و غيرآوايي
محورهای موضوعی : مهندسی برق و کامپیوتر
1 - دانشگاه سمنان
کلید واژه: نرخ بيت متغير تخمين خطیتعيين پريود سيکلهای آوايی و غيرآوايی,
چکیده مقاله :
فشرده سازي سيگنال با نرخ بيت متغير در کاربردهای مخابراتی که در آنها زمان تأخير پردازش دارای محدوديت جدی نبوده و يا ميزان آسيب پذيری پارامترهای ارسالی در کانال مخابراتی کم ميباشد، استفاده فراوان يافته است. روشهای به کارگرفته شده در اين خصوص عموماً بر استفاده بهينه از افزونگیهای موجود در سيگنال متکی بوده و تمايز آنها در نرخ بيت نهايی، کيفيت سيگنال باز سازی شده و نياز محاسباتی روش ميباشد. اين مقاله روشی را برای فشرده سازی سيگنال گفتار با استفاده از مدل شناخته شده تخمين خطی ارائه ميدهد و با استفاده از مفهوم جديد ارائه شده در طبقه بندی سيکلها و استخراج بخشهای آوايی با طول متغير، روش ساده و موثری برای استفاده بهينه از تشابه سيگنال در کاهش نرخ ارسال اطلاعات ارائه میگردد.
Variable rate signal compression has found many applications where there is no serious limitation on delay and the signal parameters are not very susceptible to errors. Methods used to apply variable rate coding usually rely on the redundancies included in the signal. Such methods are different in final bit rate, quality of the synthetic signal and computational requirements. This paper presents a novel method for compression of speech signal in a variable scheme. Based on the known linear prediction method, a simple and efficient model is developed in which segments of the speech signal are classified as voiced or unvoiced using the innovative voiced and unvoiced cycle concept.
[1] W. Hess, Pitch Determination of Speech Signls: Algorithms and Devices. Springer Series in Information Scence, Berlin, Hidelberg, Germany 1983.
[2] R. W. Shafer, J. J. Dubnowski, and L. R. Rabiner, "Real time digital hardware pitch detector," IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. 4, no. 1, pp. 2-8, Feb. 1976.
[3] K.Yaghmaie and A. M. Kondoz, "Multi-band prototype waveform analysis synthesis of original speech," IEEE Int. Conf. on Acoustics, Speech and Signal Processing, Munchen, Germany, April 1997.
[4] A. M Kondoz, Digital Speech Coding for Low Bit Rate Communication Systems, John Whiley 1994.
[5] P. E. Papamichalis, Practical Approaches to Speech Coding, Prentice Hall, 1987.
[6] M. Stephanovic and A. M Kondoz, "Source dependant variable rate speech coding below 3 kb/s," in Proc. of Eurospeech 99, vol. 3, pp 1487-1490, Budapest, Hungary, Sep. 1999.
[7] P. C. Nguien and M. Akagi, "Variable rate speech coding using straight and temporal decomposition," in Proc. IEEE Workshop on Speech Coding, pp. 26- 28, Tsukaba, Ibaraki, Oct. 2002.