ما در اين مقاله روش کارامد جديدی را مبتنی بر توصيفگر الگوی باينری محلی برای بازشناسی چهره معرفی کرديم. چون محاسبات داخل الگوی باینری محلی بین مقادیر دو پیکسل انجام میشود، حتی تغییرات کوچک در الگوی باینری عملکرد آن را تحت تأثیر قرار میدهد. در این مقاله یک روش جدید بازش چکیده کامل
ما در اين مقاله روش کارامد جديدی را مبتنی بر توصيفگر الگوی باينری محلی برای بازشناسی چهره معرفی کرديم. چون محاسبات داخل الگوی باینری محلی بین مقادیر دو پیکسل انجام میشود، حتی تغییرات کوچک در الگوی باینری عملکرد آن را تحت تأثیر قرار میدهد. در این مقاله یک روش جدید بازشناسی چهره برای انتخاب الگوهای باینری میانگین محلی (LABP) بر مبنای آتاماتای یادگیر سلولی مبتنی بر محاسبات تکاملی ارائه شده است. در روش پیشنهادی، ابتدا الگوهای باینری یکنواخت محلی توسط LABP از تصاویر چهره استخراج میشود. در LABPجهت به دست آوردن نمایش ویژگی مقاومتر، نقاط نمونه زیادی مورد استفاده قرار گرفته است، سپس بهترین زیرمجموعه از این الگوها بدون داشتن اطلاعات اولیه از آنها توسط روش CLA-ECپیدا شده و از آنها هیستوگرام گرفته میشود و در نهایت از ماشین بردار پشتیبان برای طبقهبندی استفاده میشود. نتیجه به دست آمده از شبیهسازی سیستمهای بازشناسی چهره روی مجموعه داده FERET، برتری الگوریتم پیشنهادی را نسبت به الگوریتمهای دیگر نشان داد.
پرونده مقاله
امروزه بازشناسی کنش انسان از روی تصویر ایستا به یکی از موضوعات فعال در زمینه بینایی ماشین و شناسایی الگو تبدیل شده است. تمرکز این کار بر روی شناسایی کنش یا رفتار انسان از روی یک تصویر است. برخلاف روشهای سنتی که از ویدئوها یا دنبالهای از تصاویر برای بازشناسی کنش انسان چکیده کامل
امروزه بازشناسی کنش انسان از روی تصویر ایستا به یکی از موضوعات فعال در زمینه بینایی ماشین و شناسایی الگو تبدیل شده است. تمرکز این کار بر روی شناسایی کنش یا رفتار انسان از روی یک تصویر است. برخلاف روشهای سنتی که از ویدئوها یا دنبالهای از تصاویر برای بازشناسی کنش انسان استفاده میکنند، یک تصویر ایستا فاقد اطلاعات زمانی است. بنابراین بازشناسی کنش مبتنی بر تصویر ایستا دارای چالش بیشتری نسبت به بازشناسی کنش مبتنی بر ویدئو است. با توجه به اهمیت اطلاعات حرکتی در بازشناسی کنش از روش flow2Im برای تخمین اطلاعات حرکتی از روی تصویر ایستا استفاده شده است. ساختار پیشنهادی در این مقاله، حاصل ترکیب سه شبکه عصبی عمیق است که تحت عنوان شبکه سهشاخه یاد شده است. شبکه اول بر روی تصویر خام رنگی و شبکه دوم بر روی شار نوری پیشبینی شده از روی تصویر و شبکه سوم بر روی ژست به دست آمده از انسان موجود در تصویر آموزش میبیند. در نهایت تلفیق این سه شبکه عصبی عمیق سبب افزایش دقت بازشناسی کنش انسان شده است. به عبارت دیگر در این مقاله علاوه بر اطلاعات مکانی و زمانی پیشبینی شده از اطلاعات ژست انسان نیز برای بازشناسی کنش استفاده شده است زیرا ویژگی ژست برای بازشناسی کنش بسیار حائز اهمیت است. روش پیشنهادی در این مقاله توانسته است به دقت 80/91 درصد بر روی مجموعه داده action 7Willow، به دقت 02/91 درصد بر روی مجموعه داده 2012Pascal voc و به دقت 87/96 درصد بر روی مجموعه داده 10Stanford دست یابد. با توجه به مقایسه نتایج با روشهای قبلی متوجه خواهیم شد که روش پیشنهادی بالاترین دقت را بر روی هر سه مجموعه داده نسبت به کارهای اخیر به دست آورده است.
پرونده مقاله