مقاله


کد مقاله : 13960422200326922

عنوان مقاله : ‌آنالیز حس اسناد فارسی با طراحی حوزه تبدیل بهینه

نشریه شماره : 48 فصل تابستان 1395

مشاهده شده : 358

فایل های مقاله : 685 KB


نویسندگان

  نام و نام خانوادگی پست الکترونیک مرتبه علمی مدرک تحصیلی مسئول
1 آصف پورمعصومی asef.pourmasoumi@stu-mail.um.ac.ir دانشجو دانشجوی دکترا
2 هادی صدوقی یزدی h-sadoghi@um.ac.ir استادیار دکترا
3 هادی قائمی hadi.qaemi@stu-mail.um.ac.ir دانش آموخته کارشناسی ارشد
4 زهرا دلخسته z-delkhasteh@stu-mail.um.ac.ir دانش آموخته کارشناسی

چکیده مقاله

با توسعه تعاملات مبتنی بر وب نظیر نظرسنجی‌ها، وبلاگ‌های شخصی و شبکه‌های اجتماعی، آنالیز حس و یا کاوش عقیده به یکی از حوزه‌های تحقیقاتی مهم در علوم کامپیوتر تبدیل شده است. تا کنون روش‌های زیادی مبتنی بر یادگیری ماشین و همچنین پردازش زبان طبیعی در ارتباط با آنالیز حس ارائه شده است. در این مقاله از توزیع کلمات در مجموعه اسناد جمع‌آوری شده به عنوان معیاری جدید برای تشخیص حس جمله استفاده شده است. در روش پیشنهادی با طراحی حوزه تبدیل بهینه مناسب روی توزیع کلمات، دو هدف حداکثرکردن انرژی طیفی کلاس 1 در فرکانس‌های پایین و حداکثرکردن انرژی طیفی کلاس 2 در فرکانس‌های بالا دنبال می‌شود. با طراحی حوزه تبدیل بهینه، داده‌ها از حوزه فراوانی به حوزه فوریه نگاشت می‌شوند. با این تبدیل بهینه، جداسازی الگوهای دوکلاسی از مفاهیم خوش‌بینی و بدبینی در حوزه تبدیل به راحتی امکان‌پذیر خواهد بود. برای محقق‌شدن مدل ریاضی، استراتژی استفاده از پروفایل نمونه‌ها روی همه نمونه‌های سیگنال نماینده کلاس 1 ارائه شده و مسأله حل می‌شود. طیف این پروفایل دارای مؤلفه‌های فرکانس پایین می‌باشد که با فرض تضاد طیفی دوکلاسی 1 و 2، حداکثرکردن انرژی طیفی کلاس 2 نیز ارضا می‌گردد. این روش به روی متون با زبان فارسی و انگلیسی اجرا شده است.