مقاله


کد مقاله : 139606172256297965

عنوان مقاله : افزایش سرعت جستجو در مدل‌‌های مبتنی بر مجاورت

نشریه شماره : 56 فصل تابستان 1396

مشاهده شده : 621

فایل های مقاله : 452 KB


نویسندگان

  نام و نام خانوادگی پست الکترونیک مرتبه علمی مدرک تحصیلی مسئول
1 جواد پاک‌سيما paksima@stu.yazd.ac.ir دانشجو دانشجوی دکترا
2 علي‌محمد زارع بيدكي alizareh@yazd.ac.ir استادیار دکترا
3 ولي درهمي vderhami@yazd.ac.ir دانشیار دکترا

چکیده مقاله

یکی از اصلی‌‌ترین چالش‌‌های مدل‌‌های مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات می‌‌باشد. در مدل‌‌های مبتنی بر مجاورت مفهومی به نام فاصله تعریف می‌‌شود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیت‌‌ها و محاسبه فاصله‌‌ها فرایندی زمان‌‌بر است و چون غالباً در زمان جستجو اجرا می‌‌شود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریع‌‌تر می‌‌شود. در این مقاله الگوریتمی به نام 3SNTK برای هرس‌کردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه می‌‌شود (Skip-N). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایش‌‌ها نشان می‌‌دهد که استفاده از الگوریتم‌‌ ‌‌پیشنهادی باعث بهبود سرعت بازیابی می‌‌گردد.