در این پژوهش به دنبال ارتقای یکی از الگوریتمهای کارامد در یادگیری ماشین، به نام جنگل تصادفی هستیم. برای این منظور از تکنیکهای فشردهسازی و موازیسازی بهره میبریم. چالش اساسی مورد توجه در این پژوهش، در رابطه با به کارگیری جنگل تصادفی در پردازش و تحلیل دادههای حجیم می چکیده کامل
در این پژوهش به دنبال ارتقای یکی از الگوریتمهای کارامد در یادگیری ماشین، به نام جنگل تصادفی هستیم. برای این منظور از تکنیکهای فشردهسازی و موازیسازی بهره میبریم. چالش اساسی مورد توجه در این پژوهش، در رابطه با به کارگیری جنگل تصادفی در پردازش و تحلیل دادههای حجیم میباشد. در چنین مواردی، این الگوریتم به دلیل مراجعات پرشمار به حافظه، کارایی معمول و مورد نیاز را ندارد. این پژوهش نشان میدهد که چگونه میتوان با به کارگیری یک شیوه فشردهسازی ابتکاری، در کنار تکنیکهای موازیسازی به هدف مورد نظر دست یافت. در این رابطه، اجزای مشترک درختان در جنگل تصادفی با یکدیگر به اشتراک گذاشته میشوند. علاوه بر این، روش موازیسازی مبتنی بر دستورات برداریسازی به همراه روش موازیسازی مبتنی بر حافظه اشتراکی در جریان پردازش دادهها به کار میروند. به منظور ارزیابی عملکرد روش پیشنهادی، آن را بر روی مجموعه دادههای محک Kaggle که در رقابتهای مربوط به الگوریتمهای یادگیری به وفور به کار میروند، اجرا نمودیم. نتایج بهدستآمده حاکی از آن است که به کارگیری روش فشردهسازی پیشنهادی، 66 درصد بهبود در سرعت پردازش دادهها به دنبال داشته است. همچنین به کارگیری فشردهسازی به همراه موازیسازی یادشده، 96 درصد بهبود را به همراه داشته است. به طور کلی نتایج آزمایشی و تحلیلها دلالت بر این دارند که راهکارهای پیشنهادی، قدمی مؤثر در راستای رسیدن به رایانش سریع برای جنگل تصادفی در اختیار میگذارد.
پرونده مقاله
در سالهای اخیر تشخیص فعالیت فیزیکی انسان از روی دادههای گرفتهشده توسط سنسورهای ژیروسکوب و شتابسنج در گوشی هوشمند، مورد توجه پژوهشگران قرار گرفته است. در این مقاله با به کارگیری روش تحلیل مؤلفههای اساسی، ویژگیهایی با بعد پایین و مناسب استخراج شده و کارایی چند طبقه چکیده کامل
در سالهای اخیر تشخیص فعالیت فیزیکی انسان از روی دادههای گرفتهشده توسط سنسورهای ژیروسکوب و شتابسنج در گوشی هوشمند، مورد توجه پژوهشگران قرار گرفته است. در این مقاله با به کارگیری روش تحلیل مؤلفههای اساسی، ویژگیهایی با بعد پایین و مناسب استخراج شده و کارایی چند طبقهبندیکننده مختلف شامل ماشین بردار پشتیبان، رگرسیون منطقی، ادابوست و شبکه عصبی کانولوشن برای طبقهبندی فعالیتها بررسی و یک سیستم کارا برای این منظور پیشنهاد شده است. نتایج به دست آمده نشان میدهد که سیستم پیشنهادی توانسته است دقت تشخیص را نسبت به کارهای اخیر بهبود دهد. یکی از چالشهایی که لازم است در خصوص سیستمهای تشخیص فعالیت مورد توجه قرار گیرد، میزان پایداری این سیستمها نسبت به مدلهای مختلف از گوشیهای هوشمند است. با توجه به این که کیفیت سنسورها و نویز مرتبط با آنها از یک مدل گوشی به مدل دیگر متفاوت است، بنابراین بررسی میزان پایداری الگوریتم شناسایی فعالیت در نویزهای مختلف حایز اهمیت خواهد بود. در این مقاله کارایی و میزان پایداری طبقهبندیکنندهها در سطوح مختلف نویز نیز بررسی شده است. نتایج به دست آمده نشان میدهد که ماشین بردار پشتیبان با میانگین دقت 34/96% پایداری بهتری نسبت به نویز در مقایسه با سایر طبقهبندیکنندهها داشته است.
پرونده مقاله