دستهبندی، یکی از وظایف مهم دادهکاوی و یادگیری ماشین است و درخت تصمیم به عنوان یکی از الگوریتمهای پرکاربرد دستهبندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با دادههای حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیتهای حافظه و زمان اجرا مواجه است. چکیده کامل
دستهبندی، یکی از وظایف مهم دادهکاوی و یادگیری ماشین است و درخت تصمیم به عنوان یکی از الگوریتمهای پرکاربرد دستهبندی، دارای سادگی و قابلیت تفسیر نتایج است. اما در مواجهه با دادههای حجیم، درخت تصمیم بسیار پیچیده خواهد شد و با محدودیتهای حافظه و زمان اجرا مواجه است. الگوريتمهاي ساخت درخت باید همه مجموعه داده آموزش و یا بخش زیادی از آن را درون حافظه نگه دارند. الگوریتمهایی که به علت انتخاب زیرمجموعهای از داده با محدودیت حافظه مواجه نیستند، زمان اضافی جهت انتخاب داده صرف میکنند. جهت انتخاب بهترین ویژگی برای ایجاد انشعاب در درخت هم باید محاسبات زیادی بر روی این مجموعه داده انجام شود. در این مقاله، یک رویکرد مقیاسپذیر افزایشی بر مبنای تقسیم سریع و هرس، جهت ساخت درخت تصمیم بر روی مجموعه دادههای حجیم ارائه شده است. الگوریتم ارائهشده درخت تصمیم را با استفاده از کل مجموعه داده آموزش اما بدون نیاز به ذخیرهسازی داده در حافظه اصلی میسازد. همچنین جهت کاهش پیچیدگی درخت از روش پیشهرس استفاده شده است. نتایج حاصل از اجرای الگوریتم بر روی مجموعه دادههای UCI نشان میدهد الگوریتم ارائهشده با وجود دقت و زمان ساخت قابل رقابت با سایر الگوریتمها، بر مشکلات حاصل از پیچیدگی درخت غلبه کرده است.
پرونده مقاله
با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روشهای یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقهبندیها با روشهای یادگیری ماشین قدیمی، به ویژه استفاده از طبقهبندیهای ذاتاً تنبل مانند روش k- نزدیکترین همسایگی (KNN)، عملیات ط چکیده کامل
با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روشهای یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقهبندیها با روشهای یادگیری ماشین قدیمی، به ویژه استفاده از طبقهبندیهای ذاتاً تنبل مانند روش k- نزدیکترین همسایگی (KNN)، عملیات طبقهبندی دادههای حجیم بسیار کند است.
نزدیکترین همسایگی به دلیل سادگی و دقت عملی که ارائه میدهد یک روش محبوب در زمینه طبقهبندی دادهها میباشد. روش پیشنهادی مبتنی بر مرتبسازی بردارهای ویژگی دادههای آموزشی در یک درخت جستجوی دودویی است تا طبقهبندی دادههای بزرگ را با استفاده از روش نزدیکترین همسایگی تسریع بخشد. این کار با استفاده از یافتن تقریبی دو دورترین داده محلی در هر گره درخت انجام میشود. این دو داده به عنوان معیار برای تقسیم دادههای موجود در گره فعلی بین دو گروه، مورد استفاده قرار میگیرند. مجموعه دادههای موجود در هر گره بر اساس شباهت آنها به این دو داده، به فرزند چپ یا راست گره فعلی تخصیص داده میشوند. نتایج آزمایشهای متعدد انجامشده بر روی مجموعه دادههای مختلف از مخزن UCI، میزان دقت خوب با توجه به زمان اجرای کم روش پیشنهادی را نشان میدهد.
پرونده مقاله
در این مقاله، طرح حفاظتی هوشمند بهمنظور پیشبینی برخط ناپایداری گذرای ناحیه گسترده در سیستمهای قدرت بر اساس تئوری درخت تصمیم معرفی میشود. برای این منظور با بررسی نوسان توان شبکه و شرایط معادلات دینامیک ژنراتور سنکرون در دو حالت پایدار و شرایط خروج از همگامی، شاخصهای چکیده کامل
در این مقاله، طرح حفاظتی هوشمند بهمنظور پیشبینی برخط ناپایداری گذرای ناحیه گسترده در سیستمهای قدرت بر اساس تئوری درخت تصمیم معرفی میشود. برای این منظور با بررسی نوسان توان شبکه و شرایط معادلات دینامیک ژنراتور سنکرون در دو حالت پایدار و شرایط خروج از همگامی، شاخصهای برخط مبتنی بر واحدهای اندازهگیری فازوری معرفی و تحت شرایط متفاوت بهرهبرداری و توپولوژیکی شبکه در زمانهای وقوع خطا و برطرفشدن خطا بهمنظور عملکرد سریع طرح پیشنهادی اندازهگیری میشوند. در ادامه، شاخصهای پیشنهادی بهصورت جفتداده ورودی- خروجی برای آموزش درخت تصمیم در محیط برونخط مورد استفاده قرار میگیرند. نمونههای آموزشی شامل یک سری اندازهگیریها تحت خطاهای متفاوت شامل نوع و مکان خطا هستند. توانایی حفاظتی طرح پیشنهادی بر روی یک شبکه 39باسه با پتانسیل ناپایداری گذرای ناحیه گسترده ژنراتورهای سنکرون، پیادهسازی و عملکرد درخت تصمیم تحت سناریوهای از پیش آموزش دادهنشده صحتسنجی میشود. نتایج شبیهسازی نشاندهنده توانایی طرح پیشنهادی درخت تصمیم در زمینه پیشبینی صحیح خروج از همگامی ناحیه گسترده سیستم قدرت تحت طیف وسیعی از شرایط دینامبک شبکه است.
پرونده مقاله