عاملها موجودات نرمافزاري هستند كه بطور پيوسته و خود مختار در يک محيط که براي آن طراحي شدهاند کار ميکنند. براي عاملها نيازهايي از قبيل واكنشي بودن نسبت به كنشهاي محيطي، خود مختاري در انتخاب مسير و ادامه آن، قابليت تطبيق و يادگيري و ... ضروري به نظر ميرسد. امروزه مطال چکیده کامل
عاملها موجودات نرمافزاري هستند كه بطور پيوسته و خود مختار در يک محيط که براي آن طراحي شدهاند کار ميکنند. براي عاملها نيازهايي از قبيل واكنشي بودن نسبت به كنشهاي محيطي، خود مختاري در انتخاب مسير و ادامه آن، قابليت تطبيق و يادگيري و ... ضروري به نظر ميرسد. امروزه مطالعه سيستمهاي مبتني بر عاملها به يك موضوع مهم آكادميك تبديل شده است كه كاربردهاي تجاري و صنعتي فراواني را نيز دربر دارد. در سيستمهاي چندعامله، چندين عامل هوشمند با قابليت برقراري ارتباط با يكديگر، جهت رسيدن به مجموعهاي از اهداف، با هم همكاري ميكنند. بدليل پيچيدگيهاي موجود در محيطهاي چندعامله پويا و متغير نياز به روشهاي يادگيري ماشين در چنين محيطهايي احساس ميشود. اتوماتاي يادگير يك مدل انتزاعي است كه تعداد محدودي عمل را ميتواند انجام دهد. هر عمل انتخاب شده توسط محيطي احتمالي ارزيابي ميگردد و پاسخي به اتوماتاي يادگير داده ميشود. اتوماتاي يادگير از اين پاسخ استفاده نموده و عمل خود براي مرحله بعد را انتخاب ميكند. در اين مقاله با استفاده از بستر تست شبيهسازي فوتبال روباتها به بررسي كارآيي اتوماتاي يادگير در همكاري بين عاملهاي عضو يك تيم پرداخته شده است. بدليل وجود تعداد حالات بسيار زياد در دامنههاي چندعامله پيچيده، داشتن روشي براي عموميسازي حالات محيطي، امري ضروري است چرا كه انتخاب مناسب چنين روشي، در تعيين حالات و اعمال عامل نقشي تعيين كننده دارد. در اين مقاله همچنين به معرفي و پيادهسازي تكنيك "بهترين گوشه در مربع حالت" پرداخته شده است. با استفاده از اين روش فضاي حالات پيوسته و بسيار وسيع عامل به فضاي حالات گسسته و محدود نگاشته ميشود. كارآيي اين تكنيك در عموميسازي حالات محيطي در يك دامنه چند عامله همكاري گرا مورد بررسي قرار گرفته است.
پرونده مقاله
بازیهای غیر قطعی (تصادفی) بهعنوان توسعهای از فرآیندهای تصادفی مارکوف با چندین عامل در سیستمهای چندعامله و مدلسازی آنها حائز اهمیت بوده و بهعنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله بهکار رفتهاند. در حال حاضر اتوماتاهای یادگیر بهعنوان ابزاری ارزشمن چکیده کامل
بازیهای غیر قطعی (تصادفی) بهعنوان توسعهای از فرآیندهای تصادفی مارکوف با چندین عامل در سیستمهای چندعامله و مدلسازی آنها حائز اهمیت بوده و بهعنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله بهکار رفتهاند. در حال حاضر اتوماتاهای یادگیر بهعنوان ابزاری ارزشمند در طراحی الگوریتمهای یادگیری چندعامله بهکار رفتهاند. در این مقاله مدلی مبتنی بر اتوماتای یادگیر و مفهوم آنتروپی برای حل بازیهای غیر قطعی و پیداکردن سیاست بهینه در این بازیها ارائه شده است. در مدل پیشنهادی بهازای هر عامل در هر حالت از محیط بازی یک اتوماتای یادگیر با ساختار متغیر از نوع S قرار داده شده است که اعمال بهینه را در هر حالت یاد میگیرند. تعداد اعمال هر اتوماتا با توجه به همسایگان مجاور هر حالت تعیین شده و ترکیب اعمال اتوماتاها حالت بعدی محیط را انتخاب میکند. در مدل پیشنهادی از آنتروپی بردار احتمالات اتوماتای یادگیر حالت جدید برای کمک به پاداشدهی اتوماتاها و بهبود یادگیری استفاده شده است. برای بررسی و تحلیل رفتار الگوریتم یادگیری پارامتری بهنام آنتروپی کلی تعریف گردیده که میزان همگرایی را در الگوریتم یادگیری بیان میکند. در نهایت الگوریتمی اصلاحیافته با ایجاد تعادل بین جستجو و استناد بر تجربیات پیشنهاد شده است. نتایج آزمایشها نشان میدهد الگوريتم ارائهشده از کارایی مناسبی از هر دو جنبه هزينه و سرعت رسيدن به راه حل بهينه برخوردار است.
پرونده مقاله
یکی از مسایل مطرح در ساخت سیستمهای یادگیر نظیر شبکههای عصبی و یا اتوماتای یادگیر، تعیین نرخ یادگیری است. در اکثر موارد از یک الگوریتم کاهشیابنده در طول زمان برای تنظیم نرخ یادگیری استفاده میشود. در این مقاله یک روش جدید برای تغییر نرخ یادگیری و انطباق سیستم یادگیرند چکیده کامل
یکی از مسایل مطرح در ساخت سیستمهای یادگیر نظیر شبکههای عصبی و یا اتوماتای یادگیر، تعیین نرخ یادگیری است. در اکثر موارد از یک الگوریتم کاهشیابنده در طول زمان برای تنظیم نرخ یادگیری استفاده میشود. در این مقاله یک روش جدید برای تغییر نرخ یادگیری و انطباق سیستم یادگیرنده با وضعیت محیط، برای استفاده در اتوماتای یادگیر پیشنهاد شده است. این روش جدید از برخی معیارهای آماری مربوط به توزیع فعلی به دست آمده برای بردار احتمالات متناظر با اقدامهای اتوماتا به منظور تعیین افزایش یا کاهش نرخ یادگیری استفاده میکند. مزیت این روش در آن است که بر خلاف روشهای موجود فعلی، در طول فرایند یادگیری هم افزایش و هم کاهش مقدار نرخ یادگیری را - بسته به نتایج مقایسه معیارهای آماری - انجام میدهد و به صورت خودکار نرخ یادگیری را تنظیم میکند.
ضمن تشریح مبانی ریاضی این الگوریتم جدید، عملکرد این الگوریتم را در محیطهای تصادفی نمونه بررسی کرده و با مقایسه نتایج به دست آمده نشان دادهایم روش پیشنهادی جدید به دلیل این که در طول زمان یادگیری، همزمان و بر اساس معیارهای تعیینشده، افزایش و کاهش نرخ یادگیری را انجام میدهد، از انعطافپذیری بیشتری نسبت به روشهای قبلی برای انطباق با محیطهای تصادفی پویا برخوردار است و مقادیر یاد گرفته شده به مقادیر حقیقی نزدیکتر هستند.
پرونده مقاله
در این مقاله، یک ساختار جدید شبکهای از آتاماتاهای یادگیر موسوم به آتاماتای یادگیر توزیعشده توسعهیافته معرفی شده و سپس الگوریتمی مبتنی بر این ساختار شبکهای برای حل مسأله زیرگراف بهینه در گرافهای تصادفی با یالهای وزندار از طریق نمونهگیری ارائه میشود. نشان داده شد چکیده کامل
در این مقاله، یک ساختار جدید شبکهای از آتاماتاهای یادگیر موسوم به آتاماتای یادگیر توزیعشده توسعهیافته معرفی شده و سپس الگوریتمی مبتنی بر این ساختار شبکهای برای حل مسأله زیرگراف بهینه در گرافهای تصادفی با یالهای وزندار از طریق نمونهگیری ارائه میشود. نشان داده شده که ساختار شبکهای جدید پیشنهادی قادر به حل مسایل بهینهسازی روی گرافهای تصادفی از طریق نمونهگیری با تعداد نمونه کمتر نسبت به روش نمونهگیری استاندارد است. علاوه بر این، اثباتی برای همگرایی آن به جواب بهینه ارائه شده و نشان داده میشود که ساختار شبکهای پیشنهادی همواره با احتمال 1 به جواب بهینه همگرا میگردد.
پرونده مقاله
در اين مقاله يک آتاماتاي توزيعشده جديد به نام آتاماتاي يادگير توزيعشده توسعهيافته براي يادگيري توزيع توأم مجموعهاي از متغيرهاي تصادفي معرفي خواهد شد. اين شبکه از آتاماتاها در محيطهايي که پاسخ محيط به مجموعهاي از اقدامات انجامشده توسط آتاماتا، مستقل از يکديگر نبود چکیده کامل
در اين مقاله يک آتاماتاي توزيعشده جديد به نام آتاماتاي يادگير توزيعشده توسعهيافته براي يادگيري توزيع توأم مجموعهاي از متغيرهاي تصادفي معرفي خواهد شد. اين شبکه از آتاماتاها در محيطهايي که پاسخ محيط به مجموعهاي از اقدامات انجامشده توسط آتاماتا، مستقل از يکديگر نبوده و نوعي وابستگي شرطي ميان اين پاسخها حاکم باشد، کاربرد دارد. نشان داده شده که اين آتاماتاي جديد قادر است تخميني از توزيع شرطي اقدامها را فرا بگيرد. در ادامه چارچوبی مبتني بر آتاماتاي يادگير توزيعشده جديد پيشنهادي، براي حل مسأله يادگيري برخط پارامترهاي یک شبکه بیزی ارائه شده است. اين چارچوب با دادهها و شواهد جديد منطبق شده و عمليات به روز رساني پارامترها را انجام ميدهد. با بررسيهاي رياضي و آزمايشهاي عملي روي شبکههاي نمونه، نشان دادهايم که اين مدل جديد قادر است با تخميني با دقت برابر با EM، يادگيري پارامترهاي يک شبکه بيزي را انجام دهد. علاوه بر ويژگي افتراقیبودن و يادگيري برخط، اين ساختار جديد با شرايطي که دادهها ناکامل باشند نيز سازگار است و به دليل استفاده از روابط يادگيري خطي و مبتني بر آتاماتاي يادگير، سربار محاسباتي کمي نيز دارد.
پرونده مقاله
یکی از مشکلات الگوریتمهای ژنتیک سنتی، مشکل همگرایی زودرس است که باعث ناتوانی آنها در جستجوی جوابهای مناسب میشود. یک الگوریتم ممتیک از جستجوی محلی برای افزایش سرعت کشف جوابهای مناسبی که پیداکردن آنها به وسیله جستجوی عمومی تنها به طول میانجامد یا قابل دسترس نباشند، ا چکیده کامل
یکی از مشکلات الگوریتمهای ژنتیک سنتی، مشکل همگرایی زودرس است که باعث ناتوانی آنها در جستجوی جوابهای مناسب میشود. یک الگوریتم ممتیک از جستجوی محلی برای افزایش سرعت کشف جوابهای مناسبی که پیداکردن آنها به وسیله جستجوی عمومی تنها به طول میانجامد یا قابل دسترس نباشند، استفاده میکند. در این مقاله یک الگوریتم ممتیک مبتنی بر اتوماتای یادگیر به نام LA-MA ارائه شده که از دو بخش ژنتيکي و ممتيکي تشکيل شده است. تکامل يا جستجوي عمومي در بخش ژنتیکی و بهرهبرداری یا جستجوی محلی در بخش ممتیکی انجام میشوند. در بخش ممتيکي، احتمال موفقيت جستجوي محلي تخمين زده شده و در صورتي که انجام جستجوي محلي نسبت به جستجوي عمومي مقرون به صرفه باشد، بهرهبرداري انجام ميشود. تخمين صحيح احتمال موفقيت جستجوي محلي، باعث ايجاد تعادل بين جستجوي عمومي و محلي شده و کارايي الگوريتم ممتيک را بالا ميبرد. در این مقاله از دو مسأله بيشينهسازي يكها و تناظر گراف جهت ارزيابي كارايي الگوريتم پيشنهادي استفاده شده است. نتايج آزمايشها نشان ميدهد كه الگوريتم پيشنهادي از نظر كيفيت جوابهاي به دست آمده و نرخ همگرايي نسبت به ساير الگوريتمها عملكرد بهتري دارد.
پرونده مقاله
یکی از مسایل جالب در هوش مصنوعی ساخت شبکه بیزی بر اساس نمونههایی از دادهها است؛ یعنی فرض کنید یک شبکه بیزی N روی مجموعه متغیرهای V مفروض است. هدف، ساخت یک شبکه بیزی- استخراج مجموعهای از روابط علت/ معلولی- میان مجموعه متغیرها بر اساس نمونههایی که از N استخراج شده و چکیده کامل
یکی از مسایل جالب در هوش مصنوعی ساخت شبکه بیزی بر اساس نمونههایی از دادهها است؛ یعنی فرض کنید یک شبکه بیزی N روی مجموعه متغیرهای V مفروض است. هدف، ساخت یک شبکه بیزی- استخراج مجموعهای از روابط علت/ معلولی- میان مجموعه متغیرها بر اساس نمونههایی که از N استخراج شده و بدون در اختیار داشتن N است. از این مسأله در متون با عنوان یادگیری ساختاری شبکه بیزی یاد میشود. یکی از روشهای مهم در یادگیری ساختاری شبکههای بیزی با استفاده از دادههای نمونه، استفاده از معیارهای مبتنی بر امتیاز برای ارزیابی میزان برازندگی یک ساختار بیزی مفروض با دادههای نمونه و جست و جو در میان ساختارهای ممکن است. جست و جو برای یافتن یک ساختار مناسب برای شبکه بیزی که بیشترین سازگاری را با نمونهها داشته باشد غالباً از طریق جست و جو در فضای ساختارها با استفاده از تکنیکهای جست و جوی استاندارد یا الهامگرفته از طبیعت نظیر تپهنوردی حریصانه، الگوریتمهای ژنتیک، شبیهسازی حرارتی یا الگوریتم تبرید، بهینهسازی کلونی مورچهها و نظایر آن صورت میگیرد.
در این مقاله یک روش جدید مبتنی بر آتاماتای یادگیر برای یادگیری ساختاری شبکه بیزی ارائه شده است. در این روش آتاماتای یادگیر به عنوان یک ابزار جستجوی تصادفی مورد استفاده قرار میگیرد. از ویژگیهای روش جدید پیشنهادی جستجوی همزمان در فضای جایگشتهای ممکن از متغیرها (فضای ترتیب متغیرها) و فضای ساختارها (فضای DAGها) است. ضمن بررسی ریاضی الگوریتم پیشنهادی، روش جدید روی تعدادی از شبکههای نمونه مورد آزمایش قرار گرفته است.
پرونده مقاله
در این مقاله به بررسی یک معیار جدید مقایسهای برای تولید پاسخ محیط در حل مسایل بهینهسازی روی گرافهای تصادفی به عنوان مدلی از شبکههای کامپیوتری توسط شبکهای از آتاماتاهای یادگیر میپردازیم. این روش جدید به دلیل لحاظکردن تقریبی از واریانس پاسخهای تولیدشده توسط شبکه آ چکیده کامل
در این مقاله به بررسی یک معیار جدید مقایسهای برای تولید پاسخ محیط در حل مسایل بهینهسازی روی گرافهای تصادفی به عنوان مدلی از شبکههای کامپیوتری توسط شبکهای از آتاماتاهای یادگیر میپردازیم. این روش جدید به دلیل لحاظکردن تقریبی از واریانس پاسخهای تولیدشده توسط شبکه آتاماتاهای یادگیر، قادر به انطباق بیشتری با محیط بوده و در نتیجه پاسخهای مناسبتری به اقدامهای انجامشده توسط آتاماتاها در شبکهای از آتاماتاهای یادگیر میدهد. روش جدید از طریق واردکردن یک مقدار نویز محاسبهشده، از ایستایی فرایند یادگیری و گیرافتادن آن در نقاط کمینه محلی جلوگیری کرده و باعث تسریع در فرایند یادگیری میشود. به کمک شبیهسازیها نشان میدهیم این روش جدید در مقایسه با روشهای فعلی که تا کنون مورد استفاده بوده است، هم به لحاظ سرعت همگرایی به جواب بهینه و هم به لحاظ قابلیت گریز از اثر واریانس وزن یالهای گراف تصادفی- که باعث میل جواب نهایی به سمت کوچکترین مقدار و نه مقدار میانگین میشود- عملکرد بهتری دارد.
پرونده مقاله
الگوريتم ممتيک يکی از انواع الگوريتمهاي تکاملي است که با استفاده از جستجوي عمومي و جستجوي محلي فضاي حل مسأله را به صورت بهينه جستجو مينمايد. تعادل بين جستجوي عمومي و محلي، همواره يکی از مسايل مهم در اين دسته از الگوريتمها است. در اين مقاله يک مدل جديد ممتيکي با نام 2 چکیده کامل
الگوريتم ممتيک يکی از انواع الگوريتمهاي تکاملي است که با استفاده از جستجوي عمومي و جستجوي محلي فضاي حل مسأله را به صورت بهينه جستجو مينمايد. تعادل بين جستجوي عمومي و محلي، همواره يکی از مسايل مهم در اين دسته از الگوريتمها است. در اين مقاله يک مدل جديد ممتيکي با نام 2GALA ارائه شده است. اين مدل از ترکيب الگوريتم ژنتيک و اتوماتاي مهاجرت اشيا که نوع خاصي از اتوماتاي يادگير ساختار ثابت میباشد، تشکيل شده است. در مدل ارائهشده جستجوي عمومي توسط الگوريتم ژنتيک و يادگيري محلي به وسيله اتوماتاي يادگير انجام ميشود. در اين مدل جهت افزايش سرعت همگرايي و فرار از همگرايي زودرس، به طور همزمان از دو مدل يادگيري لامارکي و بالدويني استفاده شده است. در اين مدل تکاملي، جهت استفاده توأم از اثرات مثبت تکامل و يادگيري محلي، کروموزمها به وسيله اتوماتاي مهاجرت اشيا بازنمايي شدهاند. جهت نمایش برتری مدل ارائهشده نسبت به سایر روشهای موجود، از این مدل برای حل مسأله تناظر گراف استفاده گردیده است.
پرونده مقاله