یک معیار مبتنی بر واریانس برای ارزیابی یادگیری آتاماتای یادگیر ‏در حل مسایل بهینه‌سازی گراف تصادفی

محورهای موضوعی : مهندسی برق و کامپیوتر

محمدرضا ملاخلیلی میبدی ¹ , محمدرضا میبدی ^{2
*}

1 - دانشگاه آزاد اسلامی، واحد میبد
2 - دانشگاه صنعتی امیرکبیر

تاریخ دریافت : 1396/04/27 تاریخ پذیرش : 1396/04/27 تاریخ انتشار : 1396/03/31

کلید واژه: شبکه آتاماتاهای یادگیر واریانس همگرایی درخت پوشای کمینه تصادفی کوتاه‌ترین مسیر تصادفی,

چکیده مقاله :

در این مقاله به بررسی یک معیار جدید مقایسه‌ای برای تولید پاسخ محیط در حل مسایل بهینه‌سازی روی گراف‌های تصادفی به عنوان مدلی از شبکه‌های کامپیوتری توسط شبکه‌ای از آتاماتاهای یادگیر می‌پردازیم. این روش جدید به دلیل لحاظ‌کردن تقریبی از واریانس پاسخ‌های تولیدشده توسط شبکه آتاماتاهای یادگیر، قادر به انطباق بیشتری با محیط بوده و در نتیجه پاسخ‌های مناسب‌تری به اقدام‌های انجام‌شده توسط آتاماتاها در شبکه‌ای از آتاماتاهای یادگیر می‌دهد. روش جدید از طریق واردکردن یک مقدار نویز محاسبه‌شده، از ایستایی فرایند یادگیری و گیرافتادن آن در نقاط کمینه محلی جلوگیری کرده و باعث تسریع در فرایند یادگیری می‌شود. به کمک شبیه‌سازی‌ها نشان می‌دهیم این روش جدید در مقایسه با روش‌های فعلی که تا کنون مورد استفاده بوده است، هم به لحاظ سرعت همگرایی به جواب بهینه و هم به لحاظ قابلیت گریز از اثر واریانس وزن یال‌های گراف تصادفی- که باعث میل جواب نهایی به سمت کوچک‌ترین مقدار و نه مقدار میانگین می‌شود- عملکرد بهتری دارد.

چکیده انگلیسی:

In this paper, a new criterion is introduced for solving optimization problems on stochastic graphs- as a model of computer networks-by stochastic learning Automata. This proposed method, because of considering estimated variance of response of environment, can better adaptation to changes of environment. As a result, the proposed method can produce better response to learning Automata actions. The proposed method, by entering a noise, can avoid learning Automata being stuck at a local optimum point. Our simulation shows that this proposed method can be improve the convergence rate of Automata-based algorithm.

منابع و مأخذ:

[1] K. S. Narendra and M. A. L. Thathachar, "Learning automata: a survey," IEEE Trans. Syst. Man, Cyberentics, vol. 14, no. 4, pp. 323-334, Jul. 1974.
[2] S. Lakshmivarahan, Learning Algorithms Theory and Applications, vol. 30, Springer-Verlag, New York, 1981.
[3] G. Santharam and P. S. Sastry, "A reinforcement learning neural network for adaptive control of Markov chains," IEEE Trans.Syst. Man Cybern. Part A, Syst. Humans, vol. 27, no. 5, pp. 588-600, Sept. 1997.
[4] B. J. Oommen and D. C. Y. Ma, "Deterministic learning automata solutions to the equipartitioning problem," IEEE Trans. Comput., vol. 37, no. 1, pp. 2-13, Jan. 1988.
[5] B. J. Oommen and E. V De St Croix, "String taxonomy using learning automata," IEEE Trans. Syst. Man, Cybern. Part B, Cybern. a Publ. IEEE Syst. Man, Cybern. Soc., vol. 27, no. 2, pp. 354-65, Jan. 1997.
[6] B. J. Oommen and E. V de St Croix, "Graph partitioning using learning automata," IEEE Trans. Comput., vol. 45, no. 2, pp. 195-208, Feb. 1996.
[7] A. Tsoularis, C. Kambhampati, and K. Warwick, "Path planning of robots in noisy workspaces using learning automata," in Proc. of the 1993 IEEE Int. Symp. on Intelligent Control, pp. 560-564, Aug. 1993.
[8] T. J. Gordon, C. Marsh, and Q. H. Wu, "Stochastic optimal control of active vehicle suspensions using learning automata," Proc. Inst. Mech. Eng. Part I J. Syst. Control Eng., vol. 207, no. 3, pp. 143-152, Aug. 1993.
[9] C. Marsh, T. J. Gordon, and Q. H. Wu, "Application of learning automata to controller design in slow-active automobile suspensions," Veh. Syst. Dyn., vol. 24, no. 8, pp. 597-616, Sept. 1995.
[10] E. Ikonen and K. Najim, "Use of learning automata in distributed fuzzy logic processor training," IEE Proc.Control Theory Appl., vol. 144, no. 3, pp. 255-262, May 1997.
[11] T. Aoki, T. Oka, T. Suzuki, and S. Okuma, "Acquisition of optimal action selection to avoid moving obstacles in autonomous mobile robot," in Proc., IEEE Int. Conf. on Robotics and Automation, vol. 3, pp. 2055-2060, Apr. 1996.
[12] M. A. Thathachar and B. Harita, "Learning automata with changing number of actions," IEEE Trans. Syst. Man, Cybern.-Part A Syst. Humans, vol. 17, no. 6, pp. 1095-1100, Nov. 1987.
[13] H. Beigy and M. Meybodi, Intelligent Channel Assignment in Cellular Networks: A Learning Automata Approach, Amirkabir University of Technology, Technical Report, 2004.
[14] H. Beigy and M. R. Meybodi, "Utilizing distributed learning automata to solve stochastic shortest path problems," Int. J. Uncertainty, Fuzziness Knowledge-Based Syst., vol. 14, no. 5, pp. 591-615, Oct. 2006.
[15] م. ر. ملاخلیلی میبدی و م. ر. میبدی، "یک الگوریتم جدید مبتنی بر آتاماتای یادگیر توزیع‌شده برای حل مسأله کوتاه‌ترین مسیر تصادفی،" مجموعه مقالات ششمین کنفرانس سیستم‌های هوشمند، کرمان، 10 ص.، 5-4 آذر 1384.
[16] J. Akbari Torkestani and M. R. Meybodi, "Learning automata-based algorithms for solving stochastic minimum spanning tree problem," Appl. Soft Comput., vol. 11, no. 6, pp. 4064-4077, Sep. 2011.
[17] A. Rezvanian and M. R. Meybodi, "A new learning automata-based sampling algorithm for social networks," Int. J. Commun. Syst., vol. 30, no. 5, 21 pp., 25 Mar. 2015.
[18] م. ر. ملاخلیلی میبدی و م. ر. میبدی، "روشی مبتنی بر آتاماتای یادگیر توزیع‌شده برای مدل‌سازی کاربران در محیط‌های فراپیوندی،" مجموعه مقالات کنگره ملی مهندسی برق، کامپیوتر و فناوری اطلاعات، 5 ص.، 19-17 آبان 1391.
[19] م. ر. ملاخلیلی‌میبدی و م. ر. میبدی، "استفاده از آتاماتای یادگیر توزیع‌شده در پیش‌بینی حرکت کاربران در وب،" مجموعه مقالات سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران، 6 ص.، تهران، 21-19 اسفند 1386.
[20] ع. براداران هاشمی و م. ر. میبدی، "داده‌کاوی استفاده از وب با استفاده از آتاماتای یادگیر توزیع‌شده،" مجموعه مقالات دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران، 7 ص.، تهران، 3-1 اسفند 1385.
[21] ب. اناری، م. ر. میبدی و ز. اناری، "ارائه روشی جدید برای رتبه‌بندی صفحات وب با استفاده از آتاماتای یادگیر توزیع‌شده،" مجموعه مقالات سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران، 7 ص.، تهران، 21-19 اسفند 1386.
[22] M. R. Mollakhalili Meybodi and M. R. Meybodi, "Extended distributed learning automata: an automata-based framework for solving stochastic graph optimization problems," Appl. Intell., vol. 41, no. 2, pp. 923-940, Oct. 2014.
[23] م. ر. ملاخلیلی میبدی و م. ر. میبدی، "یک الگوریتم جدید مبتنی بر آتاماتای یادگیر توزیع‌شده توسعه‌یافته برای یادگیری پارامتری شبکه بیزی،" نشریه مهندسی برق و مهندسی کامپیوتر ایران، سال 12، شماره ۲- ب، صص. 126-119، زمستان 1393.
[24] م. ر. ملاخلیلی میبدی و م. ر. میبدی، "یادگیری ساختاری شبکه‌های بیزی: یک رهیافت مبتنی بر آتاماتای یادگیر،" نشریه مهندسی برق و مهندسی کامپیوتر ایران، سال 14، شماره ۱- ب، صص. 40-27، بهار 1395.
[25] J. B. Kruskal, "On the shortest spanning sub tree of a graph and the traveling salesman problem," American Mathematical Society, vol. 7, no. 1, pp. 48-50, Feb. 1956.
[26] M. Elkin, "An unconditional lower bounds on the time-approximation tradeoffs for the distributed minimum spanning tree problem," SIAM Journal on Computing, vol. 36, no.2, pp.433-456, 2006.
[27] J. Garay, S. Kutten, and D. Peleg, "A sublinear time distributed algorithm for minimum-wight-spanning tree," SIAM J. Comput., vol. 27, no. 1, pp. 302-326, 1998.
[28] M. Khan and G. Pandurangan, "A fast distributed approximation algorithm for minimum spanning trees," in Proc. of the 20th Int. Symp. on Distributed Computing, DISC'06, pp. 355-369, 2006.
[29] H. Beigy and M. R. Meybodi, "Solving stochastic shortest path problem using distributed learning automata," in Proc. 6th Annual CSI Computer Conf., CSICC'01, pp. 70-86, 2001.
[30] K. Liu, Stochastic Online Learning for Network Optimization under Random Unknown Weights, 18 pp.
[31] م. ر. ملاخلیلی میبدی و م. ر. میبدی، "یک روش جدید مبتنی بر معیارهای آماری توزیع برای تنظیم خودکار نرخ یادگیری آتاماتای یادگیر در محیط‌های پویا،" نشریه مهندسی برق و مهندسی کامپیوتر ایران، سال ۱۱، شماره ۱- ب، صص. 51-43، تابستان 1392.
[32] م. قربعلی‌پوردرو و م. ر. میبدی، "یافتن درخت پوشای مینیمم در گراف‌های تصادفی با استفاده از آتاماتاهای یادگیر،" مجموعه مقالات چهاردهمين کنفرانس سالانه انجمن کامپیوتر ایران، 7 ص.، تهران، 21-20 اسفند 1387.
[33] K. R. Hutson and D. R. Shier, "Bounding distributions for the weight of a minimum spanning tree in stochastic networks," Oper. Res., vol. 53, no. 5, pp. 879-886, Oct. 2005.

مقالات مرتبط

یک رهیافت فرااکتشافی چندهدفه برای بهبود پوشش و اتصال در شبکه‌های حسگر بی‌سیم
تاریخ چاپ : 1405/02/22
رویکرد ارزیابی هیجان نوین جهت مراقبت از سرطان مبتنی بر مدل‌های زبانی بزرگ
تاریخ چاپ : 1405/02/22
ارائه روشی برای مدیریت منابع در شبکه‌های Fog-DSDN با بهره‌گیری از معماری میکروسرویس و شبکه‌های ESN
تاریخ چاپ : 1405/02/22
چارچوب ترکیبی سبک‌وزن برای امنیت اینترنت اشیا با استفاده از جنگل تصادفی بهینه و انتخاب ویژگی تطبیقی در معماری لبه-ابری
تاریخ چاپ : 1405/02/22
یک چارچوب یادگیری نیمه‌نظارتی جهت دسته‌بندی دقیق موارد آزمون با بهره‌گیری از تعبیه‌های زبانی و ویژگی‌های معنایی متن
تاریخ چاپ : 1405/02/22
تکنیک هوشمند مبتنی بر الگوریتم چتر دریایی برای زمان‌بندی وظایف بر اساس اولویت در شبکه‌های IoT/Fog
تاریخ چاپ : 1405/02/22

اشتراک گذاری

آدرس مقاله

یک معیار مبتنی بر واریانس برای ارزیابی یادگیری آتاماتای یادگیر ‏در حل مسایل بهینه‌سازی گراف تصادفی