ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي
برچسب ها : ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي , ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي

ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي
درباره اين فايل انتقادي داريد؟ راه هاي تماس با ما: شماره تماس : 09010318948 |
ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي
( + به همراه متن اصلي انگليسي مقاله )
2011 14th International IEEE Conference on Intelligent Transportation Systems Washington, DC, USA. October 5-7, 2011
Traffic Light Control in Non-stationary Environments based on Multi Agent Q-learning
Abstract—In many urban areas where traffic congestion does not have the peak pattern, conventional traffic signal timing methods does not result in an efficient control. One alternative is to let traffic signal controllers learn how to adjust the lights based on the traffic situation. However this creates a classical non-stationary environment since each controller is adapting to the changes caused by other controllers. In multi-agent learning this is likely to be inefficient and computationally challenging, i.e., the efficiency decreases with the increase in the number of agents (controllers). In this paper, we model a relatively large traffic network as a multi-agent system and use techniques from multi-agent reinforcement learning. In particular, Q-learning is employed, where the average queue length in approaching links is used to estimate states. A parametric representation of the action space has made the method extendable to different types of intersection. The simulation results demonstrate that the proposed Q-learning outperformed the fixed time method under different traffic demands.
كنترل چراغ ترافيك (راهنمايي) در محيطهاي غيرثابت براساس يادگيري-Q چند عاملي
چكيده
در بسياري از مناطق شهري كه در آنجا تراكم ترافيك داراي الگوي اوج نيست، روشهاي زمانبندي چراغهاي معمولي باعث كنترل موثري نميشود. يك روش جايگزين اين است كه يادگيري نحوه تنظيم چراغ بر اساس وضعيت ترافيك توسط كنترلرهاي سيگنال ترافيكي ميسر شود. با اينحال، اين امر باعث ايجاد يك محيط غيرثابت كلاسيك ميشود زيرا هر كنترلر تغييرات ناشي از ديگر كنترلرها را تطبيق ميدهد. در يادگيري چند عاملي، اين كار به احتمال زياد ناكارآمد بوده و داراي پيچيدگيهاي محاسباتي است، يعني با افزايش تعداد عاملها (كنترلرها)، بازده كاهش مييابد. در اين مقاله، يك شبكه ترافيكي نسبتا بزرگ را بصورت سيستم چند عاملي مدلسازي ميكنيم و از تكنيكهاي يادگيري تقويتي چند عاملي استفاده ميكنيم. بطور خاص، يادگيري-Q به كار گرفته شده است، كه در آن طول متوسط صف درلينكهاي نزديك شونده به منظور برآوردحالتها استفاده ميشود. يك بيان پارامتري از فضاي عمل، اين روش را قابل توسعه به انواع مختلفي از تقاطعها كرده است. نتايج شبيهسازي نشان ميدهد كه يادگيري-Q پيشنهادي عملكرد بهتري نسبت به روش زمان ثابت تحت نيازهاي ترافيكي متفاوت دارد.
برچسب ها : ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي , ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي