ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي

دانلود مباني نظري و پيشينه پژوهش ,فصل دوم مباني نظري و پيشينه پژوهش ,نمونه سوالات آزمون استخدامي اموزش و پرورش تفكيك رسته ها,دانلود پاورپوينت,طرح توجيحي با لينك مستقيم

ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي

۲۲ بازديد

ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي

برچسب ها : ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي , ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي


ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي
دسته: پژوهش
فرمت فايل: doc
حجم فايل: 522 كيلوبايت
تعداد صفحات فايل: 10

ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي

درباره اين فايل انتقادي داريد؟

راه هاي تماس با ما:

تماس با ما

شماره تماس : 09010318948

 

 

خريد

ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي

( + به همراه متن اصلي انگليسي مقاله )


2011 14th International IEEE Conference on Intelligent Transportation Systems Washington, DC, USA. October 5-7, 2011

 

Traffic Light Control in Non-stationary Environments based on Multi Agent Q-learning

 

Abstract—In many urban areas where traffic congestion does not have the peak pattern, conventional traffic signal timing methods does not result in an efficient control. One alternative is to let traffic signal controllers learn how to adjust the lights based on the traffic situation. However this creates a classical non-stationary environment since each controller is adapting to the changes caused by other controllers. In multi-agent learning this is likely to be inefficient and computationally challenging, i.e., the efficiency decreases with the increase in the number of agents (controllers). In this paper, we model a relatively large traffic network as a multi-agent system and use techniques from multi-agent reinforcement learning. In particular, Q-learning is employed, where the average queue length in approaching links is used to estimate states. A parametric representation of the action space has made the method extendable to different types of intersection. The simulation results demonstrate that the proposed Q-learning outperformed the fixed time method under different traffic demands.

 

كنترل چراغ ترافيك (راهنمايي) در محيط­هاي غيرثابت براساس يادگيري-Q چند عاملي

چكيده

در بسياري از مناطق شهري كه در آنجا تراكم ترافيك داراي الگوي اوج نيست، روش­هاي زمان­بندي چراغ­هاي معمولي باعث كنترل موثري نمي­شود. يك روش جايگزين اين است كه يادگيري نحوه تنظيم چراغ بر اساس وضعيت ترافيك توسط كنترلرهاي سيگنال ترافيكي ميسر شود. با اين­حال، اين امر باعث ايجاد يك محيط غيرثابت كلاسيك مي­شود زيرا هر كنترلر تغييرات ناشي از ديگر كنترلرها را تطبيق مي­دهد. در يادگيري چند عاملي، اين كار به احتمال زياد ناكارآمد بوده و داراي پيچيدگي­هاي محاسباتي است، يعني با افزايش تعداد عامل­ها (كنترلرها)، بازده كاهش مي­يابد. در اين مقاله، يك شبكه ترافيكي نسبتا بزرگ را بصورت سيستم چند عاملي مدل­سازي مي­كنيم و از تكنيك­هاي يادگيري تقويتي چند عاملي استفاده مي­كنيم. بطور خاص، يادگيري-Q به كار گرفته شده است، كه در آن طول متوسط صف​ ​درلينك­هاي نزديك شونده به منظور برآوردحالت­ها استفاده مي­شود. يك بيان پارامتري از فضاي عمل، اين روش را قابل توسعه به انواع مختلفي از تقاطع­ها كرده است. نتايج شبيه­سازي نشان مي­دهد كه يادگيري-Q پيشنهادي عملكرد بهتري نسبت به روش زمان ثابت تحت نيازهاي ترافيكي متفاوت دارد.

 

خريد

برچسب ها : ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيري-Q چند عاملي , ترجمه مقاله كنترل چراغ ترافيك (راهنمايي) در محيط هاي غيرثابت براساس يادگيريQ چند عاملي

تا كنون نظري ثبت نشده است
ارسال نظر آزاد است، اما اگر قبلا در مونوبلاگ ثبت نام کرده اید می توانید ابتدا وارد شوید.