q-o'rganish (q-learning)
Page preview (4 pages)
Scroll down 👇
About "q-o'rganish (q-learning)"
powerpoint presentation q-learning 1. q-o'rganishga kirish va asosiy tushunchalar 2. q-o'rganish algoritmi va uning asosiy elementlari 3. q-o'rganishning afzalliklari, kamchiliklari va kelajakdagi yo'nalishlari reja: q-o'rganish - bu model-erkin mustahkamlash orqali o'rganish algoritmi bo'lib, u agentning atrof-muhit haqidagi modelini bilmasdan optimal strategiyani o'rganishga imkon beradi. q-jadval har bir davlat-harakat juftligi uchun q-qiymatlarni saqlaydi. q-qiymat ushbu davlatda harakatni bajarishning kutilayotgan mukofotini aks ettiradi va iterativ ravishda yangilanadi. bellman tenglamasi q-qiymatlari o'rtasida rekursiv munosabatni ifodalaydi, hozirgi davlat- harakat juftligining q-qiymatini keyingi davlatning maksimal q-qiymati bilan bog'laydi. gamma qiymati mukofotlarni hisoblashda...
This file contains 9 pages in PPTX format (61.7 KB). To download "q-o'rganish (q-learning)", click the Telegram button on the left.