q-o'rganish (q-learning)
Sahifa ko'rinishi (4 sahifa)
Pastga aylantiring 👇
Ko'proq o'qimoqchimisiz?
Barcha 9 sahifani Telegram orqali bepul yuklab oling.
To'liq faylni yuklab olish"q-o'rganish (q-learning)" haqida
powerpoint presentation q-learning 1. q-o'rganishga kirish va asosiy tushunchalar 2. q-o'rganish algoritmi va uning asosiy elementlari 3. q-o'rganishning afzalliklari, kamchiliklari va kelajakdagi yo'nalishlari reja: q-o'rganish - bu model-erkin mustahkamlash orqali o'rganish algoritmi bo'lib, u agentning atrof-muhit haqidagi modelini bilmasdan optimal strategiyani o'rganishga imkon beradi. q-jadval har bir davlat-harakat juftligi uchun q-qiymatlarni saqlaydi. q-qiymat ushbu davlatda harakatni bajarishning kutilayotgan mukofotini aks ettiradi va iterativ ravishda yangilanadi. bellman tenglamasi q-qiymatlari o'rtasida rekursiv munosabatni ifodalaydi, hozirgi davlat- harakat juftligining q-qiymatini keyingi davlatning maksimal q-qiymati bilan bog'laydi. gamma qiymati mukofotlarni hisoblashda...
Bu fayl PPTX formatida 9 sahifadan iborat (61,7 KB). "q-o'rganish (q-learning)"ni yuklab olish uchun chap tomondagi Telegram tugmasini bosing.