q-o'rganish (q-learning)
Предварительный просмотр (4 стр.)
Прокрутите вниз 👇
О "q-o'rganish (q-learning)"
powerpoint presentation q-learning 1. q-o'rganishga kirish va asosiy tushunchalar 2. q-o'rganish algoritmi va uning asosiy elementlari 3. q-o'rganishning afzalliklari, kamchiliklari va kelajakdagi yo'nalishlari reja: q-o'rganish - bu model-erkin mustahkamlash orqali o'rganish algoritmi bo'lib, u agentning atrof-muhit haqidagi modelini bilmasdan optimal strategiyani o'rganishga imkon beradi. q-jadval har bir davlat-harakat juftligi uchun q-qiymatlarni saqlaydi. q-qiymat ushbu davlatda harakatni bajarishning kutilayotgan mukofotini aks ettiradi va iterativ ravishda yangilanadi. bellman tenglamasi q-qiymatlari o'rtasida rekursiv munosabatni ifodalaydi, hozirgi davlat- harakat juftligining q-qiymatini keyingi davlatning maksimal q-qiymati bilan bog'laydi. gamma qiymati mukofotlarni hisoblashda...
Этот файл содержит 9 стр. в формате PPTX (61,7 КБ). Чтобы скачать "q-o'rganish (q-learning)", нажмите кнопку Telegram слева.