danijar/dreamerv2
کاربرد:
این پروژه یک مدل یادگیری تقویتی است که با ساختن یک مدل دنیای گسسته، یاد میگیرد در محیطهای پیچیده مثل بازیهای آتاری عملکرد عالی داشته باشه. از یادگیری بدون نظارت برای درک دنیای بصری و برنامهریزی در فضای داخلی استفاده میکنه.
در چه شرایطی بهتره استفاده شود؟
وقتی با دادههای تصویری کار میکنی و نیاز به یادگیری سیاستهای پیچیده در محیطهای پویا داری، این مدل عالیه. بهویژه وقتی دسترسی به پاداش کم یا دیرهنگام هست، DreamerV2 بهتر از روشهای سنتی عمل میکنه.
چند مثال از موارد استفاده
- بازیهای ویدیویی قدیمی مثل Pong یا Breakout ️
- شبیهسازی عاملهای هوشمند در محیطهای گرافیکی ساده
- تحقیقات در حوزه مدلهای جهانی و برنامهریزی در فضای پنهان
- ##ReinforcementLearning
- ##WorldModels
- ##AtariGames
- ##DeepLearning
- ##AIResearch
- ##DiscreteLatentSpace
- ##DreamerV2
- ##IntelligentAgents
- ##UnsupervisedLearning
- ##ModelBasedRL
