سلام
پروژه ام در زمینه یادگیری تقویتی (Reinforcement Learning) است. هدف نوشتن الگوریتم کلاسیک برای FrozenLake-v1 در محیط gym میباشد که جدول را به پایان رسانده و داخل hole نیفتد. نحوه آپدیت و یادگیری و انتخاب هایپرپارامترها نیز در کد توضیح داده شود.
پ.ن: پروژه دیگری در زمینه DQN در روزهای آینده تعریف میکنم هر شخصی این پروژه را انجام دهد پروژه DQN هم به او واگذار میکنم. سپاس