熱門搜尋
【我要重新搜尋】
您輸入的關鍵字: Maxim Lapan
搜尋結果共 2 筆, 頁數 1 / 1
呈現:
實作現代強化學習方法:深度Q網路、值迭代、策略梯度、TRPO、AlphaGo Zero… 強化學習(RL)的最新發展,結合使用深度學習(DL),在訓練代理人「像人類一樣地」解決複雜問題這方面,取得... more