搞Reinforcement learning,除了OpenAI Gym,还有什么测试平台

2024-04-28 00:47

1. 搞Reinforcement learning,除了OpenAI Gym,还有什么测试平台

OpenAL(Open Audio Library)是自由软件界的跨平台音效API。它设计给多通道三维位置音效的特效表现。其 API 风格模仿自 OpenGL。 OpenAL 主要的功能是在来源物体、音效缓冲和收听者中编码。来源物体包含一个指向缓冲区的指标、声音的速度、位置

搞Reinforcement learning,除了OpenAI Gym,还有什么测试平台

2. 求助,安装openai gym all老是出错

你没正确安装

3. 本人在研究机器学习里reinforcement learning的multi-armed bandit 模型

很简单的问题啊,各种算法epsilon-greedy, soft-max之类的。出论文如果你有老师的话听老师意见,如果没有的话,除非你特别出色,否则真心出不了,因为MAB这个问题简单的部分已经被研究透彻了,难的部分根本没有什么规律可循,除非有个震惊世界的大神再能提出一个和高斯分布还有隐马尔科夫模型一样伟大的数学模型来,也许你行,但是真不是短时间能搞完的事。
MAB这个问题真是太基础了,建议你找本教材多看看关于RL其它方面的论文,例如MDP,POMDP之类的,彻底了解发展水平和该领域的展望与空缺后才能知道自己要搞什么样的研究,搞出研究成功才能出论文,没有老师带真不容易。

本人在研究机器学习里reinforcement learning的multi-armed bandit 模型