Fork me on GitHub

强化学习在之家图像理解中的应用

强化学习在之家图像理解中的应用本文介绍了强化学习的基本概念,并着重梳理了一类模型无关的强化学习,即策略梯度算法。我们分别介绍了其中的两种算法——基本策略梯度和Actor-Critic方法,并对它们的优缺点进行了分析。最后,我们展示了策略梯度算法在自然场景下的文本图像识别中的应用,并讨论了该方法在此场景下的鲁棒性。


本文地址:https://www.6aiq.com/article/1668694024478
本文版权归作者和AIQ共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出