专利类型:发明公开
申请(专利)号:CN202010550939.0
一种基于深度强化学习自适应式生成图像描述的方法及图像描述技术领域,提供一种更好的决策机制使生成描述过程中自适应的决策是否利用视觉信息。如利用语义信息生成下一个词语时不必要使用视觉信息;如利用注意力机制生成下一个单词时视觉信息的占比应该尽可能的大,可进行自适应的比重修正。本发明使在图像描述问题中生成下一个单词时能够自适应的决策是否利用视觉信息;采用强化学习的奖励机制调整在利用注意力机制生成词语时视觉信息所占比重,使得算法具有很强的学习能力、自适应性、科学性和鲁棒性。