1. 研究目的与意义
1.1背景
强化学习(ReinforcementLearning,RL)有着相当长的历史,但直到80年代末90年代初,强化学习技术才在人工智能,机器学习中得到广泛应用。强化学习是一种从环境状态到行为映射的学习技术,强化学习的思想来自于条件反射理论和动物学习理论,它是受到动物学习过程启发而得到的一种仿生算法,是一种重要的机器学习方法。Agent通过对感知到的环境状态采取各种试探动作,获得环境状态的适合度评价值(通常是一个奖励或惩罚信号),从而修改自身的动作策略以获得较大的奖励或较小的惩罚,强化学习就是这样一种赋予Agent学习自适应性能力的方法。
1.2目的
2. 研究内容和预期目标
2.1 研究内容
2.1.1强化学习(ReinforcementLearning,RL)
(1)基本原理
3. 研究的方法与步骤
第一步,需要对格子世界系统进行需求分析,掌握其大致的功能需求。然后进行资源搜索,了解一些现有的课程管理系统的功能、界面等,与我的需求分析进行比较,查漏补缺,并对功能进行优化。然后进行功能定义,角色功能描述。
第二步,在对需求进行了大致分析后,进行概要设计,包括对总体功能的设计,主要功能的设计。与此同时,也可参考其他成熟的软件系统,以完善自己的设计。
第四步,进行详细设计,对各个功能的流程进行设计,达到简化流程,操作方便的目的。
4. 参考文献
[1]SinghS.Agentsandreinforcementlearning[M].SanMatco,CA,USA:MillerfreemanpublishInc,1997.
[2]张汝波,顾国昌,刘照德.强化学习理论、算法及应用[J].控制理论与控制应用,2000,17(5):637-642.
[3]SuttonS,BartoG.ReinforcementLearning:AnIntroduction[M].Cambridge,MA,USA:MITPress,1998.
5. 计划与进度安排
(1)2022.2.1 ----2022.3.10查阅资料,撰写开题报告
(2)2022.3.11 ----2022.3.18 需求分析,熟悉开发工具
(3)2022.3.19 ----2022.3.31 概要设计
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。