全文总字数:4728字
1. 研究目的与意义(文献综述)
问答系统作为下一代搜索引擎的基本形态,受到越来越多的关注与研究。人们在日常生活中遇到的大多数问题都可以通过问答系统来回答。例如百度,谷歌等搜索引擎,会根据用户输入的问题提供答案列表以供选择。而基于单一事实回答问题的问答系统也受到更多学者的青睐。在基于单事实问题问答机制下,可以充分利用大规模知识库的优势,为人们提供快速的问答服务。事实上,如果知识库被合理组织,简单问答系统本身的任务可能包含广泛的实际用途,作为更多先进的,能解决更复杂问题的神经问答方法的未来开发基础。
随着人们对精神需求的不断提高,问答系统拥有越来越广阔的应用前景。例如,问答系统可以用于淘宝,微博等各个软件的虚拟客服,针对用户输入的自然语言问题,使用问答系统给出最符合问题的最佳答案,非常灵活方便,节约时间。其次,问答系统还可以用于各种教育辅助软件,相当于电子百科全书,用户可以通过这些软件及时准确地解决生活中各种各样的疑惑,方便快捷。然而,尽管做了大量的研究工作,问答仍是一个挑战。甚至在研究充分的领域,例如用英语的一般领域的事实问题,现有的方法很难匹配人类对问题的理解。英语以外的语言以及法律或生物医学数据等专业领域,带来了额外的挑战,使这项任务更加困难。
国外对简单问答系统的研究始于20世纪60年代[9],经过50多年的发展,已取得了大量的研究成果。虽然,在文本文件或在网上搜索,并从中提取精确答案的问答系统有很长的历史,但最近的进展来自于大型知识库(Knowledge Bases, KBS)例如FreeBase的发布。基于知识库问答的现存方法,或者使用可学习的组件,或者将问题转换成一个结构化知识库查询,或者学习将问题和事实镶嵌进一个低维向量空间,(Bordes et al. 2014)[2]通过计算相似度检索答案。最近的研究集中在设计拥有更高推理能力的系统,这种方法检索和使用多样的事实来回答问题,然而,简单问题,即能够通过提取单个事实来回答,组成了网络上问题的一大部分,仍给问答系统带来挑战。首先,现存的基准很小;他们大多数覆盖事实的主要部分,并且被限制在他们的问题类型、语法和词法的变化中。其次,现有的系统在少数小基准数据集的特定问题模板的范围外表现如何仍然是未知的,在一个单独的数据集上学习是否能很好地转移到其他数据集上也是未知的,并且这样的系统是否能够从不同的训练源学习也是未知的。尤其是是面对大量的知识资源时。现有的问答系统通常依赖于各种组件,每个组件专门用于解决问题的不同子任务(例如分裂,实体识别,消除歧义,和关系分类等)。总之,对于单事实问题(即简单问题),挑战仍然很大。国内对问答系统的研究开始于20世纪90年代,虽然起步较晚,但是同样取得了令人瞩目的成就,涉及领域甚广,与人们的生活也越来越贴近。
2. 研究的基本内容与方案
基本内容:
-
针对简单问题,同时使用字符级和单词级两种嵌入式技术分别对实体、关系、问题进行建模,得到实体候选集和关系候选集,通过神经网络选择分别返回与问题最匹配的主语和谓语,与知识库中的事实进行匹配得到答案。
-
研究负采样技术,采取不同的负采样技术计算相似度,采取正负样本,并对负样本进行统计分析,训练和修剪,挑选负样本进行误差分析。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 研究计划与安排
第一阶段(2019/1/19—2019/2/28):确定选题,查阅有关文献,翻译英文资料(不少于5000汉字),并交予指导教师检查。
第二阶段(2019/3/1—2019/4/30):系统或技术架构、程序设计与开发、测试与完善。了解问答领域相关知识,编写算法,分析并比较问答领域主流算法与本算法的准确率,进行负采样和负样本误差分析,改进算法。
第三阶段(2019/5/1—2019/5/25):撰写及修改毕业论文。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!4. 参考文献(12篇以上)
[1] Bhuwan Dhingra,Danish Pruthi and Dheeraj Rajagopal. Simple and Effective Semi-Supervised Question Answering .CoRR abs/1804.00720(2018)
[2] Antoine Bordes,Nicolas Usunier,Sumit Chopra and Jason Weston. Large-scale Simple Question Answering with Memory Networks. CoRR abs/1506.02075(2015).
[3] Zihang Dai,Lei Li,Wei , Xu.CFO: Conditional Focused Neural Question Answering with Large-scale Knowledge Bases.ACL(1)2016
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。