基于BiLSTM-CRF的医疗命名实体识别开题报告

 2022-08-15 09:24:49

1. 研究目的与意义

在互联网飞速发展所推动的信息化时代,互联网成为了人们获取信息、发布信息的重要渠道,而其中新闻是信息传递的主要形式之一。

人作为社会性的动物,为满足自我的社会化需求,需要获取外部信息以保证与外界的沟通;同时,所在地区或行业的新闻关系到人们生活和工作的切身利益。因此,从纷繁复杂的新闻中获取信息变得越来越重要。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容和预期目标

研究内容:为从新闻中快捷地提取信息,需要开发一个基于BERT BiLSTM-CRF技术、可以对新闻进行关键词提取的程序。

通过对一些程序的考察、分析,并结合当代人的社交需求及互联网使用习惯,要求程序满足一下功能:

1.程序要求

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状

美国 IBM 公司的Luhn[1]提出了基于词频统计的文献自动标引方法,标志着关键词抽取研究和应用的开始。Edmundson[2]开启了用计算机程序进行文献自动检索的实用化时代,设计并实现了最早的自动关键词抽取系统。

1999 年,Frank 等提出了 KEA 方法,使用朴素贝叶斯模型对候选词进行分类[3]。2000 年,Turney 在关键词抽取任务中对比了遗传算法与 C4.5 决策树的效果[4]。2005 年,Wang 等采用支持向量机(SupportVectorMachine,SVM)来筛选关键词,使用的特征包括单词的词频与位置信息[5]。2008 年,Zhang 等使用条件随机场(Conditional Random Field,CRF)尝试抽取中文文档中的关键词[6]。2011 年,Ding 等选择了单词的 TF-IDF值、位置信息、文档覆盖率等特征,并采用了二元整数规划方法(Binary Integer Programming,BIP)来抽取关键词[7]。2015 年,Mounia 等使用了逻辑回归算法来解决关键词提取任务,采用的特征包括单词的词长、词频等[8]。

2016 年,Zhang 等提出的一种具有两个隐层的 RNN 模型,该模型通过第一层 RNN 网络来捕获单词的信息,再通过第二层 RNN 网络来实现对序列中关键词的标注[9]。因为在较长的序列中,RNN 网络反向传播中容易出现梯度消失的问题,所以 Basaldella 等将第一层 RNN 网络替换为双向长短记忆模型BiLSTM(Bi-directional Long Short-Term Memory)[10]。考虑到 CRF 模型在序列标注任务上优异的性能,Alzaidy 等提出了 BiLSTM CRF 的模型,在与多种模型的对比中发现,该模型无论在适应性或是准确率上都有着较大的优势[11]。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 计划与进度安排

1、2020-11-16至2020-12-26:指导老师下达任务书,对本次毕业设计的进度安排、功能实现和程序提出要求。

2、2020-12-27至2020-02-28:程序设计方面,进行需求分析,做好基础的数据准备及技术准备工作,构思程序的功能模块及整体框架。

3、2021-03-01至2020-03-25:通过电子邮件保持与导师的联系,在导师的要求下进行程序的具体实现以及加强人性化、实用性。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 参考文献

[1] Luhn HP. A statisticalapproachtomechanizedencodingandsearchingofliteraryinformation.IBMJournalofResearchamp; Development, 1957,1(4):309#8722;317. [doi: 10.1147/rd.14.0309]

[2] Edmundson HP, Oswald VA. Automatic indexing and abstracting of the contents of documents. Planing Reserarch Corp, Document PRC R-126, ASTLA AD No.231606. Los Angeles: Planning Research Corp, 1959. 1#8722;142.

[3]Frank E, Paynter G W, Witten I H, et al. Domain-Specific Keyphrase Extraction[C].In: Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence. Stockholm, Sweden: Morgan Kaufmann, 1999: 668–673.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。