1. 研究目的与意义
文本分类是机器学习在自然语言处理中的最常用也是最基础的应用,是很重要的一个模块。拥有有效的文本分类方法对于建立智能推荐系统是非常有用的,因此文本分类问题在自然语言处理领域也是一个非常经典的问题。目前的文本分类方法有很多,包括传统机器学习方法、基于深度学习的方法等。
基于深度学习的文本分类方法近年来被广泛使用,可以重建单词、句子或文档的表达。其主要是利用循环神经网络(RNN)、卷积神经网络(CNN)等网络结构自动获取特征表达的能力,去掉了复杂繁琐的人工特征工程,有很大的优势。
但是卷积神经网络(CNN)有一定的局限性,它的不足主要体现在两方面:
2. 研究内容和预期目标
用基于动态路由的胶囊网络探索文本分类,以寻求更好的文本分类方法
写作提纲:
1、选题的背景及意义
3. 国内外研究现状
目前,国外当前流行的文本分类算法有Rocchio法及其变异算法、k近邻法(KNN)、决策树、朴素贝叶斯、贝叶斯网络、支持向量机(SVM)等方法,这些方法在英文以及欧美语种的文本分类上有广泛的研究,并且KNN和SVm确实是英文分类的最好方法。国外对英文文本分类领域的各个问题都有相当深入的研究,对几种流行的方法进行了大量的对比研究。国内很多学者对中文文本分类算法也进行了深入的研究,提出一种基于机器学习的、独立于语种的文本分类模型,以Word Net语言本体库为基础,建立文本的概念向量空间模型作为文本特征向量的特征提取方法,也就是基于深度学习的方法。
胶囊网络在2017年被Geoffrey Hinton提出后,主要用于图像识别领域,在自然语言领域应用很少,在文本分类未被深入研究。
4. 计划与进度安排
1.2022年11月20日(本学期第十周)——完成选题工作;2.2022年12月11日前——完成开题工作;3.2022年3月19日前——完成初稿和中期检查工作;4.2022年5月14日前——完成论文修改、重复率检查、定稿、外文文献翻译工作;5.2022年5月28日前——完成答辩环节工作,成绩发布,二次答辩;6.2022年6月11日前——完成校级优秀毕业论文评选工作;
5. 参考文献
[1] Sabour S, Frosst N, Hinton G E. Dynamic Routing Between Capsules[J]. 2017.
[2] Suofei Zhang, Wei Zhao, Xiaofu Wu, and Quan Zhou. 2018. Fast dynamic routing based on weighted kernel density estimation.
[3] Xiang Zhang, Junbo Zhao, and Yann LeCun. 2015. Character-level convolutional networks for text classification. In Advances in neural information processing systems, pages 649–657.
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。