1. 研究目的与意义
在当今中国,科技正在不断地发展,随着互联网时代的到来也崛起了一些新兴的产业电子商务,一个好的商品评价分析系统是一个电商网站蓬勃发展的关键。
商品评价结果的精确,有利于商家及时发现自己产品的优缺点,从而发挥自己商品的优点,完善自己商品的缺点,提高产品的质量。
对于消费者,准确的商品评价分析系统有助于消费者在消费时进行参考,做到谨慎抉择、理智消费。
2. 课题关键问题和重难点
1、关键问题对获取的商品评价数据可以进行精确地分析和处理,接着将处理完的数据进行情感分类,最后利用主题分析技术,分别对正负面评论进行分析,并对统计结果进行可视化展示。
2、课题难点①利用爬虫技术获取海量的评论数据。
②利用数据挖掘技术中的评论去重、数据清洗、评论分词和去除停用词等技术对获取的评论数据进行预处理,得到规范化的评论数据。
3. 国内外研究现状(文献综述)
基于文本挖掘的商品评价分析系统是通过爬虫技术,获取电商平台的商品评价数据,并对数据进行分析,归纳出消费者对商品的看法,为生产商提供可行性建议,同时为消费者购买决策提供一定的参考。
国内外现状分析: 基于文本挖掘的商品评价分析系统的主要问题和研究的关键就是对商品评论数据分析结果的准确性,然而分析结果的准确性与数据挖掘技术与情感分析技术息息相关。
首先对于数据预处理,目前中文分词有3种分类方法,分别为基于字典的分词方法,基于理解的分词方法和基于统计的分词方法。
4. 研究方案
1、设计方案该系统使用Python语言开发,开发工具用PyCharm,系统数据库采用MySql,运行平台:windows7及以上。
2、研制方案和研究方案: 主要包括如下功能模块:(1)数据获取模块 通过爬虫技术获取商品评论数据,并将数据存入MySql数据库中,最后以CSV文件的格式将数据从数据库中剥离出来。
(2)数据处理分析模块 通过文本挖掘技术对爬虫到的数据进行预处理,生成规范化的评论数据。
5. 工作计划
1.第1周:查阅课题相关资料,列出开题报告大纲。
2.第2周:完成开题报告。
3.第3周:完成外文翻译。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。