1. 研究目的与意义
随着移动互联网的普及人们的上网方更加便捷,4G网络以及光纤宽带的大规模覆盖,互联网的信息承载介质由早期的文字转为更为丰富的多媒体形式,相比于文字信息的繁杂冗长,人们更乐于接受图片和视频这样的信息传播方式。
Instagram、Pinterest 、Snapchat这些以图片形式为主的社交网络已取代Facebook 、Twitter等传统社交媒体成为年轻最受欢迎的社交网络平台。
在这样一个图片数据量呈现爆炸式增长的时代,准确而全面地从网页中提取图片以及与图片内容相关的文本并且能够对图片文件进行方便的管理显得至关重要。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
2. 课题关键问题和重难点
关键问题:1.对给定的网页代码进行解析,检测出该网站的所有图片。
2.抓取该网站的图片和与图片有关的相关文字信息。
3.将图片保存在后台数据库,可以对图片进行查看、管理。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 国内外研究现状(文献综述)
html网页是web上应用最广泛的信息组织方式。
html文档能够将文字和图片组织在一起,通过分析html中的标记,可以利用一系列启发式规则来获得相关的图片和文字。
Tomcat即是一个开源的免费的支持JSP和Servlet技术的容器,同时又是一个web服务器软件。
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 研究方案
本项目将使用Java编程语言编写相关代码,Tomcat作为应用服务器,实现对网页中的图片高效提取以及分类。
在这过程中,需要挖掘图片与文本之间的相关性,做到准确而全面地从网页中提取图片和相关对应的文本信息,并对其提取的图片进行管理。
5. 工作计划
第1周:撰写开题报告和完成外文翻译。
第2周:进行课题总体规划和课题的详细设计。
第3-5周:进行课题模块化设计并进行模块代码编写与调试。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。