1. 研究目的与意义
现如今,我国通用处理器的发展取得了丰硕的成果,在国产化进一步推进的过程中也诞生了一些国产通用处理器品牌,如主要面向桌面与服务器应用领域创新发展的龙芯处理器。对于龙芯处理器来说,其技术已经趋于成熟。但是对于计算机来说,丰富的软件生态,各类主流的开发和应用软件能够在龙芯平台上正常使用都是必不可少的。目前有上千家技术公司与龙芯中科有着密切的合作伙伴关系,基于龙芯平台做开发的研究人员更是不计其数,以龙芯处理器为中心的国产信息化联盟俨然已经形成。
虽然一些基础的开发软件和应用软件如浏览器,Java虚拟机,编译器和工具链等已经能够在龙芯平台上正常使用,但是仍然有许多重要且常用的软件架构未在龙芯平台上进行迁移和构建,如BLAS库。它是是传统的线性数学函数库标准,具备较好的稳定性以及较高的性能,能够为关于矩阵的应用提供较优的基础运算支持。
2. 课题关键问题和重难点
基于龙芯平台的BLAS库的设计与实现主要分为两个大模块:一、在龙芯平台上对BLAS库进行移植;二、根据设计指标对BLAS库的使用进行测试。本课题拟完成基于龙芯平台的BLAS库的设计与实现。
本课题的关键:
3. 国内外研究现状(文献综述)
随着全球技术的发展,人们越发依赖复杂科学计算,如人工智能卷积层的计算,需要计算大量矩阵乘法,而BLAS实现了基本的线性代数运算,因此人们对于BLAS库的使用越来越多,而BLAS库的效率也很大程度上决定了人工智能计算的效率。
龙芯作为中国科学院计算机技术研究所研制的新型通用处理器,具有高性能、低成本、低功耗、高集成度的特点,可以满足科学研究和企业应用中大部分高性能计算的需求。Intel和AMD分别有针对他们处理器实用的BLAS库——MKL和ACML,而基于LoongArch架构的龙芯没有专用的BLAS库,因此需要进行移植工作才能保证该库能在龙芯芯片上正常运行。
针对BLAS库在复杂运算中被广泛使用这一需求,国内外都对此进行了大量研究。
4. 研究方案
1. 龙芯架构分析
由于CPU指令集不同,目前市面上的应用程序大多是以支持Intel或者AMD为首的X86指令集,和支持安卓等移动端使用的ARM精简指令集为主。
而龙芯使用的LoongArch指令集与上述其他指令集并不同,因此我们需用使用特定的编译器来将指定应用程序运行在特定架构的平台上,通过编译器将静态编译型语言翻译成机器码。
5. 工作计划
2022-2023-1学期:第15-16周:完成选题,查阅相关中英文资料。第17周:与导师沟通进行课题总体规划。第18-19周:导师下发毕业设计(论文)任务书,学生根据导师的要求进行外文翻译,列出开题报告大纲,进行开题报告的撰写与提交,并进行课题的需求分析2022-2023-2学期:第1周:在导师的指导下进行课题详细设计。第2-3周:在导师指导下进根据需求分析设计并建立平台。
第4周:中期检查。完成BLAS库移植。第5周:提交论文提纲给指导老师审阅,在指导老师审阅通过之后,按照提纲撰写毕业论文初稿。第6周:继续撰写毕业论文初稿。第7周:对撰写的毕业设计报告(论文)进行严格检查,在导师指导下,修改、完善毕业论文并打印装订成册。第8周:提交报告论文终稿及合格的论文检测报告、毕业设计(论文)资料装袋。第9周:审查论文检测报告、指导教师和评阅教师完成论文的评阅,根据评阅意见进一步优化论文。第10周:筹备毕业答辩相关事宜,制作参加毕业答辩的演示课件。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。