个人项目-论文查重
2021/9/19 23:35:50
本文主要是介绍个人项目-论文查重,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
个人项目:论文查重
gitHub地址
软件工程 | |
---|---|
作业要求 | 作业要求链接 |
作业目标 | 完成论文查重项目,进行测试并使用Github 进行版本发布及源码和测试用例管理 |
一、PSP
表格
Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) | |
---|---|---|---|
Planning | 计划 | ||
· Estimate | · 估计这个任务需要多少时间 | 360 | 660 |
Development | 开发 | 120 | 165 |
· Analysis | · 需求分析 (包括学习新技术) | 120 | 120 |
· Design Spec | · 生成设计文档 | 10 | 15 |
· Design Review | · 设计复审 | 20 | 25 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 30 | 35 |
· Design | · 具体设计 | 30 | 40 |
· Coding | · 具体编码 | 80 | 95 |
· Code Review | · 代码复审 | 25 | 30 |
· Test | · 测试(自我测试,修改代码,提交修改) | 50 | 60 |
Reporting | 报告 | ||
· Test Repor | · 测试报告 | 10 | 25 |
· Size Measurement | · 计算工作量 | 20 | 20 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 20 | 30 |
· 合计 | 535 | 660 |
二、模块接口的设计与实现过程
2.1 项目结构
主要类
simhash
算法实现类:
余弦相似度算法实现类:
Unit类
算法原理
采用simhash
算法来计算文本相似度,需要计算得到汉明距离
最后由公式,将汉明距离带入x即可计算出文本相似度
算法流程
三、模块结构接口部分的性能改进
内存、CPU、GC、线程情况
Live Memory
CPU Load
堆内存
四、计算模块部分单元测试展示
代码
测试结果:
代码覆盖率
异常处理
代码
异常测试
五、测试结果
orig_0.8_add.txt 0.9739645582549769 orig_0.8_del.txt 0.8055412527550833 orig_0.8_dis_1.txt 0.9973557010035817 orig_0.8_dis_10.txt 0.682243394533814 orig_0.8_dis_15.txt 0.682243394533814
这篇关于个人项目-论文查重的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-15鸿蒙生态设备数量超8亿台
- 2024-05-13TiDB + ES:转转业财系统亿级数据存储优化实践
- 2024-05-09“2024鸿蒙零基础快速实战-仿抖音App开发(ArkTS版)”实战课程已上线
- 2024-05-09聊聊如何通过arthas-tunnel-server来远程管理所有需要arthas监控的应用
- 2024-05-09log4j2这么配就对了
- 2024-05-09nginx修改Content-Type
- 2024-05-09Redis多数据源,看这篇就够了
- 2024-05-09Google Chrome驱动程序 124.0.6367.62(正式版本)去哪下载?
- 2024-05-09有没有大佬知道这种数据应该怎么抓取呀?
- 2024-05-09这种运行结果里的10.100000001,怎么能最快改成10.1?