基于Django实现的(bert)深度学习文本相似度检测系统设计

发布于:2024-05-18 ⋅ 阅读:(131) ⋅ 点赞:(0)

基于Django实现的(bert)深度学习文本相似度检测系统设计

  • 开发语言:Python

  • 数据库:MySQL
  • 所用到的知识:Django框架
  • 工具:pycharm、Navicat、Maven

系统功能实现

  1. 登录页面

注册页面:用户账号,密码,确认密码,用户姓名,联系方式

主页面:文件管理模块

上传功能

(3)批量删除文件夹功能,可选

(4)批量下载文件夹,可选

(5)搜索功能(文件夹)

(6)单独文件夹按钮下载

(7)收藏功能按钮

文件属性:下载按钮,编辑按钮(文本内增减删),删除按钮,收藏按钮,文本内容查询

文本查重模块

收藏模块;用户收藏的文件夹与文件:

任务栏属性:文本名称,作者名称,文件大小,修改日期,

文件夹属性:本文本查看,删除文件,修改文本内容,并保存修改的内容,下载文本

网页查重-(爬虫):文本查重网页版 爬取百度搜索结果页全部链接内容

文本相似度的检测报告的pdf格式

检测报告的形成:pdf格式

检测报告内容是:1.可以打印,2.保存本地;

  • 检测报告编号:数字和字母组成,6位数;
  • 文本题目,作者,检测范围(互相被检测的文本题目)
  • 检测时间,时间范围(有效时间用户自己输入的)
  • 检测结果
  1. 总文本总数相似度:12.6%
  2. 本篇与第一个文章之间的相似度: 4.5%
  3. 本篇与第二个文章之间的相似度: 3.5%
  4. .................
  • 统计出各个文本之间相似度的统计图,
  • 原文内容与相似度来源的文本之间的对比列出,

以下图片参考:

检测报告的任务栏属性:文本名称,作者名,文件大小,报告生成时间,报告下载按钮,报告搜索框(按照文本名与作者),总文本相似度,报告删除按钮,

检测报告(pdf格式)以下的图片一比一还原,

检测报告内容是:1.可以打印,2.保存本地;

  • 检测报告编号:数字和字母组成,6位数;
  • 文本题目,作者,检测范围(互相被检测的文本题目)
  • 检测时间,时间范围(有效时间用户自己输入的)
  • 检测结果
  1. 总文本总数相似度:12.6%
  2. 本篇与第一个文章之间的相似度: 4.5%
  3. 本篇与第二个文章之间的相似度: 3.5%
  4. .................
  • 统计出各个文本之间相似度的统计图,
  • 原文内容与相似度来源的文本之间的对比列出,

以下图片参考:

检测报告的任务栏属性:文本名称,作者名,文件大小,报告生成时间,报告下载按钮,报告搜索框(按照文本名与作者),总文本相似度,报告删除按钮,

检测报告(pdf格式)以下的图片一比一还原,

8用户信息:看到个人的基本信息,上传个人图

需要源代码或者二次开发的,请联系


网站公告

今日签到

点亮在社区的每一天
去签到