介绍:
请使用前务必读一下README.md,系统主要是电影知识图谱问答系统,节点包括大量节点信息,
数据来自豆瓣的爬虫
整个系统使用django构建,自带了一份数据,比较完整,有初始化数据的脚本,
每次务必初始化数据后使用,neo4j按照README.md初始化。
底层数据库知识图谱采用neo4j,关系型数据库采用sqlite,
也可以换成mysql,主要是图谱的展示与问答。
系统分为管理员端和普通用户端,可以在注册的时候进行区分
用户端:
1、正常的登录注册功能无问题
2、可以查询关系图谱,根据开始节点、关系、结束节点查询
3、可以问答系统,问系统问题可以得到答案,问题是自然语言
4、个人中心可以维护个人信息,可以修改
5、密码修改可以修改密码,修改后要重新登录
管理员端:
1、登录注册系统
2、管理员不但可以查询节点,还可以新增节点, 节点可以增加多种类型
3、管理员可以新增关系,已经存在的节点,管理员可以建立两个节点的关系
4、查询出节点后,点击节点,下面会出现节点的编辑页面,可以点击修改,修改节点信息,可以删除,删除节点信息
6、个人重新和密码功能同用户端一样
技术描述:
1、知识图谱展示部分包括前端使用html、css和js,后端使用Django框架,
用户系统使用sqlite,图谱数据存储在neo4j,通过py2neo连接,图谱展示使用echarts。前端支持通过开始节点方式查询。
2、问答系统的数据流程包括离线阶段生成词表和词性表,在线阶段加载词表,使用结巴分词进行分词,查询词性表,
匹配模板生成match语句,查询neo4j并返回结果。
3、问答系统的业务流程为用户通过GET请求传入自然语言的输入,
使用jieba库进行分词和词性标注,从而识别实体和关系类型,查询neo4j图数据库,处理查询结果生成回答,保存用户问题和回答,
最后渲染模板文件返回查询结果。
1000