File tree 4 files changed +82
-2
lines changed
4 files changed +82
-2
lines changed Original file line number Diff line number Diff line change 1
- # KnowledgeData
2
- 史上最大规模1.4亿中文知识图谱开源下载
1
+ <h1 align = " center " >史上最大规模1.4亿中文知识图谱开源下载</h1 >
2
+
3
+ ![ 知识图谱] ( img/kg.png )
4
+
5
+ 知识就是力量,知识图谱是人工智能新时代的产物,简单地说知识图谱就是通过关联关系将知识组成网状的结构,然后我们的人工智能可以通过这个图谱来认识其代表的这一个现实事件,这个事件可以是现实,也可以是虚构的。
6
+
7
+ 知识图谱可以应用于机器人问答系统,知识推荐等等,下图为知识图谱在机器人上的应用。
8
+
9
+ ![ 机器人] ( img/bot.png )
10
+
11
+ 本次ownthink开源了史上最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式,下载连接见文末。
12
+
13
+ 解压后查看知识图谱规模:
14
+ ``` shell
15
+ $ wc -l ownthink_v2.csv
16
+ 140919781 ownthink_v2.csv
17
+ ```
18
+
19
+ 查看知识图谱数据:
20
+ ``` shell
21
+ $ head ownthink_v2.csv
22
+ 实体,属性,值
23
+ 胶饴,描述,别名: 饴糖、畅糖、畅、软糖。
24
+ 词条,描述,词条(拼音:cí tiáo)也叫词目,是辞书学用语,指收列的词语及其释文。
25
+ 词条,标签,文化
26
+ 红色食品,描述,红色食品是指食品为红色、橙红色或棕红色的食品。
27
+ 红色食品,中文名,红色食品
28
+ 红色食品,是否含防腐剂,否
29
+ 红色食品,主要食用功效,预防感冒,缓解疲劳
30
+ 红色食品,适宜人群,全部人群
31
+ 红色食品,用途,增强表皮细胞再生和防止皮肤衰老
32
+ ```
33
+
34
+ 使用python进行读取测试:
35
+ ``` python3
36
+ import sys
37
+ import csv
38
+
39
+ with open (' ownthink_v2.csv' , ' r' , encoding = ' utf8' ) as fin:
40
+ reader = csv.reader(fin)
41
+ for index, read in enumerate (reader):
42
+ print (read)
43
+
44
+ if index > 10 :
45
+ sys.exit(0 )
46
+ ```
47
+
48
+ 运行以上脚本输出结果:
49
+ ``` shell
50
+ [' 实体' , ' 属性' , ' 值' ]
51
+ [' 胶饴' , ' 描述' , ' 别名: 饴糖、畅糖、畅、软糖。' ]
52
+ [' 词条' , ' 描述' , ' 词条(拼音:cí tiáo)也叫词目,是辞书学用语,指收列的词语及其释文。' ]
53
+ [' 词条' , ' 标签' , ' 文化' ]
54
+ [' 红色食品' , ' 描述' , ' 红色食品是指食品为红色、橙红色或棕红色的食品。' ]
55
+ [' 红色食品' , ' 中文名' , ' 红色食品' ]
56
+ [' 红色食品' , ' 是否含防腐剂' , ' 否' ]
57
+ [' 红色食品' , ' 主要食用功效' , ' 预防感冒,缓解疲劳' ]
58
+ [' 红色食品' , ' 适宜人群' , ' 全部人群' ]
59
+ [' 红色食品' , ' 用途' , ' 增强表皮细胞再生和防止皮肤衰老' ]
60
+ [' 红色食品' , ' 标签' , ' 非科学' ]
61
+ [' 红色食品' , ' 标签' , ' 生活' ]
62
+ ```
63
+
64
+ 数据下载方式:
65
+
66
+ * 关注思知机器人回复【数据下载】获取下载链接
67
+
68
+ * 百度网盘(链接: https://pan.baidu.com/s/1LZjs9Dsta0yD9NH-1y0sAw 提取码: 3hpp )
69
+
70
+
71
+
72
+
Original file line number Diff line number Diff line change
1
+ import sys
2
+ import csv
3
+
4
+ with open ('ownthink_v2.csv' , 'r' , encoding = 'utf8' ) as fin :
5
+ reader = csv .reader (fin )
6
+ for index , read in enumerate (reader ):
7
+ print (read )
8
+
9
+ if index > 10 :
10
+ sys .exit (0 )
You can’t perform that action at this time.
0 commit comments