知识图谱基础概念
知识图谱指的是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成,节点表示实体(entity)、概念(concept)或属性值(value);边表示实体的属性(property)或实体间的关系(relation)。
**实体:又称为对象(object)或实例(instance),指客观世界中具有可区别性且独立存在的某种事物,如2型糖尿病、二甲双胍。实体是知识图谱最基本的元素,每个实体可以用一个唯一的ID进行标识。
概念:又称为类别(type)、类(category或class),指反映一组实体的种类或对象类型,如疾病、药品。
关系:指连接不同实体的“边”,用以描述实体之间的关联,如二甲双胍和2型糖尿病之间有适应证关系。
属性:指某个实体可能具有的特征以及参数,如二甲双胍有医保支付类别属性。
属性值:指实体特定属性的值,如二甲双胍的医保支付类别为甲类。**
知识图谱在逻辑上分为模式层和数据层。模式层一般指Schema,是知识图谱的概念模型和逻辑基础,是数据层的规范约束。数据层主要由一系列的事实组成,主要基于模式层定义的模型构建数据,以三元组形式存储。
三元组 G=(head,relation/property,tail)是知识图谱数据层的一种通用表示形式,其中head是三元组的头节点,tail是三元组的尾节点,relation/property={r1,r2,r3,…,rM,p1,p2,p3,…,pN}是知识图谱关系和属性的集合,共包含M 条关系和N条属性。三元组的基本形式主要包括(实体1,关系,实体2)和(实体,属性,属性值)。