3 两类知识图谱的联系
两类知识图谱都是以图(Graph)为基础构建网络模型,在网络分析的基础上服务于知识管理,所有网络分析的现存的理论和方法都可以应用于两类知识图谱的分析,在这些方法中,具有代表性的是网络聚类分析和可视化分析方法。
3.1 网络聚类分析 聚类分析是将分析对象根据彼此之间的亲疏关系或相似程度分成不同的类群,密切关联或相似程度高的对象归到同一类群。对于“科学知识图谱”,如共词分析过程中,将学科或主题中的关键词作为分析对象,利用网络模型中词与词之间的亲疏关系,应用聚类分析,发现隐藏的密切关联的类群,从而揭示学科或主题的结构与演化规律。对于“Google知识图谱”,为构建统一的结构化知识库,需要对含义相同但表述不同的实体归一化,即实体消歧或实体对齐过程,具体过程如下:以实体对象为聚类中心,利用空间向量模型等方法定义实体对象之间的相似度,应用聚类方法,分析不同表述的实体的相似程度,将相似程度高的那些实体归并为同一实体对象,并分配全局唯一标识,完成实体消歧和对齐。
3.2 网络可视化分析 网络可视化将复杂网络数据以清晰的网络视图展现出来,帮助研究者洞察其中隐藏的知识和规律。“科学知识图谱”能够利用相关可视化工具,如CiteSpace[12]显示节点之间的关系,找出具有重要地位的文献、作者、学科和群体,绘出网络视图,构建显示知识关系的知识地图等。“Google知识图谱”基于知识库中的语义网络模型,构建出基于图的大规模网络,应用网络可视化分析工具发现海量实体中蕴含的创新型知识并绘图展示。