/设计方法 | 知识图谱的信息可视化

设计方法 | 知识图谱的信息可视化

正文字数:3779字

图片总数:13张


引言:知识图谱作为一种语义网络,其技术算法在人工智能和大数据等领域广泛应用。通常情况下,知识图谱的运转过程由数据模型完成,用户只能看到计算后的结果,数据可视化也仅限于展示结果的可读性。但实际上,图谱之间的关系和数据计算过程中所包含的分析价值和潜在机会信息同样重要。将知识图谱转化为可视化信息图可以帮助用户更好地理解和利用数据及其关系。然而,对于缺乏技术背景的界面设计师来说,从技术架构和计算函数等技术视角去理解知识图谱概念和应用可能会比较困难。本文旨在分享一种设计思路,帮助读者在实际工作中将知识图谱转化为可视化交互界面,以更好地呈现数据和关系。


01

什么是知识图谱

Design by:人人都是产品经理

信息可视化|数据关系|知识图谱

1.基本概念

知识图谱(Knowledge graph,KG)来源于谷歌下一代智能语义搜索引擎技术。其本质上基于语义网络的思想,是一种有向图结构的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其应用服务架构如下图所示。


知识图谱通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。

2.知识图谱特点


 

数据及知识的存储结构为有向图结构。有向图结构允许知识图谱有效地存储数据和知识之间的关联关系;具备高效的数据和知识检索能力。知识图谱可以通过图匹配算法,实现高效的数据和知识访问;具备智能化的数据和知识推理能力。知识图谱可以自动化、智能化地从已有的知识中发现和推理多角度的隐含知识。


 

3.为什么需要对知识图谱进行可视化

3.1.知识图谱的技术架构-侧重在数据关系模型和机器学习,普通用户很难读取和理解
 
知识图谱的核心技术逻辑,是由整体的“数据输入-数据处理-知识图谱生成”三个大环节构成。数据输入环节包含“结构化数据、半结构化数据、非结构化数据”;数据构建环节包含“信息抽取、知识融合、知识加工”;知识图谱系统的生成环节,是整个技术架构往复迭代、不断更新和积累,慢慢形成的结果。数据输入是对数据源的挖掘,数据构建是底层的模型算法应用,知识图谱生成是数据处理结果的呈现

这个过程在底层数据模型中运转,对用户可见的往往是最终的结果。比如:搜索引擎中,用户看不到搜索过程,但可得到最匹配的搜索结果;在音乐平台中,看不到内容匹配逻辑,但可以被推荐感兴趣的歌曲。如果想利用过程数据为用户提供服务,就需要进行可视化处理。

3.2. 传统的信息可视化-侧重在数据结果的展示和筛选,较少涉及数据关系的干预

传统信息可视化的方法,在设计侧更多强调数据信息与图像、色彩的信息传达上。其方法通常集中在“如何对已经确定的数据进行图形映射”和“如何处理信息层级”的视觉表现上,较少参与设计数据关系或影响数据结构。然而,这让用户知道数据“是什么”,却不能呈现数据“为什么知识图谱的可视化,可以让数据处理过程被用户可见、可用,从而更好的分析和使用数据。

3.3. 知识图谱的可视化-侧重在数据关系构建和处理过程的可视化

知识图谱技术广泛应用于多个领域,如情报学、自动问答等。现在还扩展到智能医疗、证券投资、聊天机器人等。知识图谱信息可视化注重于数据信息的提取和关系构建,呈现数据信息之间的关系。与传统信息可视化方法不同,它更强调关系呈现。

 

02

知识图谱的可视化设计方法

Design by:腾讯CDC

数据加工|图形语义|可视化映射

知识图谱在底层算法和数据模型上提供有效的技术逻辑,进而构建丰富庞大的语义网络,但如果要在具体应用场景中给用户可见的模式,则需要图形化界面的呈现。在实际工作中,设计侧的核心任务是“多关系图”的信息可视化。结合知识图谱的特征、技术原理和传统信息可视化方法,可以将知识图谱可视化的过程,归纳为“确定知识主题(主题层)-处理与分析数据(数据层)-构建数据三元组(关系层)-进行可视化映射(可视层)”四个步骤。

1.【主题层】

确定知识图谱可视化的主题是非常重要的,因为它不仅定义了核心概念和目标,也是可视化的起点和落脚点。传统可视化往往只注重数据的可视性,而缺少对数据的实际用途和价值的考虑。因此,没有明确的主题,数据的展示就缺乏意义。在实践中,确定主题可以作为梳理业务核心需求和定义设计目标的过程,例如确定要展示哪种类型的知识、最终的可视化效果对目标用户的价值、业务要利用数据达到何种目的等。在确定主题的过程中,可以使用传统的用户需求分析、文献综述、行业研究等方法,根据具体项目的需求选择合适的方法和工具。

2.【数据层】

在未经处理前,与主题相关的可用数据是多样且庞杂的。由知识图谱的技术框架可知,技术模型经过信息提取、知识融合和知识加工后,才使原始数据变得有用和有效,同样在可视化的过程中,也离不开信息提取与数据加工。

2.1. 数据提取-围绕知识主题进行数据信息的提取。
信息提取,也就是先罗列可能有用的相关数据类型。每个主题都是一大类目的知识领域,需要经过收集、归纳、拆解后再能够清晰的进行解释和传播。
2.2 数据加工-进行知识语义加工。
数据加工是对数据进行分类、筛选,确定最能表现知识主题的数据类型。通过分析关联程度,选择具有直接影响因素的数据,或进行细分。可以利用卡诺模型、波士顿矩阵等方法找到数据对主题影响的优先级,方法多样。
 

2.3. 数据清洗-进行数据筛选和最终确认
定义出有用的数据类型后,并不是所有数据都能完美符合我们的诉求,比如数据挖掘能力限制,不能挖到更精准的数据或有数据缺失;比如数据解析能力不足,数据类型混杂,或有错误数据等。排除不足量、精准度差、错误率高等不可用的数据,盘点出能够被应用于可视化的最终数据。在实际工作中,需要跟团队的数据挖掘工程师、或业务产品负责人明确数据能力和质量。
 

3.【关系层】

知识图谱技术中,本体构建是重要技术环节,帮助构建逻辑关系符合的三元组解释主题。通过确定节点和边内容建立关系层,阐述主题,推理得到更多知识内容。定义数据关系,转化独立数据为可描述语义,用户可通过知识语义可视化了解业务现象和底层信息。
比如京剧文化中师承的演变,可以通过不同人物之间的关系脉络,构建出“师承关系、家族关系、联姻关系”几种三元组模式,从相同节点中解读到某个京剧演员擅长某个角色的师承因素。再比如,将某班级每个学生的聊天频率、好友数量、QQ在线时长等网络社交行为关系一一对应,就会勾画出集中在某个学生身上的不同特征,把这些学生再放在一起,就呈现出一个班级学生在网络世界的不同社交特点。

4.【可视层】

当关系构建好以后,简单的三元组是容易读取的,但众多三元组集成在一起,也会涉及到信息读取效率的问题,就需要将关系结构图形化,这一步骤也是传统信息可视化方法中的必然环节。根据已经构建好的数据关系结构,可通过“图表映射”和“视图设计”两种方式,进行可视化的语义转换。

4.1. 可视化图表映射

可视化图表,是指具备通用性的标准化图表。总体分为统计类图表和关系类图表,本文主要阐述关系类图表。关系类图表又可分为网状关系和层次关系。网状关系图包括:关系图、弦图、弧长链接图等;层次关系图包括:树图、旭日图、矩形树图等。详细的标准化图表,可以借助E-chart、Tableau Public、Smartbi等软件进行参考选择。

在北京邮电大学彭国雁的论文《面向京剧知识图谱的信息可视化研究与设计》的案例中,“京剧传承之美”这一主题,“师承关系、家族关系、联姻关系”的三元组关系较复杂,如果直接用可视化图表映射来展示,会产生易读性差和页面布局难以控制的问题。于是论文作者采用不同图表相结合的方式,并将图形的视觉元素进行改造。

4.2. 可视化视图设计

本文所述的可视化视图,是指能表达标准化图表以外的,不同类型数据特征的语义图形,由设计师根据与主题相关的数据类型进行构思,并关联其不同类型数据间的关系语境,最终形成的信息图。

清华大学副教授向帆老师在对“学生互联网社交行为”这一主题的研究中,作者选择QQ使用状态的相关数据,将每个学生用QQ企鹅的轮廓图形表示,在线时长为企鹅形状大小、聊天次数为圆形嘴巴、好友数量为头发多少,呈现出“学生-网络社交特征-具体行为”的可视化关系图,在最终的视图中,可直观的看到完全不同的每个人。

经过以上四个步骤,就完成了对知识图谱数据进行可视化。它不是单纯的以视觉效果展示数据信息,而是从数据关系提取到关系呈现为一体的设计过程。

03

结语

综上所述,基于知识图谱的技术架构、传统数据可视化的方法和交互设计的工作流程,本文分享了一种可在工作中易于操作的知识图谱可视化方法。与传统数据信息可视化相比,知识图谱可视化更倾向于数据之间三元组关系的视觉表达,所谓“整体大于局部之和”,有了关系的建立,则更能够发现单一数据之外的延展信息和潜在机会。希望能够通过设计的力量,让普通用户也能更好的使用数据和洞察数据。

素材来源:

1.https://baijiahao.baidu.com/s?id=1640090161487643576&wfr=spider&for=pc

2.https://mp.weixin.qq.com/s?__biz=MzU2OTA0NzE2NA==&mid=2247484152&idx=1&sn=dd3253f59f3431763405a98c16c19aee&scene=21#wechat_redirect

3.https://mp.weixin.qq.com/s/GwZ26WC-rX4XHS9mroFhTA

4.https://blog.csdn.net/weixin_36105362/article/details/87211123

版权说明:本文素材来源于网络



 
          
编辑EDITOR李佳琪
审核REVIEWER韩月

本文来自微信公众号“信息与交互设计研究所”(ID:gh_c1cd7847b233)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。