面向临床决策支持的中医脾胃病本体知识库构建研究
【摘要】 本文将本体技术、知识库、Agent技术有机地组织成一个整体,用中间表达集合对知识链进行概念化,中间表达用类对领域知识的知识实体、属性进行描述和定义,实现本体的结构化,用于规范研发中医脾胃病本体知识库与情景式临床决策探索。可以帮助临床医生从知识库中获取规律性认识,筛选出支持临床决策的直接参考证据,使之拟定更有针对性的治疗方案,提高临床疗效,并将中医脾胃病文献资源集成转化为信息知识产品,实现对中医古今脾胃病知识发现与拓展,资源共享。
【关键词】 中医脾胃病; 本体知识库; 服务模式; 资源共享
中医脾胃病是临床常见病,多发病,相当于现代医学消化系统疾病,发病率高,癌症多,癌前病变多。本病多表现为“痛、胀、痞、满、呆、嗳、烧、寐、泻、秘”十症,此十症可单独出现,也可几症同时出现,或伴有疲乏,消瘦,口臭、口干、口苦,贫血等伴随症状,一般和营养不良,暴饮暴食,过食生冷食物,如冷饮,凉啤酒等损伤有关,其疾病特征和关系复杂多样,已经严重影响到患者的寿命和生活质量。目前,笔者研究构建中医脾胃病本体知识库及临床决策探索,将会为更多的中青年医生面对临床上复杂多变的具体情景,可以从知识库中获取规律性认识,成为支持临床决策的直接参考证据,使之在他人临证得失的基础上拟定更有针对性的治疗方案,从而实现中医临床疗效的保证与提高[1]。
1 国内外研究现状简述
1.1 国家政府十分重视医药事业发展 2009年卫生部公布的《电子病历基本架构与数据标准》和2011年推行的《电子病历系统功能规范》,详细定义了新一代电子病历的数据标准和功能规范,改变了以往财务、药品、诊疗流程信息化的思路,确立了电子病历在医院信息化和区域医疗建设中的核心地位,将医疗信息化建设推向了前所未有的高度。为配合新医改形势下的卫生信息化建设,卫生部信息化工作领导小组组织全国近千名专家,开展了健康档案、电子病历及相关技术规范标准的科技攻关和试点应用工作,取得了包括《健康档案基本架构与数据标准(试行)》、《基于健康档案的区域卫生信息平台建设指南(试行)》、《基于健康档案的区域卫生信息平台建设技术解决方案(试行)》、《基于区域卫生信息平台的妇幼保健信息系统建设技术解决方案(试行)》在内的一系列重要成果,为卫生信息化建设奠定了良好的基础[2]。
1.2 中医临床医师医技水平有待加强 由于中国医疗资源分布不均衡,医生知识层次和临床技能参差不齐,所以改变医生头脑中知识结构和内容是提高医疗质量根本的方法,提供专业临床知识库和临床相似医案决策的电子病历产品才能更好地提高医生的诊疗水平。尤其在乡镇卫生院和社区医院,或欠发达地区的医疗机构,更希望得到专家经验和医学知识方面的支持。医生在临床实践中,由于日常工作的忙碌,很容易忽略基础知识的再学习;尤其是遇到疑难情况,很多医生还是通过翻阅纸质书籍来补充医学知识。所以,基于临床情景的知识推送服务非常重要,医生可以在诊疗过程中获得了特定的知识补充,而比泛泛的翻阅医学书籍更有效率、更有针对性。
1.3 医院电子病历系统架构暂不完善 电子病历系统不仅是简单的数据录入和数据采集,更是一个强大的病历管理系统,是医疗数据的汇总。当很多产品都在结构化和非结构化上争执不休的时候,往往会忽略了电子病历系统的另一个重要方向就是病历管理和医疗数据管理。此外和病历管理相关的业务需求不仅是文件和数据的存储,还有诸如病历权限、病历安全、病历流转、病历查询、病历转储、临床决策、标准化诊疗以及临床路径等多个重要管理内容,更涵盖了三级查房、病历质控等重要的医疗约束制度。这些重要的内容不仅要体现出纸质病历介质的传统管理行为,还要体现出医疗数据集中管理的优势。因此,电子病历作为医疗数据的集大成者,实现真正的病历管理系统,并趋于全面医疗行为决策,才能辅助医生为患者提供最合理的检查治疗方案的同时,为流行病学研究提供重要的原始数据。据调研发现,目前医院的电子病历系统远没有达到这个要求[3-5]。
1.4 临床医疗常规应用CDSS寥寥无几 基于HL7标准的临床决策系统目前在国际上越来越引起关注。Arden Syntax临床指南模型于1990年开始发布,后被HL7和ANSI采纳为标准,是最早的医学知识表达标准。著名的HELP(Health Evaluation through Logical Processing)系统称之为临床指南的CDSS。GLIF临床指南模型在Arden Syntax基础上发展起来,可作为各临床指南模型之间的转换格式。2002年发布的SAGE临床指南模型综合了以往研究成果,在临床医疗信息整合中又取得了一定的进展[6-10]。尽管如此,目前国内外在临床上常规应用的CDSS仍寥寥无几。造成这种情况的原因有:(1)模型问题:基于流程图的方法可以很好解决简单问题,但问题稍复杂就使流程图变得难以处理,且它不能处理不确定问题,而这正是临床医生常常遇到的问题。(2)知识库问题:智能模型的建立需要大量详细的医学知识,目前还没有一个大规模、可共享、可复用的医学知识库,缺乏知识是制约临床决策支持系统的另一重要因素。
2 本体知识库架构研究思路
2.1 本体技术 在计算机科学与信息科学领域,理论上讲本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”,提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系;或者说是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;也可以说实际上是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。作为一种关于现实世界或其中某个组成部分的知识表达形式,本体应用领域包括(但不仅限于):人工智能、语义网、软件工程、生物医学信息学、图书馆学以及信息架构。目前,笔者研究的中医脾胃病本体知识库及情景式临床决策探索,就是想以该领域的知识为素材,运用信息科学的本体论原理而编写出作品(artifacts)。并针对该领域的属性进行推理、建模[3]。
2.2 知识库 本体知识库可称为智能数据库或人工智能数据库。由人工智能和数据库两项计算机技术的有机结合,促成了知识库系统的产生和发展。其特点:(1)根据应用领域特征、背景特征、使用特征、属性特征等而构成。(2)知识库的知识是有层次的。最低层是“事实知识”,中间层是用来控制“事实”的知识(通常用规则、过程等表示)。最高层次是“策略”,它以中间层知识为控制对象。(3)知识库中可有一种特殊形式的知识——可信度。有关事实、规则和策略都可标以可信度。(4)如果对于某些问题的解决途径是肯定和必然的,就可以把其作为一部分相当肯定的问题解决途径直接存储在典型方法库中。中医脾胃病本体知识库遵循上述特点,首先考虑定义本体中的类,也就是对概念进行规范性表述;其次,根据一定的分类学等级体系安排本体中的类,并且定义其属性,允许其赋值;最后,为实例的属性插件赋值,定义每个类中对应的实例,添加这些实例的属性赋值信息和限制条件,完成一个本体知识库的建立[4]。
2.3 Agent技术 中医脾胃病本体知识库借助于Agent概念抽象和设计理念来支持系统的分析、建模。采用情景实例的方法,将系统看作与用户对等的实体,用户容易理解,便于原始需求的获取。具体作法为:情景(Scenario)是为了实现某类Agent的某类目标而发生在若干内部Agent与外部Agent之间的可能的动作流的文本描述。情景实例(Scenario-Case)是对情景的一次具体情况进行的描述。背景知识(Baekground-Knowledge)是与每个情景实例相关的信息。
3 中医脾胃病本体知识库研究方法
3.1 构建脾胃病知识本体 本体构建以数据库映射为基础。参考普通高等教育“十一五”国家级规划教材·新世纪(第2版)·全国高等中医院校规划教材《中医基础理论》、《中医诊断学》、《中药学》、《方剂学》、《中医内科学》、《中医外科学》、《中医妇科学》、《中医儿科学》等等,应用protégé软件构建脾胃病知识本体,包括疾病、中药、证候等本体8000余条,见图1。
3.2 构建本体知识库示范 以脾胃病本体为基础,对临床规范性知识进行描述,探索临床知识库的构建技术与方法。知识库内容包括决策知识(分为诊断性知识、治疗性知识、参考性知识、案例性知识、经验性知识等)、知识来源(分为临床指南、专家经验、系统评价、高质量RCT、名医验案等)、决策类型(分为提醒、咨询、医嘱集、警告、文档模板等)、临床情景(分为诊断过程、治疗过程、分析评价过程等)、判断逻辑(分为条件判断、直接判断、相似度匹配等)、证据等级(分为Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级)、基本概念等部分。
3.3 知识库临床情景描述 临床情景是决策知识应用场景或环境的描述,该部分内容阐释了在医疗信息系统中如何告诉程序读取相关知识并执行命令,并描述了情景与EMR相关业务数据之间的关系。如情景描述:已知处方、症状或治法,根据处方中,中药和症状(中药和药理、药理和理化指标)的关系,给予中药加减的决策。具体实操是通过接口从EMR获得处方和症状的结构化文本;数据类型转化;系统把获得的结构化词语对照标准词语库中的分类,进行判断词语的类别。
规则描述,加味1:中药和症状。基于某个疾病本体库,将处方和中药、中药和症状的三元组关系找到,排除处方中中药所对应的症状,对照未有对应关系的患者症状,再通过症状和中药的关系,给予对应的中药名称。例如:患者有头晕、腹痛、便溏,但处方中只有2个药是天麻、延胡索,对应的关系是,头晕-天麻、腹痛-延胡索,但便溏没有对应的中药,通过疾病本体库中,中药和症状的三元组中寻找便溏-五味子的关系,给予决策结果,应该增加一味药五味子。如果某个症状对应多个中药,系统决策结果是增加多个中药。
加味2:中药和功效、功效和治法。基于某个疾病本体库或中药基础知识本体库,将中药和功效、功效和治法的三元组关系找到,对照治法和功效的关系,将处方中没有对照关系的治法找到,再根据功效和治法、功效和中药的关系,给予相应中药的加味提示。比如治法中有健脾、利湿、止泻,而处方中只有茯苓、厚朴,在中药和功效的关系中找到健脾-茯苓、利湿-厚朴的关系,发现没有止泻的相关中药,再找出止泻-五味子的关系,提示用户应该增加一味药五味子。如果某个功效对应多个中药,系统决策结果是增加多个中药。减味:与加味相反。排除规则:调和诸药作用的甘草等中药不进行判断加减。
3.4 多Agent技术开发应用 多Agent技术的开发与应用主要考虑以下几个方面:(1)格式转换Agent:Reactive特性,输入为EMR数据,转换后输出系统可识别结构化数据;(2)分类识别Agent:Autonomy特性,输入为数据格式转换Agent提供结构化数据,判断是以下哪种词语类型:症状类、诊断类、证候类、治法类、处方类、中药类等等。判断规则需请求知识库Agent。(3)情景判断Agent:Reactive特性,输入为分类识别Agent提供词语类型,根据系统定义存在情景进行情景匹配。系统定义需请求知识库Agent。(4)规则匹配Agent:Proactive特性,输入为情景判断Agent提供情景,进行规则匹配,选择合适的规则,反馈出结果。规则匹配需请求知识库Agent。(5)知识库Agent(组):Reactive特性,输入为获取知识条件,从本体知识库(或其他知识库)中查找相应知识输出,输出为结构化知识数据。(6)公共知识Agent:提供基础数据、配置信息和数据库接口调用。(7)多Agent组织结构。
3.5 知识库决策支持系统 本系统研发主要包含有接口设计、运行设计、数据库设计、数据字典设计、安全保密设计和系统出错处理设计等。
3.5.1 接口设计 接口设计可细分为:(1)用户接口,即决策显示窗口:它将决策结果以数据块列表的方式,显示在固定的窗体中,用户可以选择点击数据块链接,调用结果,加载到EMR系统中。系统会识别EMR系统的窗体控件区域,比如:诊断、症状、证候诊断等区域,加载相应的内容。(2)外部接口,即与EMR系统软件之间的接口:体现在EMR数据格式:文本格式、Xml格式。EMR业务数据类型:症状、理化结果、诊断、证候诊断、治法、处方、方药和剂量。其中接口输入:获取EMR数据。当光标落在相应的EMR系统控件中,Agent判断情景需求,再从EMR抓取的各种类型数据。接口输出:决策结果的使用加载。当Agent决策结果展示到桌面窗口中,通过双击触发EMR程序将决策结果加载到相应的EMR控件中。(3)内部接口,即描述本系统内部各模块间的接口安排,如:模块间的调用方式、反馈应答、接口的输入、输出等。
3.5.2 运行设计 运行设计中首先考虑到系统初始化:系统作为智能知识引擎嵌入在EMR系统中实时运行,并收集相关患者疾病信息,当医生在录入患者相关诊疗信息时,触发系统提供辅助决策。运行控制设计有:(1)情景扑捉判断:智能决策系统实时运行,检测EMR系统中相关控件的录入,通过情景判断Agent扑捉情景。(2)数据确认:情景判断后,通过规则匹配Agent提供规则中要求的医疗数据类型,提交给格式转换Agent。(3)数据收集:格式转换Agent收集相关患者相关诊疗数据,用来满足决策规则,收集后交给分类识别Agent进行分类。(4)数据分类:分类识别Agent会将数据分类,并提供给规则匹配Agent。(5)知识提供:知识库Agent调取本体知识库,提供所需决策知识并返回给规则匹配Agent。(6)决策结果显示:规则匹配Agent做出结论后,将结果发送给情景判断Agent,通过分类识别Agent、格式转换Agent,最终显示到系统界面的结果窗体中。(7)决策过程结束:决策结果显示到结果窗体中,决策过程结束。运行结束(结果采用):EMR系统调用结果窗体中的数据返回到相应的控件中,运行结束。
3.5.3 数据库设计 数据库设计采用JENA,通过三元组的方式表达知识。(1)知识库的架构:笔者采用情景模式型的本体知识库构建方法,基于临床诊疗的情景组织知识间的神经网络关系,这样的好处是直接模拟医学基础知识在临床应用时的情景关系,更加真实、高效的提供决策逻辑。本体知识库逻辑架构见图2。
3.5.4 其他设计 数据字典设计考虑到由于数据库中的本体知识库是基于情景模式,所以,每个情景逻辑上需要建立一个本体数据库,每一个本体数据库中可以有多个三元组关系,三元组为实体数据关系,情景本体库为虚拟逻辑上的数据库。例如建立3个三元组,可分别是“疾病-关系-证候”、“证候-主症关系-症状”、“证候-辅症关系-症状”。不同情景的本体库中的三元组可以复用。安全保密设计强调了OWL或RDF文件存储在Oracle数据库中,通过Oracle自身存储安全策略保证知识库安全。在系统出错处理设计中,当显示数据无法加载到EMR,考虑是格式转换的问题,或出现无法通过规则提供决策结果,考虑本体数据库逻辑设计问题。
4 结语
脾胃病本体知识库构建实质就是模型化一个领域,它的构建过程必然是一个多次重复、逐步求精的过程。本研究采用本体方法表达中医临床知识,将复杂中医内容转换为机读决策知识,并使用Agent技术实现知识库嵌入EMR系统,实现实时决策支持,是国内外研究前沿。从目前的研究程度来看,本系统最核心的内容仍然是知识,尤其是如何准确的表达可以机读的中医临床知识,尽量丰富知识库内容并对知识进行证据等级区分。未来研究还需考虑知识库的兼容问题,即与已有的中医药语言系统、中医临床术语系统、中医药主题词表的一致性问题,以及知识来源问题,即如何获取高质量的中医临床知识作为决策支持的证据。这些内容将在未来研究中有待解决[5]。
参考文献
[1]李敬华,亢力,封毅,等.基于临床需求的中医数字化医案研究[J].中国医学创新,2013,10(36):137-139.
[2]李敬华,崔蒙,卜宪峥,等.未来电子病历的发展与技术探讨[J].中国数字医学,2012,7(6):8-10..
[3]赵阳耀.基于本体的数据源映射方法与策略[D].哈尔滨:哈尔滨工程大学,2010.
[4]于彤,崔蒙,吴朝晖,等.基于语义Web的中医临床知识建模[J].中国数字医学,2013,8(11):81-85.
[5]董燕,崔蒙.中医药信息研究的发展现状及趋势[J].中国中西医结合杂志,2013,33(4):559-564.
[6]蒋宏潮,王大亮,张德政,等.基于领域本体的中医知识获取方法[J].计算机工程,2008,34(12):16-18,21.
[7]曹宇峰,曹存根.基于本体的中医舌诊知识的获取[J].计算机应用究,2006,23(3):31-34.
[8]高成勉,包含飞,周强,等.本体构建原则及其在中医顶层本体构建中的应用[J].医学信息,2008,21(5):581-583.
[9]于彤,崔蒙,李海燕,等.中医药学语言系统的语义网络框架:一个面向中医药领域的规范化顶层本体[J].中国数字医学,2014,9(1):44-47.
[10]李新霞,陆建峰,孟红梅,等.本体在中医脾胃病辅助诊断中的应用[J].江南大学学报(自然科学版),2010,9(2):151-155.
(收稿日期:2014-04-01) (本文编辑:蔡元元)
上一篇:如何提高医学大学生实习质量