1.3.3规范化诊断标准体系<br> 经过长期的临床实践、研究和分析,中医已经积累、总结和发现了大量有关中医诊断方面的数据、知识,并将研究结果应用于临床医疗,为人类健康事业做出了重要贡献。然而中医诊断是一门复杂的、实践性很强的知识体系,人类对于其认识还远未结束,随着大量中医诊断病历数据的数字化、网络化,传统人工的数据分析和处理方法已经不再适应,利用现代信息处理手段进一步深刻揭示中医诊断规律的时代已经到来。信息技术以及人工智能技术的应用,将帮助人们从传统经验和现代化科研信息的大量数据中,提取出许多有价值的知识和线索来,从而帮助人们设计出对诊断某种疾病的最佳规则,大大提高诊断效果。采用大规模数据挖掘技术和机器学习方法,可以全面高效地分析多数据源的数据之间蕴涵的内在联系,发现深藏在数据内部的有用知识。通常中医诊断知识规则的发现可以采用以下两个阶段完成。<br> 第一阶段是中医诊断数据仓库的建立。数据仓库的来源主要有两种:一是根据目前已有的中医诊断数据(经典病案著作、典型病例、临床病历、原始知识等);二是老中医专家临床的诊疗过程、辨识经验、思维方法等,同步检测客观信息数据源。由于数据来源不同,首先需要经过数据清理,规范数据格式,并进行数据转换;然后确定数据表之间的关联属性,进行数据集成与约简;最后定义数据仓库,将经过预处理后的数据导人数据仓库。<br> 第二阶段是中医诊断知识(规则)的数据挖掘。在数据仓库框架下,通过对数据筛选、归类等操作对数据进行分析,通过挖掘算法发现未知知识(规则)。挖掘的内容包括:①关联规则,即发现数据属性之间的蕴涵关系,这种关系可能涉及多个表中的多个属性,这种关联规则只有在数据仓库环境下才能有效发现;②序列模式,即反映系列数据之间的规律模式;③分类知识,即建立基于统计学原理、决策树和支持向量机的自动分类器,对数据进行层次化精细分类处理;④聚类知识,即在无专家指导的条件下对数据进行自动分簇,揭示数据之间内在的相似性;⑤离群数据,离群数据反映了数据的特异性,是客观事物多样性和特殊性的一种反映,在中医诊断领域中离群数据具有明确的实际背景,因此动态识别离群数据也是需要发现的一种知识。
展开