国家标准编制说明

发布时间:2018-11-03 05:43:16

健康信息学 中医药数据集分类与代码

国家标准编制说明

一、工作简况

1 任务来源

本标准由中国中医科学院中医药信息研究所提出,经国家标准化技术委员会批准,正式列入2016年国家标准制修订项目计划,项目编号为20161344-T-424,项目名称为《健康信息学 中医药数据集分类与代码》。

随着中医药事业的发展,中医药数据资源日益丰富,为更好的发挥中医药数据资源的作用,需要制定有关标准来规范中医药数据资源的管理。数据集是数据资源经人工有序化的结果,也是信息化工作中数据资源存贮的基本形式。中医药数据集分类与编码是实现数据资源管理工作现代化的必要条件,在信息检索、共享、交换中起着至关重要的作用。依据本分类与编码标准将具有某种共同特征的中医药数据集归并在一起,不具有共性的中医药数据集区分开来,并通过设定的代码体系进行编码,使计算机系统或人工能够识别和处理,用以保证中医药数据资源得到有效的管理,并能按类别开发数据集,支持高效率的查询服务。

本标准起草单位:中国中医科学院中医药信息研究所、北京英富森软件股份有限公司、中国标准化研究院等

本标准主要起草人:……

2 本标准制定目的和意义

通过制订《健康信息学 中医药数据集分类与代码》国家标准,可给予每个中医药数据集一个规范化的分类和编码,使计算机系统更方便地能够识别和处理,对促进中医药资源得到有效利用具有重要的指导意义。

3 主要工作过程

1.建立标准起草组

该标准由中国中医科学院中医药信息研究所提出后,于2016年获国家标准化管理委员会立项,201610月成立了由中国中医科学院中医药信息研究所、北京英富森软件股份有限公司、中国标准化研究院等组成的标准起草组。

2.形成标准草案

标准起草组于201611月启动本文件的调研工作,并于20175月底前完成了相关资料的收集和分析工作。起草组经多次组内研讨,确定了标准的框架和主要内容,并于201710月形成了标准草案稿。

3. 征求意见阶段

标准起草工作组先后召开了多次组内研讨会,对标准草案进行了讨论。根据专家意见,起草组对草案内容进行了修改,于20183月底形成标准征求意见稿。

二、国家标准编制原则和确定国家标准主要内容的论据

1 编制原则

按照GB/T1.1-2009《标准化工作导则第1部分:标准的结构和编写》的要求和规定编写本标准内容。

本标准应具有科学性、先进性。同时应充分考虑到现阶段我国中医药数据集情况和描述需求,使其具有可操作性。

2 标准主要内容与确定论据

2.1 标准主要内容及适用范围

本标准规定了中医药数据集的分类与代码

本标准适用于中医药领域数据集调查与规划,数据集的组织与描述、整合、汇交、发布和目录查询,以及中医药信息系统的规划与设计

2.2 标准主要内容的确定

本标准起草过程中,对当前中医药领域数据集和卫生领域数据集相关标准进行了调研和数据分析。

2.2.1 数据集分类方法的确定

调研分类编码的方法,分为线分类法和面分类法。

线分类法:线分类法是将分类对象按选定的若干属性(或特征),逐次地分为若干层级,每个层级又分为若干类目。同一分支的同层类目之间构成并列关系,不同层级类目之间构成隶属关系。

面分类法:选定分类对象的若干属性(或特征),将分类对象按每一属性(或特征)划分成一组独立的类目,每一组类目构成一个“面”。再按一定顺序将各个“面”平行排列。使用时根据需要将有关“面”中的相应类目按“面”的制定排列顺序组配在一起,形成一个新的符合类目。

结合中医药数据集的特点,本标准采用面分类法和线分类法相结合的方法。

2.2.2 数据集分类与代码的确定

1)数据集分类维度的确定

数据集分类根据数据集的重要属性对它进行分类。每个数据集都是围绕一定的主题构建的,每个数据集都有一个主题,这也是数据集的主要内容属性。所以中医药数据集分类以主题分类为主要分类。其次,数据集的内容来源,是来自于实验、观测等的原始记录,还是来自于研究报告、论文等经过一定总结归纳的内容,亦或来自于历史文献中等信息,对于数据集的使用者也是非常重要的。再次,数据集创建者是什么类型的机构,科研机构、医疗机构、还是商业机构等,也是数据集分类的一个重要维度。

所以,中医药数据集分类按照数据集主题进行主要分类,同时在若干相同主题数据集中,又根据其个性,如创建者类型、内容来源等多属性进行分类。

2)数据集编码设计

数据集分类编码设计分为中医药领域代码、创建者类型代码、数据来源类型代码、主题类型代码等4部分每部分之间用符号“· ”分隔

中医药领域代码:用中医药英文缩写首字母TCM 表示;

创建者类型代码:按中医药领域业务范围,将数据集创建机构分为10个类型,并为每一类型赋予3位字母代码。

数据来源类型代码:根据数据集原始数据来源不同,将数据集来源分为4个类型,用2位阿拉伯数字表示。

主题类型代码:根据数据集内容主题不同,将数据集按主题分为6个一级类及若干子类,用6位阿拉伯数字表示。

三、采用国际标准和国外先进标准的程度

本标准为首次自主制定,不涉及国际国外标准采标情况。

四、与有关的现行法律、法规和强制性国家标准的关系

本标准符合国家现行法律、法规、规章和强制性国家标准的要求,本标准有助于《中华人民共和国产品质量法》等相关法律、法规、规章和强制性国家标准的实施。

本标准的实施不涉及对现行标准的废止情况。

五、重大分歧意见的处理经过和依据

本标准在制定过程中未出现重大分歧意见。

六、国家标准作为强制性国家标准或推荐性国家标准的建议

本标准为首次制定,建议作为推荐性标准发布实施。

七、贯彻国家标准的要求和措施建议

本标准为首次针对中医药数据集分类与编码规范制定的国家标准,为推荐性标准,在组织上建议在中医药信息研究机构应用实施,并逐渐引导其他中医药及其相关机构积极实施本标准。并将实施过程中出现的问题和好的改进建议反馈起草组以便进一步对本标准的修订完善。

在技术上,在标准实施过程中,按照本标准中给出的中医药数据集分类与代码要求逐步对现行的中医药数据集分类与编码信息进行规范,通过本标准的实施,尽可能的实现在整个中医药领域对中医药数据集的分类与代码信息描述的规范化和一致性。

八、废止现行有关标准的建议

本标准不涉及对现行标准的废止。

健康信息学 中医药数据集分类与代码准起草组

20183

国家标准编制说明

相关推荐