期刊简介
是国家科技部、国家新闻出版署2003年7月批准创办的第一份专注卫生信息化领域研究与应用的综合性科技期刊。该杂志由卫生部主管,卫生部卫生统计信息中心主办,国内外公开发行。
首页>中国卫生信息管理杂志

- 杂志名称:中国卫生信息管理杂志
- 主管单位:中华人民共和国国家卫生健康委员会
- 主办单位:国家卫生健康委统计信息中心
- 国际刊号:20
- 国内刊号:1672-5166
- 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:万方收录(中), 维普收录(中), 知网收录(中), 上海图书馆馆藏, 国家图书馆馆藏
基于条件随机域的临床文本去识别研究
都丽婷;夏晨曦;赵冬;宋阳;罗维;冯德军;洪旭;马敬东
关键词:去识别, 临床文本, PHI, CRF
摘要:目的 本研究旨在有效识别临床文本中的隐私信息,以保护患者隐私,实现临床信息的共享与利用,促进基于临床医学证据研究的发展.方法 采用中国四川省某市级区域人口健康信息平台随机抽取的18350条住院小结作为样本,基于条件随机域(conditional random field,CRF)模型,对样本数据中多种PHI类型进行识别.结果 人工标注PHI实体总数为32210个,标注一致性达到92.7%,经过对不一致标记进行校正审核,一致性收敛至100%.测试结果评估显示,除病理号、X线片号、89岁以上的年龄以外,其他PHI类型的F值均超过95%,综合F值达到98.72%.结论 本研究基于大规模多样化临床文本数据,利用机器学习的方法,实现了高效的自动化临床文本去识别.对于在保护模型的基础上开发更高效的健康大数据去识别算法以及保证去识别技术的一般性和可扩展性的研究还有待探索.
友情链接