期刊简介
是国家科技部、国家新闻出版署2003年7月批准创办的第一份专注卫生信息化领域研究与应用的综合性科技期刊。该杂志由卫生部主管,卫生部卫生统计信息中心主办,国内外公开发行。
首页>中国卫生信息管理杂志

- 杂志名称:中国卫生信息管理杂志
- 主管单位:中华人民共和国国家卫生健康委员会
- 主办单位:国家卫生健康委统计信息中心
- 国际刊号:20
- 国内刊号:1672-5166
- 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:万方收录(中), 维普收录(中), 知网收录(中), 上海图书馆馆藏, 国家图书馆馆藏
基于词向量的消费者体检健康词表研究
张兴厅;文栋;雷健波
关键词:深度学习, 机器学习, 文本挖掘, Word2vec, 消费者健康词表
摘要:目的 本研究探索中文消费者健康词表的构建方法;研究利用Word2vec构建消费者体检健康词表的可行性和合理性.方法 抓取天涯医院的信息作为语料,使用结巴分词进行中文分词处理,使用Word2vec构造词向量模型,从而形成消费者体检词表.后,使用预测准确率、准确率、召回率评价指标对词向量的模型效果进行评估.结果 消费者体检健康词表包含了74个种子词、137个消费者用词.候选词的准确率为94.71%,召回率为51.27%,F1值为0.33,74个种子词形成的候选词中前3个词为同义词的预测准确率为60.81%.结论 本研究验证了Word2vec在识别消费者用词方面的强大能力,利用Word2vec技术可以用来开发中文消费者健康词表.我们发现,Word2vec自动生成的候选消费者词列表质量不足以生成消费者健康词表,但是能作为人工审核构建的重要参考,为开发完整的中文CHV奠定了坚实的基础.
友情链接