版权说明 操作指南
首页 > 成果 > 详情

多源环境下中药实体统一视图构建策略

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
论文标题(英文):
Construction Strategy for Unified View of TCM Entities in Multi-source Environment
作者:
梁杨;丁长松;蔡雄
作者机构:
湖南中医药大学信息科学与工程学院,湖南 长沙 410208
湖南省中医药大数据分析实验室,湖南 长沙 410208
中南大学计算机学院,湖南 长沙 410000
湖南中医药大学科技创新中心,湖南 长沙 410208
[蔡雄; 梁杨; 丁长松] 湖南中医药大学
语种:
中文
关键词:
大数据;多源数据;实体融合;词向量;相关度
关键词(英文):
multi-source data;entity fusion;word vector;correlation
期刊:
中国中医药信息杂志
ISSN:
1005-5304
年:
2020
卷:
27
期:
9
页码:
108-114
基金类别:
国家重点研发计划(2017YFC1703306) 湖南省教育厅科学研究项目(19C1391) 湖南省重点研发计划(2017SK2111) 湖南省教育厅重点项目(18A227) 湖南省自然科学基金(2018JJ2301) 湖南省中医药科研计划重点课题(2020002) 湖南中医药大学电子科学与技术学科开放基金(2018DK04)。
机构署名:
本校为第一机构
院系归属:
信息科学与工程学院
摘要:
目的针对大数据环境下跨数据源查询面临的中药实体呈现多视图,且中药实体在各数据源中表现出属性不完整、多模态、差异性等问题,提出面向多源数据的中药实体统一视图的构建策略。方法基于实体属性间的相互关系,构建实体多视图融合整体架构,并对实体和属性等关键元素进行抽象化表示;以用户需求为约束提出基于词向量的相关度计算方法,采用Skip-gram模型训练出表征实体属性的词向量;提出基于欧氏距离和Jaccard系数的相关度算法,并以此为依据进行实体融合。结果共训练完成属性词向量6116个,其中有效词向量230个,以400对不同源中药实体作为测试集,分别采用AFCDS、FF和WVCC方法进行实体融合实验,其融合...
摘要(英文):
Objective To propose a construction strategy of unified view of TCM entities for multi-source data targeting the fact that TCM entities are faced with multi-data query with multiple views in the big data environment, and that TCM entities exhibit incomplete attributes, multi-modality, and differences in each data source. Methods Based on the interrelationship between entity attributes, an entity multi-view fusion overall architecture was constructed, and abstract representations of key elements such as entities and attributes were carried out. A word vector-based correlation calculation method...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com