版权说明 操作指南
首页 > 成果 > 详情

基于Hadoop的中医药数据管理策略研究

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
梁杨;丁长松;于俊洋
作者机构:
[梁杨; 丁长松] 湖南中医药大学信息科学与工程学院
[梁杨] 中南大学信息科学与工程学院
[于俊洋] 河南大学软件学院
语种:
中文
关键词:
中医药数据;分层管理;分布式
关键词(英文):
Hadoop;MapReduce
期刊:
中国中医药信息杂志
ISSN:
1005-5304
年:
2018
卷:
25
期:
5
页码:
96-100
基金类别:
国家重点研发计划(SQ2017YFC170323) 湖南省重点研发计划(2017SK2111) 湖南中医药大学青年教师科研基金(99820001-221)
机构署名:
本校为第一机构
院系归属:
信息科学与工程学院
摘要:
目的为解决传统方法采集、存储和处理海量中医药数据的低效问题,探索数据管理的新策略。方法根据中医药数据的典型特征,设计基于Hadoop的分层管理架构,对串行数据挖掘算法进行MapReduce化改进;部署单节点服务器和分布式集群,采用8组不同规模的数据集,进行数据采集实验和串并行算法实验。结果数据传输时间在非分布式环境下通常超过3000 s,增幅较大,而在分布式集群下一般不超过300 s,增幅平缓;当数据规模超过一定范围后,与伪分布式和完全分布式下的并行算法比较,非分布式下串行算法的运行耗时急剧增加。结论与传统单节点系统相比,基于Hadoop的中医药数据管理平台采集、存储及处理海量数据的效率明...
摘要(英文):
Objective To solve the inefficiencies of traditional methods of collecting, storing and processing mass TCM data; To explore new strategies for data management. Methods According to the typical characteristics of TCM data, a hierarchical management architecture based on Hadoop was designed and a processing algorithm based on MapReduce was improved. The single node server and Hadoop distributed clusters were deployed. Data acquisition experiment and serial and parallel algorithm experiments were conducted, using eight groups of data sets of different sizes. Results The data transfer time was us...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com