近些年来,根据帕金森疾病(PD)患者的语音数据对该疾病做出诊断成为一种行之有效的疾病诊断方法.首先,针对语音数据集中存在非均衡数据和噪声样本的问题使用SVM SMOTE过采样技术,利用支持向量机分类器寻找支持向量并在此基础上合成新的样本以达到均衡数据集的目的;为了减少数据维度,降低学习难度,运用信息增益特征选择对所有特征属性计算数值并划分数据集以此来获得信息增益,根据信息增益的大小排序选取得到八个特征作为最优特征组合;最后,构建随机森林帕金森疾病诊断模型,并采用网格搜索和交叉验证相结合的方式进行参数调优,进一步优化模型,实现诊断模型准确率的进一步提高.实验结果表明,优化后...