====== 随机森林使用全部数据集进行分析 ====== ===== 一、需求说明 ===== 客户不想设置训练集和测试集,想使用全部的数据做训练集或测试集来进行随机森林分析 ===== 二、实现方式 ===== 去除训练集和测试集比例分配部分,以及前期交叉验证的结果部分,用全部数据进行randompredict ===== 三、测试路径 ===== /TJPROJ1/META_ASS/script_Advanced_analysis/randomforest_totaldata ===== 四、运行脚本及注意事项 ===== 运行流程时需要将rf.main_modify.cagv2.R替换为附件中的rf.main_modify.cagv2.R文件,并同时更换对应集群下的randomforest.crossvalidation.last.r与group.colorx.xls文件(适用与基础流程与云平台执行任务,建议重新删除处理) {{ ::rf.main_modify.cagv2.zip |}}