目录

随机森林使用全部数据集进行分析

一、需求说明

客户不想设置训练集和测试集,想使用全部的数据做训练集或测试集来进行随机森林分析

二、实现方式

去除训练集和测试集比例分配部分,以及前期交叉验证的结果部分,用全部数据进行randompredict

三、测试路径

/TJPROJ1/META_ASS/script_Advanced_analysis/randomforest_totaldata

四、运行脚本及注意事项

运行流程时需要将rf.main_modify.cagv2.R替换为附件中的rf.main_modify.cagv2.R文件,并同时更换对应集群下的randomforest.crossvalidation.last.r与group.colorx.xls文件(适用与基础流程与云平台执行任务,建议重新删除处理)

rf.main_modify.cagv2.zip