摘要:通过对红葡萄酒化学检测数据的分析,构建质量预测模型
head(redwine)
## 混合酸挥发性酸柠檬酸残糖 氯化物 二氧化硫 总二氧化硫量
密度 PH
## 1 7.4
0.70 0.00 1.9 0.076
数据来源:网络公开数据,采集自葡萄牙北部的红葡萄酒检测数据,网址:http://archive.ics.uci.edu/ml/datasets/Wine+Quality
数据量:1599
结论:我们关注的是测试集的均方误差和相关系数,对于这个数据集,随机森林的均方误差最小,相关系数最大;其次是支持向量机;经典最小二乘回归和神经网络位于中间水平;决策树拟合效果最差。
1、数据导入
redwine<-read.csv(file='winequality-red.csv',header=T)head(redwine)
##
## 1
