前言:之前自己试着写了一下ID3,发现自己逻辑不够清晰。所以决定仔细研读前人的代码,努力弥补一下差距。
源代码见:华夏35度,Data Mining,归纳决策树ID3(Java实现)
源代码见:华夏35度,Data Mining,归纳决策树ID3(Java实现)
- ID3简介
算法核心:在决策树各节点应用信息增益准则选择特征,递归地构建决策树。
输入:训练数据集D,特征集A,阈值ε
输出:决策树T - 输入数据集
数据集描述气候的指标(天色outlook、温度temperature、湿度humidity、风速windy),以及分类能否出去玩(yes,no)
@relation weather.symbolic
@attribute outlook {sunny, overcast, rainy} //天色
@attribute temperature {hot, mild, cool} //温度
@attribute humidity {high, normal} //湿度
@attribute windy {TRUE, FALSE} //风速
