新浪博客

概率密度估计—parzen矩形窗和parzen正态核窗

2017-11-15 21:52阅读:
概率密度估计—parzen矩形窗和parzen正态核窗 一、问题描述:
给定鸢尾花的一维特征数据集
1. 利用直方图、Parzen矩形窗和Parzen正态核窗,进行概率密度估计
2. 利用贝叶斯分类器进行分类和比较
二、实验数据说明
1.实验数据
a.选取的类别为SetasaVersicolour两个类别;
b.选择的特征为Sepal_length
2.1显示了所选两类类别的两维特征的各自的均值和方差;

特征
Sepal_length
mean
var
Setasa
5.006
0.3489
Versicolour
5.9360
0.5110
2.1
、解决方案:
使用语言:python
思路:获取数据,求出各类该特征的均值和方差,生成训练数据,进行概率估计,利用贝叶斯分类器进行分类,求出正确率。
步骤:
$1.从文件中获取Setasa和Versicolour两类的Sepal_length特征的数据集和类别(Setasa用1标注、Versicolour用2标注)标签;
$2.求出Setasa和Versicolour两类的Sepal_length特征的均值和方差;
$3.用$2得到的均值和方差生成符合正态分布的两类别的Sepal_length特征数据集和标签;
$4.用不同的方式进行概率密度估计;
$5.用估计出的概率密度作为条件概率,用贝叶斯分类器进行分类;
$6.计算分类的正确率;
四、结果如下:
2.1显示Setasa和Versicolour两类的Sepal_length特征的数据分布直方图,可以看出该数据符合正太分布,因此,可以用求出的均值和方差生成符合正态分布的数据集;
概率密度估计—parzen矩形窗和parzen正态核窗
2.1

1、改变样本量的大小
1)表2.2显示了三次实验中,窗宽的大小;(样本量1000)
次数
1
2
4
窗宽
0.1
0.3
0.5
2.2
(2) 2.2显示了不同窗宽时,利用Pazen矩形窗对两种类别进行的概率密度曲线拟合的结果与原概率密度曲线的比较;
(3) 2.3显示了不同窗宽时,利用Pazen正态核窗对两种类别进行的概率密度曲线拟合的结果与原概率密度曲线的比较;
概率密度估计—parzen矩形窗和parzen正态核窗
2.2
概率密度估计—parzen矩形窗和parzen正态核窗
2.3
结论:从图2.2和图2.3可以看出,Pazen矩形窗和Pazen正态核窗窗的宽度越小,估计的概率密度越准确。
2、改变样本类别的数量
1)表2.3显示了7次实验时,样本的数量(窗宽为0.3)
次数
1
2
3
1800
100
1000
5000
2.3
2)图2.4显示了不同样本量时,利用Pazen矩形窗对两种类别进行的概率密度曲线拟合的结果与原概率密度曲线的比较;
概率密度估计—parzen矩形窗和parzen正态核窗
2.4
3)图2.5显示了不同样本量时,利用Pazen正态核窗对两种类别进行的概率密度曲线拟合的结果与原概率密度曲线的比较;
概率密度估计—parzen矩形窗和parzen正态核窗
2.5

结论:从图2.4和图2.5可以看出,利用Pazen矩形窗和Pazen正态核窗进行率密度估计,样本量决定了拟合曲线的平滑程度。
3、比较两个概率密度估计的准确性
1)表2.4显示了实验的样本量和窗宽
样本量
窗宽
1000
0.3
2.4
2)图2.6显示了相同样本量,相同窗宽时,利用Pazen矩形窗和Pazen正态核窗对两种类别进行的概率密度曲线拟合的结果与原概率密度曲线的比较;
概率密度估计—parzen矩形窗和parzen正态核窗
图2.6
结论:从图2.6可以看出,利用Pazen矩形窗和Pazen正态核窗进行率密度估计,没有出现明显差异。
4、 比较用两个概率密度估计分类的准确性
1)表2.5显示了实验的样本量和窗宽,实验进行7次
样本量
窗宽
实验次数
300
0.1
7
2.5
2)图2.7显示了相同样本量,相同窗宽时,利用Pazen矩形窗和Pazen正态核窗对两种类别进行的概率密度曲线估计,用贝叶斯分类器进行分类的准确性;
概率密度估计—parzen矩形窗和parzen正态核窗

我的更多文章

下载客户端阅读体验更佳

APP专享