逻辑回归教程和SAS实现程序
2014-08-29 09:28阅读:
一、逻辑回归定义
逻辑回归模型:p=e^(A0+A1X1+...+AnXn)/(1+e^(A0+A1X1+...+AnXn)),即逻辑回归函数是计算事件发生的概率。
二、逻辑回归的参数估计
逻辑回归参数估计常用方法为最大似然法。举例指出计算方法是:

三、逻辑回归模型评价
1.拟合优度(Goodness of fit):观测值=预测值;Person 卡方检验(皮尔逊卡方检验);
2.差异函数(Deviance function):
似然比检验:

3.拟合优度指标:观测值=估计值;

4.预测准确性检验

四、逻辑回归的假设检验
1. 拟合优度检验:目的是验证模型估计值与实际观测值的符合程度。SAS提供的检验量如下:

2.偏回归系数的显著性检验:目的是检验回归模型中自变量的系数是否为0,等价于总体优势比OR是否为0。

五、sas的Logistic过程
proc logistic ;
freq 频数变量;
model 因变量=自变量;
order=data 表明输入数据集中的顺序一样
descending 表明反应变量以高水平1为事件发生在先,0为时间发生在后;
noint 为取消截距;
selection=stepwise 选择逐步法;
sle=逐步法引入的显著性水平;
sls=剔除变量的显著性水平;
scale=none 以残差统计量来衡量模型的拟合优度检验
六、举例说明
例1:

data logist1;
input treat effect count @@;
cards;
1 1 16 1 0 48
2 1 40 2 0 20
;
proc logistic data=logist1 order=data ;
freq count;
model effect=treat;
run;
例2:一项关于使用交通工具上下班的调查中,以X1表示年龄,以X2表示月入,X3表示性别(男-1,女-0),以Y表示交通工具(公共汽车-1,自行车-0),其所的数据如下:
data logist2;
input x1 x2 x3 y @@;
cards;
18 850 0 0 21 1200 0 0
23 850 0 1 23 950 0 1
28 1200 0 1 31 850 0 0
36 1500 0 1 42 1000 0 1 46 950 0 1
48 1200 0 0 55 1800 0 1
56 2100 0 1 58 1800 0 1
18 850 1 0 20 1000 1 0
28 1500 1 0 33 1800 1 0
33 1000 1 0 38 1200 1 0
41 1500 1 0 45 1800 1 1
48 1000 1 0 52 1500 1 1
56 1800 1 1
;
建模如下:
proc logistic data=logist2;
model y=x1 x2 x3;
run;
结果包括:模型信息、响应概况、建模概率:y=0(descending表明反应变量以高水平1为发生事件在先,0为不发生事件在后)等、模型收敛状态、模型拟合统计量、检验全局0假设、最大似然估计值分析、优比估计值、预测概率与响应的关联的。
内容来自于网址:http://www.docin.com/p-243784294.html读后笔记!