新浪博客

统计学第二章课堂笔记

2008-02-01 10:14阅读:
第二章 统计数据的收集
2.1 统计测量尺度
一、统计测量尺度的概念与种类
测量:用仪器确定空间、时间、温度、速度、功能等的有关数值。
统计测量:运用某种方法使自然或社会经济现象量化。
测量结果:形成变量或指标。
分类、标识即统计测量过程。自然或社会经济现象按性质不同分类;按数量不同分类;最后形成变量或指标。
统计测量尺度的种类:
定类尺度(尺度、指标)按现象性质差异进行的辨别与区分,测量结果形成定类变量或定类指标。定类变量或指标确切的值是以文字表述的,可以用数值标识,但仅起标签作用。定类变量或指标的各类别间是平等的,没有高低、大小、优劣之分。
定序尺度(尺度、指标)对现象顺序差异进行的辨别与区分,测量结果形成定序变量或定序指标。定序变量或指标确切的值是以文字表述的,也可以用数值标识,也仅起标签作用。定序变量或指标各类别间有高低优劣之分,不能随意排列,但差异无法准确计量。
定距尺度(尺度、指标)按现象绝对数量差异进行的辨别与区分,测量结果形成定距变量或定距指标。定距变量或指标的值以数字表述,有计量单位,可以进行加减运算。定距变量或指标各类别间有大小之分,但没有绝对的零点(楼层没有零层,年龄有零岁),不能进行乘除运算。
定比尺度(尺度、指标)对现象绝对差异与相对差异进行的辨别与区分。测量结果形成定比变量或定比指标。定比变量或指标确切的值也以数字表述,有计量单位,可以进行加减运算。定比变量或指标有绝对意义上的零点,既可以加减运算,也可以乘除运算。高度、重量、体积、面积、人口、产量、资产都有绝对零点
数据测量尺度(Data Measured by Scales)1、定类尺度(Nominal)无等级次序排列。例如:男-女;从事工作的行业。定序尺度(Ordinal)可作等级次序排列。例如:公司职位、产品满意度。定距尺度(Interval)没有真正的零点。例如:温度。定比尺度( Ratio)存在真正的零点;倍数有意义。例如:身高、体重。
数据度量与信息含量(Data Measurement and Information)
度量尺度的信息含量由弱到强排列:定类尺度——定序尺度——定距尺度——定比尺度
定类尺度和定序尺度用于属性数据——信息量低
定距尺度和定比尺度用于数值数据——信息量高
思考题:
他们是属性数据还是数值数据?是离散的还是连续的?属于哪一种度量尺度?
1、汽车速度 78,64,45 2、温度℃ 78,64,85
3、兄弟姐妹个数 0-1,2-3,4+ 4、成绩 A,B,C
统计测量尺度的作用:
第一,决定数据的整理、显示方法
第二,决定数据的分析方法
第三,决定计算机的处理方法
注意:在自然或社会经济领域里,单纯的定距变量是很少的,绝大多数定距变量同时也是定比变量。
定距测量与定比测量的区别只在理论上有意义,在实际工作中常将二者归为一类。
对测量尺度层次的判断
较低层次的测量尺度(低\少\小)测量精度、计算方法、信息数量(高\多\大)较高层次的测量尺度

某甲某乙的
生命现象
测量
精度
计算方法
信息数量
定类测量
甲、乙有生命
很低
不能计算,
只能判断=、≠
甲、乙有生命
定序测量
甲为中年人、
乙为少年人
较低
=、≠、<、>
甲、乙有生命甲生命时间较乙长
定距测量
甲生于1941年、
乙生于1986年
较高
=、≠、<、
>、+、—
甲、乙有生命甲生命时间较乙长甲比乙大45岁
定比测量
甲60岁、乙15岁
很高
=、≠、<、>、
+、—、×、÷
甲、乙有生命甲生命时间较乙长甲比乙大45岁甲年龄为乙的4倍
定比测量
定距测量
定序测量
定类测量
测量尺度的正确应用
对于不同的现象,要注意准确性
例如:对宗教、种族、民族、性别、党派、国别、职业等等品质方面的差异进行测量(定类测量
对圣亚海洋世界的评价:对于人的主观态度,定序尺度可能是最好的方法。(定距以上的尺度不一定合适)很差、较差、一般、较好、很好。
对数量差异的度量,要注意层次
对受教育程度的度量方法
定比测量:顺序性差异、绝对差异距离、相对差异
定距测量:顺序性差异、绝对差异距离
定序测量:顺序性差异(文盲半文盲、小学、初中、高中、大学)
对意统计指标体系,要注意统一性
一个指标体系中的指标应属于相同的测量尺度
2.2 原始数据的收集方法
数据来源:直接来源:试验,问卷调查,观察;间接来源:出版物(或者网上)
一、统计调查概述
统计调查:收集原始数据资料的统计活动过程
原始数据资料指直接从各调查单位收集的用来反映个体特征的数据资料。
要求:准确、及时、全面、系统
统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。
统计调查的种类
按调查单位的范围大小分为:非全面调查,全面调查
按调查事件是否连续分为:经常性调查,一次性调查
按调查的组织方式不同分为:统计报表;专门调查:普查、重点调查、典型调查、抽样调查。
统计报表制度:指按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度。
优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要
局限:统计报表过多会增加基层负担;有可能由于虚报瞒报而影响统计资料质量。
普查:指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查。
作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息。
局限:由于需要大量的人力、物力和财力,不宜经常进行。
重点调查:为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面组织方式。
重点单位:这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况。
作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料。
局限:只适用于客观存在着重点单位的情况。
典型调查:在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行调查的一种非全面调查组织方式。
典型单位:指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量。
作用:一定条件下能估计总体指标数值;可以补充全面调查的不足;可以用来研究新生事物。
局限:不能确定推断的把握程度,无法计算和控制推断误差。
抽样调查:按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
随机原则:样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。
特点:按随机原则抽取样本单位;目的是推断总体的数量特征;抽样误差可以事先计算并控制。
优点:能用较少的人力、物力和时间达到全面调查的目的;调查资料的准确性较高、受人为干扰的可能性较小。
抽样调查研究
为什么要抽样?1、涉及破坏受试对象质量控制;2、取得精确可靠的结果;3、实际情况的约束时间、成本等。

报表制度可以全面调查,但通常是调查限定规模以上的总体单位。
普查:对每一个单位调查。
重点调查:指调查重点单位(单位数不多但其标志量占标志总量比重较大的单位)。
典型调查:对典型单位进行调查,典型单位的选择并不一定按规模。
抽样调查:按随机原则选择调查单位,各单位被选中的机会相同。
我国统计调查方法体系改革的目标模式是:建立以周期性普查为基础,以经常性的抽样调查为主体,以必要的统计报表、重点调查和科学的推断为辅助手段的调查方法体系模式。

统计调查的主要技术方法
观察记录法
报告法:被调查者受调查者的强制与约束
访问调查法:调查者与被调查者平等合作

二、统计调查方案
统计调查方案:用来指导整个调查工作的纲领性文件,是统计设计在统计调查阶段的具体化。
基本内容:
1、调查目的(为什么调查);2、调查对象与调查单位;3、调查项目与调查表;(向谁调查)(调查什么)4、调查时间;5、制定调查工作的组织实施计划。

三、问卷设计
问卷调查:主要指非政府性统计机构或个人所从事的对人的主观意见的调查工作,也称作民意调查或民意测验。
调查问卷的基本格式
表头:说明词:解释调查意义、表达感激之情等
表体:主体问句:被调查者基本情况、调查项目
表脚:作业记录:时间、操作者等

调查问卷的问题类型
封闭式问题;既给出问题,又给出答案,选择(容易控制,但不易全面)
开放式问题;提出问题通常不给出答案。(不易控制,但内容丰富)

问卷设计的基本要求
主题明确(问题的提出要紧扣主题)
提问科学(问句和标准答案要易于理解和回答)
逻辑性强(先易后难、开封闭口开放、先基本问题后派生问题)
容量适度(以不超过20分钟为宜)

问卷设计
问卷的长度,尽可能短,只保留调查所必需的关键问题
调查方式
面谈 回答率较高,费用较高 ;电话访问 居中;信函调查 回答率较低,费用较低
问题设计,语言简明易懂,避免含糊其词;考虑完备而避免重复。

2.3次级资料的收集
次级资料:指已经被收集、加工整理成型的数据信息
次级资料的主要收集渠道:
1、查阅公开出版物;2、向政府统计机构咨询;3、向其他机构咨询;4、网上查询。

常用的统计数据来源
《中国统计年鉴》《中国统计摘要》中国统计信息网(国家统计局网站)http://www.stats.gov.cn
美国经济分析局http://www.bea.doc.gov
美国人口普查局http://www.census.gov
美国劳工统计局http://www.stats.bls.gov
美联储经济数据库heep://www.stls.frb.gov/fred
美国联邦统计http://wwwfedstats.gov
世界银行http://www.worldbank.org
国际货币基金组织http://www.imf.org
OECD http://www.oecd.org

2.4统计调查误差
调查误差:指收集来的数据资料与真实情况间的差异。(但是真实值是不确定的)研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。
调查值与真值之间的误差
调查误差的种类
登记误差:由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以消除。
代表性误差(随机误差):由部分单位数值来推断总体数值所产生的误差,它不可以消除,但可以加以控制。

我的更多文章

下载客户端阅读体验更佳

APP专享