数据来源
所有数据追溯源头,都是通过调查
和实验
获得的。
直接来源
自己调查或者实验直接得到的一手数据
提示
如果对总体中所有个体单位进行,我们称为普查
。
间接数据
由别人调查或者实验的方式收集的,使用者只是使用它们。
- 优点-搜集比较容易 采集数据成本低,能够很快得到
- 缺点-资料相关性不够,口径可能不一致,数据可能不准确,数据可能过时。
调查方法--抽样方法
概率抽样
也称随机抽样,是指遵循随机原则惊醒抽样,总体中每个单位都有一定的机会被选入样本。
抽样框
- 是概率抽样的必要元素,理解为包含所有总体单位的
信息
。
- 是概率抽样的必要元素,理解为包含所有总体单位的
特点
- 抽样时按一定的概率以随机原则抽取样本
- 抽中的概率是已知的,是可以计算出来的
- 总体估计量不仅与观测值有关,与入样概率也有关
分类
- 简单随机抽样--就是从包括总体N个单位的抽样框中随机的,一个个地抽取n个单位作为样本,每个单位入样的概率是相等的
- 分层抽样--将抽样单位按照某种特征或某种规划划分为不同的层,然后从不同的层中独立 随机地抽取样本。将各层样本结合起来,对总体的目标进行估计。
- 整群抽样--将整体若干个岗位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的方法抽样方法称为整群抽样。
- 系统抽样--将总体的所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为初始单位,然后按事先制定好的规则确定其他样本。
- 多层抽样--类似整群抽样,首先抽取群,但单并不是调查群内所有单位,而是再进一步抽样,从选中的群中抽出若干个单位进行调查。
非概率抽样
不依据随机的原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
- 分类
- 方便调查
- 判断抽样
- 自愿样本
- 滚雪球抽样--请调查者再提供一些调查对象。
- ✨配额抽样--
- 将所有单位按一定标志(单一变量或交叉变量)分为若干类
- 将每个类中采用方便抽样或判断抽样的方式抽取样本。
两者区别
非概率抽样
因为统计量分布不确切,无法推断总体相应的参数进行推断,如果需要推断总体参数需要用概率抽样
,但非概率抽样
适合探索性研究,市场调查的概念测试等。
调查方法--数据搜集方式
项目 | 自填式 | 面访式 | 电话式 |
---|---|---|---|
调查时间 | 慢 | 中等 | 快 |
调查费用 | 低 | 高 | 低 |
问卷难度 | 要求容易 | 可以复杂 | 要求容易 |
有形辅助物的使用 | 中等利用 | 充分利用 | 无法利用 |
调查过程的空值 | 简单 | 复杂 | 容易 |
调查员作用的发挥 | 无法发挥 | 充分发挥 | 一般发挥 |
问答率 | 最低 | 较高 | 一般 |
各种调查方式属性维度比较
实验方法
在实验中控制一个或多个变量,再有条件的方式下得到观测结果。
研究方法
将实验对象分为两组,一个实验组
,一个对照组
。
数据的误差
通过调查搜集到的数据与研究对象真实结果之间的差异
抽样误差
- 抽样的随机性引起的样本结果与总体真值之间地差异。
- 抽样的误差并不是针对某个计提样本的检测结果与总体的差异而言的,是平均差异。
- 最关键的影响因素是样本量的大小。
非抽样误差
- 抽样误差之外的由其他原因引起的样本观测结果与总体真值之间的差异。
如何避免误差
- 改变样本量
- 选好抽样框
- 做好问卷设计
- 调查员筛选
...