六西格玛统计学中的抽样调查类型-专业自动化论坛-中国工控网论坛

现在，为了熟悉抽样调查，大家需要先熟悉以下几个术语：

总体：也被称为母体，是研究对象的全体。如对某一定固定时间段和固定地点的单位、项目、服务、居民等的调查。

抽样框：是总体中全部单位的物理目录。

差距(gap)：总体中的单位与抽样框中的单位的差别。

如果差距中的单位分布和抽样框里的单位分布相同，那么差距就不会出现问题。然而，如果差距中的单位分布和抽样框中的单位分布不同，对抽样框的分析就会出现系统偏差。例如，如果18周岁以上的纽约城市居民的抽样框是选民登记名单，而名单上(抽样框)的18岁及以上人员的分布与不在名单上(差距)的人们是不同的，那么对名单上的选民的统计分析可能包含偏差。这种差别可能会带来一定的影响。例如，一个调查是为了确定对待移民的态度而进行的，但选民登记名单中不包括那些还不是公民的居民。

样本是总体的一部分，是选择出来收集信息，进而为描述总体提供基础的。与总体普查不同，统计抽样程序把重点放在收集总体中的一小部分数据。例如，从10000份应收账款组成的数据清单或抽样框中，抽取50份应收账款组成一个样本。最终的样本要为估计总体抽样框的特征提供可用信息。

使用抽样调查有四个原因，如下表所示：

抽样调查的原因

样本有两种类型：非等概率样本和等概率样本。

在非等概率样本中，项目和个体的选择不借助抽样框。因为非等概率样本没有依据抽样框选择单位，所以选择概率是未知的(例如，在某些情况下，被测对象有自选择行为)。

对于一个非等概率样本，不能对样本数据应用统计推论理论。例如，许多公司通过让访问其公司网页的访问者填写电子调查表格并提交的方式进行调查。调查得到的回复可以提供大量的数据，但是因为样本包括自选择的网页浏览者，所以不存在抽样框。我们通常基于专家的意见(判断样本)，为了方便而选用非等概率样本(便利样本)，或者是因为人们希望样本中的某类项目、单位或人达到既定的比例(配额样本)。非等概率样本都包括一个未知程度的偏差。出现偏差是因为没有使用抽样框，继而项目或人群的分类可能在系统上就否定了样本的代表性(差距)。

非等概率样本具有的潜在优点是：便捷、快速和低成本。然而，它们也有两个主要的缺点：潜在的选择偏差和由此带来的对结果缺乏概括性。这些缺点远远盖过了优点。因此，只有当你想以低成本进行粗略的估计，或是在小规模初始研究或试点研究后会接着进行更严格的调查时，才可以使用非等概率抽样方法。

要尽可能地使用等概率抽样，因为可以从一个等概率样本中做出统计学推论。

在等概率样本中，项目或个体是从抽样框中选择的，因此，总体中的单个个体有一个已知的被选中概率。

最常用的四种等概率样本抽样类型是：简单随机抽样、分层抽样、系统抽样以及整群抽样。这些抽样方法在成本、精确度和复杂性方面都各不相同。

六西格玛统计学中的抽样调查类型

天行健管理 2021-10-18 10:59