通过数字:如何轻松计算正确的样本量

抽象的作者提供了一个表格,用于计算正确的样本量以达到所需的置信水平和误差幅度。 其中包括在线表格生成器的链接。

有多种公式可用于计算研究所需的样本量。这些公式需要了解总体中的方差或比例,并确定最大可取误差以及可接受的 I 类错误风险。例如,徐刚在 1999 年 7 月发表于 Quirk 的文章中讨论了样本量公式。

这些公式通常以避

开人口规模问题的方式呈现——它们假设样本来自无限大的人口。然而,对于偶尔需要处理这些问题的研究人员来说,这些公式可能显得过于复杂。他们提出的问题很简单:难道没有更简单的方法吗?

答案是肯定的。毕竟,如果没有必要,为什么要费心使用公式呢?许多研究人员更喜欢使用简单的表格来帮助他们确定研究的适当样本量。

可以使用其中一个公式来构建一个表格,该表格表明最佳样本量 – 给定总体规模、特定误差幅度和所需置信区间。这可以帮助研究人员完全避免使用公式,并简化确定适当样本量的过程。附表显示了一组计算的结果。该表可轻松用于确定几乎任何研究的适当样本量。

对于商业和社会科学研究

表格中的第一列通常被认为是可接受的(置信度 = 95%,误差幅度 = ±5%)。要使用该表格,只需确定最左侧列中要抽取样本的总体规模(如果没有列出确切的总体规模,则使用下一个最高值),然后确定下一列中的值。此列中的值是产生 ± 5% 误差幅度所需的样本量,对于任何具有 95% 置信度的总体比例。如果需要更高的精度(即更小的误差幅度)或更大的置信度(0.99),则应使用表格的其他列。

因此,如果您有 5,000 个客户,并且想要抽取足够数量的样本来生成 95% 的置信区间,从而预测在 ±2-1/2 % 范围内的回头客比例,那么您将需要从所有客户中随机抽取 1,176 个客户的回答。

手机号码数据改变了数字营销世 手机号码数据 界的游戏规则,帮助企业在个人层面上与受众建立联系。利用这些数据,公司可以创建有针对性的活动,并允许及时推广个性化内容。短信营销进一步发展为消息应用程序,以实现更深入的参与,从而提高转化率。它还使企业能够收集有关客户行为的宝贵见解,改进其策略以实现最大影响。

如您所见

手机号码数据

使用表格比使用公式简单得多。(可以下载动态版本的表格作为 Excel 电子表格,用户可以更改误差幅度、置信度和/或总体规模。请访问

假设这些客户被分为两个子组 – A 组有 1,500 名客户,B 组有 3,500 名客户 – 并且您想要确定每个子组的比例。为了保持相同的置信度和精度水平(95% 和 ±2-1/2%),您需要从 A 组中随机抽取 759 个样本,从 B 组中随机抽取 1,068 个样本。

需要注意的是

不要仅仅为了最小化所需样本量而使用较低的置信度(例如 95%)或较大的误差幅度(5%)。与所有统计程序一样,置信度应由因抽 您需要了解的有关业务成本的一切 样误差而得出错误结论的后果决定。同样,误差幅度应根据构建区间的实用性来确定(请记住,区间宽度是误差幅度的两倍)。

这些计算使用的公式如下所示(这是 Krejcie 和 Morgan 在他们的文章“确定研究活动的样本量”中使用的公式)。

讨论的所有样本估计

值都给出了所需置信水平的最大可 搜索引擎优化美国 能样本量的数字。如果具有所需特征的样本比例与 50% 有很大差异,那么可以使用较小的样本建立所需的准确度水平。但是,由于您通常在实际询问样本之前无法知道这个百分比是多少,因此最明智的做法是假设它将是 50%,并使用列出的较大样本量。

本地号码可携性 (LNP) 也对样本效率产生了不利影响。LNP 是指用户能够在特定费率中心内更改其电话服务提供商而无需更改其电话号码。截至 2004 年 12 月,已有近 3100 万个固定电话号码被携至另一家固定电话提供商。携号转网需要每条电话线路提供两个 10 位数字。一个是原始用户号码,另一个是与呼叫所连接的新运营商的交换机关联的号码。如今在大多数情况下,新号码(有时称为幽灵号码)在拨号时不会接通,但它们在 RDD 帧中的存在导致了 WPR 的整体下降。

当地电话公司在其

分配的前缀内分配电话号码的方式也可能影响 WPR。在未强制实施号码节约(1,000 块池)的地区,随机分配号码更为常见,这些前缀中的工作块的工作号码将比过去更少。

小区域样本的工作电话率可能异常低或异常高。城市地区通常倾向于具有较低的 WPR,因为这些地区的流动率较高、租户较多、企业较多且仅使用无线网络的家庭较多。农村地区的上市样本往往具有较高的 WPR,因为这些地区的流动率较低、隐私问题较少且企业较少。然而,农村地区的 RDD 样本可能具有较低的 WPR,因为在非上市号码的 RDD 号码中,新上市号码或未上市号码较少。郊区社区的增长率高且未上市率高,因此通常具有较高的 WPR。

SSI 使用包含

1250 万个商业电话号码的文件,从其列出的和 RDD 数据库中识别并删除已知的商业号码。但是,大多数企业都有多条语音线路(转接线路、直接拨入线路),这些线路未列在目录或业务文件中。这意味着 RDD 样本将始终包含未列出的商业号码以及未列出的传真和调制解调器号码。样本中未识别的商业号码的百分比自然在城市地区较高,在农村地区较低。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注