SAMPLE 命令

使用记录抽样或货币单位抽样方法抽取记录样本。

语法

说明

该语法不包含过滤(IF 语句)或范围参数,因为应用这些选项会损害样本的有效性。

固定间隔选择方法

SAMPLE <ON> RECORD INTERVAL 间隔值 <FIXED 初始值> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND>

单元选择方法

SAMPLE <ON> RECORD CELL INTERVAL 间隔值 <RANDOM 种子值> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

随机选择方法

SAMPLE <ON> RECORD NUMBER 样本量 <RANDOM 种子值> <ORDER> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

参数

说明

指定值时,不要包括千位分隔符。

名称 描述
ON RECORD 使用记录抽样。
INTERVAL 间隔值 FIXED 初始值 | CELL INTERVAL 间隔值 | NUMBER 样本量

INTERVAL 间隔值 FIXED 初始值

使用固定间隔选择方法。

首先选择一个初始记录,所有后续选择都相距固定的间隔或距离 – 例如,在进行初始选择之后,选择往后数第 20 个记录,依此类推。

  • INTERVAL 间隔值 指定通过计算样本量生成的间隔值
  • FIXED 初始值指定选择的初始记录编号

    如果您指定初始值零 ('0'),或者省略 FIXED,则 Analytics 随机选择初始记录。

CELL INTERVAL 间隔值

使用单元选择方法。

数据集被划分为多个相同大小的单元或组,并且从每个单元中随机选择一个记录。

间隔值指示每个单元的大小。指定通过计算样本规模所生成的间隔值。

NUMBER 样本规模

使用随机选择方法。

将从整个数据集中随机选择所有记录。

指定通过计算样本规模所生成的样本规模。

RANDOM 种子值

可选

说明

仅限单元和随机选择方法。

要用来在 Analytics 中初始化随机数生成器的种子值。

如果您指定值零 (‘0’) 或者省略 RANDOM,则 Analytics 会随机选择种子值。

ORDER

可选

说明

仅限随机选择方法。

指定 FIELDS 时,您只能使用 ORDER。

向输出结果中添加 ORDER 域。

此域显示随机选择每个记录的顺序。

RECORD | FIELDS 域名称 <...n> | FIELDS ALL
  • RECORD 整个记录被包括在输出表中

    这些域被按照它们出现在源表布局中的顺序包括在内。

  • FIELDS 域名称单个域而不是整个记录被包括在输出表中

    指定要包括的域或表达式。如果您指定多个域,它们必须以空格分隔。

    域被按照您列出它们的顺序包括在内。

  • FIELDS ALL 所有域都被包括在输出表中

    这些域被按照它们出现在源表布局中的顺序包括在内。

EXCLUDE 域名称

可选

仅在使用 FIELDS ALL 抽样时有效。

要从该命令中排除的一个或多个域。EXCLUDE 使您可以通过排除指定的域优化 FIELDS ALL。

EXCLUDE 必须紧跟在 FIELDS ALL 后面。例如:

FIELDS ALL EXCLUDE 域 1 域 2
TO 表名

要将命令结果发送到的位置:

  • 表名将结果保存到一个 Analytics 表

    请将表名指定为具有 .FIL 文件扩展名的带引号的字符串。例如:TO "Output.FIL"

    默认情况下,表数据文件 (.FIL) 被保存到包含 Analytics 项目的文件夹。

    请使用绝对或相对文件路径将该数据文件保存到另外的现有文件夹:

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    说明

    表名称被限制为不超过 64 个字母数字字符(不包括 .FIL 扩展名)。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。

LOCAL

可选

请将输出文件保存在与 Analytics 项目相同的位置。

说明

仅当针对服务器表运行该命令并且输出文件为 Analytics 表时适用。

LOCAL 参数必须紧跟在 TO 参数后面。

OPEN

可选

在命令执行后打开该命令创建的表。仅当该命令创建输出表时有效。

APPEND

可选

将命令输出附加到现有文件的末尾,而不是覆盖现有文件。

说明

您必须确保命令输出的结构和现有文件完全相同:

  • 相同的域
  • 相同的域顺序
  • 匹配的域具有相同的长度
  • 匹配的域具有相同的数据类型

Analytics 将输出附加到现有文件,而无论其结构如何。如果输出的结构和现有文件不匹配,则可能生成混乱的、不完整的或不准确的数据。

MERSENNE_TWISTER

可选

说明

仅限单元和随机选择方法。

Analytics 中的随机数生成器使用梅森旋转算法。

如果您省略 MERSENNE_TWISTER,则使用默认的 Analytics 算法。

说明

如果您需要与在 Analytics 版本 12 之前创建的 Analytics 脚本或抽样结果保持向后兼容,则只应使用默认 Analytics 算法。

示例

抽取记录样本

您将要使用记录抽样来估计包含发票的账户中规定控制的偏差率。

在计算在统计学意义上有效的样本量后,您准备好抽取样本。您将要使用随机选择方法。

以下示例:

  • 对打开的 Analytics 表进行抽样
  • 使用随机选择方法和种子值 123456
  • 指定样本量为 95 个记录
  • 仅在输出表中包括指定的域
  • 指定 Analytics 中的随机数生成器使用梅森旋转算法
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS 参考编号 客户编号 金额 日期 类型 TO "Ar_record_sample" OPEN MERSENNE_TWISTER

备注

有关此命令工作方式的详细信息,请参见执行记录抽样

语法

说明

该语法不包含过滤(IF 语句)或范围参数,因为应用这些选项会损害样本的有效性。

固定间隔选择方法

SAMPLE <ON> mus 数值域 INTERVAL 间隔值 <FIXED 初始值> <CUTOFF 顶层截止值> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND>

单元选择方法

SAMPLE <ON> mus 数值域 CELL INTERVAL 间隔值 <CUTOFF 顶层截止值> <RANDOM 种子值> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

随机选择方法

SAMPLE <ON> MUS 数值域 NUMBER 样本量 POPULATION 绝对值 <RANDOM 种子值> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>

参数

说明

指定值时,不要包括千位分隔符。

名称 描述
ON mus_数值域

使用货币单位抽样 (MUS)。

MUS 数值域是要用作抽样基础的数值域或表达式。

INTERVAL 间隔值 FIXED 初始值 | CELL INTERVAL 间隔值 | NUMBER 样本量 POPULATION 绝对值

INTERVAL 间隔值 FIXED 初始值

使用固定间隔选择方法。

首先选择一个初始货币单位,所有后续选择都相距固定的间隔或距离 – 例如,在进行初始选择之后,选择往后数第 5000 个记录,依此类推。

  • INTERVAL 间隔值 指定通过计算样本量生成的间隔值
  • FIXED 初始值指定选择的初始货币单位

    如果您指定初始值零 ('0'),或者省略 FIXED,则 Analytics 会随机选择初始货币单位。

CELL INTERVAL 间隔值

使用单元选择方法。

数据集被划分为多个相同大小的单元或组,并且从每个单元中随机选择一个货币单位。

间隔值指示每个单元的大小。指定通过计算样本规模所生成的间隔值。

NUMBER 样本量 POPULATION 绝对值

使用随机选择方法。

将从整个数据集中随机选择所有货币单位。

  • NUMBER 样本量指定通过计算样本量所生成的样本量。
  • POPULATION 绝对值指定 MUS 数值域的总绝对值,它是可供从中选择样本的总体
CUTOFF 顶层截止值

可选

说明

仅限固定间隔方法和单元选择方法。

顶层截止值。

MUS 数值域中大于或者等于该截止值的金额会被自动选择并包括在样本中。

如果您省略 CUTOFF,则会使用等于间隔值的默认截止值。

RANDOM 种子值

可选

说明

仅限单元和随机选择方法。

要用来在 Analytics 中初始化随机数生成器的种子值。

如果您指定值零 (‘0’) 或者省略 RANDOM,则 Analytics 会随机选择种子值。

SUBSAMPLE

可选

说明

指定 FIELDS 时,您只能使用 SUBSAMPLE。

向输出结果中添加 SUBSAMPLE 域。

如果样本域中的每个金额都表示多个单独交易的合计,并且您只想对每个抽样合计金额中的单个交易执行审计程序,则可以使用 SUBSAMPLE 域中的值随机选择单个交易。

有关详细信息,请参见执行货币单位抽样

NOREPLACEMENT

可选

同一个记录不会被选择一次以上。因此,样本包含的记录数可能要少于 SIZE 命令所计算的记录数。

如果省略 NOREPLACEMENT,或者如果您指定 REPLACEMENT,则记录可以被选择一次以上。

ORDER

可选

说明

仅限随机选择方法。

指定 FIELDS 时,您只能使用 ORDER。

向输出结果中添加 ORDER 域。

此域显示随机选择每个记录的顺序。

RECORD | FIELDS 域名称 <...n> | FIELDS ALL
  • RECORD 整个记录被包括在输出表中

    这些域被按照它们出现在源表布局中的顺序包括在内。

  • FIELDS 域名称单个域而不是整个记录被包括在输出表中

    指定要包括的域或表达式。如果您指定多个域,它们必须以空格分隔。

    域被按照您列出它们的顺序包括在内。

  • FIELDS ALL 所有域都被包括在输出表中

    这些域被按照它们出现在源表布局中的顺序包括在内。

EXCLUDE 域名称

可选

仅在使用 FIELDS ALL 抽样时有效。

要从该命令中排除的一个或多个域。EXCLUDE 使您可以通过排除指定的域优化 FIELDS ALL。

EXCLUDE 必须紧跟在 FIELDS ALL 后面。例如:

FIELDS ALL EXCLUDE 域 1 域 2
TO 表名

要将命令结果发送到的位置:

  • 表名将结果保存到一个 Analytics 表

    请将表名指定为具有 .FIL 文件扩展名的带引号的字符串。例如:TO "Output.FIL"

    默认情况下,表数据文件 (.FIL) 被保存到包含 Analytics 项目的文件夹。

    请使用绝对或相对文件路径将该数据文件保存到另外的现有文件夹:

    • TO "C:\Output.FIL"
    • TO "Results\Output.FIL"

    说明

    表名称被限制为不超过 64 个字母数字字符(不包括 .FIL 扩展名)。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。

LOCAL

可选

请将输出文件保存在与 Analytics 项目相同的位置。

说明

仅当针对服务器表运行该命令并且输出文件为 Analytics 表时适用。

LOCAL 参数必须紧跟在 TO 参数后面。

OPEN

可选

在命令执行后打开该命令创建的表。仅当该命令创建输出表时有效。

APPEND

可选

将命令输出附加到现有文件的末尾,而不是覆盖现有文件。

说明

您必须确保命令输出的结构和现有文件完全相同:

  • 相同的域
  • 相同的域顺序
  • 匹配的域具有相同的长度
  • 匹配的域具有相同的数据类型

Analytics 将输出附加到现有文件,而无论其结构如何。如果输出的结构和现有文件不匹配,则可能生成混乱的、不完整的或不准确的数据。

MERSENNE_TWISTER

可选

说明

仅限单元和随机选择方法。

Analytics 中的随机数生成器使用梅森旋转算法。

如果您省略 MERSENNE_TWISTER,则使用默认的 Analytics 算法。

说明

如果您需要与在 Analytics 版本 12 之前创建的 Analytics 脚本或抽样结果保持向后兼容,则只应使用默认 Analytics 算法。

示例

抽取货币单位样本

您将要使用货币单位抽样来估计包含发票的账户中货币错报的总金额。

在计算在统计学意义上有效的样本量后,您准备好抽取样本。您将要使用固定间隔选择方法。

以下示例:

  • 基于交易金额域对打开的 Analytics 表进行抽样
  • 使用固定间隔选择方法和间隔值 $6,283.33
  • 指定所选第一个记录包含第 100,000 个货币单位($1,000 中的美分数)
  • 使用顶层截止值 $5,000
  • 在输出表中包括整个记录
SAMPLE ON 金额 INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "Ar_monetary_unit_sample" OPEN

备注

有关此命令工作方式的详细信息,请参见执行货币单位抽样