SAMPLE 命令
使用记录抽样或货币单位抽样方法抽取记录样本。
语法
说明
该语法不包含过滤(IF 语句)或范围参数,因为应用这些选项会损害样本的有效性。
固定间隔选择方法
SAMPLE <ON> RECORD INTERVAL 间隔值 <FIXED 初始值> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND>
单元选择方法
SAMPLE <ON> RECORD CELL INTERVAL 间隔值 <RANDOM 种子值> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
随机选择方法
SAMPLE <ON> RECORD NUMBER 样本量 <RANDOM 种子值> <ORDER> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
参数
说明
指定值时,不要包括千位分隔符。
名称 | 描述 |
---|---|
ON RECORD | 使用记录抽样。 |
INTERVAL 间隔值 FIXED 初始值 | CELL INTERVAL 间隔值 | NUMBER 样本量 |
INTERVAL 间隔值 FIXED 初始值 使用固定间隔选择方法。 首先选择一个初始记录,所有后续选择都相距固定的间隔或距离 – 例如,在进行初始选择之后,选择往后数第 20 个记录,依此类推。
CELL INTERVAL 间隔值 使用单元选择方法。 数据集被划分为多个相同大小的单元或组,并且从每个单元中随机选择一个记录。 间隔值指示每个单元的大小。指定通过计算样本规模所生成的间隔值。 NUMBER 样本规模 使用随机选择方法。 将从整个数据集中随机选择所有记录。 指定通过计算样本规模所生成的样本规模。 |
RANDOM 种子值 可选 |
说明 仅限单元和随机选择方法。 要用来在 Analytics 中初始化随机数生成器的种子值。 如果您指定值零 (‘0’) 或者省略 RANDOM,则 Analytics 会随机选择种子值。 |
ORDER 可选 |
说明 仅限随机选择方法。 指定 FIELDS 时,您只能使用 ORDER。 向输出结果中添加 ORDER 域。 此域显示随机选择每个记录的顺序。 |
RECORD | FIELDS 域名称 <...n> | FIELDS ALL |
|
EXCLUDE 域名称 可选 |
仅在使用 FIELDS ALL 抽样时有效。 要从该命令中排除的一个或多个域。EXCLUDE 使您可以通过排除指定的域优化 FIELDS ALL。 EXCLUDE 必须紧跟在 FIELDS ALL 后面。例如: FIELDS ALL EXCLUDE 域 1 域 2 |
TO 表名 |
要将命令结果发送到的位置:
|
LOCAL 可选 |
请将输出文件保存在与 Analytics 项目相同的位置。 说明 仅当针对服务器表运行该命令并且输出文件为 Analytics 表时适用。 LOCAL 参数必须紧跟在 TO 参数后面。 |
OPEN 可选 |
在命令执行后打开该命令创建的表。仅当该命令创建输出表时有效。 |
APPEND 可选 |
将命令输出附加到现有文件的末尾,而不是覆盖现有文件。 说明 您必须确保命令输出的结构和现有文件完全相同:
Analytics 将输出附加到现有文件,而无论其结构如何。如果输出的结构和现有文件不匹配,则可能生成混乱的、不完整的或不准确的数据。 |
MERSENNE_TWISTER 可选 |
说明 仅限单元和随机选择方法。 Analytics 中的随机数生成器使用梅森旋转算法。 如果您省略 MERSENNE_TWISTER,则使用默认的 Analytics 算法。 说明 如果您需要与在 Analytics 版本 12 之前创建的 Analytics 脚本或抽样结果保持向后兼容,则只应使用默认 Analytics 算法。 |
示例
抽取记录样本
您将要使用记录抽样来估计包含发票的账户中规定控制的偏差率。
在计算在统计学意义上有效的样本量后,您准备好抽取样本。您将要使用随机选择方法。
以下示例:
- 对打开的 Analytics 表进行抽样
- 使用随机选择方法和种子值 123456
- 指定样本量为 95 个记录
- 仅在输出表中包括指定的域
- 指定 Analytics 中的随机数生成器使用梅森旋转算法
SAMPLE ON RECORD RANDOM 123456 NUMBER 95 FIELDS 参考编号 客户编号 金额 日期 类型 TO "Ar_record_sample" OPEN MERSENNE_TWISTER
备注
有关此命令工作方式的详细信息,请参见执行记录抽样。
语法
说明
该语法不包含过滤(IF 语句)或范围参数,因为应用这些选项会损害样本的有效性。
固定间隔选择方法
SAMPLE <ON> mus 数值域 INTERVAL 间隔值 <FIXED 初始值> <CUTOFF 顶层截止值> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND>
单元选择方法
SAMPLE <ON> mus 数值域 CELL INTERVAL 间隔值 <CUTOFF 顶层截止值> <RANDOM 种子值> <SUBSAMPLE> <NOREPLACEMENT> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
随机选择方法
SAMPLE <ON> MUS 数值域 NUMBER 样本量 POPULATION 绝对值 <RANDOM 种子值> <SUBSAMPLE> <NOREPLACEMENT> <ORDER> {RECORD|FIELDS 域名称 <...n>|FIELDS ALL <EXCLUDE 域名称 <...n>>} TO 表名称 <LOCAL> <OPEN> <APPEND> <MERSENNE_TWISTER>
参数
说明
指定值时,不要包括千位分隔符。
名称 | 描述 |
---|---|
ON mus_数值域 |
使用货币单位抽样 (MUS)。 MUS 数值域是要用作抽样基础的数值域或表达式。 |
INTERVAL 间隔值 FIXED 初始值 | CELL INTERVAL 间隔值 | NUMBER 样本量 POPULATION 绝对值 |
INTERVAL 间隔值 FIXED 初始值 使用固定间隔选择方法。 首先选择一个初始货币单位,所有后续选择都相距固定的间隔或距离 – 例如,在进行初始选择之后,选择往后数第 5000 个记录,依此类推。
CELL INTERVAL 间隔值 使用单元选择方法。 数据集被划分为多个相同大小的单元或组,并且从每个单元中随机选择一个货币单位。 间隔值指示每个单元的大小。指定通过计算样本规模所生成的间隔值。 NUMBER 样本量 POPULATION 绝对值 使用随机选择方法。 将从整个数据集中随机选择所有货币单位。
|
CUTOFF 顶层截止值 可选 |
说明 仅限固定间隔方法和单元选择方法。 顶层截止值。 MUS 数值域中大于或者等于该截止值的金额会被自动选择并包括在样本中。 如果您省略 CUTOFF,则会使用等于间隔值的默认截止值。 |
RANDOM 种子值 可选 |
说明 仅限单元和随机选择方法。 要用来在 Analytics 中初始化随机数生成器的种子值。 如果您指定值零 (‘0’) 或者省略 RANDOM,则 Analytics 会随机选择种子值。 |
SUBSAMPLE 可选 |
说明 指定 FIELDS 时,您只能使用 SUBSAMPLE。 向输出结果中添加 SUBSAMPLE 域。 如果样本域中的每个金额都表示多个单独交易的合计,并且您只想对每个抽样合计金额中的单个交易执行审计程序,则可以使用 SUBSAMPLE 域中的值随机选择单个交易。 有关详细信息,请参见执行货币单位抽样。 |
NOREPLACEMENT 可选 |
同一个记录不会被选择一次以上。因此,样本包含的记录数可能要少于 SIZE 命令所计算的记录数。 如果省略 NOREPLACEMENT,或者如果您指定 REPLACEMENT,则记录可以被选择一次以上。 |
ORDER 可选 |
说明 仅限随机选择方法。 指定 FIELDS 时,您只能使用 ORDER。 向输出结果中添加 ORDER 域。 此域显示随机选择每个记录的顺序。 |
RECORD | FIELDS 域名称 <...n> | FIELDS ALL |
|
EXCLUDE 域名称 可选 |
仅在使用 FIELDS ALL 抽样时有效。 要从该命令中排除的一个或多个域。EXCLUDE 使您可以通过排除指定的域优化 FIELDS ALL。 EXCLUDE 必须紧跟在 FIELDS ALL 后面。例如: FIELDS ALL EXCLUDE 域 1 域 2 |
TO 表名 |
要将命令结果发送到的位置:
|
LOCAL 可选 |
请将输出文件保存在与 Analytics 项目相同的位置。 说明 仅当针对服务器表运行该命令并且输出文件为 Analytics 表时适用。 LOCAL 参数必须紧跟在 TO 参数后面。 |
OPEN 可选 |
在命令执行后打开该命令创建的表。仅当该命令创建输出表时有效。 |
APPEND 可选 |
将命令输出附加到现有文件的末尾,而不是覆盖现有文件。 说明 您必须确保命令输出的结构和现有文件完全相同:
Analytics 将输出附加到现有文件,而无论其结构如何。如果输出的结构和现有文件不匹配,则可能生成混乱的、不完整的或不准确的数据。 |
MERSENNE_TWISTER 可选 |
说明 仅限单元和随机选择方法。 Analytics 中的随机数生成器使用梅森旋转算法。 如果您省略 MERSENNE_TWISTER,则使用默认的 Analytics 算法。 说明 如果您需要与在 Analytics 版本 12 之前创建的 Analytics 脚本或抽样结果保持向后兼容,则只应使用默认 Analytics 算法。 |
示例
抽取货币单位样本
您将要使用货币单位抽样来估计包含发票的账户中货币错报的总金额。
在计算在统计学意义上有效的样本量后,您准备好抽取样本。您将要使用固定间隔选择方法。
以下示例:
- 基于交易金额域对打开的 Analytics 表进行抽样
- 使用固定间隔选择方法和间隔值 $6,283.33
- 指定所选第一个记录包含第 100,000 个货币单位($1,000 中的美分数)
- 使用顶层截止值 $5,000
- 在输出表中包括整个记录
SAMPLE ON 金额 INTERVAL 6283.33 FIXED 1000.00 CUTOFF 5000.00 RECORD TO "Ar_monetary_unit_sample" OPEN
备注
有关此命令工作方式的详细信息,请参见执行货币单位抽样。