STATISTICS 命令

概念信息

生成统计

为 Analytics 表中的一个或多个数值域或日期时间域计算统计信息。

语法

STATISTICS {<ON> 域名称 <...n>|<ON> ALL <EXCLUDE 域名称 <...n>>} <STD> <MODMEDQ> <NUMBER n> <TO {SCREEN|文件名|PRINT}> <IF 测试> <WHILE 测试> <FIRST range|NEXT 范围> <APPEND>

参数

名称 描述
ON 域名称 <...n> | ON ALL

指定一个或多个数值域或日期域来为表中的每个数值域或日期时间域生成统计信息,或指定 ON ALL 来为 Analytics 表中的所有数值域或日期时间域生成统计信息。

EXCLUDE 域名称

可选

仅在使用 ON ALL 生成统计信息时有效。

要从该命令中排除的一个或多个域。EXCLUDE 使您可以通过排除指定的域优化 ON ALL。

EXCLUDE 必须紧跟在 ON ALL 后面。例如:

ON ALL EXCLUDE 域 1 域 2

STD

可选

除其他统计信息之外,还计算指定域的标准差。

MODMEDQ

可选

除了计算其他统计信息以外,计算指定域的模式、中值、第一个四分位数的值和第三个四分位数的值。

NUMBER n

可选

要在处理过程中保留的高值和低值的个数。默认值为 5。

TO SCREEN | 文件名| PRINT

可选

要将命令结果发送到的位置:

  • 屏幕 – 在 Analytics 显示区域中显示结果

    提示

    您可以单击显示区域中的任何链接结果值以向下追溯到源表中的关联记录。

  • 文件名将结果保存至文件

    请将文件名指定为具有适当文件扩展名的带引号的字符串。例如:TO "Output.TXT"

    默认情况下,该文件被保存到包含 Analytics 项目的文件夹。

    请使用绝对或相对文件路径将该文件保存到另外的现有文件夹:

    • TO "C:\Output.TXT"
    • TO "Results\Output.TXT"
  • PRINT 将结果发送到默认打印机

IF 测试

可选

一个条件表达式,它必须为真以便处理每个记录。仅对满足条件的那些记录执行该命令。

说明

在应用任何范围参数(WHILE、FIRST、NEXT)之后,仅针对表中的剩余记录评估 IF 条件。

WHILE 测试

可选

一个条件表达式,它必须为真以便处理每个记录。该命令被一直执行到条件的计算结果为假或者到达表的末尾为止。

说明

如果您将 WHILE 与 FIRST 或 NEXT 结合使用,请在达到一个限制时立即记下处理步骤。

FIRST 范围 | NEXT 范围

可选

要处理的记录数:

  • FIRST 从第一个记录开始处理,直到达到指定的记录数为止
  • NEXT 从当前选定的记录开始处理,直到达到指定的记录数为止

请使用范围指定要处理的记录数。

如果您省略 FIRST 和 NEXT,则会默认处理所有记录。

APPEND

可选

将命令输出附加到现有文件的末尾,而不是覆盖现有文件。

说明

您必须确保命令输出的结构和现有文件完全相同:

  • 相同的域
  • 相同的域顺序
  • 匹配的域具有相同的长度
  • 匹配的域具有相同的数据类型

Analytics 将输出附加到现有文件,而无论其结构如何。如果输出的结构和现有文件不匹配,则可能生成混乱的、不完整的或不准确的数据。

Analytics 输出变量

说明

如果您为某个表中的一个以上的域生成统计信息,则系统生成的输出变量仅包含首先列出的域的值。

名称 包含
ABSn

该命令计算出的绝对值。

不计算日期时间域的数据。

AVERAGEn

该命令计算出的平均值。

COUNTn

该命令计算出的记录计数。

  • 如果变量名为 COUNT1,则将存储大部分近期执行命令的记录计数。
  • 如果变量名为 COUNTn,其中 n 大于 1,则该变量将存储在 GROUP 命令内部执行的命令的记录计数。

    n 的值将根据 GROUP 中命令的行号进行分配。例如,如果 GROUP 命令下的命令只有一行,则将分配值 COUNT2。如果 GROUP 命令下的命令有四行,则将分配值 COUNT5。

HIGHn

该命令识别出的第 5 大值或第 5 个最近日期。

第 5 大值是默认设置。可使用 NUMBER 参数更改该设置。例如,NUMBER 3 指定存储第三大值。

说明

当 Analytics 识别最高值时,不会排除重复值。例如,如果值按降序排列依次为 100、100、99、98,则第三大值是 99,而非 98。

LOWn

该命令识别出的第 5 小值或第 5 个最早日期。

第 5 小值是默认设置。可使用 NUMBER 参数更改该设置。例如,NUMBER 3 指定存储第三小值。

说明

当 Analytics 识别最低值时,不会排除重复值。例如,如果值按升序排列依次为 1、1、2、3,则第三小值是 2,而非 3。

MAXn

该命令识别出的最大值或最近日期。

MEDIANn

该命令识别出的中间值。

中间日期显示为序列日期时间值。

MINn 该命令识别出的最小值或最早日期。
MODEn

该命令识别出的出现频率最高的值。

模态日期显示为序列日期时间值。

Q25n

该命令计算出的第一个四分位数值(下四分位数值)。

第一个四分位数日期显示为序列日期时间值。

Q75n

该命令计算出的第三个四分位数值(上四分位数值)。

第三个四分位数日期显示为序列日期时间值。

RANGEn 该命令计算出的最大值和最小值之间的差。
STDDEVn 该命令计算出的标准偏差值。
TOTALn

该命令计算出的合计值。

n 的值为 1,除非 TOTAL 命令位于 GROUP 命令内部,在这种情况下,n 的值与 GROUP 命令中的 TOTAL 命令的行号相对应。

有关详细信息,请参阅GROUP 命令

对于日期时间域,该域中所有序列日期时间值的总和。

示例

生成条件性统计信息

您为产品类别 ID 为 01 的记录中的 Quantity 域生成统计信息:

STATISTICS ON Quantity IF ProdCls = "01"

备注

为数值域生成所有统计信息。只为日期时间域生成一小部分统计信息。

一些日期时间统计信息显示为序列日期时间值。您可以使用转换函数将序列日期时间值转换为可读的常规日期时间值。有关详细信息,请参阅序列日期时间

统计信息名称 数值域 日期时间域
范围 最高值与最低值之差 最近日期与最早日期间隔天数
  • 正数值的数量

  • 所有正数值汇总

  • 平均正数值

  • 日期时间值的数量

  • 所有序列日期时间值汇总

    对表示时间点的日期或时间值没有意义。对表示时间量的时间值有意义。

    有关详细信息,请参见时间量与时间点

  • 平均日期时间值

  • 负数值的数量

  • 所有负数值汇总

  • 平均负数值

不适用,未生成
零值的数量 空白日期的数量
合计
  • 正、负和零值的总数

  • 所有正、负和零值的汇总

  • 所有正、负和零值的平均值

不适用,未生成
绝对值 不考虑数值符号时的所有值汇总 不适用,未生成
标准偏差(可选) 与平均值的标准偏差

与平均日期时间值的标准偏差

在向屏幕输出统计信息时不显示,但会捕获在 STDDEVn 系统生成的输出变量中。

中间值(可选) 中间值
  • 奇数编号的值集:中间值

  • 偶数编号的值集:中间两个值的均值

中间日期
  • 奇数编号的日期集:中间日期

  • 偶数编号的日期集:中间两个日期的平均值

Q25(可选) 第一个四分位数值(较低的四分位数值)
  • 结果是一个基于 Analytics 算法的内插值

  • 所产生的结果与 Microsoft Excel 中的 QUARTILE 和 QUARTILE.INC 函数相同

第一个四分位数日期(下四分位数日期)
  • 结果是一个基于 Analytics 算法的内插值

  • 与 Microsoft Excel 中的 QUARTILE 和 QUARTILE.INC 函数的结果相差 1 天

    有关详细信息,请参见序列日期时间

Q75(可选) 第三个四分位数值(较高的四分位数值)
  • 结果是一个基于 Analytics 算法的内插值

  • 所产生的结果与 Microsoft Excel 中的 QUARTILE 和 QUARTILE.INC 函数相同

第三个四分位数日期(上四分位数日期)
  • 结果是一个基于 Analytics 算法的内插值

  • 与 Microsoft Excel 中的 QUARTILE 和 QUARTILE.INC 函数的结果相差 1 天

    有关详细信息,请参见序列日期时间

模式(可选) 最常出现的值
  • 如果没有任何值出现一次以上,则显示“不适用”

  • 如果出现次数相等,则显示最低值

最常出现的日期
  • 如果没有任何日期出现一次以上,则显示“不适用”

  • 如果出现次数相等,则显示最早日期

最高

五个最高值

您可以使用统计信息对话框中的更多选项卡上的高/低值的数量设置,更改高值的数量。

五个最近日期

您可以使用统计信息对话框中的更多选项卡上的高/低值的数量设置,更改最近日期的数量。

最低

五个最低值

您可以使用统计信息对话框中的更多选项卡上的高/低值的数量设置,更改低值的数量。

五个最早日期

您可以使用统计信息对话框中的更多选项卡上的高/低值的数量设置,更改最早日期的数量。