测试间隔

顺序排列的数值或日期时间域中的间隔可能提示一个数据文件不完整。可以在域中测试顺序排列值的间隔,或识别一个或多个间隔或缺失项(如果存在的话)。

要使结果有效,在测试之前被测试的域必须是连续的顺序。可以提前对一个域进行排序,或者在间隔测试中使用预排序选项。

还可以测试数值或日期时间域,或字符域中的数值。每次只能测试一个域。

列举间隔范围或列举缺少的条目

输出间隔测试结果时会有两个选项:

  • 列出间隔范围
  • 列出丢失条目

列出间隔范围

此选项标识间隔的起点和终点,以及该间隔中缺少项的总数。

标识间隔起始点和结束点的值本身不会缺少项。它们是在间隔前后出现的连续值(标记为间隔起始(不含)间隔结束(不含))。例如,支票号码 12345 和 12350 标识这两个号码之间的有 4 个缺少项的间隔。

列出丢失条目

此选项列出间隔中的单个缺少项。例如,支票号码 12346、12347、12348 和 12349。

这些缺少项是计算出来的值,并不会实际出现在测试的数据中。使用该选项时,最大丢失条目数域允许指定最大丢失条目数数量以分别列出每个间隔,如果一个间隔很大,这会很有用。如果超出最大范围,Analytics 会改用标识间隔的范围方法,不同之处在于标识间隔起始点和结束点的值是第一个和最后一个缺失项(按顺序),它们被标记为间隔起始(含)间隔结束(含)

说明

指定的最大丢失条目数的数量应用于每个间隔。无论是单个列出或按照范围列出,这并不会限制数据集范围缺失项结果的总数。

取决于最大丢失条目数域中的值和不同间隔的大小,使用缺失项方法时,结果可能包含单个缺失项和范围的组合。

测试间隔数值数据

当您测试间隔的数值数据时,数据中的小数位数将控制该数据中允许的间隔:

  • 数值数据仅包含整数(无小数部分)允许的间隔是 1

    大于 1 的间隙为间隔。对于报告为范围的间隔,缺失项的数量是缺少整数的数量。

  • 数值数据包含小数位允许的间隔相当于最小小数间隔

    例如,如果某个数值域具有两个小数位,则允许的间隔是 0.01。大于最小小数间隔的间隔就是一个间隔。对于报告为范围的间隔,缺少项的数量是缺少小数间隔的数值。

测试间隔数值数据示例

在第一个示例中,数值数据仅包含整数。允许的间隔是 1。

测试值

缺失项

缺失项数量

-2

-1

0

1

4

5

15

2

3

6 (到) 14 (包含在内)

1 (整数)

1 (整数)

9 (整数)

在第二个示例中,数值数据包含两个小数位。允许的间隔是 0.01。

测试值

缺失项

缺失项数量

4.24

4.25

4.26

4.29

4.30

5.00

4.27

4.28

4.31 (到) 4.99 (包含在内)

1 (0.01 间隔)

1 (0.01 间隔)

69 (0.01 间隔)

测试日期时间数据间隔

可以测试日期、日期时间或时间数据的间隔:

  • 日期域中允许的间隔是一天

    大于一天的间隔就是一个间隔。对于报告为范围的间隔,缺失项的数量是缺少天的数量。

  • 日期时间域或时间域中允许的间隔是一秒

    大于一秒的间隔就是一个间隔。对于报告为范围的间隔,缺少项的数量是缺少秒的数量。因此一个小时的间隔会报告为有 3,600 缺少项的范围,一天的间隔会报告为有 86,400 缺少项的范围。

测试日期和日期时间间隔示例

在第一个示例中,数据仅包含日期。允许的间隔是一天。

测试值

缺失项

缺失项数量

27 十二月 2014

12 十二月 2014

31 十二月 2014

01 一月 2015

02 一月 2015

12 一月 2015

13 一月 2015

29 十二月 2014

30 十二月 2014

03 一月 2015(到)11 一月 2015(包含在内)

1(天)

1(天)

9(天)

在第二个示例中,数据包含日期时间。允许的间隔是一秒。

测试值

缺失项

缺失项数量

31 十二月 2014 23:59:54

31 十二月 2014 23:59:55

31 十二月 2014 23:59:58

31 十二月 2014 23:59:59

01 一月 2015 01:00:00

01 一月 2015 01:00:01

02 一月 2015 01:00:02

31 十二月 2014 23:59:56

31 十二月 2014 23:59:57

01 一月 2015 00:00:00(到)01 一月 2015 00:59:59(包含在内)

01 一月 2015 01:00:02(到)02 一月 2015 01:00:01(包含在内)

1(秒)

1(秒)

3,600 (秒)

86,400 (秒)

测试字符域中数值数据间隔

您可以测试出现在字符域中的数值数据间隔 - 例如,通常格式化为字符数据的支票号码。

如果字母和数字一起出现在字符域中,仅测试数字,会忽略字母。

测试字符域数字间隔示例

请注意字母前缀如何被忽略,并且只有数字被考虑。

测试值

缺失项

缺失项数量

A123

C124

 

0 (字符数字)

A123

B125

124

1 (字符数字)

字符域的排序可能影响间隔测试

取决于字符域值中的字母和数字排列,间隔测试结果可能会有异常。例如,如果一些数字前缀为字母,而有些不是,或是 Analytics 的非 Unicode 版本,如果一些前导字母小写,一些大写,结果可能不准确。

不准确的原因是字母不一致,或者字符大小写不一致,阻止了预排序选项对其完全进行排序。在下表中,126、127 和 124 并不是实际缺少的项,但是因为字母数字字符串的排序方式,它们被返回为缺少的项。

如果您怀疑有异常,请对有问题的域执行单独的排序操作,以显示被测试是否有间隔的字符域值的顺序。如果数值顺序被出现的字母打断,要确保结果有效,请在测试间隔之前,使用 Analytics 函数,如 INCLUDE( ) 去掉这些字母。

不正确间隔结果示例

请注意,字母字符存在性的不一致或者字母字符大小写的不一致如何导致某些条目被错误报告为缺少项。

测试值

缺失项

缺失项数量

123

124

125

128

129

A-126

A-127

126

127

1 (字符数字)

1 (字符数字)

A-123

a-124

A-125

A-128

A-129

A-126

A-127

124

1 (字符数字)

步骤

在活动表中,可以每次测试单个域来检测按顺序排列的数字或日期时间值是否含有间隔。

Analytics 14.1 帮助