模糊重复帮助功能
-
OMIT( )
-
ISFUZZYDUP( )
OMIT 函数
使用模糊重复功能前,您可以使用 OMIT( ) 函数来创建计算域,以从字符域中删除特定的词语、缩略词或一组字母或数字。删除“Corporation”、“Corp.”、“Street”、“Ave.”等通用元素可注重仅对可能出现重大差异的字符值部分进行模糊重复对比。您可以对计算域而非原始域进行测试,并使用更低的差异阈值来生成包含较少错误结果的更小、更集中的结果。
例如,“Intercity Couriers Corporation”和“Inter-city Couriers Corp.”可能至少需要差异阈值为 8 才能包括在结果中,但可能会使值避免被检测为模糊重复。高差异阈值还可能会生成大量包含多数为误报的非集中的结果。相比之下,如果使用 OMIT( ) 创建一个去处通用元素的计算域,差异阈值为 1 即可要求作为模糊重复返回“Inter-city Couriers”和“Intercity Couriers”。
有关 OMIT( ) 函数的详细信息,请参见《ACL 脚本指南》。有关差异阈值的更多信息,请参见 差异设置工作原理。
ISFUZZYDUP 函数
使用模糊重复功能和查看结果后,您可以使用 ISFUZZYDUP( ) 函数将结果中看起来与审计目标特定相关的任何字符值输出为详尽的模糊重复列表。详尽是指将返回指定测试值差异程度内的所有值,无论它们在测试域中相对于测试值的位置如何。
从设计上,模糊重复功能的结果是不详尽的,以防结果增大到超出控制。非详尽的结果可能足以满足您的分析使用。如果未能满足,可以使用 ISFUZZYDUP( ) 针对各个字符值生成详尽的结果。
有关 ISFUZZYDUP( ) 函数的详细信息,请参见《ACL 脚本指南》。有关非详尽组和结果的详细信息,请参见 如何对模糊重复分组。