Analytics 入门

此入门教程向您介绍使用 Analytics 分析数据的完整流程。

 

估计时间 60 分钟
要求 不需要以前具有 Analytics 经验。假定您有一些基本的数据分析经验,但并非绝对需要。
Analytics 版本 13.0 及更高版本(非 Unicode 版)
完成正确版本的教程

如果您使用的是非 Unicode 版 Analytics,请完成此版本的教程。

如果您使用的是 Unicode 版,请完成Analytics 入门(Unicode 版)

提示

要弄清您使用的是哪个版本的 Analytics,请在 Analytics 主菜单上,单击帮助 > 关于以打开 Analytics 对话框。版名称出现在版本号之后。

说明

中文、日语和波兰语用户界面仅有 Unicode 版。

场景

审核公司信用卡交易

您被要求审核两个月期间的公司信用卡交易。您的目标是大概了解一下员工如何使用信用卡,另外还要识别出任何可能存在的滥用信用卡的情况。

交易数据被包含在三个单独的 Excel 工作表中。在分析数据之前,您需要将其导入到 Analytics 中,并且将多个单独的数据集组合为单个 Analytics 表。

在您分析数据后,您想要直观地呈现您的分析结果,以更好地吸引您的受众。

可选部分

您被告知自今往后,审核公司信用卡交易将是一项经常性职责。

为了使您自己或者其他人能够快速而准确地执行将来的审核,您决定创建一个脚本以自动完成某些工作。

PIPAR – Analytics 中的数据分析周期

Analytics 中的数据分析周期包含五个阶段,首字母缩略词 PIPAR 对此进行了总结:

计划(P)导入(I)准备(P)分析(A)报告(R)

计划您的 工作

计划您的数据分析工作很重要,并且通常很关键。如果您跳过计划阶段,并且直接跳到对数据运行解析命令的阶段,则可能会遇到问题,为您自己带来额外的工作,甚至遗漏重要的解析深刻见解。

即使是基本的计划也好过没有计划。借助于经验以及日益增加的 Analytics 知识,您的计划将变得越来越完善和精确。良好的计划是平稳而有效地推进数据分析项目的关键。

计划指南

制定清晰而具体的目标
规划分步骤方法
识别您需要哪些数据
考虑技术要求
做好反复的准备

导入数据

您必须首先将数据导入到 Analytics 中,然后才能分析它。

我们将通过使用数据定义向导导入三个 Excel 工作表来熟悉导入流程。从 Excel 导入是在 Analytics 中获取数据以进行分析的最常见方法之一。但是,Analytics 支持从各种各样的数据源导入数据。

打开 Analytics 和 "Sample Project.ACL"

说明

下面的步骤假定您已经激活 Analytics。

导入前两个 Excel 工作表

您将同时导入两个 Excel 工作表。同时导入多个 Excel 工作表是减少工作量的好方法。

导入第三个 Excel 工作表

现在导入第三个 Excel 工作表自身。当您导入单个工作表时,您可以选择在导入期间手动调整某些元数据设置,而不是以后在 Analytics 中调整。

您现在应该在导航器概览选项卡中具有三个新的 Analytics 表。这些表包含 Excel 数据的只读副本。它们不包含 Excel 源数据本身。

准备数据

通常您必须执行一项或多项数据准备任务,才能使数据做好供分析的准备。

在本教程中,您将执行两项准备任务:

  • 进行附加调整以协调数据域
  • 将三个新的 Analytics 表组合为单个表以进行分析

另外,作为最佳做法,您始终应该首先验证所导入数据的有效性,然后再执行解析工作。即使表中仅含少量无效数据也会使您的所有后续数据分析无效。

为什么我需要准备数据?

您急于着手进行数据分析,但不经过适当的数据准备,您可能无法执行分析。否则,您执行的分析可能有瑕疵。

各种各样的问题可能影响源数据,使其在不经过某种初始准备的情况下不适合于分析。

例如:

  • 源数据分布在多个不同文件中,需要加以合并,以便将其作为单个数据集进行分析。
  • 不同文件中的相应域需要加以“协调”,这意味着使其在结构和格式方面完全相同,以便对其进行处理。
  • “脏数据”需要清理和标准化,您可以使用 Analytics 函数完成该工作。

要点

您花在导入和准备数据上的时间可能超过您花在实际分析上的时间。但是,它们是关键性的初始阶段,并可提供您的分析所依赖的基础。

调整表布局

Analytics 项目中的每个表都具有表布局。表布局包含元数据,如域名称、域的开始位置、域的长度、域的数据类型等等。

在将三个新的 Analytics 表组合为单个表之前,我们需要协调表布局中的某些元数据。

下面是 Trans_Apr 表布局的样子。随着您越来越熟悉 Analytics,您将很快了解表布局的使用方法。您可以在表布局中做很多有用的事情。

调整 Trans_Apr 表布局

首先,您需要更改 Trans_Apr 表中两个域的数据类型。

调整 Trans_May 表布局

要完成调整,您需要更改 Trans 1_MayTrans 2_May 布局中两个域的数据类型。您可能还需要对 DATE 域进行调整。

验证导入的数据

现在,让我们验证三个导入的表中的数据,以确保可以安全地继续执行其他数据准备和数据分析。

说明

我们将在更新数据类型之后验证数据。当您在 Analytics 中验证数据时,您需要确保某个域中的所有值都符合该域的数据类型的要求。因此,仅当数据类型落实后,验证数据才有意义。

了解详细信息

如果您想要查看当 Analytics 识别出数据有效性错误时会发生什么,请打开 Tables\Badfile 并运行验证流程。

组合三个 Analytics 表

对于最终的数据准备任务,您需要将三个新的 Analytics 表组合为单个表。

简单起见,本教程只组合三个表。但是,您可以使用相同的流程将 12 个月度表组合为单个年度表,并且对整个会计年度的数据执行分析。

您现在就准备好执行某种实际数据分析工作了。

分析数据

当您在 Analytics 中执行分析时,可使用命令和其他工具获取有关您所调查的数据的深刻见解,并且回答具体问题。

说明

在分析阶段,您先前所做的计划工作的威力将展现出来。如果您已经构想出与您的调查有关的明确目标,则您会更清楚要执行的分析类型。

数据分析

在本教程中,您将对 Trans_All 表中的数据执行以下分析:

  • 按贸易商类别代码对信用卡交易记录进行分组,以便发现:
    • 员工如何使用公司信用卡
    • 在每个类别中花费了多少钱
  • 创建一个过滤器以隔离任何被禁止的交易

按贸易商类别代码对信用卡交易进行分组

对数据集进行分组或汇总是快速获取数据概况的极好方式。

简单的调查工具

既然您有了汇总版的数据,您可以使用一些基本的 Analytics 工具获取有关公司信用卡使用情况的深刻见解。

只需几次单击操作,您就可以了解大量有关使用模式和可能的滥用的信息。

要获得此深刻见解: 在 Trans_All_Grouped 表中执行此操作:
员工在 4 月和 5 月收取的总金额是多少?
  • 选择总金额标题。
  • 选择解析 > 合计

总支出是 $187,177.13。

员工
  • 右键单击总金额标题并选择按降序快速排序

DESCRIPTION域显示大多数资金被花费在下列方面:

  • Caterers(餐饮公司)
  • Eating places and Restaurants(饮食场所和餐厅)
  • Hilton International(希尔顿酒店集团)
最大的单项支出是什么?
  • 右键单击最大金额标题并选择按降序快速排序

DESCRIPTION最大金额域告诉您最大单项支出是 Club Med 金额 $1999.06。

Club Med 是不是公司信用卡的授权贸易商代码? 如果信用卡限额是 $2000,那么某位员工收取的金额是否低于限额?

对非常用代码的检查揭示了哪些问题?
  • 右键单击 COUNT 标题并选择按升序快速排序

有五个类别分别只有一项收费。其中一些是被禁止的类别吗? 可能会有一名或多名员工认为偶尔滥用公司卡会使其逃避检查。

  • Cigar Stores & Stands(烟店)
  • Dating & Escort Svcs.(约会与陪伴服务)
  • Babysitting services(保姆服务)
  • Amusement Parks(游乐园)
  • Civic, Fraternal, and Social Associations(公民、兄弟和社会团体)
这些类别中有被禁止的吗?
  • 右键单击 DESCRIPTION 标题,然后选择按升序快速排序以按字母顺序排列域值,以便于浏览
  • 向下浏览该域以查找可疑的类别

也许下列一个或多个类别被禁止?

  • Babysitting services(保姆服务)
  • Betting (including Lottery Tickets, Casino)(博彩 — 包括彩票、赌场)
  • Civic, Fraternal, and Social Associations(公民、兄弟和社会团体)
  • Dating & Escort Svcs.(约会与陪伴服务)
  • Massage Parlors(按摩院)
  • Precious Stones and Metals, Watches and Jewel(宝石、贵金属、名表和珠宝)
  • Video Game Arcades/Establishments(电子游戏商场/会所)

说明

人工浏览是不切实际的(小型数据集除外)。接下来我们将考察更实际、更可靠的方法。

了解详细信息

也许您只是想执行一些快速分析,而不想将结果输出至新表。当您汇总 Trans_All 表时,您可以不选择汇总对话框中的文件,而是选择屏幕,并且将结果输出至 Analytics 显示区域。

输出至屏幕仅对较小的数据集具有实际意义。但是,它的优势是可以提供一种简便的方式,以便深入分析单个组并且只查看每个组中的源记录。

创建一个过滤器以隔离被禁止的交易

过滤器使您可以只隔离您在特定时刻感兴趣的记录。过滤器是用于回答有关数据的具体问题的强大工具。

对公司信用卡交易进行一番粗略审核后,您意识到可能存在一些被禁止的交易。您决定将数据与被禁止贸易商类别代码加以比对,以确认是否有被禁止的交易。

了解详细信息

超越过滤器

如果过滤器所包含的准则或条件的数量是可控的,那么过滤器可以很好地发挥作用。您在本教程中创建的过滤器只包含 9 个代码。但是,如果被禁止贸易商类别代码列表包含数十个代码,那该怎么办呢?

一种更有效的方法是将一个包含被禁止代码的 Analytics 表与交易表进行联接。联接输出表中的每个匹配项都是一项被禁止的交易。

联接超出了本教程的范围,但它是 Analytics 中的一项常用功能。

报告结果

在您的数据分析完成后,Analytics 为您提供了多种不同的方式来报告或者呈现您的结果。

传统的包含数据列的报告也可用,但我们将考察使用下面描述的更吸引人的数据可视化效果来表达结果。

树状图可视化效果

此树状图可视化效果显示了您在 Trans_All_Grouped 表中输出的分组信用卡交易。这些组之间的关系被用两个不同的方式表达:

  • 框大小指示每个组中单个交易的计数

    框越大,交易数量越高。这些框按照大小从左上到右下排列。

  • 框的颜色强度指示每个组的总金额

    框越黑,总金额越高。

因此,以位于右下象限的 Club Med 框为例,该框的大小指示仅有少量的交易,但其颜色却表明总交易金额很大。

首先做一点儿准备工作

您将要在结果应用程序中创建树状图可视化效果,该应用程序是云计算 HighBond 平台中的问题修复应用程序。您的 ACL Robotics 订阅中包括访问精简版结果应用程序的权限。

为了创建可视化效果,您必须首先创建一个简单的两级数据容器来容纳它。第一个级别被称为集合,第二个级别被称为分析。它们都可以被快速轻松地创建。

登录启动面板并访问结果应用程序

说明

如果由于某种原因您无法登录启动面板或者访问结果应用程序,您可以使用Analytics 中的其他报告方法中列出的备选报告创建方法之一。

创建集合

创建分析

将数据从 Analytics 导出至结果应用程序

下一个阶段是将 Trans_All_Grouped 表从 Analytics 导出至结果应用程序。

创建可视化效果

现在您已做好在结果应用程序中创建可视化效果的准备。

保存可视化效果

如果您想要保留您创建的任何可视化效果,您需要保存它们。您需要分别保存每个可视化效果以及容纳它们的容器(称作解释)。

Analytics 中的其他报告方法

除了结果应用程序中提供的数据可视化效果以外,Analytics 还提供了其他几个可供您用来报告数据分析结果的方法:

报告方法 描述
分析应用程序窗口中的数据可视化效果

在 Analytics 的独立组件分析应用程序窗口中,也就地提供了结果应用程序中的数据可视化功能。

说明

在发布 Analytics 的新版本之前,可能无法在分析应用程序窗口中使用结果应用程序中的某些图表和可视化效果。

要了解更多信息,请参考解释和可视化效果

传统 Analytics 图表

Analytics 包含使您可以创建基本可视化报告的传统图表和绘制功能。

要了解更多信息,请参考使用 Analytics 图表

传统多栏式报告

在某些情况下,传统的由数据行和数据列组成的、基于文本和数字的报告即可满足您的需要。

要了解更多信息,请参考设置 Analytics 报告格式并生成报告

第三方报告工具

您可以使用第三方报告工具(如 Tableau 或 Microsoft BI)直接从 Analytics 导入数据。

要了解更多信息,请参考从第三方报告应用程序连接至 Analytics

将数据导出至 Excel 或 CSV

您可以将数据导出至 Excel 或者逗号分隔文件,并且使用 Excel 或者任何可处理 CSV 文件的工具的报告功能。

要了解更多信息,请参考导出数据

您完成了

祝贺您! 您已完成使用 Analytics 分析数据的完整简介。

下一步做什么?

要继续学习有关 Analytics 的知识,您有多种选择:

学校

学校为各种经验水平提供一系列课程。ACL Analytics 基础课程是包含六门微型课程的一系列课程,它们为新用户讲授 Analytics 基础知识。

“学校”是 Galvanize 在线培训资源中心。转到课程目录以查看可用课程。

对于任何具有订阅的用户,学校课程均无须额外付费。

Analytics 帮助

(“Analytics 帮助”)

您当前位于《Analytics 帮助》中,它是“ACL 帮助”中的主要指南之一。本指南提供有关 Analytics 所有方面的参考性概念材料和分步骤说明。

例如,下面是有关附加操作的两个用户指南主题,它们构成了您刚完成的教程的一部分:

社区

社区是一个基于 Web 的平台,它具有多种客户资源,其中包括客户论坛,有经验的 Analytics 用户可在此分享他们的专业知识并回答问题。

客户论坛是了解 Analytics 的真正用法和应用的最佳场所。

将您的工作脚本化(可选部分)

估计时间 20 分钟
要求 不需要以前具有编写脚本的经验。
Analytics 版本 13.0 及更高版本(非 Unicode 版)

您可以即兴使用或者先查阅手册而后再使用 Analytics,而不需要具有编写脚本的经验。大多数情况下,任何可以在脚本中完成的工作都可以在用户界面中完成,反之亦然。但是,要从 Analytics 获取最大的价值、威力和效率,您需要编写脚本。

好消息是 Analytics 提供了使编写脚本变得比较容易(即使对新手而言也是如此)的工具。

脚本编写案例

假设除了您当前的所有职责以外,您还负责定期审核公司的信用卡使用情况。

节省时间

基本的审核流程被标准化了。在每个审核周期中,您都可以花费时间来手动重复执行基本流程,或者您也可以通过自动完成该流程来节省时间。

放心地委托

如果该流程被自动完成,您也许可以将该任务委托给资历较浅的员工。经过测试的脚本使您能够确信,经验较少的员工可以一致且准确地执行该任务,并且不会大大增加他们的工作负担。

什么是脚本?

Analytics 脚本是一系列 ACLScript 命令,这些命令执行一项特定的任务或多项相关的任务。例如,您刚刚在本教程第一部分中手动完成的所有工作也可以使用脚本完成。

ACLScript 是构成 Analytics 基础的命令语言。脚本被存储在 Analytics 项目中。单个脚本出现在导航器,并且前面带有脚本图标

Analytics 命令日志如何工作

您可能已经注意到导航器包含日志选项卡。作为脚本编写者,您会发现 Analytics 命令日志是您最好的朋友。

通过从日志中复制命令生成脚本

您将再次从日志中重用 ACLScript 语法,但这一次您将复制该语法到一个 Analytics 脚本。为了快速和轻松起见,您将仅脚本化您在本教程中手动执行的一部分工作,但是您也可以脚本化全部工作。

说明

我们将略过某些脚本编写最佳做法,以便简化该脚本编写简介教程。我们的目标是演示即使对于新用户而言,在 Analytics 中创建脚本也是多么地容易。

位于脚本中的整个教程

您刚刚手动执行的整个教程出现在下面的脚本中(在“步骤”部分)。要完成此脚本编写简介,您需要复制该脚本到 Analytics,然后重做教程工作,但这一次只使用几次鼠标单击。

说明

该脚本假定样例数据文件文件夹被安装在默认位置。如果该文件夹被安装在另外位置,您需要修改脚本中的导航路径以指向正确位置。

该脚本创建的表被附加 _s,以避免它们覆盖您手动创建的表。

您完成了

此脚本编写简介至此结束。我们希望您已经看得足够多,从而深信编写脚本的价值并且想要学习更多知识。

下一步做什么?

要学习有关在 Analytics 中编写脚本的更多知识,您有多种选择:

ACL 脚本指南

《 ACL 脚本指南》包含下列初级水平教程:

《ACL 脚本指南》还包含完整的 ACLScript 语言参考,其中包括有关每个 Analytics 命令和函数的详细信息。

学校

学校提供了介绍性以及高级脚本编写课程:

  • ACL Analytics (ACL 106) 脚本编写简介
  • ACL Analytics 脚本编写 (ACL 303)

“学校”是 Galvanize 在线培训资源中心。转到课程目录以查看可用课程。

对于任何具有 ACL 订阅的用户,这些学校课程均无需额外付费。

社区

社区是一个基于 Web 的平台,具有多种客户资源,其中包括一个供人们经常深入讨论 Analytics 脚本编写的客户论坛。

Analytics 14.1 帮助