10-K 风险因素报告方法
10-K 风险因素报告利用了公开来源的数据,包括 10-K 报告的风险部分,10-K 报告是上市公司必须向美国证券交易委员会 (SEC) 提交的年度文件。10-K 报告分析了 10-K 数据,从而呈现有用的信息,可用于向利益相关方传达公司的风险因素。
10-K 报告使用称为行业平均同行的虚构公司,它根据同行组的汇总数据创建,与单个公司进行比较。单个公司的范围包括 Russel 3000,即美国最大的 3,000 家上市公司。
术语
以下是 10-K 报告方法中使用的常用术语及其定义。
-
风险因素 – 一家公司在 10-K 报告中披露的风险的简短摘要。10-K 报告有三个风险等级:
-
风险类别 – 包含几个更详细的风险因素的一般主题。
-
风险因素 – 对风险的具体描述。
-
风险详细信息 – 对风险的最详细描述。它与每个公司的风险因素都有一一对应的联系。
-
-
行业平均同行(同行组))– 同行组是通过其全球行业分类标准 (GICS) 的部门代码和行业代码来确定的。GICS 是一个行业分析框架,可帮助投资者了解世界各地的公司的关键业务活动。一些例子包括能源、医疗保健和通信服务等。
主题分类方法
为了理解和比较风险因素,我们将其分成了不同的主题。使用机器学习算法,分析了每个风险因素的前两个句子,生成了主题类别。
利用 AI 驱动的主题分类,这些类别被分成了 33 个涵盖范围很广泛的主题。这有助于您确定不同部门和行业中最受关注的领域。
行业平均同行:一种假想的参考基准
平均行业同行代表同行组中所有公司的平均值。这个虚构的参考基准帮助我们了解某一家公司与行业同行的比较情况。
创建平均行业同行
为了创建平均行业同行,我们统计了一个特定主题的所有独特风险因素,然后将其除以同行组中的公司数量。我们忽略了所有小于 1 的值,并将剩余的数字四舍五入。这确保了同行组中仅呈现与每家公司相关的主题。然后,根据所包含的所有主题的加权分数计算平均行业同行的风险因素数量。
-
计算风险因素中的主题:每家公司在其包含不同主题的报告中列出了各种风险因素。如果某个主题很重要,公司会多次提及这个主题。我们统计了同行组中每个主题的这些独特风险因素。
-
平均计数:接下来,我们会将总风险因素数量除以公司数量。例如,如果 10 家公司有 50 个独特的风险因素,我们将 50 除以 10,平均数为 5。
-
四舍五入和最终确定:任何小于 1 的平均值都会被忽略,因为并非同行组中的每家公司都认为风险很大。然后,我们对剩余的数字进行四舍五入,以确定平均行业同行的每个主题应该有多少个风险因素。
加权重叠
这一部分说明了我们如何使用加权重叠将单个公司与平均行业同行进行比较。
我们只计算匹配主题的分数,否则值为 0。分数会按主题单独计算,之后我们会将所有数值相加求和。例如,如果主题匹配,则该值计算为 x 除以平均行业同行中的风险因素数量,其中 x 是主题被提及的次数。
-
匹配主题:我们只考虑匹配主题。
-
得分:得分计算为 x 个风险因素除以行业平均同行中的风险因素数量,其中 x 是公司提及某个话题的次数。但是,x 不能超过该主题在同行组中被提及的次数。