文|上官鹏 王兆宇 赵文荣
随着数据采集、存储、管理与分析技术的快速发展,另类数据在金融投资中的应用日益广泛,成为挖掘低相关Alpha收益的重要工具。本文系统梳理了分析师、行业、行为、企业特征和消费五大类共9个细分领域的另类数据,分析其应用现状与投资价值。研究发现,分析师数据与中观行业数据策略相对成熟,在成长风格占优或景气上行阶段表现突出;新闻舆情与股吧数据因与基本面因子相关性低,叠加AI语言模型推动,应用加速;专利数据在大盘成长股筛选中具备较强能力,财务附注信息的结构化处理效率显著提升。建议重点关注A股市场中具备Alpha潜力的另类数据应用。未来,随着AI技术持续演进,新闻、文本类等非结构化数据的应用广度与深度有望进一步拓展。

另类数据:挖掘低相关Alpha的新蓝海
另类数据在全球呈现“行为数据领先、商业数据跟进、传感数据蓄势”的发展格局。本文聚焦分析师、行业、行为、企业特征与消费五大类别,涵盖9个细分方向,数据来源包括Wind、朝阳永续、通联数据、数库科技等主流服务商。随着技术进步,另类数据正展现出来源多元、形态异构、更新高频、内容客观且动态演化的五大核心特征,为量化策略提供持续增量信息。
分析师数据:更新高效,策略成熟
- 分析师研报中的文本及盈利预测可实现当日入库,数据时效性强;
- 2019年以来,A股分析师覆盖率稳定在60%左右;
- 相关策略发展较为成熟,在成长风格占优时期有效性更显著。
行业数据:景气度跟踪的核心工具
- 中观行业数据受机构高度关注,广泛用于日常景气度监测;
- 基本面量化策略主要通过横向比较行业景气趋势,筛选高景气组合,并结合历史时序变化进行行业择时。
行为数据:AI驱动舆情应用提速
- 新闻舆情数据来源覆盖政府网站、财经媒体及公众号,A股覆盖率高;
- AI语言模型提升情绪识别能力,助力构建情绪指标与选股因子;
- 新闻因子与传统基本面因子相关性较低,具备较高Alpha挖掘空间。
企业特征数据:专利与财务附注价值凸显
- 产业链与供应链数据当前应用较少;
- 专利数据覆盖超60%的A股公司,是衡量企业科技含量的重要指标,在大盘成长股中选股能力突出;
- AI技术显著提升财务附注信息的结构化效率与质量,未来使用范围有望扩大。
消费数据:线上销量应用偏跟踪型
- 线上销量数据覆盖约207家A股公司,整体覆盖率偏低;
- 主要用于个股收入变化的高频跟踪,以及行业销售额、均价变动分析,有效反映行业景气趋势。
风险提示
模型失效风险;分析师覆盖不全;宏观或产业政策发生超预期变动。

