大数跨境
0
0

【理论方法】战略管理研究中的机器学习方法

【理论方法】战略管理研究中的机器学习方法 战略与供应链管理研究团队
2025-11-12
4
导读:机器学习引领战略管理研究进入数据驱动的新纪元,其卓越的数据处理能力不仅拓展了数据来源、创新了建模方法,也显著提升了研究结果的稳健性。这些前沿进展为战略管理研究注入了新的理论活力和实践指导价值。


战略管理研究中的机器学习方法

Machine Learning Approaches in Strategic Management Research


01机器学习方法简介

机器学习(machine learning)是指一系列能从数据中学习并通过经验改进性能的模型(Mitchell,1997)。机器学习引领战略管理研究进入数据驱动的新纪元,其卓越的数据处理能力不仅拓展了数据来源、创新了建模方法,也显著提升了研究结果的稳健性。这些前沿进展共同推动了研究者对复杂商业与管理现象的深层理解和精准洞察,为战略管理研究注入了新的理论活力和实践指导价值。


02机器学习

在战略管理研究中的应用

机器学习在战略管理研究中的应用可以被理解为一个由四个相互依赖的维度构成的有机整体:变量测量特征选择模型估计以及因果推断


1

变量测量

运用机器学习处理非结构化数据生成代理变量已成为战略管理研究的主流。机器学习方法为传统战略管理研究提供了新视角和工具,使研究者能够基于历史数据量化变量,并从多个非结构化数据源中提取有价值的信息。

文本挖掘

基于文本挖掘的变量测量依托自然语言处理技术(NLP),能够将大量非结构化的文本数据转化为用于战略分析和决策支持的结构化信息,从而为战略管理研究提供了一种创新的量化方法和视角。NLP通过自动化和深入分析公司报告、新闻报道、社交媒体及其他公开资料,为处理和分析大规模文本数据集提供了高效的方法。具体而言分为两种互补的策略:

基于词向量的测量策略。该技术通过分析文本数据,学习词汇间的深层语义联系,将词语表示为高维空间中的向量。这些向量的距离和方向揭示了词语的语义相似度,为研究者提供了量化工具,探究变量词与其他词之间的语义关系。在战略管理研究中,这种工具意味着能够精确地捕捉并量化关键概念,如“可持续性”“社会责任”等语义关联,衡量变量词与其他词之间的语义联系。

词向量空间

基于主题模型的测量策略。主题模型能够系统地揭示文本集中的主题分布,能够深刻反映出文档的核心内容。主题建模尤其适用于分析复杂的组织环境和战略配置。例如,通过分析企业年报和市场报告中的主题,研究人员能够识别出企业的战略议题、市场趋势以及潜在的竞争优势等关键因素。

预测建模

主题模型能够系统地揭示文本集中的主题分布,能够深刻反映出文档的核心内容。主题建模尤其适用于分析复杂的组织环境和战略配置。例如,通过分析企业年报和市场报告中的主题,研究人员能够识别出企业的战略议题、市场趋势以及潜在的竞争优势等关键因素。

战略管理研究广泛采用了多种分类算法以测量变量,包括人工神经网络(ANN)、朴素贝叶斯(NB)、K近邻(KNN)、决策树(DT)以及支持向量机(SVM)等。

(1) ANN,特别是反向传播(BP)神经网络,因其卓越的非线性拟合能力和分类性能,在变量测量(如文本分类)中获得了广泛应用。然而,ANN面临着对大量数据和计算资源的依赖,以及模型可解释性方面的局限性。

(2) NB算法源于Maron和Kuhns(1960)的概率论原理,尽管在小规模数据集和文本分类上表现优异(Domingos和Pazzani,1997;Ng和Jordan,2001),但受到条件独立假设的限制,难以处理复杂的变量测量。

(3) KNN算法(Cover和Hart,1967),通过考虑最近邻居进行类别预测,在多类别变量测量中表现良好,但可能在处理大型数据集时面临计算复杂度的挑战。

(4) DT算法 (Breiman等,1984),因其强大的解释性和在高维特征及不平衡类别分布中的适用性而受到认可(Kotsiantis,2013)。虽然存在过拟合风险,但通过适当的剪枝策略可以控制。

(5) SVM算法(Cortes和Vapnik,1995),在处理高维度和非线性问题方面表现出色,特别适用于文本分类(Joachims,1998),但其训练过程可能较为耗时。

(6) 集成分类算法,如随机森林和AdaBoost,通过整合多个分类器来优化性能,在变量测量中考虑关键变量的贡献。


2

特征选择

在战略管理研究中,特征选择是构建模型的关键步骤。特征选择涉及从复杂数据集中筛选出对模型最重要的特征,从而揭示驱动组织战略和绩效的关键因素。此外,在处理多维信息数据集时,特征选择能够剔除冗余和不相关的数据,并提高模型的预测准确性。特征选择包括三种主要途径:主题提取、特征权重评估以及深度学习。

主题提取

战略管理研究中,有效提取和理解大量文本数据中的信息对于揭示企业环境、竞争态势和战略选择至关重要。例如,在LDA中,文档代表输入数据的样本,主题表示不同的类别集合,而词汇则用于表示样本的特征,这些元素之间存在深刻的关系。LDA通过分析文档中词汇的出现模式,学习得到主题—词汇分布和文档—主题分布的信息,为战略管理研究中的主题提取任务提供了强大支持。

特征权重选择

基于特征权重评估的特征选择旨在识别对模型预测贡献最大的变量,同时排除那些冗余或不相关的因素。这种方法在处理大规模数据集时,不仅能够提高模型的效率和精度,而且是确保预测准确性和防止过拟合的关键策略。

战略管理研究中,各种机器学习算法展现出其在模型特征选择上的独特优势:

(1) 套索回归在战略管理研究中的应用得到了广泛认可(Belloni等,2014;Guzman和Stern 2020;Miric等,2019)。该算法通过引入L1正则化实现稀疏化的模型参数,能够有效剔除冗余变量,进而避免过拟合。

(2) 随机森林(RF)算法通过特征重要性分数,基于节点分裂频率或对模型准确性的贡献识别关键变量。

(3) 梯度提升机(GBM)则侧重通过多个树模型中变量的频繁使用来衡量其重要性。

(4)支持向量机(SVM)在变量选择方面的特点是分析支持向量的权重,较大的权重通常意味着该变量对分类边界至关重要。

(5) 深度学习不直接进行变量选择,而是通过层级学习和特征融合的方式,自动学习并提取特征,为不同的输入特征赋予不同的重要性。

深度学习

基于深度学习的模式识别为战略管理研究者提供了一种从大量复杂数据中提取有价值信息的手段。基于深度学习的特征选择核心在于其归纳性质,这在某种程度上类似于传统定性研究中的扎根理论方法。

战略管理研究中,机器学习能够帮助研究者识别和预测潜在的企业行为模式:

(1) DT算法通过递归地分割数据集,揭示了特定战略情境下对企业行为起决定性作用的关键特征。

(2) RF算法通过集成多个决策树,增强了模型的预测能力和对异常值的鲁棒性,这对于在不确定性高的战略环境中做出决策尤为重要。

(3) SVM算法通过寻找最优分类面来处理战略管理中的分类问题,尤其是在处理高维数据和非线性问题时表现出色,有助于揭示复杂的战略决策模式。

(4) ANN,尤其是深度学习模型,能够自动从数据中学习特征表示,对于处理非结构化数据如文本和图像,在战略分析中识别潜在的模式和关联具有独特的优势。

(5) 主成分分析(PCA)等降维技术通过减少数据的维度来揭示数据中的主要趋势和模式,使得战略管理研究者能够更容易地理解复杂的数据结构。而长短期记忆网络(LSTM)等序列模型在处理时间序列数据方面表现出色,能够识别和预测战略管理中的动态变化模式。


3

模型估计

战略管理实证研究中,机器学习作为一种新途径,是传统统计方法的补充。Hofman等(2017)解释了基于监督机器学习的预测建模如何补充回归建模,以进行理论解释和模型估计。机器学习技术与传统计量经济学方法的深度融合将是未来管理研究的新趋势。

非线性关系建模

机器学习提供了多种用于建立和估计非线性模型的算法,如DT、SVM、ANN等。这些算法能够通过从数据中自动学习到的复杂模式来预测或分类数据,从而揭示战略变量之间的深层次关系。DT通过递归地分割数据集,构建树状模型拟合非线性关系。SVM通过寻找不同类别之间的最优边界,处理高维数据,并且捕捉复杂的非线性关系。ANN通过模拟人脑神经网络的结构和功能,能够学习到数据之间复杂的非线性关系和模式。ANN由多个层次组成,每一层包含多个神经元,通过激活函数实现非线性映射。

数据质量优化

模型估计过程中,机器学习凭借其在处理复杂数据方面的优势,在异常值检测及缺失数据插补这两个关键领域为战略管理研究提供了有效策略。

(1)异常值识别。机器学习算法结合Z分数等手段与传统的模型估计,使得数据分布的符合性检验更为全面和灵活。通过度量数据点相对于其均值的偏离程度能够评估数据是否符合特定的统计分布假设,并为异常模式的识别提供可靠的统计依据,因此可以为战略管理研究中的数据分析和统计推断增添新的价值。

(2)缺失值插补。通过捕捉数据中的复杂模式和变量间的微妙关系,提供精细的缺失值插补策略。与传统的统计插补技术(如均值或中位数插补)相比,机器学习算法能够利用数据的整体结构和变量间的相互作用,为缺失值提供更为合理的估计。


4

因果推断

因果推断在战略管理研究中处于核心地位,尽管传统统计方法奠定了方法论基础,但在处理高维数据、复杂交互作用以及内生性问题时有其局限性。随着机器学习技术的兴起,因果推断的方法论得到显著提升。现在探讨这些技术在战略管理研究中的应用,并揭示它们在实现因果推断中的作用。

双重套索

双重套索(double lasso)。作为处理高维数据环境下因果推断问题的有效工具,为战略管理研究提供了因果估计的手段。基于双重套索选择因子并解决遗漏变量偏差问题以改进因果推断的做法已经成为学者们的共识。它通过两阶段正则化线性回归过程,筛选出关键变量并估计其对策略决策的因果效应,同时控制遗漏变量偏差。

双重机器学习

双重机器学习(double machine learnin,DML)。战略管理研究中,因果推断的精确性对于揭示企业战略决策与绩效之间的真实关系至关重要。(double machine learnin,DMLChernozhukov等(2016)提出双重机器学习)方法,结合了机器学习的预测能力和传统统计学的因果推断理论,通过两个阶段的学习过程来提高估计因果效应的准确性。

在战略管理研究中,双重机器学习在提升因果推断估计的精准性方面值得关注。鉴于战略管理研究常涉及多重影响因素及其相互作用,双重机器学习有效地克服了传统统计方法的局限。例如,Bach等(2021)运用双重机器学习方法量化了多种因素对性别工资差异的贡献,为政策制定和战略管理提供了数据支持。该研究凸显了双重机器学习在揭示复杂经济和社会现象中因果关系的能力,为战略管理研究带来了新的洞察。

通用机器学习

通用机器学习(general machine learning,GML)。作为一种先进的分析工具,通过融合多种机器学习算法,为战略管理研究中的复杂数据分析提供了新的解决方案。Chernozhukov等(2018)指出,GML在处理高维数据集和揭示处理效果的异质性方面表现出显著优势,这对于战略管理研究尤为重要。这是由于企业战略的实施效果往往因多种内外部因素而呈现异质性,GML能够有效地识别和学习这些复杂数据中的模式和规律。

GML的核心优势在于整合多种算法,提高对战略决策影响因素的预测准确性和可靠性。与依赖特定模型设定和前提条件的传统统计经济学方法相比,GML的灵活性和自适应能力使其能够揭示数据中的复杂结构,提供更深入的见解。在评估诸如国际化、产品创新或企业并购等特定战略决策的效果时,GML可以处理大量多渠道数据,识别影响战略决策的关键因素,为战略管理实证研究提供了新的方法论工具。

广义随机森林

广义随机森林(generalized random forests,GRF)。作为一种灵活的非参数方法,在战略管理研究中的应用日益受到重视。GRF适用于多种预测问题,包括回归、分类,以及因果推断(Wager和Athey,2018;Athey等,2016),并在适应复杂数据结构和精确估计变量间交互效应方面的核心优势。它在处理高维数据和估计存在潜在混杂因素时的处理效应方面表现出强大的预测能力。在战略管理研究中,GRF能够精确估计个体或企业对于特定战略举措的反应,这对于理解战略决策的效果至关重要。



03机器学习

在战略管理研究中的未来展望

1

基于多模态数据的变量测量

机器学习技术为战略管理学者分析多模态数据提供了新机遇,使学者能够综合利用文本、图像及视频等数据,以获取组织行为和战略决策的深入见解。通过对文本的逻辑和语义分析,以及对图像数据中的场景和视觉元素进行精确解析,研究者可以更全面地理解企业战略、品牌形象和市场趋势(Choudhury等,2019)。这种基于机器学习的多模态数据的分析方法,对于深化对组织战略配置的理解至关重要。

2

特征选择中的模拟预测

战略管理研究中,机器学习推动的模拟预测方法正在成为不可或缺的技术,极大地增强了对组织未来走向的预测能力。这些方法已经在多个领域证明了其有效性,包括提高生产效率、加强网络安全、优化金融投资策略、精确期权定价,以及预测制造业中的潜在故障(Giardili等2022;Ban等2018;Kumar等2022;Dutta 2022;Ciocan和Misic 2022),展现出其广泛的应用潜力。

3

模型估计与因果推断

战略管理研究中,模型估计与因果推断的准确性是确保决策科学和有效的关键。随着数据驱动决策模式的兴起,机器学习技术在特征选择和模型估计方面的应用,为提升模型准确性和因果推断的严谨性提供了新解决方案。传统统计方法与机器学习的结合,尤其是将计量经济学的因果推断理论与机器学习在处理数据异质性方面的优势相融合,已成为推动该领域发展的新趋势(刘景江等2023)。这种跨学科的融合不仅丰富了研究的深度和广度,也极大提高了研究结果的可靠性和实际应用价值。

4

战略管理理论的构建、泛化与检验

机器学习技术在战略管理理论的构建、泛化与检验中扮演着日益重要的角色(Sen和Puranam,2022;Tidhar和Eisenhardt,2020)。通过其强大的数据处理和模式识别能力,机器学习不仅揭示了已知特征间的关系,还能够挖掘出尚未被传统研究所发现的新特征关系。这种能力对于提升理论的综合性和适用性具有重大意义。机器学习的应用使得研究者能够从大量数据中提炼出新的理论概念,从而推动理论的发展和创新。此外,机器学习技术在量化验证方面的应用,为战略管理理论提供了更为严格的检验,使得理论的普适性和局限性能够在更广泛的数据集上得到测试(Choudhury等,2021a)。


E

N

D


内容来源

吴建祖,郑朝杰.战略管理研究中的机器学习:研究述评与展望[J].外国经济与管理,2025,47(03):119-136.DOI:10.16538/j.cnki.fem.20240409.101.



研究团队录制的《供应链金融》课程慕课在“学堂在线”正式上线

(点击图片即可获取课堂链接)


【声明】内容源于网络
0
0
战略与供应链管理研究团队
1234
内容 145
粉丝 0
战略与供应链管理研究团队 1234
总阅读101
粉丝0
内容145