数据委:请分享下小象典型的项目案例及经验,同时日常会用到哪些分析方法和分析工具?
罗容飞:自从2018年开设数据分析师事务所以来,我们事务所主要合作单位是各地市税务局,以下两个项目算是小象的经典案例;
【案例一】某市税务局经济高质量发展评价指标体系研究。以新发展理念为指导,以体现高质量发展为宗旨,从发展绩效、创新发展、绿色发展、协调发展、开放发展和共享发展6个方面出发构建我市高质量发展评价指标体系。利用税务登记、增值税申报、企业所得税申报、个税申报等数据优化指标体系,形成税收经济高质量发展评价指数的指标体系。
本项目通过税收大数据设计反映我市经济高质量发展的监测指标体系,以及采用熵值法分析测量了近几年经济高质量发展趋势,填补了国内税收大数据在“践行新发展理念推进高质量发展”的研究和应用。
【案例二】某市税务局经济税源分析及调度。基于基础税源、重点税源、可统筹税源三大类税源标准,提供三大税源的数据分析和构建行业预测模型;为全市税收目标分解、测算和调度提供数据分析,为分局税收努力提供数据参考及能力评估。
本项目实施后税源预测更加准确,充分利用经济数据、重点企业报送数据,利用大数据分析和挖掘技术,结合税收数据分析结果,实现对税收分镇街、分行业、分重点企业的量化预测。同时实现税源统筹调度。结合年度税收增长目标达成需要,聚焦重点行业、重点区域、重点企业,进行目标测算拆解,形成各镇街税收达成任务的细分目标支撑。
我们日常会用到的分析方法及工具具体如下:
数据清洗与治理环节:基于数据清洗引擎,处理异构数据源;
多维建模环节:在数据建模阶段,通过DataHoop平台内置算法进行数据和模型预研,使用了逻辑回归、随机森林、时序分析等方法建立税收风险分析、企业经营行为分析、风险预警、税收预测等模型;
数据可视化环节:利用省税务局统一的大数据平台,生成交互式图表。
小象在长期数据分析项目中积累了如下经验:
以业务为导向建模:数据分析必须嵌入税务数据的业务特点、理解用户根本需求,避免“模型空转”;
轻量级系统交付机制:通过“分析+可视化展示”的方式快捷交付结果,提升客户需求落地率;
模型优化:针对政务数据使用场景,通过不断地优化模型,提升预测精准度,同时需选择业务解释性强的模型,便于形成有效的政策建议。
数据委:随着DS等AI应用与工具的普及,您认为对于行业产生了哪些影响?
罗容飞:随着豆包、DeepSeek、文言一心等 AI 工具软件的上线,我认为AI 工具可自动化完成数据清洗、预处理等任务。传统数据清洗可能需数天,借助 AI 能缩短至几小时,还降低了错误率,算是极大简化了操作流程;同时借助机器学习和深度学习技术,AI 能够揭示分析师可能忽略的复杂模式,提供更准确的预测分析。过去,数据分析师主要负责数据清洗和基础分析,伴随 AI 引入,现在他们能将更多时间用于战略制定和决策支持;这要求数据分析师不断更新技能,提升自己在数据分析思维、算法理解等方面的能力,以适应新的工作环境。
数据委:小象目前内部的人员构成与分工是怎样的?
罗容飞:我们小象事务所目前团队成员主要分为三类大数据岗位;
项目经理与业务分析师:负责需求沟通、数据方案设计;
数据工程师:擅长ETL开发与数据仓库建设;
数据建模工程师:进行模型构建与算法实现。
我们的团队核心成员均拥有CPDA数据分析师认证,毕竟我坚信CPDA证书是事务所衡量求职者数据分析能力,以及企业客户衡量事务所专业水平的重要参考标准之一,该认证体系的严谨训练保障了分析能力的专业性、合规性与政策理解能力,特别适配政务项目场景,是我们赢得政府项目的重要背书。
数据委:您对于数据分析行业未来的发展趋势有哪些见解?
罗容飞:我认为整个行业未来的大趋势是从“数据分析”向“决策支持”持续进步,也就是数据分析师将更多参与客户的决策分析和顶层设计,事实上我们小象目前就在逐步向这个趋势倾斜。同时AI辅助分析越来越成为我们需要掌握的标配工具;垂直化和专业化的数据分析服务更加具有市场竞争力:比如在岗位设置时突出“税务大数据分析专员”、“缉私大数据风险分析专员”等不同业务场景的角色细分化。
最后,罗经理表示小象未来将与数据委继续保持紧密沟通,在CPDA人才引进和项目合作方面可以有更多的发展空间,小象也很乐意分享在税务和海关等领域的经验和积累,依靠数据委在全国范围的影响力,力争打造专业型+研究型并重的数据分析师事务所。

