大数跨境

【税务合规】Logistics模型与以数治税

【税务合规】Logistics模型与以数治税 坤荣资产规划
2023-03-10
2
导读:一:Logistics模型Logistics模型(又称“Logistics回归”)是一个线性回归分析模型,其

一:Logistics模型


Logistics模型(又称“Logistics回归”)是一个线性回归分析模型,其特点是根据一组变量评估某个事件发生(或者不发生)的概率,例如,根据身高、体重、饮食习惯、幽门螺杆菌等一系列变量预测某人患胃癌的概率等。


Logistics模型的数学表达式如下:



表达式中的xi是回归方程所使用的各个变量, βi是各个变量的影响系数,β0是模型的截距项 。


Logistic模型具有以下特点:

1Logistic模型已广泛应用于风险评级的相关研究中,是一项成熟的风险评级研究方法。

2)该模型的假设条件得到了放宽,对所使用的自变量限制较少,既可以是连续值,也可以是离散值

3Logistic模型是常见的对二分类因变量进行回归分析的方法,其中因变量的取值是0或者1,可以分别代表某个事件是否发生。

4Logistic模型的表达式可以保障概率值在有意义的区间内取值。


与Logistics模型类似的模型还有Probit模型,其采用了概率分布函数,Y按照一个概率分布函数进行转化,即事件发生概率P=F(Y),其中F(Y)是符合标准正态分布的累计分布函数,即:



在社会经济领域,Logistics模型与Probit模型已经有过至少下列若干应用研究:

•上市公司财务预警

上市公司财务危机预警

上市公司信用评级

•绿色住宅消费行为研究



二:以数治税——“两本账”加油公司隐瞒收入偷税稽查案例


根据中国税务报报道的一宗案例,一家“两本账”的加油站是这样被税务稽查识别的:

【变量1】该纳税人名下有大量进项发票(燃油采购)未抵扣,X1=未抵扣进项采购额/量;

【变量2】通过交通运输部门电子运单信息查证,该纳税人实际采购了大量燃油,X2=企业实际采购额/量;

【变量3】根据行业管理特性,该加油站实际储油量有限,采购燃油却没有销售不合乎逻辑,X3=加油站实际储油量;

【变量4】该企业销售数额与采购数额背离,X4=该企业纳税申报销售额/销项开票额;

【变量5】该企业主的母亲有一张银行卡,在一定期间内累计收款1,800万,与已采购但显然没有存储在加油站内的油量市值相匹配,X5=私户收款额;

【变量6】该企业主母亲银行卡所收款项会转账予企业主本人,企业主本人收款后还会转账予加油站(因加油站需要支付燃油采购款),X6=不合乎营业常规的转账关系。


本案中,税务机关通过实地检查、约谈等方式查证了企业主“私户收款”隐瞒收入的事实,最终企业被按偷税处理。


但我们也注意到,现行以数治税虽然基于大数据和逻辑分析能力,已经很犀利了,但其仍然比较依赖人力识别风险纳税人。在AI技术蓬勃发展的今天,这似乎还有点复古味道。


那么,我们能否将数学与法律结合起来呢?



三:回归与以数治税


在上述案例中,税务机关实际上获得了一个训练样本,即符合若干指标的一家纳税人具有偷税行为,虽然不能以单个企业直接类推适用所有同行业纳税人,但积累若干同类训练样本,不断提升模型精准度,未来,我们是否就可以获得一个自动分析加油站账外经营风险的“加油站隐瞒收入Logistics模型”呢?


类推适用,是否可以有更多行业、更多行为,分别建立单独或者统一数理模型呢?


再进一步地,结合Python爬虫、Chat-GPT技术,一份税务风险分析意见书是否可以“秒出”,而稽查方的任务,就是基于分析意见书进行实地检查、约谈、核实和最终形成正式处理/处罚决定呢?


这会不会是以数治税的未来?又或者是程序员35岁后再就业的奔头吗?这不刚省下来5%编制么……





笔者不精通数学,本文亦未考虑置信区间设定、拟合优度检验(如Hosmer与 Lemeshow检验方法)、训练样本可得性与充分性等事宜。

【声明】内容源于网络
0
0
坤荣资产规划
税务/传承/信托/股权综合服务
内容 55
粉丝 0
坤荣资产规划 税务/传承/信托/股权综合服务
总阅读0
粉丝0
内容55