大数跨境

重庆万科眼中的城市真相

重庆万科眼中的城市真相 脉策科技
2019-12-18
3
导读:方法的创新可以让小部分人看清现在,生产工具的变革则可以让所有人都掌握未来,地产数字化的变革,首先要从地产人与地产工具的数据变革开始。

重庆万科“城市空间大数据平台”上线平稳运行了一段时间后,为了更加深刻认识城市发展趋势把握与匹配客户需求,随即启动了第一个研究课题:《基于城市空间大数据,挖掘重庆土地价值,预测城市未来趋势》,期望探索基于大数据分析的土地价值研究先进方法,准确把握城市发展趋势,从而为客户提供更好的产品与服务


土地价值预测影响研究


在研究中我们基于7类研究对象,共计1.5亿余条数据,精准构建土地价值预测模型,同时将模型固化在大数据平台中,根据后台的实时数据更新,加以研究同事的经验认知,同步输出模型结果



参与模型计算的1.5亿余条各类数据


模型刚一落地,课题组选定了茶园东部某地块(重庆近郊某板块),希望对大数据在地块投拓支撑方面的应用进行验证模拟,这也是我们的研究成果第一次实际应用:


每个课题都要落实到业务场景


茶园东部某地块区位图;来源于重庆万科大数据平台


众所周知,研究地块首先要研究区位。茶园作为重庆东部外围板块是近些年的市场热点,南岸区政府也坐落此处,区内的项目用地受到了竞相追逐。近些年,茶园更是融入了大量的企业和产业,这也为区域发展注入了大量的动力。


茶园之于整个重庆市,其区位处于什么水平呢?我翻阅了一些公开资料:


左图:重庆2020都市区城市总体规划;来源于重庆市规划与自然资源局

右图:重庆十大组团格局;来源于重庆市规划局


根据不同的规划文件:


  • 从规划导向的空间特征看,我们可以把重庆划分为四大片区、六大副中心;

  • 基于产业规划的空间特征来理解,重庆有十九个组团;

  • 最后从政策导向的层面来切入,重庆可以分为十大组团……                                           



看到这里,你是不是跟我一样晕眩了?没错,重庆是一个多中心的城市的认知已经深入人心,茶园算做一个近郊副中心也被广泛认可。但这种模糊的说法对一个基于数据说话的地产研究团队是不可以接受的。所以,在研究茶园之前,我们必须先搞清楚下面这个问题:


重庆到底是不是多中心城市?


作为地产从业人员,我们的核心关注点包括项目用地与城市发展的关系项目周边成熟度人群属性和日常行为状态等。如果一个人或者一群人的日常生活(衣食住行、工作学习、公共服务),基本上能在一个较小的区域内获得满足,那么这个区域就被称为“组团”。“组团”实际上表达的是一个区域连结性的概念。


这个时候我们决定采用infomap算法去做一个“组团”的发现。

infomap算法:广泛应用在电商平台用户标签处理和社交媒体用户行为轨迹分析上。用于发现不同结构下,不同人群行为趋势的共性,将这些共性标签纳入一类群体进行分析。而这个项目上,我们把群组发现的纬度放在我们真实地理范围上,去寻找真正的“组团”。



这个算法的具体实施是这样的:

  • 我们首先将重庆划分为了3万8千个250米*250米的栅格,并且对每一个栅格进行了编码;

  • 随后将重庆常住居民(样本)的职住地点落在栅格上,并对职住轨迹进行编码;

  • 识别每条样本的轨迹是否落在某个组团之内,或者跳出;

  • 根据人群轨迹的聚集和跳出情况,在空间上划分城市组团。


经过短暂的运算,我们得出的结论是这样一张图:


通过人群职住信息识别出的重庆“组团”;可双击放大查看


当一定区域内的人迹行为高度一致时,这个区域内的所有栅格会被识别为同一类(图中显示为同一个颜色),也就是被认定为一个独立的“组团”。


黄色点点集中的地方,我们可以理解为重庆的中心城区。其他颜色比较密集的区域我们可以理解为所谓的“组团”。但是此时我的脑中越发凌乱:


为什么茶园是主城区的外延?南山处于主城与茶园之间反而成为了组团?


南山与茶园属性明显不同


我初步猜测,不同的组团划分,可能跟茶园、南山两个地区不同的交通条件有关。

 

刘家坪站15分钟车行等时圈人迹;来源于重庆万科大数据平台;可双击放大查看


我切到茶园地块,从板块中心(刘家坪地铁站)向外绘制了15分钟车行等时圈。从这个图可以发现,尽管茶园离长江市区段有整整10公里,但在路况良好的情况下,从茶园车行15分钟就可到达长江边的南滨路;不想开车的话,也有联通茶园和市中心的地铁。借助于便利的交通条件,茶园每天往返市中心通勤的市民接近10万人次!


重庆邮电大学15分钟车行等时圈人迹;来源于重庆万科大数据平台可双击放大查看


再把视角切换到南山,以南山板块中心(重庆邮电大学崇文路口)绘制15分钟车行等时圈。可以看到,虽然南山相比茶园距市区更近,但是缺少地铁的引流,再加上地理的天然阻隔,车行15分钟也只能在南山立交徘徊,很难“进城”。一个佐证是从南山每天往返市区通勤人口只有3万。可以预见,南山居民基本的生活和工作都局限在本地区之内,与市中心和周边联系较少,以至于出现了独立“组团”现象。


茶园和南山的对比告诉我们,虽然目前尚未达到区域内"自给自足"的程度,但园的配套发展都一步步在向前迈进在这样的大前提下,茶园板块包括研究地块的整个区域,仍在承载市区外溢人口的居住与就业需求。因此,不能仅仅考虑与主城区的距离,更应该将它现阶段承载的城市功能列入考虑。


重庆主城区组团的中心在哪里?


既然遥如茶都能进“市中心”组团重庆的这个市中心组团不可谓不大。那么下一个问题就来了:市中心组团的区位价值是否处处相等如果不处处相等,那么市中心组团的“中心”和价值“制高点”在哪里?


我们首先将主城区域内的每一个小栅格内的2019年至今所有市场中成交的项目的分为新房二手房普通住宅别墅四种类型;为了减少项目极值所带来的误差,与对缺少项目栅格数据的补足,我们又将每一个栅格作为中心,绘制其15分钟车行等时圈的范围,以范围中的项目均价作为栅格均价,带入模型作为因变量。


我们将重庆3万8千个栅格都作为“制高点”的候选点,分别计算7大要素与候选点的距离;然后用随机森林建立模型对进行土地价值进行了预测;随后选择分组模型以解释模型的候选点作为“制高点”的计算结果。


不出所料,我们找到了三个标识重庆主城区区位价值高地:观音桥解放碑弹子石。


模型运行结果;来源于重庆万科大数据平台


进一步分析,观音桥无论是在价值体现,城市能级,发展趋势还是人口通勤中的重要性,均略胜解放碑,成为当之无愧的城市价值制高点



在观音桥,解放碑、弹子石的三强相争之外,嘉陵江、长江与诸多水系也成为了在置业中首要考虑的区位因素:用相同的方法,在除了别墅以外的所有业态的价值体现中,嘉陵江大幅度领先长江,成为重庆价值的核心轴线



这三个制高点沿嘉陵江与长江合流处分布,而被北滨一路、嘉滨路、嘉陵江大桥与千厮门大桥围合出的嘉陵江水域也因地处于三者核心,成为了重庆的真正价值主轴线


模型“计算“出的重庆价值主轴线


于是与这条主轴线距离而出现的区位因素,也将被纳入我们数据模型中最重要的变量之一与其他变量一同去评估各个区域价值的重要因素。


此时,地块研究的中区位影响终于完整的呈现在我的面前。


与此同时,还有无数个和“区位价值”同样的模型同时平台中运行,当然,关于其他模型的研究内容,又是另外一个故事了……



研究重在创造方法,产品重在业务落地

 

对于重庆具体“组团”的认知将决定我们对于“距离”因素在地块估值中的认知;与“距离”因素同样重要的因素在这次城市的研究中我们还发现了很多,而实现研究与业务衔接的最后一公里则需要将新方法完整固化成产品模块,便于后续实时更新,快速调用


快速调用地形交通纳入为评估要素


卫星投影与规划交叉分析未开发用地


将专家认知与土地价值模型固化为产品功能


城市、客户与市场的变化对于地产本身的研究提出了更专业、更细化、更全面的要求,就必须纳入数据科学。除了简单地购置数据系统做辅助外,我们更需要的是认知上的全面变革服务上的全面升级从科学的层面对客户负责。地产数字化的变革,首先要从地产人与地产工具的数据变革开始。


方法的创新固然可以让小部分人看清现在,而生产工具的变革则可以让所有人都掌握未来。




说明:

1.   文中插图源自重庆万科大数据平台与研究报告

2.   文中人名、茶园某地块研究事件为虚构;

3.   平台内主要数据由重庆万科、铭腾机构和脉策数据提供。

4.   参与本研究的人员包括:

  • 重庆万科:涂怡然,彭娜,喻政慷,谭逸爽,李瑜,何大杰,谢力夫,王茂琪,严然 等;

  • 脉策:单玥,倪家禹,王旻昊,张丹,杨金龙,赵食惠 等;

  • 铭腾:顾明 等;

5.   本文内容仅做参考,不作为任何的要约或承诺。 





【声明】内容源于网络
0
0
脉策科技
我们是致力于大数据和人工智能领域的科技公司,为政府和大型企业提供数据平台、数据研究、人工智能、算法服务及系统解决方案。
内容 132
粉丝 0
脉策科技 上海脉策数据科技有限公司 我们是致力于大数据和人工智能领域的科技公司,为政府和大型企业提供数据平台、数据研究、人工智能、算法服务及系统解决方案。
总阅读176
粉丝0
内容132