大数据告诉你谁是统治上海的人?

2017-11-29 行业:综合
  孙不熟按:
  本号此前分享过一篇文章《谁是真正统治北京的人?》(回复27),里面提到,胡同北京人早已被成片地连根拔起,搬迁到通州、昌平等边缘郊区。真正住在北京中心区的早已是各种各样的城市新贵。
  无独有偶,今日分享的这篇文章,通过大数据的方法告诉你,中国第二大城市上海同样经历过这样的现象。从1991年到2003年,大约有300多万原本住在市中心的老上海被迁往郊区动迁房,而在拆迁废墟上拔地而起的高档商住楼的买主,很多是跨国公司在上海的高管。
  也就是说,上海内环不讲上海话,讲起英语了。不仅如此,这篇文章还发现,中环居民大多为城市新移民,他们也不讲上海话,讲的是普通话。真正讲上海话的很多都已搬迁到远郊的外环了——当然,这个过程不一定是被迫,很多还是自愿的选择,因为能够从容地住在郊区,并不是谁都能做到。
  我在上一篇文章《高房价对深圳有没有正面意义》(回复31)里谈到这样一个观点:北上广深这些一线城市,就像是一个个码头,一个个擂台,他们不可能是原住民的自留地,而是天下兵马必争之地。这里没有生活,只有奋斗,没有共和,只有战争。而且结果只有一种:赢的留下,输的离开。
  经过改革开放30多年的大发展大变局,跨国精英、城市新移民、原住民三大阵营在大上海的土地争夺战中,胜败格局基本已分:内环讲英语,中环讲普通话,外环才讲上海话。
  谁是大上海的真正主人?读者诸君自己玩味。当然,既然是码头,就一定不会有真正的平静,新的挑战者一定会接踵而至。所谓铁打的营盘、流水的兵,你方唱罢我登台。今日盘踞在上海中心的跨国精英们,会不会有一天败给上海新移民或者北京的大亨们,也未可知。
  感谢“城市数据团”的分享,原标题是“走向外环的上海话”。本篇文章因为使用了大数据的分析方法,读起来可能并不通俗,需要你的一点耐心。
  文|chenqin
  感谢“城市数据团”(metrodatateam)的分享
  从90年代到本世纪初,上海经历了举世罕见的大动迁。
  1991年到2003年,共有95万户,约300多万原本住在市中心的上海市民被迁往郊区动迁房。而在拆迁废墟上拔地而起的高档商住楼的买主,又往往是一些跨国公司在上海的高管。在这样的极端对比下,有一句谶语悄悄传开——
  未来的上海,内环讲英语,中环讲普通话,外环才讲上海话。
  时至今日,这句预言的背景已经发生了巨大的变化。1995年时,每3个住上新房的上海人,就有1人是因为拆迁。近20年过去,2014年,上海市动迁房面积仅占商品房销售总面积的3%。本地居民被半强制地迁往郊区,已经不再是市内人口流动的主要原因。
  只要有能力购房,不管是本地人还是外来人口,都可以自由选择自己的住所。
  那么,上海话是会继续走向外环,还是回到内环呢?
  使用来自同策房产咨询的新房交易数据,我们恰好可以进行这样的分析。该数据从2012年9月开始至2015年9月结束,共有15000套新房交易数据,包括每套住房的小区名称、面积、单价以及购买者的性别、年龄和来源地(根据身份证前两位判断)。将无法准确识别的小区、车库的购买记录以及购房者信息错误的记录全部删除后,还剩下11638条数据,来自144个不同的小区。
  注意,由于迁移户口并不会直接改变身份证号码,本文所提到的所有“本地”和“外地”并非指户口所在地的区别,更多是指出生地的区别。

  首先,我们将所有小区定位经纬度,计算该小区至上海市地理中心(人民广场)的直线距离,与该小区的住房平均价格。

大数据告诉你谁是统治上海的人?

  从距离市中心不到5公里的高档住宅区,到距离市中心50多公里位于金山区的临海公寓,房屋的每平方米单价严格下降。每离市中心远1公里,每平米单价下降920元。比起市中心动辄单价6、7万以上的小区,市郊那一群单价2万不到的小区看起来真是白菜价呢。
  那么,从市中心到上海市边界的这些房子都给谁买走了?

  我们将每个小区的购买者按照其来源地区分开来。每个小区的买主都包括来自上海的本地购买者,和来自外省的外地购买者,使用购买面积加权后,可算出每个小区的“本地人口购买比例”,如下图:

大数据告诉你谁是统治上海的人?

  上图的纵轴为每个小区的“本地人口购买比例”,横轴是每个小区到市中心的距离。可以看到,小区每靠近市中心1公里,本地人购买的比例就平均下降0.4%。
  按照这个关系,从市郊到市中心,上海本地人口购买的比例从60%下降到40%左右。看起来,上海话仍然没有回到内环,而是继续走向了外环。
  上海话为什么继续走向外环?
  一种看法是,由于大动迁,上海市中心的大部分人口已经迁往市郊,中心城区外来人口多、郊外本地人口多的现象已经形成。那么,如果大家都喜欢购买自己身边的房子,自然就能形成市中心的外来人口购买者多,而市郊的本地人口购买者多的现象。
  事实是否如此呢?

  使用2010年人口普查数据,将上海市213个街道/镇的本地人口比例与该镇/街道到市中心的距离绘图如下:

大数据告诉你谁是统治上海的人?

  可以看到,在市中心0至20公里范围内,越靠近市中心本地人口越多。而在20公里范围以外,则是越靠近郊外本地人口越多。与上图对比,似乎能够部分解释“越靠近郊外,本地人口购房比例越高”的现象。

  接下来让我们看一个更加有意义的指标z:

大数据告诉你谁是统治上海的人?

  Z可以理解为“本地化速度”。
  当该比例大于1时,说明该地区的本地人口比例会提高。例如,一个地区常住人口的50%为本地人,而其新房的购买者有80%是本地人,那么该地区的z值大于1,由于迁入人口的本地人比例比平均值更高,我们可以想象这个地区的本地人口居住比例会逐渐高于50%,并最终升至80%(暂时不考虑买了新房之后直接出租给其他人的情况)。
  反过来,如果z小于1,则该地区的本地人口居住比例会逐渐降低——去本地化。z距离1越远,说明该地区的“本地化”或“去本地化”的速度越快。

  我们计算每一个小区的本地人口购买比例,并将该小区五公里范围内的街道/镇的本地人口居住比例对应到该小区,绘制了不同区位的“本地化速度”:

大数据告诉你谁是统治上海的人?

  可以看到,上海市的本地化呈现出非常明显的外热内冷趋势。
  在距离市中心20公里之外的郊区,尽管本地人口比例已经比较高,但本地人口的购买比例还要更高,导致这些地区会变得越发“本地化”。而越往市中心,则是“去本地化”的趋势越显著。
  从这点看,上海话从内环离开,逐步走向外环的趋势还会继续进行。
  既然原本的人口分布无法解释,那么上海话走向外环的情况到底为何会出现呢?

  不同年龄的购房行为可能是另一个分析入口。我们根据上海市分年龄的本地人口和外来人口总数,可以计算出各年龄本地人口和外地人口的购房概率,再计算两者的比值,公式如下:

大数据告诉你谁是统治上海的人?

  j表示每个年龄的上海人口比起外来人口来说买房的概率高多少。

  下图显示了不同年龄的上海人相比外来人口的购房强度。

大数据告诉你谁是统治上海的人?

  在18到25岁,上海市人口的购房概率要大于外来人口。尤其是对一个正在大学就读或者刚刚本科毕业的上海学生来说,他购房的概率要比同年龄的外来人口高出3至4倍。
  这样的概率在26岁发生了逆转。从26岁开始,每个年龄的外来人口购房概率都要大于本地人口了。这也许是因为上海青年的父母往往早就为自己的孩子准备好了房子,而外来人口购房需要数年的积累,在外来人口开始购房时,上海本地人口由于早已有房,购房的概率反而下降了。
  上海人口和外来人口不同的购房模式其实反映出的是两种行为模式。
  对于上海人口来说,早些为子女备下婚房是一件很重要的事,提前买好,也可以避免许多结婚时可能的麻烦。
  而对外来人口来说,如果没有改善性的换房,白手起家为自己购买婚房几乎完全不可能。
  在这种背景下,一个很容易想到的猜测是:上海人口的买房可能会更加考虑家庭生活,要求婚房一步到位;而外来人口购房更多地会考虑工作——先买一套小房子,住起来再说,反正是不可能一步到位的。(再次强调,本文的本地与外地的区别是指出生地而非户籍所在地。)

  根据以上假设,画出分年龄的上海人口和外来人口的购房面积情况。从下图显示,无论在哪个年龄,上海市人口的购房面积总是要大于外来人口,体现出上海人口购房时的“一步到位”意愿。

大数据告诉你谁是统治上海的人?

  另一方面,我们又能画出分年龄的上海人口和外来人口的购房地段情况。可以看到,不管哪个年龄,上海人口购房总是要比外来人口购房距离市中心更远一些。

  将上两幅图联系在一起,我们可以得到一个很直接的结论:

大数据告诉你谁是统治上海的人?

  由于对“一步到位”的要求,上海人口购房更加注重房屋的面积,因而在预算有限的情况下牺牲了地段,购买了距离市中心更远的房子。
  而外来人口没有可能一步到位,只好选择首先购买面积较小的单身公寓,但这也使他们有机会选择更加靠近市中心的房子。
  这两个趋势的结合,便使得市中心的普通话越来越流行,上海话渐渐地向外继续迁移了。
  有人可能要感到奇怪,上海人口明明具有更好的先天家庭条件,而且更容易“啃老”,为什么就逐渐远离市中心了呢?
  要记住的是,前往市郊,并不一定是坏事。
  对于外来人口来说,他们选择了离公司更近,方便打拼,放弃的是像上海人口那样早早买好大户型婚房的机会。根据2010年的CFPS数据,一个在上海念完大学的外地学生,比起同等状态的上海本地学生来说,结婚年龄平均要晚2.7岁。
  这近2.7年的时间,大概就是外来人口在上海扎根,向市中心迁移所付出的代价。