我们生活在一个数据无处不在的时代,用数据说话成为常态。然而,数据可以帮你了解事实,数据也会说谎。曾任过英国首相的Benjamin Disraeli有一句经典名言:世界上有三种谎言:谎言、该死的谎言和统计。在我们津津乐道于手上有多少数据时,在我们不断接受各种他人呈现的数据信息时,不妨先回到源头,回答一个最基础的问题,这个数据是否可信?
数据是否可信的问题实际上就是数据质量评估,评估的方法非常多,也没有一个放之四海而皆准的方法或准则,数据评估是一个需要理论、方法、经验和数据的综合过程。这里推出本科生的一篇文章,是基于《数据质量评估方法》课程写成的部分成果,当媒体充斥着博人眼球的标题“高危职业!8个月内獐子岛任命第4任财务总监”,这篇文章从一个专业视角介绍了如何用卫星数据揭穿獐子岛“扇贝失踪”的谎言。
本文来自微信公众号:严肃的人口学八卦(ID:renkou8gua),作者:沈小杰,题图来自:IC photo
6月24日,证监会官网发布消息称,证监会近日依法对獐子岛公司信息披露违法违规案作出行政处罚及市场禁入决定——网友们惊呼时隔六年的“扇贝迷案”终于破案了。
而这背后的破案功臣之一想必大家都已经了解到是我国最新的北斗导航定位系统,利用这一系统提供的卫星数据,证监会最终揭开獐子岛财务造假手段的谜题,这一期小编就带大家走进破案过程,感受用卫星数据“办案”的魅力!
扇贝谜团背后的数据评估难题
獐子岛的扇贝谜团源于2014年,当年獐子岛宣布前三个季度盈利,但是没过多久便说早遇到几十年一遇的“冷水团”,导致扇贝跑没了,所以最终前三个季度财报变成亏损8亿。同样的戏码在2015年、2017~2019年继续上演……
獐子岛的扇贝失踪已经成为“人尽皆知”的谎言,甚至獐子岛自己都知道人们知道它的谎言,可是这个谎言始终没办法揭穿,因为海底到底是个什么情况,我们没法知道,只能是獐子岛自己说了算。
这一谜团背后实际上反映了生物资产数据的计量与评估难题。首先,海洋生物的库存难以用肉眼观测,生物的捕捞难以进行追溯。如果要进行查证,一个传统的做法便是对数百万亩海洋生物的底播、捕捞进行查证,这似乎是一项不可能完成的工作。这些困境实际上让生物养殖的企业有了隐蔽的造假手段,在资产申报方面也有了很强的话语权,对于那些明目张胆的谎言也大可“否认三连”。
北斗卫星如何大显身手
对生物资产数据进行评估的传统方法大多数是以“数”论“数”,也就是要想方设法数清楚到底有多少资产。而北斗导航系统提供的卫星数据则给这类数据评估提供了一个新思路,在对獐子岛财务数据进行评估的过程中,北斗导航系统提供的最核心的数据是扇贝采捕船只的导航定位信息。
证监会委托外部机构使用了獐子岛捕捞船只27万条定位信息,还原了獐子岛公司真实的捕捞区域。利用定位信息还原轨迹的过程可以简单类比为我们平时在运动软件里跑步时记录跑步轨迹的过程,我们在运动过程中形成的轨迹实际上便是由导航系统记录下的一个个点位数据构成,而当点位数据足够多的时候我们便可以还原一个完整轨迹。
下面的图1红色区域代表獐子岛记录的捕捞区域,而蓝色区域则是调查人员还原的船只运动轨迹,可以很明显地看出獐子岛的采捕海域记录有误,这类造假使得獐子岛可以记录更少成本、营业外支出等等。而调查人员也发现獐子岛声称的120个抽测点位实际上有50%的数据是凭空捏造的(如图2所示),再一次说明獐子岛公司资产盘点十分混乱,企图掩盖真实的财务状况。
图1
图2
看到这里,不由得为北斗导航系统和外部调查机构点赞!这一数据评估的思路总体来看是用外部来源数据对内部数据进行溯源与评估,这里的“溯源”跳出了传统审计方法的思路,并非查验扇贝最初的养殖过程,而是对采捕船只的活动进行溯源,从而间接估计真实的养殖与捕捞情况。
而整个评估过程外部数据的选用也颇有新意,让人感受到“跨界”的卫星数据的强大。对于用外部数据进行评估的例子,我们容易想到在对人口普查中的出生数据进行评估的时候会使用教育数据、公安数据,他们的共同点都是用一种数据中的人数去评估另一种数据的人数是否准确,内部和外部数据记录的数据类型是一致的。但是獐子岛数据的评估选用了看似毫不相关的导航定位数据用来评估了资产数据的准确性,从定位坐标得到经营实况,真是让人直呼“有才华”!
扇贝谜团背后的数据评估难题
卫星导航系统最大的优势是它有“千里眼”,可以很好地用于数据的溯源追踪和数据预测。对于数据的溯源,就是我们在这里介绍的獐子岛案例,根据船只的定位数据调查人员最终“回到过去”,弄清楚船只到底去了哪。而对于数据的预测,更多地可以用于农业领域,比如我国每年就会通过对粮食产区的遥感数据来预测粮食收成等等。
那么,卫星数据是否就是万能的呢?当然不是!卫星“站得高、望得远”虽然是优势,但是也给它带来了不足。卫星数据只能记录在较大空间尺度上产生的数据,比如獐子岛那苍茫的海域……对企业内部数据的评估可就束手无策了,毕竟卫星不是X光,看得到外表,看不透内心啊!
此外,用卫星数据进行数据评估与数据决策也要注意虚假相关的风险,毕竟从“所见”到“事实”还有相当长的距离!獐子岛数据的评估之所以成功,是因为从船只航行的轨迹就能反映企业的捕捞活动,也能直接佐证企业的抽测活动,因此这是可行的。
但是前段时间,我们也见证了误用卫星数据的典型案例,某些研究者用卫星记录的医院停车场的图片来推断新冠肺炎出现的时间,不仅忽略医院本身的属性,也忽略了从医院停车场车辆变化可以反映的多种事实,他们强拉因果的研究简直让全网哗然。
因此,小编最后再唠叨一句:卫星数据虽然可以大显神通,但是当我们真的要用卫星数据来评估其他数据时,一定要三思而行,不仅要明白卫星数据可以提供给我们什么,更要明白我们利用卫星数据得出的结论是否是一个合理的因果关系,不然可就错付了卫星数据呀!
图片来源:中国北斗卫星导航系统企鹅号、央视视频等
责任编辑:靳永爱 中国人民大学社会与人口学院讲师
图文编辑:庄溪瑞 中国人民大学社会与人口学院研究生
本文来自微信公众号:严肃的人口学八卦(ID:renkou8gua),作者:沈小杰