管清友:评估新冠疫情带来的风险变数

意见领袖 | 发布于2021-08-22

本文来自微信公众号“清友会”,贝壳投研经授权发布。

本文是沈阳教授在2020年接受南方都市报专访文章,其中观点迄今仍有指导意义,故将本文进行分享。沈阳教授在2020年表示:我们对预测的持续研究,已逐步形成了一套方法论,预测某些事情已经比较准确。预防方法名称为基于网络公开数据的风险弱信号发现与预测。这一新兴研究领域已初露锋芒,沈阳教授在2020年对北京第二轮疫情的影响天数和感染人数都做出了较为精确的预判。但他也坦言,相关研究刚刚起步,尚不能实现100%准确预测,未来还需进一步优化效率和准确度,并尝试从人工为主过渡到电脑为主的阶段。究竟如何实现“风险弱信号发现与预测”?这项研究在新冠疫情中表现如何?沈阳教授向南都记者表示,新冠疫情既是一场“指数级危机”,也加速了诸多危机的到来,促使种种矛盾爆发。

他认为,传统上的事件线性发展规律,在新冠疫情的背景下不完全适用了。要把疫情带来的变量加入到预测模型当中,这样才能对未来有比较有效的判断。2021年8月22日(周日晚)19:30沈阳教授受邀将在清友会企业家俱乐部作疫情对经济社会影响主题分享,参与方式见文末。如何做“预测帝”?关注事物的内在风险逻辑,而非紧跟新闻报道南都:你所做的预测和传统的舆情监测有什么区别?沈阳:传统的舆情监测更多关注重大舆情,我们所说的风险弱信号有点像小微舆情。在研究范式上还是有区别的。在我看来,小微舆情、线索性的选题、风险弱信号三者之间是高度重叠的。我们团队有一个弱信号发现组,专门收集老百姓在民生服务方面的吐槽,直接反馈给省内的相关领导做出改善。假设市民去办事大厅办证,结果遇到工作人员消极怠工,他在网上吐槽了这件事。实际上,他发在网上后我们就能看到,这相当于“民生服务弱信号”,通过发现这些不良现象的信号,反馈给有关部门改进,营商环境就能越变越好。南都:当预测一件事物时,你们如何选取切入角度?沈阳:我们分析了江西九江昌洲乡和广西河池龙岩乡的水灾情况。

一个地方玩抖音的人越多,展现出的灾情就越详细。我们通过看朋友圈、微博等渠道,发现水灾中的细节,比较两地的情况。我们关注一件事,不是通过媒体报道的方向,而是会根据救灾的逻辑去跟进,关注事物内在的风险逻辑。昌洲乡决堤之后水淹进来了,我们就比较在意父老乡亲们有没有得到及时救助。我们从短视频上看到,他们一部分人被安置在一个中学里,还有人做心理辅导工作。由此,我们会主动对比两个地区的数据,比如这个地区有5条关于安置点的视频,另一个地区可能没有这么这么多。这可能意味着另一个地区在这方面工作上出问题的概率会更高。南都:你提到了很多具体的分析框架,这些框架需要先由有经验的研究者提出吗?预测的准确度如何?沈阳:目前这个阶段还必须是人工为主,我们还没跨越到机器为主的阶段。从我们的角度看,“风险弱信号的发现和预测”还处在研究早期,需要不断努力。我们对一部分项目做了预测准确度评估,更多的项目还没做评估。

南都:随着研究者意识到可能存在更多的变量,将其加入模型后,最终结果也将是一个不断进化的过程。沈阳:对。我们在研究当中有一系列方法分析哪些变量比较重要,再把决定性的变量保留下来。在这个基础上,再做进一步优化。做预测最好玩的地方在哪?你可以对明天做一个预测,如果这件事明天没有发生,你当时就能看到预测的对错。自然或者社会当中一定会发生的事,是不以人的意志为转移的。如果预测的不准,一定是模型里哪些要素考虑不对,第二天就可以做调整。新冠疫情加速了各种事物的变化,过去还需要很长的观测周期,现在可能隔几天就会看到结果。02从1亿网络数据找到风险:不提倡使用内部数据,要有挖掘公开数据的能力南都:要发现风险弱信号并实现预测,需要哪些数据支撑?是否需要政府或企业的内部数据?

沈阳:我们对风险的判断,全部是基于公开数据,包括微博、微信、网页、客户端、论坛、贴吧、短视频等。我们团队一贯提倡使用网络公开数据做发现、预测、预警。我们不提倡使用内部数据,这既会涉及到一系列管理规定,同时内部数据也会存在失真。其实,我们做国际分析的时候,也只能拿到外部数据,这就需要有网络公开数据的挖掘和分析能力。目前,我们团队每天的数据量超过1亿多条。当然,这个数据量也意味着价值密度不高。比如,我们要预测一支股票的走势,但贴吧里有大量从事商业推广的水军在灌水,这部分是不能作为预测工具的,或者权重占比要非常低。南都:有一个比较现实的问题,全世界能接触网络、有网络使用习惯并会公开发表言论的人还是少数。这种情况下,基于公开数据做推断,有没有可能出现偏差?沈阳:传统上做分析和预测,大多基于抽样调查。但从目前情况看,抽样调查的方法其准确性有时候也是要打问号的。未来可能要将小数据调查和大数分析结合起来。确实,大部分人是不说话的。但我们也可以建模,根据喧哗的少数来推测沉默的大多数。有一些科学模型可以推测他们的逻辑,他们的想法是什么。随着技术手段增强,大家使用社交网络的时间越来越长,推测沉默大多数的能力也会越来越强。

飞鲸投研从多维度分析,整理了一份《成长50》的名单,可以关注同名公众号:"飞鲸投研":feijingtouyan,进行领取(点击复制)

该文观点仅代表作者本人,飞鲸投研系信息发布平台

/阅读下一篇/

股市中的反复异动是指什么?

热门推荐