|
据外媒报道,希拉里在大选投票开始前曾一路领先,在各类统计数据上她都力压特朗普,大大都人坚信她会成为美国首任女总统。不外功效各人也知道,希拉里输了。于是人们开始怪罪数据,以为它们并非万能。
不外,其实希拉里的败选并非数据之错,真正出问题的是预测和阐明,而这两项任务是人类来主导的。数据照旧谁人数据,但阐明的人却缺乏深度。 大数据之辩 关于这次大选预测和阐明失误的争论一般都会合在两点:1.民调方法是否堕落;2.民调数据未能反应社会真实状况。 确实,很多民调都低估了特朗普支持者的实力。上周二的大选也成了民调行业的又一个黑汗青,此前它们就因为预测错误而广遭质疑,同时,它们还面对着数个布局性困难。不外,民调的本意并非用来预测,它们只是盛满数据点浩瀚篮子中的一个。 本次大选功效跌破眼镜的主要原因是我们未能跳出民调的牢笼并找出晋升政治预测精确度的数据集,而这将成为情绪颠簸时代预测大选的要害。 数据的精确度并未低落,只是我们必需以创新的目光对待它。 就拿数据阐明公司Predata来说,它们就换了个方法来领略数据。鉴于路边采访的民调逐渐向互联网转变,该公司专门开拓了收罗网民民意变革信号的要领,为了收集这些信号,该公司天天都要阐明成千上万个数据点。 人类的失误,非大数据之过 在希拉里必胜新闻的刺激下,阐明师错估了形势,忽视了特朗普在佛罗里达和其他摇摆州的庞大领先优势。这不是数据之错,而是人之失误。 所有的数据集和数据预测模子,纵然是那些依靠人工智能来阐明的预测,从必然水平上来说,城市带有它们缔造者的成见。因此,无论是民调照旧预测,都带有极强的主观性。收集数据、处理惩罚数据、理会数据的进程是大数据阐明的必由之路,我们需要分明的是这些数据到底能汇报我们什么,分明它的潜力和极限并学会在差异配景下如何准确的对其举办阐明。 弥合极客与诗人间的鸿沟 在大选上,极客(即数据科学家)与诗人(新闻报道者)之间存在庞大的文化差别,上周二的大选功效也显示,两者都无法独有真理。假如想在纷繁的数据中去伪存真,就必需将两者的概念团结起来。 也就是说,想要正确预测大选,我们不单要把握第一手数据,还得重视各类概念犀利的报道,这样才气将数据与现实相团结,得出两者之间的交集。 在大数据的海洋中,人类依然是一叶扁舟,大选预测的毛病并不是我们放弃这一科学要领的来由。相反,这次荆棘是让我们时刻保持谦虚,在失败中生长的催化剂。只有借助机动的思想和对极限的认识,我们才气让大数据阐明重回正轨。 |















