|
云计较的应用,更快的数据处理惩罚速度,以及从物联网输入大量的数据,这些意味着,企业此刻正在收集前所未见的数据量。此刻大数据比以往任何时候都大。可是如何组织、处理惩罚和领略数据仍然是很多组织面对的一个主要挑战。 你的公司是否仍然在尽力领略大数据是什么,以及如何打点吗?这里有6个关于大数据的误区,行业专家将辅佐你把真相从虚构的大数据规模中疏散出来。 1.大数据意味着“许多”数据 今朝,大数据已经成为一个风行词。但人们凡是对它真正的寄义照旧不清楚。有些人将大数据简朴地认为是大量的数据。可是,这并不完全正确,它比这稍微巨大一些。大数据是指一个数据集,无论是布局(如数据表)或非布局化(如元数据从电子邮件)团结的数据,如社会媒体阐明或物联网数据,形成一个更大的故事。大数据故事说明组织很难用传统的阐明技能来捕捉产生的趋势。 丰田研究院的数据研究总监吉姆•阿德勒表达了一个很好的概念:“数据也有质量。这就像水一样:玻璃容器中的水长短常易于打点。可是,假如稠浊在大水中,这将是压倒性的灾害。”他说,“在数据阐明系统中,事情在一台呆板的的数据将被冲走时,其数据局限将增长100或1000倍。所以,虽然,原型虽小,但其架构却很大。” 2.数据需要洁净 “最大的误区就是你必需要有清洁的数据举办阐明。”BeyondCore公司首席执行官阿里吉特•森古普塔说,“没有人有清洁的数据,必需将数据举办清理,不然阐明是行不通的。这是一个猖獗的想法。你要做的就是举办一个足够好的阐明。你要阐明所有的数据,尽量这些数据是肮脏的,这只说明你有数据质量问题。我可以汇报你一些模式,尽量数据存在质量问题,但完全可以举办正常阐明。此刻,你可以会合举办数据质量事情,只是提高数据可以获得稍微好一点的洞察力。” InOutsource贸易智能和阐明总监梅根•布茨梅因对此暗示附和,“许多时候,企业就会将这些事情能拖就拖,因为他们认为数据是不清洁的,这是没有须要的。陈设的阐明应用措施将可以找到数据的单薄环节,”她说。“一旦这些问题已经确定,清理打算可以投入到位。然后,阐明应用措施可以操作一种机制,加大清理力度,并监测希望环境。” 布茨梅因说。“一旦你把这些数据整合在一起,你将在一个应用措施中赋予它生命的视觉,你可以看到这些搜集在一起的数据的关联,你会很快看到你的资料不敷。”她说,“你可以看到数据的问题在于要提供一个清理数据的基准。” 3.期待,让你的数据完美 你不该该期待清理你的数据,这里尚有一个原因,森古普塔说,“在你完全排除数据之后,这大概需要三个月的时间,然而三个月后,这些数据已经陈旧过期了。”因此,这些信息将不再合用。 森古普塔暗示,第一州际银行的乔希•巴特曼在集会会议提出了一个重要概念。乔希展示了他是如何运行阐明,发明问题,阐明变革,从头运行阐明的。他说,“你看,我的阐明时间只有约莫四到五分钟。所以,假如我可以运行阐明,发明问题,办理问题,再从头举办阐明,并在四、五分钟后查察陈诉,改变如那里理惩罚阐明的要领。” 森古普塔用编码来比喻那些旧方法。“我的一切都是正确的,然后我举办编码。但此刻,每小我私家举办编码都不太机动。”他说。“你写好措施之后,你必需要测试它,并查察如何能使它更好,那么等它变得更好之后。世界产生了变革,人们仍然回收的是旧的干事要领。” 4.数据湖 数据湖是持有大量的原始布局化和布局化数据的松散的存储库,常常在大数据的配景下提到。 独一的问题是,尽量他们是如何常常被引用,但它们却不存在,阿德勒说,“一个组织的数据不被倒入一个数据湖中。这是经心筹谋的一个部分的数据库。勉励会合利用专业常识。他们还提供了精采的数据管理和合规性所需的问责性和透明度。” 5.阐明数据是昂贵的 假如假定在数据阐明东西涉及一些用度的话,你大概会畏惧得到数据。而可以汇报你的有好动静是,如今有很多免费的数据东西,任何人都可以开始利用这些东西来阐明大数据。 同时,森古普塔暗示,当今云计较的低本钱意味着“你真的可以做那些以前从来不行能实现的的工作。” 6.呆板算法将代替人类阐明 |














