首页 资讯 财经 汽车 关注 科技 房产 图片 全国 视频

数据

旗下栏目: 业内 数据 数码 手机

关于大数据,你不知道的几点

来源:新闻门户     作者:华夏门户     浏览:次     发布时间:2020-08-28
摘要:你的组织是否在思量阐明数据的最佳方法?以下是在你回收大数据阐明之前,需要留意的有关大数据的6个误区。……

云计较的应用,更快的数据处理惩罚速度,以及从物联网输入大量的数据,这些意味着,企业此刻正在收集前所未见的数据量。此刻大数据比以往任何时候都大。可是如何组织、处理惩罚和领略数据仍然是很多组织面对的一个主要挑战。

你的公司是否仍然在尽力领略大数据是什么,以及如何打点吗?这里有6个关于大数据的误区,行业专家将辅佐你把真相从虚构的大数据规模中疏散出来。

1.大数据意味着“许多”数据

今朝,大数据已经成为一个风行词。但人们凡是对它真正的寄义照旧不清楚。有些人将大数据简朴地认为是大量的数据。可是,这并不完全正确,它比这稍微巨大一些。大数据是指一个数据集,无论是布局(如数据表)或非布局化(如元数据从电子邮件)团结的数据,如社会媒体阐明或物联网数据,形成一个更大的故事。大数据故事说明组织很难用传统的阐明技能来捕捉产生的趋势。

丰田研究院的数据研究总监吉姆•阿德勒表达了一个很好的概念:“数据也有质量。这就像水一样:玻璃容器中的水长短常易于打点。可是,假如稠浊在大水中,这将是压倒性的灾害。”他说,“在数据阐明系统中,事情在一台呆板的的数据将被冲走时,其数据局限将增长100或1000倍。所以,虽然,原型虽小,但其架构却很大。”

2.数据需要洁净

“最大的误区就是你必需要有清洁的数据举办阐明。”BeyondCore公司首席执行官阿里吉特•森古普塔说,“没有人有清洁的数据,必需将数据举办清理,不然阐明是行不通的。这是一个猖獗的想法。你要做的就是举办一个足够好的阐明。你要阐明所有的数据,尽量这些数据是肮脏的,这只说明你有数据质量问题。我可以汇报你一些模式,尽量数据存在质量问题,但完全可以举办正常阐明。此刻,你可以会合举办数据质量事情,只是提高数据可以获得稍微好一点的洞察力。”

InOutsource贸易智能和阐明总监梅根•布茨梅因对此暗示附和,“许多时候,企业就会将这些事情能拖就拖,因为他们认为数据是不清洁的,这是没有须要的。陈设的阐明应用措施将可以找到数据的单薄环节,”她说。“一旦这些问题已经确定,清理打算可以投入到位。然后,阐明应用措施可以操作一种机制,加大清理力度,并监测希望环境。”

布茨梅因说。“一旦你把这些数据整合在一起,你将在一个应用措施中赋予它生命的视觉,你可以看到这些搜集在一起的数据的关联,你会很快看到你的资料不敷。”她说,“你可以看到数据的问题在于要提供一个清理数据的基准。”

3.期待,让你的数据完美

你不该该期待清理你的数据,这里尚有一个原因,森古普塔说,“在你完全排除数据之后,这大概需要三个月的时间,然而三个月后,这些数据已经陈旧过期了。”因此,这些信息将不再合用。

森古普塔暗示,第一州际银行的乔希•巴特曼在集会会议提出了一个重要概念。乔希展示了他是如何运行阐明,发明问题,阐明变革,从头运行阐明的。他说,“你看,我的阐明时间只有约莫四到五分钟。所以,假如我可以运行阐明,发明问题,办理问题,再从头举办阐明,并在四、五分钟后查察陈诉,改变如那里理惩罚阐明的要领。”

森古普塔用编码来比喻那些旧方法。“我的一切都是正确的,然后我举办编码。但此刻,每小我私家举办编码都不太机动。”他说。“你写好措施之后,你必需要测试它,并查察如何能使它更好,那么等它变得更好之后。世界产生了变革,人们仍然回收的是旧的干事要领。”

4.数据湖

数据湖是持有大量的原始布局化和布局化数据的松散的存储库,常常在大数据的配景下提到。

独一的问题是,尽量他们是如何常常被引用,但它们却不存在,阿德勒说,“一个组织的数据不被倒入一个数据湖中。这是经心筹谋的一个部分的数据库。勉励会合利用专业常识。他们还提供了精采的数据管理和合规性所需的问责性和透明度。”

5.阐明数据是昂贵的

假如假定在数据阐明东西涉及一些用度的话,你大概会畏惧得到数据。而可以汇报你的有好动静是,如今有很多免费的数据东西,任何人都可以开始利用这些东西来阐明大数据。

同时,森古普塔暗示,当今云计较的低本钱意味着“你真的可以做那些以前从来不行能实现的的工作。”

6.呆板算法将代替人类阐明

责任编辑:华夏门户

热点新闻资讯

首页 | 资讯 | 关注 | 科技 | 财经 | 汽车 | 房产 | 图片 | 视频 | 全国

Copyright © www.msgkpx.com 北京新闻网 版权所有 粤icp备10021497号-9

电脑版 | 移动版