|
大数据的呈现带来了很多新的术语,但这些术语往往较量难以领略。因此,我们通过本文给出一个常用的大数据术语表,抛砖引玉,供各人深入相识。个中部门界说参考了相应的博客文章。虽然,这份术语表并没有100%包括所有的术语,假如你认为有任何漏掉之处,请奉告我们。 A 聚合(Aggregation) – 搜索、归并、显示数据的进程 算法(Algorithms) – 可以完成某种数据阐明的数学公式 阐明法(Analytics) – 用于发明数据的内涵涵义 异常检测(Anomaly detection) – 在数据会合搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来暗示异常的词有以下几种:outliers, exceptions, surprises, contaminants.他们凡是可提供要害的可执行信息 匿名化(Anonymization) – 使数据匿名,即移除所有与小我私家隐私相关的数据 应用(Application) – 实现某种特定成果的计较机软件 人工智能(Artificial Intelligence) – 研发智能呆板和智能软件,这些智能设备可以或许感知方圆的情况,并按照要求作出相应的回响,甚至能自我进修 B 行为阐明法(Behavioural Analytics) – 这种阐明法是按照用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门阐明学科,它着眼于数据中的人性化模式 大数据科学家(Big Data Scientist) – 可以或许设计大数据算法使得大数据变得有用的人 大数据创业公司(Big data startup) – 指研发最新大数据技能的新兴公司 生物测定术(Biometrics) – 按照小我私家的特征举办身份识别 B字节 (BB: Brontobytes) – 约便是1000 YB(Yottabytes),相当于将来数字化宇宙的巨细。1 B字节包括了27个0! 贸易智能(Business Intelligence) – 是一系列理论、要领学和进程,使得数据更容易被领略 C 分类阐明(Classification analysis) – 从数据中得到重要的相关性信息的系统化进程; 这类数据也被称为元数据(meta data),是描写数据的数据 云计较(Cloud computing) – 构建在网络上的漫衍式计较系统,数据是存储于机房外的(即云端) 聚类阐明(Clustering analysis) – 它是将相似的工具聚合在一起,每类相似的工具组合成一个聚类(也叫作簇)的进程。这种阐明要领的目标在于阐明数据间的差别和相似性 冷数据存储(Cold data storage) – 在低功耗处事器上存储那些险些不被利用的旧数据。但这些数据检索起来将会很耗时 比拟阐明(Comparative analysis) – 在很是大的数据会合举办模式匹配时,举办一步步的比拟和计较进程获得阐明功效 巨大布局的数据(Complex structured data) – 由两个或多个巨大而彼此关联部门构成的数据,这类数据不能简朴地由布局化查询语言或东西(SQL)理会 计较机发生的数据(Computer generated data) – 如日志文件这类由计较机生成的数据 并发(Concurrency) – 同时执行多个任务或运行多个历程 相关性阐明(Correlation analysis) – 是一种数据阐明要领,用于阐明变量之间是否存在正相关,可能负相关 客户干系打点(CRM: Customer Relationship Management) – 用于打点销售、业务进程的一种技能,大数据将影响公司的客户干系打点的计策 D 仪表板(Dashboard) – 利用算法阐明数据,并将功效用图表方法显示于仪表板中 数据聚合东西(Data aggregation tools) – 将分手于众大都据源的数据转化成一个全新数据源的进程 数据阐明师(Data analyst) – 从事数据阐明、建模、清理、处理惩罚的专业人员 数据库(Database) – 一个以某种特定的技能来存储数据荟萃的客栈 数据库即处事(Database-as-a-Service) – 陈设在云端的数据库,即用即付,譬喻亚马逊云处事(AWS: Amazon Web Services) 数据库打点系统(DBMS: Database Management System) – 收集、存储数据,并提供数据的会见 数据中心(Data centre) – 一个实体所在,安排了用来存储数据的处事器 数据清洗(Data cleansing) – 对数据举办从头审查和校验的进程,目标在于删除反复信息、更正存在的错误,并提供数据一致性 数据打点员(Data custodian) – 认真维护数据存储所需技能情况的专业技能人员 数据道德准则(Data ethical guidelines) – 这些准则有助于组织机构使其数据透明化,担保数据的简捷、安详及隐私 数据订阅(Data feed) – 一种数据流,譬喻Twitter订阅和RSS 数据集市(Data marketplace) – 举办数据集交易的在线生意业务场合 数据挖掘(Data mining) – 从数据会合掘客特定模式或信息的进程 数据建模(Data modelling) – 利用数据建模技能来阐明数据工具,以此洞悉数据的内涵涵义 数据集(Data set) – 大量数据的荟萃 |














