|
如今,当组织需要从数据中得到一些看法时,他们首先倾向于寻找数据科学家的辅佐。但这真的是一个更好的选择吗?人们需要相识数据科学家和数据阐明师的脚色有何差异,以及为什么但愿聘用数据阐明师。 聘用数据科学家照旧数据阐明师 那么,数据科学家和数据阐明师之间的区别是什么?这些脚色的界说大概有所差异,但凡是认为数据科学家团结了三个要害学科的常识——数据阐明、统计、呆板进修。呆板进修涉及到数据阐明的进程,以进修和生成阐明模子,这些模子可以对看不见的数据执行智能操纵,而且工钱过问最少。有了这样的期望,很明明具有这三方面技术的数据科学家也越来越受到企业的青睐。 可是,数据科学家在这三个方面的表示都是完美的吗?更重要的是,所有这些脚色都需要雷同的技术吗?可能说数据阐明师和呆板进修工程师利用的技术和要领是完全差异的吗? 事实上,这些专家的要领确实有很大差异。谷歌公司首席决定科学家Cassie Kozyrkov对这种差别提供了一个精粹的表明。她声称,组织的数据阐明师是为了提供快速的功效,譬喻阐明数据中有趣的相关性。 为了满意决定者对快速和简短谜底的期望,数据阐明师利用相应的编码气势气魄——利用更少的代码行,并为打点者生成易于领略的相关矩阵。呆板进修工程师有一个完全差异的编码气势气魄,他们的方针是成立一个完美的模子,这凡是需要许多时间。 统计学家也无法提供快速功效,他们会说,“等等,我们无法从这些数据中得出任何因果干系。我们甚至不知道其功效是否具有统计意义!”是的,有时组织需要擅长统计数据的统计学家或数据科学家来答复这类问题。可是真的需要知道这些谜底才气相识数据中的相关性吗? 实际上没有。在得到数据阐明师的劈头功效后,组织应礼聘规模专家,他们可以抉择哪些已识此外模式对业务确实很重要,值得进一法式查。人们大概已经看到数据阐明师在某些环境下比数据科学家更令人满足。但此刻需要澄清数据阐明师应该具备哪些技术来满意决定者的需求,并成为组织的资产。 组织真正需要什么样的数据阐明师? 数据阐明师在组织中的主要浸染是通过识别数据中有趣且重要的模式,并提供埋没在大量表格、图表和日志文件中的快速谜底来辅佐决定者。简而言之,假如规模专家发明这些规模很重要,数据阐明师会确定统计人员和呆板进修工程师需要留意的规模。 因此,人们但愿在数据阐明师中看到以下品质: 报告数据故事:优秀的数据阐明师可以阅读数据,并环绕数据报告故事。数据专家从不逾越数据,老是提供多种大概的表明。 譬喻,他们可以说:“我们在Facebook上推出一个告白勾当后,我们好像得到了更多的潜在客户。这大概是关于此勾当有效性的信号,但潜在客户数量的增长也大概是由季候性变革引起的。需要举办更深入的阐明。” 数据可视化技术:建设具有视觉吸引力、具有意义、易于表明的图形的本领对数据阐明师也很是重要。其故事老是受益于精彩的可视化,这使得决定者的事情变得越发容易。 技能专长:专业数据阐明师可以利用电子表格为组织提供埋没在数据中的洞察力。可是,为了提供快速的功效,并建设专业的可视化,数据阐明师凡是需要电子表格之外的技能专业常识。 因此,人们期望数据阐明师熟悉Python编程语言,并纯熟利用Tableau或Microsoft Power BI等东西。 针对速度优化的编码样式:组织不需要数据阐明师具有与软件工程师或呆板进修工程师沟通的编程技术。数据阐明师应该知道如何利用Python清理数据,如何执行数据阐明,以及如何利用清晰的可视化和表格来泛起信息。 网上有一些很好的课程可以培训这些技术。另外,数据阐明师应该熟悉为数据阐明建设的风行的数据包,并利用这些数据包以最有效的方法阐明数据。 规模专业常识:并非所有公司都需要数据阐明师的规模专业常识,但这绝对是专业数据阐明师的一项要害优势技术。换句话说,假如有人想成为好的数据阐明师,他们应该熟悉某个规模。这种技术将辅佐他们区分对业务真正重要的模式和不值得数据专家和决定者耗费时间的发明。 既然人们知道什么样的数据阐明师可以成为组织的名贵资产,那么总结一下人们对优秀数据阐明师的期望,以及为什么每个组织都需要这样的专家。 每个公司都需要数据阐明师 假如组织的打点者做出数据驱动的决定,那么该组织必定需要数据阐明师。组织但愿招募具有上述技术的优秀专家,他们可以: |














