在12月2日火山引擎举行的"新云·共未来"发布会上,火山引擎数据产品负责人郭东东现场进行了题为“云+数据:敏捷数智引擎”的主题分享。郭东东表示,字节跳动的数据产品,基于抖音、今日头条,以及电商、教育、游戏等不同流量型业务沉淀,打磨而来,在To B角度,火山引擎有能力支持更多客户、更多复杂场景。 数据驱动增长、全链路数据体系构建能力,是火山引擎数据产品核心引擎的两个核心理念。火山引擎的数据产品沉淀了端到端数据全链路的技术解决能力,包括数据源、数据集成、数据应用等,覆盖了数据全生命周期各个环节的需求。同时,为了更好地帮助企业客户使用数据,火山引擎构建了一站式数据治理体系,以及全链路数据开发体系,保证数据的质量和安全、可靠。 与很多传统建设数据体系的理念不同,火山引擎数据产品的核心是应用驱动中台,本质来说是自上而下推动数据体系的建设,更多从业务场景出发,推动数据应用层工具建设,再拉动数据中台、数据工具、数据治理体系的沉淀。 此次发布的数据产品,都在实际使用中经历了检验和打磨。如2012-2014年之前,字节跳动内部就开始投入A/B测试,帮助业务决策。而Bytehouse,则基于字节跳动越来越大的业务数据量,以及对数据洞察分析越来越大的需求。 现场展示了火山引擎数据产品能力的全景图,分为SaaS、PaaS、IaaS三个层次。 SaaS主要是应用产品,让客户更好使用数据,如A/B测试产品、增长营销平台GMP等。PaaS层的核心价值是数据中台能力,价值在于提效数据开发,沉淀数据资产,落地数据治理体系,让数据建设更加体系化、流程化。 发布会上,火山引擎发布的四大核心数据产品,则全部集中的PaaS层,包括大数据治理开发套件DataLeep、极速OLAP引擎Bytehouse云数仓版、湖仓一体分析服务LAS、开源Hadoop生态企业级大数据分析系统EMR。 大数据治理开发套件DataLeap,可以帮助客户提效数据开发,沉淀数据资产,落地数据治理体系。火山引擎提供数据治理的核心点,赋能业务方自治,可以帮助客户更快识别数据体系中存在的问题。规范数据体系。 极速OLAP引擎Bytehouse基于云原生架构,其核心定位是通过数据加速层,帮助客户更灵活、便捷获取数据。通过实践环境中的沉淀打磨,Bytehouse已可以实现低时延分析、PB级数据秒级查询,同时可以灵活部署,按需创建,同时不存在厂商依赖,避免客户搬迁数据的成本。 Serverlees湖仓一体分析服务LAS特点包括统一了SQL接口和智能引擎选择。火山引擎统一了SQL层,屏蔽引擎差异,保证SQL灵活运行在不同的引擎上面,降低了基于智能引擎开发的效率。同时,基于不同场景下的不同需求,火山引擎数据产品提供智能引擎选择,帮助客户更灵活地选择引擎,降低开发门槛。另外,LAS设计的统一数据存储格式,简化了架构,提升了开发效率,节约和优化了成本。 企业级大数据分析服务EMR则兼容开源Hadoop生态,强调开源的兼容性,集成了Hadoop、Spark各种各样的开源组件,保证强兼容,客户可以相对无门槛地迁移到服务上去。同时,大数据开发层人员则可以把更多精力集中在大数据层开发本身,而不是软件管理。 郭东东表示,火山引擎强调以数据价值为先,构建敏捷的数智引擎,为企业提供更好的数据产品与服务。 |