iis服务器助手广告广告
返回顶部
首页 > 资讯 > 数据库 >数智时代基石,阿里云推出新一代云原生数据仓库与数据湖
  • 785
分享到

数智时代基石,阿里云推出新一代云原生数据仓库与数据湖

摘要

6月9日, 在2020阿里云峰会上,阿里巴巴副总裁、阿里云计算平台事业部高级研究员贾扬清宣布推出新一代云原生数据仓库和数据湖解决方案。基于创新的技术架构,新一代云原生数据仓库可支持PB级数据关联分析和实时查询,实现离线、实时、分析、服务的四

数智时代基石,阿里云推出新一代云原生数据仓库与数据湖

6月9日, 在2020阿里云峰会上,阿里巴巴副总裁、阿里云计算平台事业部高级研究员贾扬清宣布推出新一代云原生数据仓库和数据湖解决方案。基于创新的技术架构,新一代云原生数据仓库可支持PB级数据关联分析和实时查询,实现离线、实时、分析、服务的四位一体。同时推出的数据湖解决方案,采用一种存储多种计算理念,基于存储与计算分离架构和全新大数据分析加速引擎,可实现与本地计算一样的快速体验,激发企业数智动能。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

以下为贾扬清演讲全文(附视频回顾>>)

如今我们谈到产业数字化,数字产业化,今天绝大多数的经济活动、数据的沉淀分析和服务都是离不开的。同时我们又说摸着石头过河,绝大多数的企业在业务升级跟技术升级的过程当中,往往都采取一个摸着石头过河的方法,在遇到不同的数据分析跟服务的需求的时候,寻找单个的单点的系统来解决它实际的单点的问题。这样的一个过程就会遇到最后的一个问题,是在一个看似完整的系统背后,是一个一个的数据的孤岛,这些孤岛之间数据的联通,数据的实时传输都变成了非常大的问题。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

从一个整个企业的角度来说,业务所看到的是数据洞察的困难,而系统看到的是数据分裂的成本,作为企业业务如此重要的数据仓库的概念,我觉得我们需要顶层的设计来重构数据仓库,这是我们今天向大家展示的基于Hologres、MaxCompute、Realtime Compute的离线、实时、分析、服务一体化的,实时即服务的一个理念。如果我们回到数据仓库最本质的需求的话,其实它的本质问题并不复杂。数据仓库需要把多个来源的数据综合在一起,实时地沉淀到一套存储上去,同时在上面做多种形态的,无论是离线、实时还是交互式的分析,以及做结果的展示和服务。我们以前经常听到的一个概念叫HTAP(Hybrid Transaction and Analytical Process),事物跟分析的一体化,对于事物来说,它更多的是在考察一个数据的单位,比如说一个数据库,对于读写性能和安全性这样的一些指标。但是今天我们所看到的是,分析跟服务是更加一体的。分析,是说我们要把这样海量的数据当中的规律分析洞察出来,那么同时这些洞察的最终目的是为了服务,无论是数据大屏还是运营分析,它都是一个展示服务数据的一个过程。要解决数据孤岛的问题,我们就要把分析的形态跟服务的形态更紧的结合起来。我们把这样的一种模式叫HSAP(Hybrid Serving Analytical Processing),基于Hologres跟MaxCompute这样的一个数仓,我们可以实现Hologres跟MaxCompute数据的打通,通过Hologres来实现高性能、低延时的分析,同时通过MaxCompute来实现大规模、低成本的离线计算。在这样的一个基础上面,我们可以实时的将这些数据分析的结果以及实时沉淀的数据,推送到不同的像大屏和运营看板这样的一些服务上去。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

在阿里巴巴集团内,对于数据最大的一个需求可能是在双11这一天,它有了大量的数据流转,也有着非常复杂的业务决策。在2019年的时候,我们通过Hologres跟MaxCompute这样的一个数仓,给我们支持业务的系统做了一次升级。在双11当天的时候,我们这一套系统支持了总共1.45亿次的在线查询,这些查询再往上所支持的是非常复杂的业务的分析和决策的一个过程。这些分析的背后同时又是带有着1.3亿条实时记录写入的一个大规模的数据体量。顶层设计走对了之后,性能其实并不是问题。基于MaxCompute、RealtimeCompute和Hologres,这样的一整套数仓体系可以解决我们数据孤岛的问题。在没有数据冗余的这样一个情况下面,来简化系统,降低成本,同时来提升我们数据分析的效率。我们也考虑到在建设一个数仓的时候,开源、社区和生态是很重要的,所以我们在建设Hologres的时候,采取了基于postgresql这样的一个完全兼容开源的生态体系。数据工程师和上层的BI工具,可以更加容易地、无缝地把自己现有的系统接入到Hologres和MaxCompute,实现分析和服务的一个无缝迁移。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

实时即服务,基于HSAP这样的一个理念,我们可以大大的简化数仓的设计,真正的实现在数据全生命周期当中离线、实时、分析、服务一体化的一个系统。

在企业上云的过程当中,我们还看到另外一个需求,就是海量的异构数据,这些数据可能是日志,可能是图片、视频、语音也有可能是在之前经营过程当中沉淀下来的大量的数据形态。这些数据和数仓所解决的结构化数据的问题是不太一致的,他们变得更加的多样,更加的非结构化,但是同时他们也有和结构化数据一样的需求:海量、高速、安全、智能以及无缝上云。基于这样的一个需求,已经有1000多家企业在我们阿里云OSS对象存储这样的一个通用存储的解决方案上面,来构建一体化的数据湖解决方案。数据湖可以给大家解决两个问题。第一个问题是解决多种形态的数据的无缝接入、聚合的一个问题,他可以把多样的数据都放在同一套存储上面,同时在这套存储上面,它可以更快地对接多种自建和托管的引擎,来实现不同的分析服务的业务的创新,无论是搜索推荐、机器学习,还是其他各种多种多样的服务形态。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

今天我们在这里重磅发布新一代云原生的数据仓库和数据湖的解决方案,背后的理念是从数据孤岛到一种存储,多种计算、实时即服务这样的一个系统设计。在阿里云上面我们还有数据的综合治理DataWorks和机器学习Pai这样的平台,通过这一整套的数据产品,我们可以实现应用的数据化和智能化。我们认为未来每一家企业都应该在云上建设数据仓库和数据湖,解决纷繁复杂的数据问题。

您可能感兴趣的文档:

--结束END--

本文标题: 数智时代基石,阿里云推出新一代云原生数据仓库与数据湖

本文链接: https://www.lsjlt.com/news/6596.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 阿里云新品数据库开启数据新时代
    随着科技的快速发展,数据的重要性日益凸显。阿里云推出的新品数据库,旨在帮助企业更好地管理和利用数据,提升数据处理效率,为企业的发展提供强大支持。 阿里云新品数据库是一种先进的数据管理系统,可以帮助企业更高效地处理和管理数据。它集成了阿里云的...
    99+
    2023-10-31
    阿里 新时代 新品
  • 阿里云数据库H5云端数据库的新一代技术
    随着云计算技术的发展,云端数据库已经成为企业进行数字化转型的重要工具。阿里云数据库H5作为云端数据库的新一代技术,以其强大的功能和性能,受到越来越多企业的关注和使用。 文章:随着云计算技术的不断发展,云端数据库已经成为企业进行数字化转型的重...
    99+
    2023-10-31
    数据库 阿里 新一代
  • 阿里云数据库与数据仓库的区别
    阿里云数据库与数据仓库是两种不同的数据存储方式,它们在功能、应用场景和性能上有所不同。本文将对两者进行详细比较,帮助读者更好地理解两者之间的区别。 一、功能上的区别阿里云数据库是一种关系型数据库,主要用于存储和管理结构化数据。它提供了丰富的...
    99+
    2023-11-18
    阿里 数据仓库 区别
  • 苏州阿里云原生数据库
    苏州阿里云原生数据库:强大的数据存储和管理解决方案 1. 引言在当今数字化时代,数据已成为企业的重要资产。为了有效地管理和利用这些数据,企业需要一个可靠的数据库管理系统。苏州阿里云原生数据库是阿里云提供的一项强大而灵活的数据存储和管理解决方...
    99+
    2023-12-26
    阿里 苏州 数据库
  • 第七代阿里云数据库
    1. 引言 随着云计算技术的不断发展,企业对于数据存储和处理的需求也在不断增长。阿里云作为国内领先的云计算服务提供商,不断推出新的产品和服务来满足用户的需求。其中,第七代阿里云数据库(AlibabaCloud Database RDS)就是...
    99+
    2024-01-20
    阿里 数据库 第七代
  • 构建实时数据仓库首选,云原生数据仓库AnalyticDB for MySQL技术解密
    阿里云分析型数据库重磅推出基础版,极大降低了用户构建数据仓库门槛。高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化。 AnalyticDB...
    99+
    2024-04-02
  • 阿里云新数据库高性能、高可用的新一代数据库解决方案
    随着大数据时代的到来,数据量的爆炸式增长使得传统的数据库解决方案已经无法满足日益复杂的应用需求。阿里云新数据库,作为新一代的数据库解决方案,以高性能、高可用为特点,为用户提供了一种全新的数据库体验。 阿里云新数据库是阿里云推出的一款高性能、...
    99+
    2023-11-01
    数据库 阿里 高性能
  • 阿里云的云原生数据库分析
    简介 阿里云的云原生数据库是一种基于云计算技术的数据库服务,它提供了高性能、高可用性和可扩展性的数据库解决方案。本文将对阿里云的云原生数据库进行分析,探讨其特点、优势以及应用场景。云原生数据库的特点1. 高性能阿里云的云原生数据库采用了分布...
    99+
    2024-01-31
    阿里 数据库
  • 阿里云数据库安全代理
    一、阿里云数据库安全代理的优点 强大的防护能力 阿里云数据库安全代理采用先进的数据库加密技术,能够有效地保护数据库免受未经授权的访问、篡改、泄露等安全威胁。该代理采用多层次的安全防护策略,包括访问控制、安全审计、数据备份等,确保数据库...
    99+
    2023-10-27
    阿里 数据库
  • 阿里云数据库代理配置
    1. 什么是阿里云数据库代理 阿里云数据库代理是一种轻量级的数据库代理服务,可以帮助用户轻松管理和扩展数据库连接。它可以自动分配连接到数据库实例,并提供高可用性和负载均衡功能。 2. 配置阿里云数据库代理 2.1 创建数据库代理 在阿里云...
    99+
    2023-10-27
    阿里 数据库
  • 阿里云数据库代理服务
    阿里云数据库代理可以帮助用户在阿里云上搭建自己的数据库,包括MySQL、PostgreSQL、MongoDB等多种数据库。用户可以根据自己的需求选择适合的代理,并将应用部署在代理上,从而实现对数据库的访问和管理。 阿里云数据库代理可以按照...
    99+
    2023-10-27
    阿里 代理服务 数据库
  • 腾讯云数据库与阿里云数据库谁更胜一筹?
    本文将对腾讯云数据库和阿里云数据库进行详细比较,从安全性、性能、易用性、价格等几个方面进行全面对比,帮助读者了解这两个数据库的优缺点,以便在选择时做出明智的决定。 腾讯云数据库与阿里云数据库是目前市场上两大主流数据库提供商,它们在安全性、性...
    99+
    2023-11-10
    数据库 腾讯 阿里
  • 阿里云数据库代理怎么开
    了解阿里云数据库代理的服务类型和功能 在开通阿里云数据库代理之前,你需要先了解阿里云数据库代理的服务类型和功能。常见的阿里云数据库代理服务包括MySQL、SQL Server、Oracle等。在选择阿里云数据库代理时,需要根据自身业务...
    99+
    2023-10-28
    阿里 数据库
  • 阿里云数据库代理怎么做
    一、阿里云数据库代理的工作原理 阿里云数据库代理是一种基于云计算技术的数据库服务合作伙伴,它们可以通过阿里云的云服务器、云数据库、云存储等多种产品,为阿里云用户提供数据库服务。代理的主要工作原理是通过云计算技术将数据库服务提供给用户,用户...
    99+
    2023-10-27
    阿里 怎么做 数据库
  • 代理IP访问阿里云数据库
    首先,阿里云提供了多种云计算服务,包括但不限于云服务器、负载均衡、云数据库、云存储等,可以为企业提供全方位的云计算解决方案。 其次,阿里云拥有强大的数据存储和处理能力,能够帮助企业快速实现数据管理和处理,并且可以提供安全、高效、稳定的数据...
    99+
    2023-10-28
    阿里 数据库 IP
  • 阿里云数据库形态分析从传统数据库到云原生数据库的演进
    阿里云数据库形态分析是一篇深入研究阿里云数据库发展历程的文章。本文将从传统数据库到云原生数据库的演变历程进行分析,旨在帮助读者理解阿里云数据库的发展趋势和未来可能的发展方向。 阿里云数据库形态分析:从传统数据库到云原生数据库的演进随着云计算...
    99+
    2023-10-31
    数据库 阿里 形态
  • 数据库容器化:开启云端数据库新时代的钥匙
    简化部署 数据库容器化通过将数据库环境打包成轻量级的、可独立部署的单元,极大简化了数据库部署。它消除了在不同环境中安装和配置数据库的复杂性,使得在云端或混合环境中快速部署数据库成为可能。 提高可移植性 容器化的数据库可以轻松地从一个平台迁...
    99+
    2024-04-02
  • 阿里云数据库代理怎么做出来的呢
    简介 阿里云数据库代理是一种将数据库请求转发到多个数据库实例的服务,它可以提高数据库的可用性和性能。本文将介绍阿里云数据库代理的工作原理和实现方式。实现方式1. 负载均衡阿里云数据库代理使用负载均衡技术来分发数据库请求。当一个请求到达代理服...
    99+
    2024-01-17
    阿里 怎么做 数据库
  • 大数据时代数据库-云HBase架构&生态&实践
    ...
    99+
    2024-04-02
  • 数据库容器化:云计算时代数据库管理的新范式
    优势: 敏捷性:容器可轻松部署和扩展,从而缩短上市时间并应对业务需求的变化。 隔离性:每个容器都是独立的,可确保不同的工作负载彼此隔离,提高了安全性。 可移植性:容器可以在不同的云平台和操作系统之间轻松移动,增强了应用程序的可移植性。 ...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作