广告
返回顶部
首页 > 资讯 > 数据库 >数据库发展史(下)
  • 461
分享到

数据库发展史(下)

数据库发展史(下) 2019-01-16 05:01:31 461人浏览 才女
摘要

数据库发展史(下)

本篇文章为大家讲解ai原生数据库和其他类型数据库的发展历程。

AI原生数据库

近年来,随着AI(人工智能)技术的成熟和发展,AI与数据库的结合越来越紧密。为了提高数据库系统的智能化程度,使数据库系统能够更加智能地运行、维护、管理,不断有研究者采用人工智能方法来解决数据库管理、优化等问题。

2019年初,谷歌联合麻省理工学院、布朗大学的研究人员共同推出了新型数据库系统SageDB,并撰写了一篇论文详述SageDB的设计原理和性能表现。论文中提出学习模型可以渗透到数据库系统的各个方面,提供了一种构建数据库系统的全新方法。清华大学利用AI技术来支持数据库的自调优、基于AI的代价估计器、基于AI的优化器、基于AI的物化视图技术以及库内AI推理技术。

2019年5月,华为公司发布了全球首款AI原生(AI-Native)数据库——GaussDB,该数据库实现了两大革命性突破:

  • 该数据库首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。
  • 该数据库通过异构计算创新框架充分发挥x86、ARM、GPU、NPU 多种算力优势。

GaussDB的出现,标志着数据库产业将全面进入人工智能时代。虽然AI原生数据库具有很多优势,但是AI原生数据库处于起步阶段,面临很多挑战,需要研究者投入更多的精力进行开发和研究。

其他类型数据库

除了上面介绍的比较有影响力的数据库外,在数据库领域还存在着许多其他类型的数据库。

1. 实时数据库

在大多数系统中,实时处理数据一直都是十分迫切的需求。实时数据处理最早的尝试在20世纪80年代末,有人提出了活动数据模型,该类模型能够实时捕获数据变化并更新数据,在很多关系数据库中得到了使用,但由于其语法过于复杂,往往会导致计算代价过高。在20世纪90年代到21世纪初期间,出现了多种用于管理数据流的系统(Data Stream Management System,DSMS)。典型的实时数据库有Apache StORM、PipelineDB、Heron和谷歌的Dataflow等。

2. 终端数据库

前面介绍的数据库都是运用在服务器集群云计算平台等计算资源上的,“体积”庞大,以“客户端/服务端”的形式提供数据存储和管理服务。为了克服“客户端/服务端”模型因为通信带来的开销,降低延迟时间,提出了终端数据库的概念。

sqlite是一款轻型的由C语言编写的,遵守ACID特性的关系数据库管理系统。它的设计是嵌入式的,因此资源占用非常低,目前已经在很多嵌入式产品中使用。

LevelDB是谷歌公司实现的一个非常高效的键值数据库,目前的版本能够支持10亿级别的数据量。尽管LevelDB是单进程的服务,但是它的性能非常高,这主要归功于它的良好的设计。

终端数据库主要是为了应对性能的数据访问需求出现的,结构简单,性能高,往往只适合在单机上使用。

3. 数据仓库

为了解决企业数据集成问题,1988年,IBM 公司的研究员Barry Devlin和PaulMurphy创造性地提出了一个新的概念———数据仓库(Data Warehouse)。数据仓库是决策支持系统和联机分析应用系统的结构化数据环境。之后,众多厂商开始构建实验性的数据仓库。1991年,数据仓库之父比尔·恩门(Bill Inmon)在出版的Building the Data Warehouse 一书中提出的关于数据仓库的定义被广泛接受,使得数据仓库真正开始应用,其功能是将联机事务处理(OLTP)长期累积的大量数据,经过抽取、转换、集成和清洗等操作后得到的一组具有主题的、面向分析的数据。比较著名的数据仓库产品有IBM 公司的InfoSphere Warehouse,微软公司的Microsoft SQL Server Fast Track以及天睿公司的Teradata等。数据仓库容量大,能够进行分析决策和数据挖掘,但是,数据仓库中的数据难以更新,缺乏规范,往往都是面向某一应用,具有一定的局限性。

4. 数据湖

企业在生产过程中会产生、接收和存储大量的数据,而这些数据通常难以被其他应用程序直接利用,面临着这些数据应该以何种方式进行存储和分析数据的挑战,数据难以被共享和利用也容易导致数据孤岛的产生。为了解决这些问题,Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊于2011年提出了数据湖的概念。简单来说,数据湖就是一个以比较自然的方式存储企业的原始数据的数据仓库或者系统,它能以各种模式和结构形式方便地配置数据,通常是对象块或文件。数据湖不但能存储传统类型数据,也能存储其他类型的数据,并且能基于这些数据做处理与分析工作,产生最终输出供各类程序消费。目前,成熟的数据湖并不多,亚马逊公司AWS Lake Formation服务,可以在几天内轻松建立安全的数据湖,松下、Accenture等公司都借助亚马逊公司的这一服务搭建自己的数据湖。近年来,虽然数据湖逐渐得到重视,但是数据湖缺乏数据治理和元数据管理,对原始数据的可用性也有一些过分夸大。

5. 并行数据库

为了提高数据库的性能和可用性,研究者提出利用并行处理的方法,通过多个处理节点并行执行数据库任务,提高整个数据库系统的性能和可用性。目前并行数据库主要分成两类: 一类是传统的大规模并行处理(Massively Parallel Processing,MPP)关系数据库,比如Greenplum、Vertica等; 另一类是借鉴了MPP并行数据库的设计思想的SQL on hadoop类的方案,比如Impala、HAWQ、sparkSQL等。

然而,并行数据库系统也有一些难以克服的缺点。例如,该类数据库的数据迁移代价通常比较昂贵、没有较好的弹性,灵活性较低,这影响到了并行数据库的弹性以及实用性。此外,该类数据库的另一个问题就是容错性较差。如果在查询过程中节点发生故障,那么整个查询通常都要重新执行。

6. 大数据分析工具

大数据的处理往往需要依赖专门设计的硬件和软件,目前,已经有很多企业开发出了多种大数据分析工具。

mapReduce是由谷歌公司研发的一种面向大规模数据处理的并行计算框架。简单来说,MapReduce基于并行计算的思想,将一个大计算量的任务和数据分解给若干个Mapper同时进行处理和计算,最后由Reducer负责汇总Mapper的处理结果。随着MapReduce在众多大数据任务中取得成功,它已经为大数据并行处理带来了巨大的革命性影响,同时也是大数据时代的流行计算框架之一。

Hadoop是Apache公司设计开发的一个能够对海量数据进行快速分布式分析处理的软件框架。它能基于简单的编程模型将海量数据分发到计算集群中,以便进行分布式计算。

Storm 也是Apache公司研发的一款实时计算系统,该系统可以强化数据流的处理效果和性能,也可以用于在线机器学习、分布式PRC(Remote Procedure Call)和持续处理等大数据分析相关的场景。Apache公司的Spark是专为大规模数据处理而设计的快速通用的计算引擎,可用它来完成各种各样的运算,包括SQL查询、文本处理、机器学习等。

RapidMiner能够提供一个集成开发环境进行数据挖掘、机器学习和文本挖掘等工作。

迄今为止,已经有很多优秀的大数据分析工具投入使用,并形成了良好的生态,极大地推动了数据科学的进步。

小结

到目前为止,随着计算机应用领域的不断发展,数据库技术与计算机网络技术、人工智能技术和并行计算技术等相互渗透、互相结合,成为当前数据库技术发展的主要特征之一,呈现了下一代数据库的潜在发展方向。例如,传统的OLAP(联机分析处理)技术主要面向关系数据,然而其他类型的数据(例如,图数据和时空数据等)也有越来越多的应用场景。因此,如何分析这些多模态的数据也是OLAP面临的挑战之一。特别是企业从BI(商业智能)到AI的转型,继续设计下一代OLAP系统来实现智能化分析。

首 先,如何将人工智能技术与数据库技术相结合是未来的一个发展趋势之一。传统的数据库优化主要依赖于有经验的数据库管理员进行查询优化,然而在当今的大数据时代,数据和业务变得越来越复杂,仅仅靠数据库管理员的经验进行数据库优化显然是不能适应复杂的数据和业务的变化。因而如何利用人工智能技术(例如强化学习技术)来进行数据库的自动优化是重要的发展趋势,同时也是一项挑战。

其次,诸如一些非易失性存储器(Non-Volatile Memory,NVM)等新型介质的出现也为数据库的设计和优化提供了一些新的思路。

最后,数据安全和隐私是未来需要解决的重要问题,需要研究全密态数据库来提升数据库的安全性。此外区块链因为其分布式、去中心化和信息不可篡改等特性也越来越受到关注,从某种角度来说,区块链是一个去中心化的数据库,但是其对数据的查找和数据格式化处理方面有天生的不足。因此,在以区块链作为数据存储层的基础上,研究如何将数据库技术与区块链结合起来,为区块链提供一个数据库层,从而加速数据的查询效率、提高区块链作为数据库的可用性,这也是发展趋势之一。

Gauss松鼠会是汇集数据库爱好者和关注者的大本营,

大家共同学习、探索、分享数据库前沿知识和技术,

互助解决问题,共建数据库技术交流圈。

您可能感兴趣的文档:

--结束END--

本文标题: 数据库发展史(下)

本文链接: https://www.lsjlt.com/news/8278.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 数据库发展史(下)
    ...
    99+
    2019-01-16
    数据库发展史(下)
  • 数据库发展史(上)
    ...
    99+
    2021-04-18
    数据库发展史(上)
  • 数据库发展史(中)
    ...
    99+
    2017-12-15
    数据库发展史(中)
  • 数据库未来发展趋势(下)
    ...
    99+
    2014-07-29
    数据库未来发展趋势(下)
  • C/C++Qt数据库与Chart历史数据展示
    在前面的博文中具体介绍了QChart组件是如何绘制各种通用的二维图形的,本章内容将继续延申一个新的知识点,通过数据库存储某一段时间节点数据的走向,当用户通过编辑框提交查询记录时,程序...
    99+
    2022-11-12
  • 回顾一下PHP时间格式化的发展历史
    PHP 是一种广泛使用的服务器端脚本语言,用于 Web 开发、命令行编程等场景。其强大的日期和时间处理功能是其优势之一。时间和日期处理对于 Web 应用程序来说至关重要,无论是用于存储时间戳、计算时间间隔还是将时间显示为可读格式。PHP 提...
    99+
    2023-05-14
    php
  • C/C++中Qt数据库与Chart历史数据展示的示例分析
    这篇文章主要为大家展示了“C/C++中Qt数据库与Chart历史数据展示的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“C/C++中Qt数据库与Chart历史数据展示的示例分析”这篇文章...
    99+
    2023-06-25
  • 数据库未来发展趋势(上)
    ...
    99+
    2021-09-25
    数据库未来发展趋势(上)
  • 国产数据库发展情况如何?
    一、数据库开发难度数据库研发是和操作系统相提并论的高难度工作。参考对数据库和分布式很感兴趣,学习路线是什么?这篇文章里说到了很多学习过程,从学术上就能看到其复杂度。然而这还只是万里长征的开始,学术到产品还有...
    99+
    2022-10-18
  • 阿里云数据库发展趋势分析
    阿里云数据库作为阿里云的核心产品之一,一直以来都在不断发展和进步。本文将从以下几个方面对阿里云数据库的发展趋势进行分析。 一、云计算的发展趋势随着云计算技术的发展,阿里云数据库也将逐步实现云端化,从而实现更好的性能和可扩展性。未来,阿里云数...
    99+
    2023-11-08
    阿里 发展趋势 数据库
  • 如何看待FoundationDB数据库发展前景?
    如果说数据是科技领域的“石油”,那么数据库就是油井。无论你用哪一个程序,使用哪一个平台,都必须要有一个数据库。 数据库如此重要,以至于各大巨头企业都在抢夺数据库市场。在开源技术领域,数据库已呈疯长之势,...
    99+
    2022-10-18
  • 阿里云数据库的由来和发展
    阿里云数据库是阿里巴巴集团推出的一种云计算数据库服务,具有高效、安全、可扩展等特点,为用户提供一站式数据库解决方案。本文将详细说明阿里云数据库的由来和发展。 一、阿里云数据库的由来阿里巴巴集团成立于1999年,起初是一家电子商务公司,后来发...
    99+
    2023-12-17
    阿里 由来 数据库
  • 处理Zabbix历史数据库办法一
    一 问题描述随着Zabbix监控的主机和监控项目增多,Zabbix的历史数据会越来越多,MySQL数据库磁盘空间很容易就爆满,同时Zabbix前端查询数据会变得越来越慢。特别是通过Zabbix的API生成自...
    99+
    2022-10-18
  • ubuntu下安装php pdo扩展和导入数据库
    默认安装的php不存在pdo扩展,因此在使用到的时候会报错,直接使用这个命令 apt-get install php-mysql 就可以成功安装pdo扩展 安装完数据库后需要导入sql语句,先进入数据库中提前创建数据库名,比如laykefu...
    99+
    2016-09-05
    ubuntu下安装php pdo扩展和导入数据库 数据库入门 数据库基础教程 数据库 mysql
  • 跨越数据库发展鸿沟,谈分布式数据库技术趋势
    金融行业架构转型需求随着移动化与互联网化的不断发展,我国金融行业的商业模式与技术体系已经逐渐走上了与西方世界完全不同的道路。众所周知,欧美国家的移动化普及率远远不如我国,同时人口基数也有着数量级的不同,这...
    99+
    2022-10-18
  • MySQL数据库技术如何影响职业发展?
    MySQL数据库技术如何影响职业发展?随着互联网的快速发展以及数据爆炸式增长,数据库技术变得越来越重要。作为一种十分流行的关系型数据库管理系统(RDBMS),MySQL在职业发展中扮演着重要的角色。本文将探讨MySQL数据库技术对职业发展的...
    99+
    2023-10-22
    职业发展 MySQL(数据库) 技术(技能)
  • 阿里云数据库的变化与未来发展
    随着数字化转型的加速,数据库技术正在经历着前所未有的变化。作为全球领先的云计算服务提供商,阿里云数据库也在不断发展和创新,以满足企业日益增长的数据处理需求。本文将对阿里云数据库的变化进行深入剖析,并对其未来发展进行展望。 一、阿里云数据库的...
    99+
    2023-12-15
    阿里 未来发展 化与
  • Linux下的MySQL数据库开发有哪些
    本篇内容介绍了“Linux下的MySQL数据库开发有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  ...
    99+
    2022-10-18
  • 数据库中如何高效率删除大表历史数据
    这篇文章主要介绍数据库中如何高效率删除大表历史数据,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!清理大表历史数据通过将非分区表Online Redefinition转换为以删除条件为...
    99+
    2022-10-18
  • Oracle11g怎么清理数据库的历史日志
    这篇文章主要介绍“Oracle11g怎么清理数据库的历史日志”,在日常操作中,相信很多人在Oracle11g怎么清理数据库的历史日志问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解...
    99+
    2022-10-18
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作