PingCAP 发布TiDB 5.0 打造完整 HTAP 能力的分布式数据库

原创
数据库 分布式
近日,PingCAP 正式发布面向企业级核心场景的 TiDB 5.0 版本,通过引入 MPP (Massively Parallel Processing,即大规模并行处理)架构成为具备完整 HTAP 能力的分布式数据库,为高成长企业和数字化创新场景提供一栈式数据服务平台。

【51CTO.com原创稿件】 PingCAP 是一家企业级开源分布式数据库厂商,成立六年来,所开发的分布式关系型数据库 TiDB 已经被全球超过1500家企业用于线上生产环境,包括像银行、电信、医院等传统企业,也有腾讯、美团、新浪微博、哔哩哔哩等互联网企业。

近日,PingCAP 正式发布面向企业级核心场景的 TiDB 5.0 版本,通过引入 MPP (Massively Parallel Processing,即大规模并行处理)架构成为具备完整 HTAP 能力的分布式数据库,为高成长企业和数字化创新场景提供一栈式数据服务平台。

企业级数据库就要“省心、放心、不担心”

在PingCAP成立之初,目标就是要开发一款通用型数据库,因为基础软件必须通用才能有更高的天花板。所以,TiDB的研发从零开始,每行代码都是PingCAP的工程师写出来的,因此核心代码(自主可控率)是100%。

早期,TiDB是一个救命型的产品,第一个用户是一家游戏公司。在这家游戏公司决定广告应该投放在什么渠道时,数据库查询出现了瓶颈。TiDB的出现,让这家游戏公司在不用修改代码的情况下,就完成了查询速度从20分钟到10秒钟的飞跃。而这个客户的需求其实就是实时分析需求,也为后来PingCAP发展HTAP做了铺垫。

在有了第一家客户后,PingCAP开始逐渐积累了众多互联网企业客户。但很多客户最关注的是企业的产品有没有应用在金融行业的核心系统中,于是,PingCAP又继续发展到金融等传统行业。然而,每个人对于企业级数据库的理解不一,服务过大型传统企业、闭源的、收费昂贵的软件,就真的是企业级么?

在PingCAP联合创始人兼CTO黄东旭看来,用户一定是想用一个稳定、数据不出错并且是整合的数据库,因此真正的企业级数据库应该是“省心,放心,不担心”。业务代码尽可能不修改,不学习新东西就可以搞定业务问题,用起来省心;数据不出错、不丢失、性能无抖动、维护不愁人,用起来放心;业务高速增长,数据库可以轻松应对带来的复杂性和挑战,用起来不担心。

TiDB 5.0 修炼内功

HTAP (Hybrid Transactional/Analytical Processing,即混合事务 / 分析处理)数据库能够在一份数据源上同时支撑在线事务处理(OLTP)和在线分析处理(OLAP)场景,避免了传统架构中在线与离线数据库之间大量的数据交互。Gartner 认为, HTAP 数据库将成为数据库领域的重要发展趋势,一个集成的数据平台将会加速数字化转型。

TiDB 早在 1.0 版本就实现了 OLTP Scale(在线事务处理的规模化扩展),4.0 版本已经实现初步的 HTAP 能力。黄东旭指出,TiDB 5.0更多的是在修炼内功,其中最大的一个特点就是补全MPP,使得TiDB成为具备完整 HTAP 能力的分布式数据库。这个功能的加入标志着TiDB终于成为一个横跨OLTP在线交易业务和OLAP数据仓库的具备全功能数据分析的数据库,这也是第一个开源的企业级的real-time HTAP数据库。

5.0 版本在原有 HTAP 引擎 TiFlash 的基础上引入 MPP 架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。通过与 TiDB-Server 共享 SQL 前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或 MPP 模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。

此外,TiDB 5.0 基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户和互联网用户都可以通过一套 TiDB 系统构建数字场景应用,而不必关注底层架构。SaaS 厂商和独立软件开发商都可以通过简化的 TiDB 技术栈获得敏捷开发、易于运维的数据底座。

TiDB 5.0 在性能方面取得了巨大的进步,通过提供聚簇索引、异步提交事务功能, 在 Sysbench 和 TPC-C 等 OLTP 基准测试中,获得均值 50% 的性能提升。同时,TiDB 5.0 通过优化调度过程中对 I/O、网络、CPU、内存等资源的占用,大幅减少因为资源被抢占而出现的 QPS(每秒查询量) 抖动问题,在 TPC-C OLTP 的基准测试中,衡量 TPC-C tpmC 抖动标准差的值小于等于 2%。TiFlash MPP 在 OLAP 方面更是获得了同等配置下数倍于 GreenPlum 的性能优势。

未来发展

据了解,PingCAP 成立之初就以开源作为核心战略,高度活跃的开源社区为 TiDB 产品发展带来了飞轮效应,TiDB 还是一个生态友好型的数据库,TiDB 5.0 集成了更丰富的大数据生态,新增 Kafka 连接器 、支持 S3 存储服务,并提供多个数据迁移、导入与共享组件,方便用户在自己的异构环境使用 TiDB。

黄东旭指出,5.0 是 TiDB 的里程碑,标志着 TiDB 成为一个完整能力的 Real-Time HTAP 分布式数据库。但是里程碑不是终点,所有的基础软件都会在云基础设施的背景下被重新发明一遍,PingCAP 已经准备好重新出发,让数据库回归原本的样子。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】


责任编辑:鸢玮 来源: 51CTO
相关推荐

2024-03-15 07:33:02

分布式数据库索引数据结构

2022-05-31 07:58:49

TiDB数据库开源

2021-01-08 08:19:36

数据库TiDB集群

2022-05-20 08:12:02

数据库HTAP场景

2021-04-25 16:44:00

PingCAPHTAP数据库

2021-12-20 15:44:28

ShardingSph分布式数据库开源

2023-07-31 08:27:55

分布式数据库架构

2023-12-05 07:30:40

KlustronBa数据库

2023-07-28 07:56:45

分布式数据库SQL

2018-10-15 11:20:04

分布式数据库数据库TiDB

2023-12-18 09:03:53

MatrixOneNewSQL数据库

2023-11-14 08:24:59

性能Scylla系统架构

2023-10-19 07:09:57

NewSQL数据库

2018-04-23 13:49:03

大数据数据库HTAP

2022-03-10 06:36:59

分布式数据库排序

2022-06-09 10:19:10

分布式数据库

2019-12-18 10:24:10

数据库PostgreSQL Oracle

2018-06-05 14:21:33

NewSQLMySQLRadonDB

2023-03-09 15:53:05

TiDB数据库MySQL
点赞
收藏

51CTO技术栈公众号