国产开源数据库走热,却难一蹴而就

发布时间:2022-10-26

国产开源数据库商业化的难点是什么?

 

1. 当下以 Oracle 为主导的关系型数据库仍然占据许多存量客户市场,由于风险、成本等因素的考量,仍然没有采用复杂、大规模的核心系统改造。这对于包括全球化市场在内的任何一家分布式数据库厂商都是共同挑战。

2. 开源商业化这条路径的选择,需要大量的研发和生态投入,并拉长到十年为单位衡量,如何通过订阅服务、商业发行版等商业模式,提升企业商业化经营运作的能力?

3. 从共性来讲,客户仍然希望以最快的速度将新业务推向市场,并且能够在一定程度上应对当下诸多不确定性因素的压力。但国内数据库厂商非常之多,这使得客户的数据库选型成本非常高,当然这也与客户在数据库乃至底层基础的改造路径和策略有密切关系

从 PingCAP 的发展路径,或许值得参考。

近日,企业级开源分布式数据库厂商 PingCAP 举办了首届用户峰会,来自传音、百胜中国、老虎国际、建信金科、杭州银行、平安科技等各行业客户代表分享了与 PingCAP 的合作经历。钛媒体 APP 等与 PingCAP 创始人兼 CEO 刘奇 、研发副总裁唐刘、副总裁陈煜琦进行了交流。

梳理过去一年 PingCAP 的两个最新动作:一是发布 TiDB Cloud,基于亚马逊云科技、谷歌云、阿里云提供调用接口,强化开源项目 TiDB 的商业化版本能力;二是在国内持续挖掘行业头部客户价值,并出海东南亚、日本、美国、欧洲等地区,在全球化市场中构筑用户壁垒。

基于 TiDB Cloud,PingCAP 发布了 Serverless Tier 和 TiDB Playground,为每一个开发者提供一个免费的云上数据库,后者可以让开发者在 5 分钟内快速体验 HTAP。此外,PingCAP 构建了 "Ti 星系 " 合作伙伴体系,任何个人、公司、数据平台、云基础设施都可以通过 TiDB 开源社区连接在一起,持续挖掘和创造商业价值。

PingCAP 创始人兼 CEO 刘奇在大会上表示,分布式数据库是一个高度复杂的系统,和云的结合使得复杂性进一步提升。分布式数据库能否生存下去,取决于能否掌控复杂性。TiDB 分而治之的开放式架构能够管理复杂性,因此能够成为更多用户的选择。

为此,PingCAP 还启动了稳态 + 敏态双轨并行研发机制,一是基于开放式架构,二是基于大量客户场景,与客户共创打磨整个产品体系。例如,PingCAP 与平安科技联合打造了 TiDB 商业发行版 UbiSQL,与百胜中国共同创建分布式数据库联合实验室。

TiDB 是 PingCAP 研发的开源分布式关系型数据库,定位于在线事务处理 / 在线分析处理(HTAP)的融合型数据库产品,实现了一键水平伸缩、强一致性的多副本数据安全、分布式事务、实时 OLAP 等重要特性,同时兼容 MySQL 协议和生态。

可以看到,开源改变了数据库软件的迭代速度,而坚持云计算的服务模式,又将开源主导的企业商业化呈现出了一条可规模的路径。对于 PingCAP 而言,作为数据库开源领域成长起来的创新企业,已经逐步构建起核心的生态圈,并且吸引到一定的高质量代码贡献者,高度活跃的开源技术社区也在反向推动企业数据库产品研发能力、工程质量、迭代速度。目前 PingCAP 以外的贡献者占比超过 75%,其中近 20% 为企业决策者。

当一体化 HTAP 成为一种潮流

如今,数据库技术融合发展关键趋势明显,云原生和多云的需求进一步增强,数据库与大数据的深度融合应用,存算分离也成为发展的主流,一体化实时 HTAP 数据库成为新的关注方向。

结合 Gartner 对 HTAP 的定义本质来看,HTAP 实际上是通过内存计算来实现,它可以使分析业务与事务业务共享同一份数据,通过消除数据在数据库和数据仓库之间的数据迁移,可以对实时事务数据进行实时分析和态势感知,而不只是对数据进行事后分析。

这意味着构建 HTAP 并不是一步到位的事情。从 TiDB 的演变历程来看,1.0 版本就实现了在线事务处理的规模化扩展,为 HTAP 能力打下坚实的基石;4.0 版本实现初步的 HTAP 能力,OLAP 与 OLTP 分区独立,物理隔离;5.0 版本在原有 HTAP 引擎的基础上引入 MPP 架构,进一步提升海量数据下的并行计算与分析能力,支持同一架构下对 Spark、Flink 等技术栈的集成,成为具备完整实时 HTAP 能力的分布式数据库。

刘奇表示," 从整个 HTAP 的架构来看,这个技术本身的天花板非常高,天花板越高,企业发展的极限就越高。"

过去三年,PingCAP 在实时 HTAP 领域的创新,为企业在数据实施洞察、实时分析、实时变现等场景提供了一站式解决方案。

预计在接下来,PingCAP 将在 DB 微服务化、云原生、智能化等技术方向继续探索。其中,DB 微服务化也是为了应对复杂性而诞生,可以将数据库任何可分离的组件都实现服务化,打造 PB 级在线数据服务平台,提供更高的规模效应、更好的容错能力以及更强的风险控制手段。

在唐刘看来," 面向未来,任何可分离的数据库组件都可实现微服务化,但同时也会带来管理成本的复杂性问题。PingCAP 的策略是将这种管理的复杂性封装在云上,提供给客户的仍然是一体化的数据库服务体验。"

市场的回答

据悉,PingCAP 目前服务客户超过 3000 家,覆盖金融银行、互联网、物流、游戏、智能制造等行业。

建信金科基础技术中心副总裁邢磊介绍,从 2020 年的 TiKV 分布式键值数据库,到 2021 年的 Chaos Mesh 云原生混沌工程平台,再到 2022 年的 TiDB HTAP 在业务系统的投产,PingCAP 以客户成功、开源开放、面向未来的技术架构和服务体系,深入参与了建信金科系统升级,顺利扛住 4 万多 TPS 压力,稳定运行。

百胜中国目前已经在用户、支付、消息等业务中台,以及企业财务系统中落地实施了 TiDB 等开源技术。百胜中国 CTO 张雷介绍,餐饮行业的交易存在明显的高低峰场景,如旗下品牌肯德基的营销活动 " 疯狂星期四 " 的交易量远超平常交易日,TiDB 的灵活水平扩展能力让企业及时根据业务的需求对计算资源进行调整,助力降本增效。

某开源用户企业的 CFO 对 TiDB 也有一定认可," 在支撑现有业务的情况下,能够节省掉一半的人力成本。"

中国人寿财险核心系统目前也基于 TiDB 实现从集中式到分布式数据库的升级改造,大幅提升海量数据和高并发情况下的业务处理性能。

PingCAP 副总裁陈煜琦向钛媒体 APP 表示," 作为国内排名靠前的保险公司,国寿财险希望能够在未来产生更多的增量价值,对业务的敏捷性和灵活性要求非常高,大概从两年前国寿财险就开始与 PingCAP 进行合作。很多金融业客户提到,他们希望能够多一些选择,而不是只绑定某家数据库。在分布式数据库这个赛道上,PingCAP 的技术优势有一定的契合度。"

值得一提的是,在目前 PingCAP 着力出海的东南亚、日本、美国、欧洲等地区,会结合地域监管、区域用户场景、行业和对云端应用的使用特征等维度,进行海外业务的拓展。据了解,PingCAP 尤其在过去一年已经拓展到了一些行业头部的大型企业客户。