PingCAP 这家公司的前景如何?

PingCAP 的盈利模式是怎样的,市场规模多大,未来的发展前景怎样?被某家大公司收购的可能性如何?
关注者
1,691
被浏览
944,084

32 个回答

作为 TiDB 的开发者来强答一发~

我是 16 年 4 月初加入的 PingCAP,主要负责 SQL 计算引擎,包括 Planner 和 Executor 两部分。我刚开始加入的时候,整个 SQL 层做的比较乱,计算层不是完整的 volcano 模型,很多计算的东西要基于 ast,没有 hash join,plan 层几乎都是基于单机的思路。之后到 7 月末 beta 1.0 对 plan 层重构,区分了 Logical 和 Physical Plan。 @周昱行 写了第一版基于采样的 statistic 模块。executor 层和表达式计算不再基于 ast,实现了 hash join。8月份的时候实现了第一版 cost based optimizer, @申砾 贡献了 aggregation 下推和并行 hash join,为我们争取了第一个大客户。

9月-10月我在梦游

11月-12月 SQL Team 来了两个 ACM 神级选手实习,其中一个为我们优化了 analyze 语句。planner 加入了 eager aggregation功能,并且参考 SQL Server 实现了 subquery 的去关联化。

17年 1月 - 4月,两个妹子重构了 SQL 算子下推的逻辑,怀宇开始设计新的表达式计算框架,最重要的改动是,我们有了完全不基于分布式锁的 statistics 实时更新 / 通知机制,并尽可能的保证了一致性。

5月-8月,新的基于动态规划算法的 cost-based optimizer 完工,支持 index look-up join / sort merge join / hash join 的自动选择,TopN Query 更好的支持(很少有优化器可以做好这一点)。TiSpark beta 发布,让 TiDB 有了真正的 OLAP 引擎。

接下来的一年,我们会实现真正的 parallel execution,支持真正分布式的带 distinct 聚合算子的下推,基于动态规划的 Join Reorder,完全自动化更新统计信息(DBA 可以下岗了)。

我们这一年做的事情非常的。。。梦幻,没错,就是梦幻。。。从刚加入 PingCAP 的时候开始,我对“完美”的数据库的幻想正在一步步变成现实。我最喜欢一个作品初期的样子:它有无限的可能性,而让这些可能性成真的人,正是你,是我们每一个工程师。

这也许是一家在国内最能让你体验作为“工程师”的价值的公司。你仿佛是一个画家,一个雕塑家,你可以告别任何无意义的劳动,尽情发挥自己的才华。你每一个自以为天才(实际上可能愚蠢)的想法,即使失败了,仍然可以推倒重来,在一篇又一篇的论文里寻找正确答案。这里是可以实践每一个前沿理论的地方。

自由,专注,创新,严谨,也许这些就是这家公司的基因,由此而诞生的产品必然卓越,由此而形成的市场必然广阔。前方也许有很多未知的考验,但是走好这段路的每一步,让我十分心安。

利益相关:PingCAP 联合创始人, CTO

在湾区出差,昨晚看到问题的时候已经深夜了,早上起来发现不用回答了呃。。。但是还是简单回答下吧。

TL;DR

我觉得这家公司还蛮靠谱的。


这年头人越来越贵,好点的架构师/开发者/DBA的薪资差不多都在和美帝看齐,同时数据存储的问题越来越突出,慢慢的我们发现关系型数据库变成整个后端架构里面最难 scale 的单点,你说我可以 sharding 啊,我可以分库分表啊,对大公司来说,当然可以,无数的大公司就开始养人自己造 mysql sharding 中间件了,功能差不多,质量良莠不齐,对于中型公司和传统企业来说基本没啥办法,即使这样每年还得花好多钱养着团队,更别提开发效率低带来的时间成本。另外一个方面分库分表 sharding,听起来简单,用起来维护起来简直不要太痛苦,当初要不是维护过豌豆荚的 mysql sharding 集群,我也不知道这个事情那么屎。后来不行了,决定彻底解决一下这个问题,看到了 Spanner 和 F1 的论文,于是出来拿了笔钱开始搞了。

首先啊,PingCAP 到现在两岁多了,融资保持着一年一轮的健康的节奏,各轮 VC 都是国内顶级 VC, 比如天使轮的经纬,险峰华兴啊,A 轮的云启,FreeS啊,B 轮的华创。每轮 Closed 都很快,也感谢各方投资人的认可~

做的事情说起来其实 pretty simple, 就是从解决 MySQL 的 Scale 问题入手,发展出一套 HTAP 的数据库并尽可能形成开源的事实标准,将开发者从数据基础设施中解放出来,Make Data Smart.

但是这个目标背后的工程难度极高。也是在我们之前没人做出来的原因,这个是少见的因为技术太难,没人做的事情。这太好了,我觉得比较适合我们几个码农。


盈利模式也很简单,其实也没什么复杂的,几个关键的指标:

1. 数据库的市场多大(天花板在哪)

2. MySQL 的 install base 多大,和在 MySQL 上遇到扩展性问题的用户比例,迁移到 TiDB 上的迁移成本(这个关系到增长及 market size)

3. Cloud 的发展速度(渠道)

4. 随着 Adoption 的增长,用于销售,客户支持,服务及维护的成本会不会随之线性增长(成本)


数据库的市场大小不用说,看看 Oracle 的市值就知道了,更不用说国内的去 IOE 和开源自主可控什么的,MySQL 也是世界上最流行的开源数据库。剩下几个问题就是增长,渠道和成本控制。通过一些黑科技,我们让 MySQL 到 TiDB 的 Migration Cost 几乎为 0,所以我们的前期 POC 成本很低,甚至大多数情况不需要我们上, 用户自己就完成了,所以 Pipeline 增长很健康;Open source 天生自带病毒传播特性,我们在几乎 0 市场成本的情况下完成了国内开发者社区的覆盖(嗯,就是写文章有点累。。。);第三,我们已经谈下了国内几家最大的公有云厂商数据库首级入口,正在进行技术整合,大家在不久的未来就会看见,所以也算完成了渠道的布局和卡位;


其实也没那么多复杂的东西,盈利模式简单一句话就是:收人钱财与人消灾,同时这个消灾的过程是可以 scale 的,That's all,亘古不变的朴素道理。

天时地利都不错,剩下最最重要的问题就是人的问题了,谁能搞定这个事情很重要,不过我相信其他的几个回答能看得出来,我们还是比较幸运的,凑了一个务实而凶悍的技术团队,我爱你们。

在 Infra 领域,我们就是新的巨头。


==========更新一下=============

2018年仍让保持了一年一轮的健康融资节奏,刚融了5000万美金,正是发力的时候,广纳贤才,基本上和数据库从内核到周边工具和商业产品,从研发测试到销售运维dba都招,没有工作地点限制,从硅谷到中国几个大城市都有分舵(硅谷 (san mateo) / 北京 / 上海 / 广州 / 杭州 / 成都, 深圳武汉筹备中),有兴趣的盆友可以联系我。


#简历不要发给我,我内推没有 iPhone 8 拿(这 tm 谁定的政策 T_T)。。发给 @zhexuany (他缺手机了) @韩飞 @申砾 @Xiaoyu Ma @姚维 就好了