既然有 HTTP 请求,为什么还要用 RPC 调用?

首先 RPC 框架配置复杂,如果走 HTTP 请求同样也能做到相同功能,而且配置可以几乎为零配置。项目也不用引用太多的包。虽然如果单纯用 RPC,可以…
关注者
5,344
被浏览
1,942,173

212 个回答

这个回答里恰巧讲了一些rpc通信协议的细节,但是强调一遍通信协议不是rpc最重要的部分,不要被这个回答带偏了。如果要了解rpc请更多的去了解服务治理(soa)的一些基本策略,推荐去看看dubbo的文档。

这个问题其实是有理解误区的,首先 http 和 rpc 并不是一个并行概念。

rpc是远端过程调用,其调用协议通常包含传输协议和序列化协议。

传输协议包含: 如著名的 [gRPC](grpc / grpc.io) 使用的 http2 协议,也有如dubbo一类的自定义报文的tcp协议。

序列化协议包含: 如基于文本编码的 xml json,也有二进制编码的 protobuf hessian等。

因此我理解的你想问的问题应该是:为什么要使用自定义 tcp 协议的 rpc 做后端进程通信?

要解决这个问题就应该搞清楚 http 使用的 tcp 协议,和我们自定义的 tcp 协议在报文上的区别。

首先要否认一点 http 协议相较于自定义tcp报文协议,增加的开销在于连接的建立与断开。http协议是支持连接池复用的,也就是建立一定数量的连接不断开,并不会频繁的创建和销毁连接。二一要说的是http也可以使用protobuf这种二进制编码协议对内容进行编码,因此二者最大的区别还是在传输协议上。

通用定义的http1.1协议的tcp报文包含太多废信息,一个POST协议的格式大致如下

HTTP/1.0 200 OK 
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
  <body>Hello World</body>
</html>

即使编码协议也就是body是使用二进制编码协议,报文元数据也就是header头的键值对却用了文本编码,非常占字节数。如上图所使用的报文中有效字节数仅仅占约 30%,也就是70%的时间用于传输元数据废编码。当然实际情况下报文内容可能会比这个长,但是报头所占的比例也是非常可观的。

那么假如我们使用自定义tcp协议的报文如下

报头占用的字节数也就只有16个byte,极大地精简了传输内容。

这也就是为什么后端进程间通常会采用自定义tcp协议的rpc来进行通信的原因。

-- 分割线 2017.08.03 --

所谓的效率优势是针对http1.1协议来讲的,http2.0协议已经优化编码效率问题,像grpc这种rpc库使用的就是http2.0协议。这么来说吧http容器的性能测试单位通常是kqps,自定义tpc协议则通常是以10kqps到100kqps为基准

简单来说成熟的rpc库相对http容器,更多的是封装了“服务发现”,"负载均衡",“熔断降级”一类面向服务的高级特性。可以这么理解,rpc框架是面向服务的更高级的封装。如果把一个http servlet容器上封装一层服务发现和函数代理调用,那它就已经可以做一个rpc框架了。

所以为什么要用rpc调用?

因为良好的rpc调用是面向服务的封装,针对服务的可用性和效率等都做了优化。单纯使用http调用则缺少了这些特性。

我估计题主是看了下面这个图,觉得http和rpc是在同一个层,而且互斥的概念。RPC只是对底层协议的封装,其实对具体的通信协议是啥并没有太多要求。



实际上application layer是可以有不止一层的,比如说RPC可以直接建立在tcp之上,也可以建立在http协议之上。对于rpc来说,这都是一样的,只要把通讯的内容塞进不同的报文理好了。

其实http是最常用的承载RPC的通信协议之一。而且我们可以在http 上传输xml和json这样的文本协议,也可以是protobuf和thrift这样的二进制协议,这都不是问题。大家常用的REST api就可以很好的封装成rpc。当然,http这种协议是笨重一些,但它的穿透性比较好,配套的设施也齐全,也比较简单直观,还是比较收欢迎的。比如说著名的grpc就通过http来传输。

至于题主说引用太多包的问题,这就是RPC的服务器端框架和实现的问题了。要看题主要用什么样的框架,但总的来说这些rpc框架是让你的远程调用更方便,而不是更麻烦的。

补充视频讲解: