最近给SRPC项目写几篇学习文章,希望协助小伙伴通过这个轻量级的框架快速了解RPC相关内容。
本篇为第二篇,注重于解读一次RPC请求的过程,是最简单、最主干的部分,而里边每一个层级怎么做资源调度和复用都不会包括在内,因此有基础的小伙伴可以直接跳读源码解析。
1. RPC概念简述
SRPC项目地址:https://github.com/sogou/srpc
花一点点时间补充RPC的基本概念,其字面意思是Remote Procedure Call,远程过程调用。也就是说:
- 如果我们是客户端,通过RPC调用,把某些事情交给远程机器去做;
- 如果我们是服务端,就是被调用,别人交一些事情让我做;
那么必然涉及到三个小问题:
- 请求是什么?
- 怎么指定调用哪个过程?
- 怎么给填好回复?
整个调用由客户端发起。服务端启动服务器之后,等待他人调用。
我们举个小例子,上述三个小问题可以这样:
- 请求是
int a
和int b
; - 指定调用对方的
sum
; - 回复是求和后的值
int ret
;
一会儿用这个例子看看RPC框架的代码是怎么做的。
2. 协议与框架
我们常提到的RPC可能是一种框架
:
用来帮我们做网络收发。
比如SRPC是个轻量级的RPC框架,还有大家熟知的GRPC、Thrift等。
也可能是一种协议
:
RPC协议让不同语言、不同框架都可以互通。
个人理解协议的本质是为了生态服务的,RPC承担的是衔接整个生态系统的桥梁。
两者关系:
以SRPC为例,支持多种协议,包括SRPC、Thrift、BRPC、tRPC,另外还可以收发HTTP协议。
我们给出一张RPC请求过程的图及其中涉及到的关键函数接口,然后正式开始下面的学习。
这里我们看到几个有意思的事情:
- 请求/回复,是对称的。
- 对客户端Client来说,请求时发出SRPCRequest,收到SRPCResponse;
- 对服务端Server来说,收到SRPCRequest,回复时发出SRPCResponse;
- 收/发,接口是对称的。
- 发消息的接口都是encode(),无论我要发的是SRPCRequest还是SRPCResponse;
- 收消息的接口都是append(),无论我要收的是SRPCRequest还是SRPCResponse;
- Client/Server,也是对称的。
- Client主动发出请求,然后回复时是被动调起callback()的(哪怕我们用同步接口,那也是调用完代码再往下走);
- Server被动接收请求,然后回复是process()处理完之后主动进行的。
3. 定义RPC接口
我们刚才三个小问题怎么定义呢?可以使用protobuf
作为接口描述文件:
// [ MyService.proto ]
syntax="proto2";
message Request { // request包含了a和b
required int32 a = 1;
required int32 b = 2;
};
message Response { // response包含了ret
required int32 ret = 1;
};
service MyService { // 服务名,用来区分我们的服务
rpc Sum(Request) returns (Response); // 调用名字为Sum的函数
};
也可以配合srpc小工具的api命令,产生一个简单的protobuf描述文件,并进行修改。命令参考如下:
./srpc api MyService
然后就可以根据提示,打开MyService.proto并编辑其中的接口定义。
4. step-0 : client发出请求
如总图的step-0,我们想要发出请求,就需要调用上述定义的RPC接口Sum( )
:
// [ client_main.cc ]
int main()
{
MyService::SRPCClient client("127.0.0.1", 1412);
Request req; // 准备好Request
Response resp; // 准备好Response
RPCSyncContext ctx; // 一些必要的请求上下文,包括调用状态码
req.set_a(1); // 填a
req.set_b(2); // 填b
client.Sum(&req, &resp, &ctx); // 调用Sum()
...
}
当然想要框架知道怎么从上述的protobuf文件进行调用,我们需要一些代码生成工作。这不是本篇的重点,因此这里仅列出一些命令供大家运行起来。
我们根据刚才srpc小工具的示例,通过改好的proto文件把项目生成出来:
./srpc rpc my_rpc_project -f MyService.proto -p ./
我们打开生成代码MyService.srpc.h
,可以看到刚才调用的Sum()
函数的异步接口和同步接口,定义如下:
// [ MyService.srpc.h ]
class SRPCClient : public srpc::SRPCClient
{
public:
void Sum(const Request *req, SumDone done);
void Sum(const Request *req, Response *resp, srpc::RPCSyncContext *sync_ctx);
...
};
5. step-1:框架为Client发出请求
以上,我们作为RPC的用户,代码就告一段落了。
接下来交给RPC框架干活,它要做的事情包括但不仅限于:
把这个请求内容、以及用户要调用哪个服务(service)的哪个函数(method)告诉远程,并通过网络发送出去。
我们想要了解一个框架如何工作时,首先要了解它是基于什么构建起来的,包括什么语言什么底层网络收发库等。
SRPC是基于Workflow的任务流编程范式开发的,并使用了其携带的网络收发功能,因此我们可以不用手写I/O多路复用等事情,但是开发需要遵循Workflow的编程规范,即:任务流
。
我们可以认为对于网络任务来说,一次会话就是一个task,对于client我们的task职责就在于把Request发给对方,收回Response。
继续围观生成代码MyService.srpc.h,我们看一下最简单的异步接口实现是什么:
// [ MyService.srpc.h ]
inline void SRPCClient::Sum(const Request *req, SumDone done)
{
auto *task = this->create_rpc_client_task("Sum", std::move(done));
task->serialize_input(req);
task->start();
}
内部会构造出一个RPCClientTask
,它被task->start();
之后,就可以认为请求交给框架,用户态无需再关心,直到回复时框架通过回调等机制叫醒用户代码。
由于RPCClientTask
的定义比较复杂,我们挑重点看:
// [ rc/rpc_task.inl ]
// 1. 它派生于Workflow的WFComplexClientTask,
// 以REQ,RESP为模版,定义了内部请求与回复的格式,
// 我们这里分别是SRPCRequest和SRPCResponse。
template<class RPCREQ, class RPCRESP>
class RPCClientTask : public WFComplexClientTask<RPCREQ, RPCRESP>
{
...
protected:
// 2. SPRC框架重新实现了父类的方法message_out(),
// 用来告诉Workflow网络层面这次发出的请求内容时啥
CommMessageOut *message_out() override;
// 3. 保存了一个rpc_callback, 让网络回复了之后通知SRPC框架
// SRPC框架再去做网络请求到用户Response的格式转换
void rpc_callback(WFNetworkTask<RPCREQ, RPCRESP> *task);
};
上述的RPCREQ
就是我们发出的请求,SRPCRequest
与SRPCResponse
都从SRPCMessage
派生:
// [ src/message/rpc_message_srpc.h ]
class SRPCRequest : public SRPCMessage
{
...
};
class SRPCResponse : public SRPCMessage
{
...
};
那么谁定义了 SRPCMessage
的内存结构呢?就是SRPC协议
。下图可以清晰地看到,我们在SRPC协议头部就有meta部分,上述提到的service
和method
就是填在里边。而后面的message就是我们的Request。
我们把消息按照上述结构,通过SRPCMessage::encode()
接口填好。这是Workflow的接口,它会在进行网络发送时entry->session->out->encode()
被调用。
// [ src/message/rpc_message_srpc.h ]
inline int SRPCMessage::encode(struct iovec vectors[], int max, size_t size_limit)
{
// 这里用上了RPC协议,我们按照协议结构填内容。
}
6. step-2:与操作系统相关的网络操作
这部分在Workflow中实现,涉及到的网络基础知识很多,后续会针对性展开写学习心得,包括:
- 命名服务
- 目标选取
- 负载均衡
- 连接管理
- IO多路复用
等等,现在暂时跳过。
7. server接收请求
我们切换一下视角,来到上述总图的右半边,server要接收请求了。
当然server作为一个被动接收者,它需要先被用户启动起来。以下是用户代码:
// [ server_main.cc ]
int main()
{
SRPCServer server; // 1. 构造一个server,负责网络请求
MyServiceServiceImpl impl; // 2. 构造一个服务,负责实现Sum
server.add_service(&impl); // 3. 把服务实现加到server中
if (server.start(1412) == 0) // 4. 传入端口,把server跑起来
{
printf("my_rpc_project SRPC server started, port %u\n", 1412);
wait_group.wait(); // 5. server start也是异步的,暂时要卡住主线程不退出
server.stop();
}
else
perror("server start");
return 0;
}
然后就可以愉快地按照SRPC协议来接受请求了。
这是谁来做的呢?RPCServer来做的。
8. step-4:框架为server接受请求
// [ src/rpc_server.h ]
// 1. 从Workflow的WFServer派生
// 由RPCTYPE::REQ和RPCTYPE::RESP来指定请求与回复的类型
template<class RPCTYPE>
class RPCServer : public WFServer<typename RPCTYPE::REQ,
typename RPCTYPE::RESP>
{
...
protected:
// 2. 需要实现怎么构造一次会话,即RPCServerTask
CommSession *new_session(long long seq, CommConnection *conn) override;
// 3. 调用具体server接口的地方
void server_process(NETWORKTASK *task) const;
...
};
我们的父类WFServer是可以帮我们按照某种协议收网络包的,只需要:
- 我们实现new_session(), new 一个RPCServerTask给它;
- 在模版参中指定的RPCTYPE::REQ上实现append()接口,指引Workflow网络层面如何从操作系统收到的数据上切一份完整的REQ下来。
其中第一步不是必须的,但我们SRPC框架需要,因为我们在本次会话有一些上下文要处理。但本文中我们只需关心REQ。
这个REQ就是SRPCRequest
,父类就是SRPCMessage
,刚才也有提到过它的encode()
实现,现在看看它的append()
实现:
// [ src/message/rpc_message_srpc.cc ]
int SRPCMessage::append(const void *buf, size_t *size, size_t size_limit)
{
... // 把网络收到的一批buf,按照RPC协议保存到我的内存里,
... // 并通过返回值告知核心我收发完没有,因为内部需要维护状态
}
Workflow会不停调用这个append()
来把SRPC协议图里的消息收完。
我们这里通过返回值来告知Workflow的网络层本条消息的接收情况:
- 1:消息接受完成;
- 0:未完成,继续收;
- < 0:错误;
只要返回1,流程就会继续往下走,也就是到了process()
函数。
9. step-5:调用开发者的rpc函数
SRPC框架收完消息之后,需要对meta进行一些处理:
- 根据meta里的service去找到用户刚才server.add_service(impl)时的那个service;
- 根据meta里的method去找用户的impl里实现的函数;
然后就可以调用server端开发者实现的rpc函数了。
查找过程很简单,以下是简化的流程:
// [ src/rpc_server.h ]
template<class RPCTYPE>
void RPCServer<RPCTYPE>::server_process(NETWORKTASK *task) const
{
// 1. 把SRPC协议中的meta信息反序列化出来
req->deserialize_meta();
...
// 2. 找service对象
auto *service = this->find_service(req->get_service_name());
...
// 3. 找method对象
auto *rpc = service->find_method(req->get_method_name());
...
// 4. 进一步处理
status_code = (*rpc)(server_task->worker);
...
}
注意上述的进一步处理是因为,我们还需要对body进行反序列化:
// [ src/rpc_service.h ]
template<class INPUT, class OUTPUT, class SERVICE>
static inline int
ServiceRPCCallImpl(SERVICE *service,
RPCWorker& worker,
void (SERVICE::*rpc)(INPUT *, OUTPUT *, RPCContext *))
{
// 1. new一片请求,是一开始定义的包含a和b的Request,它是个ProtobufMessage
auto *in = new INPUT;
// 2. 按照网络包里的body,从req反序列化处出来到in上
int status_code = worker.req->deserialize(in);
// 3. new一片回复,是一开始定义的包含ret的Response,它也是个ProtobufMessage
auto *out = new OUTPUT;
// 4. 调用用户代码实现的rpc函数,进行计算
(service->*rpc)(in, out, worker.ctx);
}
之后就可以交给框架做回复返回的事情了。
10. 对称的回程
我们最后简单看一下用户代码里一般长啥样,也就是刚才impl里的rpc实现:
// [ server_main.cc ]
class MyServiceServiceImpl : public MyService::Service
{
public:
void Sum(Request *request, Response *response, srpc::RPCContext *ctx) override
{
// 这里是我们自己实现的加法
response->set_ret(request->a() + request->b());
}
};
之后,用户无需进行任何代码编写,SRPC和Workflow会进行step-6和step-7,与先前的步骤类似且对称地,把回复填好并发出。
而client端又会先从Workflow和SRPC进行step-8和step-9,同样与上述步骤类型且对称地,把回复收好,并调用到我们的callback,或者在同步接口中(也就是文中的Sum调用示例)填好Response,此次请求就完整结束了。
// [ client_main.cc ]
int main()
{
...
client.Sum(&req, &resp, &ctx);
if (ctx.success)
fprintf(stderr, "ret = %d\n", resp.ret());
else
fprintf(stderr, "sync status[%d] error[%d] errmsg:%s\n", ctx.status_code, ctx.error, ctx.errmsg.c_str());
return 0;
}
附上从调用模块角度来看的one round图:
更多内容参考:https://github.com/sogou/srpc/blob/master/docs/wiki.md
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。