大数跨境
0
0

网络框架解完包后,进行业务数据处理,一定要单独开线程吗

网络框架解完包后,进行业务数据处理,一定要单独开线程吗 CppGuide
2023-02-03
2

在 《one thread one loop 思想》一文我们介绍了一个 loop 的主要结构一般如下所示:

while (!m_bQuitFlag)
{
epoll_or_select_func();

handle_io_events();

handle_other_things();
}

对于一些业务逻辑处理比较简单、不会太耗时的应用来说,handle_io_events() 方法除了收发数据也可以直接用来直接做业务的处理,即其结构如下:

void handle_io_events()
{
//收发数据
recv_or_send_data();

//解包并处理数据
decode_packages_and_process();
}

其中 recv_or_send_data() 方法中调用 send/recv API 进行实际的网络数据收发。以收数据为例,收完数据存入接收缓冲区后,接下来进行解包处理,然后进行业务处理,例如一个登陆数据包,其业务就是验证登陆的账户密码是否正确、记录其登陆行为等等。从程序函数调用堆栈来看,这些业务处理逻辑其实是直接在网络收发数据线程中处理的。我的意思是:网络线程调用 handle_io_events() 方法,handle_io_events() 方法调用 decode_packages_and_process() 方法,decode_packages_and_process() 方法做具体的业务逻辑处理。

需要注意的是,为了让网络层与业务层脱耦,网络层中通常会提供一些回调函数的接口,这些回调函数我们将其指向具体的业务处理函数。以 libevent 网络库的用法为例:

int main(int argc, char **argv)
{
struct event_base *base;
struct evconnlistener *listener;
struct event *signal_event;

struct sockaddr_in sin;

base = event_base_new();

memset(&sin, 0, sizeof(sin));
sin.sin_family = AF_INET;
sin.sin_port = htons(PORT);

//listener_cb是我们自定义回调函数
listener = evconnlistener_new_bind(base, listener_cb, (void *)base,
LEV_OPT_REUSEABLE|LEV_OPT_CLOSE_ON_FREE, -1,
(struct sockaddr*)&sin,
sizeof(sin));

if (!listener) {
fprintf(stderr, "Could not create a listener!\n");
return 1;
}

//signal_cb是我们自定义回调函数
signal_event = evsignal_new(base, SIGINT, signal_cb, (void *)base);

if (!signal_event || event_add(signal_event, NULL)<0) {
fprintf(stderr, "Could not create/add a signal event!\n");
return 1;
}

//启动loop
event_base_dispatch(base);

evconnlistener_free(listener);
event_free(signal_event);
event_base_free(base);

printf("done\n");
return 0;
}

上述代码根据 libevent 自带的 helloworld 示例修改而来,其中 listener_cbsignal_cb 是自定义的回调函数,有相应的事件触发后,libevent 的事件循环会调用我们设置的回调,在这些回调函数中,我们可以编写自己的业务逻辑代码。

这种基本的服务器结构,我们可以绘制成如下流程图:

这是这个结构的最基本逻辑,在这基础上可以延伸出很多变体。不知道读者有没有发现,上述流程图中第三步解包和业务逻辑处理这一步中(位于 handle_io_events() 中的 decode_packages_and_process() 方法中),如果业务逻辑处理过程比较耗时(例如,从数据库取大量数据、写文件),那么会导致 网络线程在这个步骤停留时间很长,导致很久以后才能执行下一次循环,影响网络数据的检测和收发,最终导致整个程序的效率低下。

因此,对于这种情形,我们需要将业务处理逻辑单独拆出来交给另外的业务工作线程处理,业务工作线程可以是一个线程池,这个过程业务数据从网络线程组流向业务线程组。

这样的程序结构图如下图所示:

上图中,对于网络线程将业务数据包交给业务线程,可以使用一个共享的业务数据队列来实现,此时网络线程是生产者,业务线程从业务数据队列中取出任务去处理,业务线程是消费者。业务线程处理完成后如果需要将结果数据发出去,则再将数据交给网络线程。这里处理后的数据从业务线程再次流向网络线程,那么如何将数据从业务线程交给网络线程呢?这里以发数据为例,一般有三种方法:

方法一

直接调用相应的的发数据的方法,如果你的网络线程本身也会调用这些发数据的方法,那么此时就可能会出现网络线程和业务线程同时对发方法进行调用,相当于多个线程同时调用 socket send 函数,这样可能会导致同一个连接上的数据顺序有问题,此时的做法时,利用锁机制,同一时刻只有一个线程可以调用 socket send 方法。这里给出一段伪代码,假设 TcpConnection 对象表示某路连接,无论网络线程还是业务线程处理完数据后需要发送数据,则使用:

void TcpConnection::sendData(const std::string& data)
{
//加上锁
std::lock_guard<std::mutex> scoped_lock(m_mutexForConnection);
//在这里调用 send
}

方法一的做法在设计上来说,存在让人不满意的地方,即数据发送应该属于网络层自己的事情,而不是其他模块(这里指的是业务线程)强行抢夺过来越俎代庖。

方法二

前面章节介绍了存在定时器结构的情况,网络线程结构变成如下流程:

while (!m_bQuitFlag)
{
check_and_handle_timers();

epoll_or_select_func();

handle_io_events();
}

业务线程可以将需要发送的数据放入另外一个共享区域中(例如相应的 TcpConnection 对象的一个成员变量中),定时器定时从这个共享区域取出来,再发送出去,这种方案的优点是网络线程做了它该做的事情,缺点是需要添加定时器,让程序逻辑变得复杂,且定时器是每隔一段时间才会触发,发送的数据可能会有一定的延迟。

方法三

利用线程执行流中的 handle_other_things() 方法,再来看下前面章节中介绍的基本结构:

while (!m_bQuitFlag)
{
epoll_or_select_func();

handle_io_events();

handle_other_things();
}

我们在《one thread one loop 思想》章节介绍了 handle_other_things() 函数可以做一些“其他事情”,这个函数可以在需要执行时通过前面章节介绍的唤醒机制立即被唤醒执行。业务线程将数据放入某个共享区域中(这一步和方法二介绍的一样),然后添加 "other_things" ,在 handle_other_things() 中执行数据的发送。

如果读者能清晰明白地看到这里,说明您大致明白了一个不错的服务器框架是怎么回事了。上面介绍的服务器结构是目前主流的基于 Reactor 模式的服务程序的通用结构,例如 libevent、libuv。

如果读者有兴趣,咱们可以再进一步深入讨论一下。网络编程技术交流群加微信 easy_code 

实际应用中,很多程序的业务逻辑处理其实是不耗时的,也就是说这些业务逻辑处理速度很快。由于 CPU 核数有限,当线程数量超过 CPU 数量时,各个线程(网络线程和业务线程)也不是真正地并行执行,那么即使开了一组业务线程也不一定能真正地并发执行,而业务逻辑处理并不耗时,不会影响网络线程的执行效率,那么我们不如就在网络线程里面直接处理。

上文介绍了在 handle_io_events() 方法中直接处理,如果处理的业务逻辑会产生新的其他任务,那么我们可以投递 "other_things",最终交给 handle_other_things() 方法来处理。此时的服务器程序结构如下:

特别说明一下:这种方式仅限于 handle_io_events() 或 handle_other_things() 里面不会有耗时的逻辑,才可以替代专门开业务线程,如果有耗时操作还得老老实实单独开业务线程。虽然线程数量超过 CPU 数量时,各个线程不会得到真正的并行,但那是操作系统线程调度的事情了,应用层开发不必关心这点。


C/C++ 网络编程实战训练营火热进行中~

适合人群

  • 有一定 C 、C++ 或 C# 基础的同学;
  • 想深入系统地学习下网络编程的同学;
  • 想独立设计或者想掌握如何研究大型开源项目的网络框架的同学;
  • 网络编程知识存在夹生饭,但是又不知道如何补缺补差的同学;
  • 网络编程爱好者。

不适合人群

  • 提问问题态度恶劣,老气横秋的人;

  • 叶公好龙、三分钟热度的人;

  • 对自己不负责,懒于提高的人;

  • 把学习当作别人的事情,缺少主观能动性的人。

学完后,你将获得的技能

  • 规范的代码编写能力和源代码管理能力;

  • 熟悉 C++11/14/17 常用语法;

  • 系统性地掌握 C/C++ 网络编程知识体系;

  • 熟悉网络编程模型,可以写出商业的网络通信模块;

  • 拥有一定的网络故障排查能力;

  • 掌握 Visual Studio 开发工具的高级使用技巧和调试方法;

  • 掌握 Linux gdb 调试;

  • 熟悉前后端如何联调;

  • 熟悉客户端和服务器网络框架如何组织,模块如何规划,细节如何实现,每一行代码如何考究地写;

  • 拥有容易地看懂市面上常见的网络库的能力;

  • C++ 面试中,网络编程问题轻松回答。

训练营大纲

热身篇

  • 开场白——摸底学员参加此训练营的诉求和期望目标

  • 开发工具介绍

  • 如何学习网络编程

基础篇 1 —— C++语言新特性

C++11~C++17 新增的 88 个用于实战的特性。

在这个系列中,我将结合一些流行的开源代码,详细地讲解 C++11~ C++17 新增的一些功能和特性,这些功能和特性是建议大家在自己的项目中经常使用的。

涉及到的项目 uWebSockets、Filezilla、TeamTalk、Chrome 浏览器等。

基础篇 2 —— 网络编程基础

  • 阻塞模式与非阻塞模式,同步与异步模式

  • 精讲常用 socket 函数(socket、connect、bind、accept、send、recv 等)

  • 瑞士军刀 nc 命令

  • 常用的 Socket 选项

  • 域名解析

  • 字节序

  • 实战项目 1—— Flamingo 客户端网络框架解析

网络编程进阶 1 —— IO 复用模型

  • IO 复用函数之 select 函数
  • 实战项目 2 —— TeamTalk 客户端网络框架解析
  • IO 复用函数之 poll 函数
  • IO 复用函数之 epoll 函数
  • 实战项目 3—— uWebSocket 网络框架解析
  • 实战项目 4—— 一个简单的 httpserver 的实现
  • Windows 网络模型 WSAPoll 精讲、WSAEventSelect 模型精讲、WSAAsyncSelect 模型精讲
  • 实战项目 5 —— Filezilla 源码 0.2 版本网络框架解析
  • 实战项目 6 —— 网狐源码游戏大厅网络框架解析
  • 实战项目 7 —— 电驴源码网络框架解析
  • Windows 网络模型 —— 完成端口模型(IOCP)精讲
  • 实战项目 8 —— gh0st 远程控制软件服务端网络框架解析

网络编程进阶 2 —— 协议设计与进阶

  • 应用层协议如何设计
  • telnet 命令与 telnet 协议
  • SSH 协议详解
  • curl 命令与 tcpdump 命令详解
  • HTTP 协议详解
  • 实战项目 9 —— Nginx 源码之解析 HTTP 协议精讲
  • 实战项目 10 ——如何在 Visual Studio 中调试 Windows 版本的 Nginx 源码
  • 实战项目 11 —— 12306 刷票软件的开发
  • 实战项目 12 —— 通过 Redis 源码来分析 Redis 协议格式
  • 实战项目 13 —— 邮箱协议与实现一个邮箱报警功能
  • 实战项目 14 —— 文件传输 FTP 协议与 Filezilla 中的实现
  • 实战项目 15 —— 如何搭建 MySQL-Server 8.0 调试环境
  • TLV 格式设计
  • Google Protobuf 原理分析

网络编程高级篇  —— 网络框架组件设计

  • 阻塞模式的使用场景

  • 异步 connect 函数

  • 收发数据的正确姿势

  • 收发缓冲区的设计

  • 一个线程处理一个连接的结构设计

  • one thread one loop 结构

  • 定时器设计

  • 实战项目 16 —— libuv 源码精讲

  • 客户端网络框架如何组织

  • 服务端网络框架如何组织

  • 实战项目17 —— pcshare 远程控制软件网络框架解析

  • 实战项目 18 —— Flamingo Server 新版网络框架解析

  • 实战项目 19 —— TeamTalk 服务端网络框架解析

  • 实战项目 20 —— FileZilla 最新源码网络框架解析

网络编程补缺补差篇

  • 如何保证关闭连接前,数据可以发送出去
  • 心跳包机制如何设计
  • 断线重连机制如何设计
  • 超时机制如何设计
  • 拔网线问题
  • 网络故障排查与定位
  • 监控端口
  • 三次握手与四次挥手常见问题解析
  • 实战项目 21 —— P2P 网络项目实战
  • 实战项目 22 —— 手把手教你在 Windows 上调试 Chrome 浏览器源码
  • 聊一聊面试中常考的网络编程问题
  • 课程总结

涉及到的开发工具

  • Visual Studio 2022
  • Visual Studio Code
  • gcc 9.1、gdb 8.3 等

课程时间安排

  • 线上腾讯会议直播课,手把手辅导;

  • 尽量每周安排 2 ~ 3 次课,时间会提前与学员商定,课后提供录像、课件和源码;

  • 课程周期约 3 ~ 4 月;

  • 课程有专门的打卡交流群和知识星球;

  • 自开营日开始,后续一年内提供技术解答和全部训练营录像。

课程费用

课程定价 3000,春节期间,前 5 名报名者八折优惠

有兴趣报名的同学,可加微信 easy_coder 咨询,非诚勿扰。



    
    
    
点个在看是对我最大的支持

【声明】内容源于网络
0
0
CppGuide
专注于高质量高性能C++开发,站点:cppguide.cn
内容 1260
粉丝 0
CppGuide 专注于高质量高性能C++开发,站点:cppguide.cn
总阅读582
粉丝0
内容1.3k