Tornado 源码分析
admin
2023-07-31 00:38:56
0

简述

源码分析基于 Tornado 2.0 版本,2.0 版本时候 Tornado 的介绍还是:

Tornado is an open source version of the scalable, non-blocking web server and and tools that power FriendFeed.

这个时候介绍中还未加入 asynchronous networking library,关于 Tornado 在以后版本中对 asynchronous 的支持,在下篇文章会进行介绍。

这篇文章主要介绍 Tornado 基本执行流程,对 HTTP Request 的解析和处理,和 No-blocking I/O 在 Tornado 的具体应用。

执行流程

我们用一个简单的 Hello World 示例分析其基本的执行流程。

1234567891011121314151617181920212223242526 #!/usr/bin/env python import tornado.httpserverimport tornado.ioloopimport tornado.optionsimport tornado.web from tornado.options import define, options define(\”port\”, default=8888, help=\”run on the given port\”, type=int) class MainHandler(tornado.web.RequestHandler):    def get(self):        self.write(\”Hello, world\”) def main():    tornado.options.parse_command_line()    application = tornado.web.Application([        (r\”/\”, MainHandler),    ])    http_server = tornado.httpserver.HTTPServer(application)    http_server.listen(options.port)    tornado.ioloop.IOLoop.instance().start() if __name__ == \”__main__\”:    main()

代码测试无误后,添加 pdb.set_trace() 开始获取 “调用堆栈”。

12345 class TestHandler(RequestHandler):    def get(self):        import pdb        pdb.set_trace()        self.write(\”Hello, World!\\n\”)

使用 curl 请求 curl http://localhost:8888 触发断点。
pdb 中输入 w 获取详细堆栈信息,输入 u d 可在上下堆栈之间切换,查看函数的调用情况。
以上测试方法来自于 参考资料 2。

IOLoop

先来看一下 IOLoop 的基本功能:


IOLoop 的基本功能

可以看到 IOLoop 是典型的 Reactor 模型 的实现。

再来看一下 Hello World 那个代码的详细执行流程,以及 IOLoop 是如何发挥总调度作用的:


IOLoop 调度流程

比较重要的是绿色部分把 listening socket fd 和 connecting socket fd 添加到 ioloop 中的过程。然后 ioloop 在监听到这些 fd 可用之后,开始调用对应的处理函数开始处理。

HTTP Request 的解析和处理


HTTP Request 的解析和处理

数据的读写都是通过 IOStream 实现,绿色部分表示对 HTTP Request Header 和 HTTP Request Body 的处理。

各 Class 的主要作用

Tornado 各个类的分工还是很清晰的,实现也比较容易看懂。

  • HTTPServer

    处理套接字的 listen/bind/accept。

  • IOStream

    处理套接字的 read/write。

  • HTTPConnection

    处理与 HTTP client 建立的连接,解析 HTTP Request 的 header 和 body。

  • IOLoop

    I/O loop,循环取出可用的 fd,并调用对应的事件处理函数。

  • RequestHandler

    处理请求,支持 GET/POST 等操作。

No-bloking I/O

先看两个事件处理函数:

12345678910111213141516171819 def handle_read():    socket.setblocking(False)    while True:        try:            data = socket.recv(1024)        except socket.error, e:            if e.args[0] in (errno.EWOULDBLOCK, errno.EAGAIN):                return            raise def handle_accept():    socket.setblocking(False)    while True:        try:            connection, address = sockets.accept()        except socket.error, e:            if e.args[0] in (errno.EWOULDBLOCK, errno.EAGAIN):                return            raise

考虑一下这里为什么要采用非阻塞方式来 read/accept 数据?
我们发现 IOLoop 已经通过多路复用帮我们监听了所有 fds,等 fd 可用之后才开始调用对应的事件处理函数。换句话说在调用 handle_read/handle_accept 我们已经知道 fd 可用了,那为什么不采用阻塞 I/O 读取,而要采用非阻塞 I/O 的方式呢?
问题其实可以抽象成「多路复用为什么要搭配非阻塞 I/O」,具体讨论可以参考 这里。

参考资料

  1. Tornado 2.0
  2. 有没有什么很好的 Tornado 的教材或者开源项目可以做参考的?
  3. Tornado: 1. 流程分析
  4. Tornado: 2. 源码分析
  5. 高性能网络编程(一)—- accept 建立连接
  6. 为什么 IO 多路复用要搭配非阻塞 IO?


相关内容

热门资讯

Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
500 行 Python 代码... 语法分析器描述了一个句子的语法结构,用来帮助其他的应用进行推理。自然语言引入了很多意外的歧义,以我们...
定时清理删除C:\Progra... C:\Program Files (x86)下面很多scoped_dir开头的文件夹 写个批处理 定...
scoped_dir32_70... 一台虚拟机C盘总是莫名奇妙的空间用完,导致很多软件没法再运行。经过仔细检查发现是C:\Program...
65536是2的几次方 计算2... 65536是2的16次方:65536=2⁶ 65536是256的2次方:65536=256 6553...
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
pycparser 是一个用... `pycparser` 是一个用 Python 编写的 C 语言解析器。它可以用来解析 C 代码并构...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
Apache Doris 2.... 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于...
python清除字符串里非数字... 本文实例讲述了python清除字符串里非数字字符的方法。分享给大家供大家参考。具体如下: impor...