async/await 这个协程 异步为什么对磁盘 io 无效?
import asyncio
async def wr1(): # f = open('text1.txt','w') # for x in range(1,39999999): # f.write('12345ddd') # f.close()
f = open('text3.txt','r') print(f.read()) f.close()
async def wr2(): # f = open('text2.txt','w') # for x in range(1,79999999): # f.write('23456fff') # f.close()
for x in range(1,519999): print('xx')
async def wr3(): # f = open('text3.txt','w') # for x in range(1,99999999): # f.write('34567ggg') # f.close()
for x in range(1,919999): print('yy')
def demo4():
async def washing1(): await wr1() async def washing2(): await wr2() async def washing3(): await wr3() # 1. 创建一个事件循环 loop = asyncio.get_event_loop() # 2. 将异步函数加入事件队列 tasks = [ washing1(), washing2(), washing3(), ] # 3. 执行事件队列, 直到最晚的一个事件被处理完毕后结束 loop.run_until_complete(asyncio.wait(tasks)) # 4. 如果不再使用 loop, 建议养成良好关闭的习惯 loop.close()
if name == 'main': start = time()
demo4() end = time() print('elapsed time = ' + str(end - start))
第一段是读取磁盘,第二第三段是打印。按道理遇到 io,dma 交出总线,cpu 就空运转直到有数据才工作,所以 wr1 应该和 2 或 3 一块执行才对的,而实际情况不是这样的,是跟单线程同步执行一样的所需时间
![]() | 1 lucays 2020-04-15 18:21:41 +08:00 washing1(),washing2(),washing3()不要 await wr1(),wr2(), wr3()这么搞,这样本来就和同步一样了 |
![]() | 2 lniwn 2020-04-15 18:22:48 +08:00 ![]() 首先你得明白协程的概念,不是加个 async 修饰就能叫异步函数的。如果使用了 asyncio,那 io 以及 sleep 等操作,就要使用 asyncio 包内的封装函数。或者使用 executor 。 你的代码里 open 操作卡死整个线程,导致没法 yield 到其他协程,所以只能顺序执行。 |
![]() | 3 CosimoZi 2020-04-15 18:24:32 +08:00 ![]() 不是你说他是协程它就是协程的,它得是协程它才是一个协程. https://github.com/Tinche/aiofiles |
![]() | 4 gwy15 2020-04-15 18:27:00 +08:00 在异步函数里面调用同步函数还是会阻塞的啊,你得用异步的文件接口。官方库里面没有,得用线程池,或者你自己造。 |
![]() | 5 iyaozhen 2020-04-15 18:44:56 +08:00 这就是 Python 这些语言半路出家搞协程的缺点 底层很多东西没有异步,不是简单加个 async 关键字就解决问题了 其实目前绝大部分异步方案都无法做到文件 IO 的异步,都是线程池去模拟的 |
![]() | 6 iyaozhen 2020-04-15 18:46:26 +08:00 |
![]() | 7 janxin 2020-04-15 18:50:26 +08:00 via iPhone 需要选择支持异步功能的 io 库 |
![]() | 8 fghjghf OP |
![]() | 9 Trim21 2020-04-15 22:09:26 +08:00 网络 io 有原生协程,文件 io 要要协程只能用线程包起来,没法原生异步。 |
![]() | 10 fghjghf OP @Trim21 不懂求解。 from tornado.web import RequestHandler from tornado import gen import tornado.ioloop class IndexHandler(RequestHandler): def get(self): self.write('this is index') class BlockingHandler(RequestHandler): async def get(self): result = await self.dosomething() self.write(result) async def dosomething(self): # 如果是其他处理函数或者逻辑,要保证函数是协程 await gen.sleep(20) return 'block end' app = tornado.web.Application([ (r"/index", IndexHandler), (r"/blocking", BlockingHandler) ]) if __name__ == "__main__": app.listen(80) tornado.ioloop.IOLoop.instance().start() 那 async/await 用在 tornado6 上有啥作用呢?一定要 asyncio 内包装的函数才有效。但 IOLoop 已经用 epoll 实现网络 io 复用了。实际应用中,堵塞的不都是磁盘 io 么。那这么做的目的又是啥呢 |
![]() | 11 Trim21 2020-04-15 22:47:31 +08:00 @fghjghf #10 io 复用和异步 io 是两个概念吧,async/await 是为了解决 io 阻塞,不负责解决 io 是否复用的问题。 |
![]() | 12 fghjghf OP @Trim21 但网络 io 的堵塞问题,封装 eopll 的 ioloop 已经帮我们处理了。底层有个队列。socket 非堵塞执行,epollin 和 out 的时候才能寻找对应路由表执行逻辑。EAGAIN 就 modify epoll 的状态,继续执行队列的下一个,如此类推。那就是能走到路由表的 client socket 的网络 io 绝对是可用的。根本不存在堵塞啊。那 tornado 上的 async/await 具体有啥作用呢,不知道我这理解有没有错 |
![]() | 13 Trim21 2020-04-15 23:19:07 +08:00 @fghjghf #12 这个是 python 语言内的异步。之前 python 同步调用(比如 requests.get )是没法在 io 阻塞的时候让出解释器的。 |
![]() | 14 PTLin 2020-04-15 23:33:36 +08:00 |
15 lolizeppelin 2020-04-16 02:19:45 +08:00 没学会走就开始跑就这结果了 正正经经的把异步编程写几次,什么 select,epoll 多线程都好好用过几次再来折腾协程吧 别堕落到低端 php 程序员的水准好么 |
16 neoblackcap 2020-04-16 03:00:36 +08:00 async/await 本质上是对 IO 复用机制的封装,系统提供的 IO 复用不能完成的事情,async/await 也不能实现。比如你想用底层是 epoll 实现的 eventloop 去处理文件 IO 那是不行的,要不就是模拟。 去读《 Unix 网络编程》吧,回来就会更好地理解这些语法 |
![]() | 17 dreamapple 2020-04-16 03:41:02 +08:00 via Android python 的异步不完备吧,现在没必要在上面浪费时间 |
18 conn4575 2020-04-16 07:28:29 +08:00 via Android 官方 group 有讨论过这个问题,由于底层系统不支持,现在的异步本地 io 都是多线程包装的,实际的提升很小,所以 asycio 才没有做这个 |
![]() | 19 CzaOrz 2020-04-16 08:43:57 +08:00 --- async/await 这个协程 异步为什么对磁盘 io 无效? 可以看看官网文档,明确说了对磁盘 IO 不支持,他们推荐 `loop.run_in_executor` |
![]() | 21 Orenoid 2020-04-16 09:48:54 +08:00 因为 python 的协程本质上是借助 IO 多路复用来实现异步的,磁盘 IO 没有相应的机制和接口 |
![]() | 22 fghjghf OP @lolizeppelin 不看我上面的回复吗?张嘴就来??? |
![]() | 23 pmispig 2020-04-16 10:22:08 +08:00 python 的协程就是搞笑的,别花太多心思,底层大部分不支持。比如网络 io,你用 socket 弄到死都不能异步,你得用 asyncio.open_connection(host,22), |
![]() | 24 ipwx 2020-04-16 10:23:39 +08:00 @pmispig ... asyncio.XXX 也是 socket 啊,不是 socket 库的才是 socket 啊。你这批判毫无道理啊。 |
![]() | 26 pmispig 2020-04-16 10:27:04 +08:00 @ipwx 看你跟什么比,你用 go 的,最基础的 net.Conn 就是支持的,python 要是不能让 socket 支持,那异步有个毛用呢,现在这么多库都是基于 socket,得要人家全部重写 |
![]() | 27 ipwx 2020-04-16 10:33:22 +08:00 |
28 youxiachai 2020-04-16 10:35:37 +08:00 ![]() |
![]() | 29 sikong31 2020-04-16 11:10:54 +08:00 这需要库专门支持,比如 requests 不行得用 aiohttp 不像多线程,直接往里面放就行了,多线程该阻塞的还是阻塞,只不过不在一个线程 协程是阻塞的时候直接转向 loop 里的下一个任务,所以这里面就有一个操作,就是告诉系统你待会儿来找我, 普通的库并没有这个操作,只会让你等着 就像买东西,有些人你能打个招呼,待会等做完了来取东西,有些只能等着不能走 |