TensorFlow 2 现已支持使用 macOS 上可用的 GPU 进行模型加速(包括 Apple Silicon M1) - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mmtromsb456
V2EX    Apple

TensorFlow 2 现已支持使用 macOS 上可用的 GPU 进行模型加速(包括 Apple Silicon M1)

  •  3
     
  •   mmtromsb456 2020-11-19 09:08:06 +08:00 5093 次点击
    这是一个创建于 1788 天前的主题,其中的信息可能已经有所发展或是发生改变。
    19 条回复    2020-11-19 15:16:39 +08:00
    mmtromsb456
        1
    mmtromsb456  
    OP
       2020-11-19 09:08:19 +08:00
    简单来说 apple fork 了一份 TensorFlow 并将 ML Compute 框架用作其中,M1 性能大概相当于 1080 ~ 1080Ti 之间
    ltltfuture
        2
    ltltfuture  
       2020-11-19 09:13:22 +08:00 via Android
    接下来就看 pytorch 如何了
    xfrgux
        3
    xfrgux  
       2020-11-19 09:13:55 +08:00
    @mmtromsb456 请问这个相当于 1080 ~ 1080Ti 有数据来源吗 怎么比的呢
    mmtromsb456
        4
    mmtromsb456  
    OP
       2020-11-19 09:17:25 +08:00 via iPhone   2
    zhusimaji
        5
    zhusimaji  
       2020-11-19 09:19:20 +08:00
    apple 不讲武德啊!
    tzm41
        6
    tzm41  
       2020-11-19 09:21:17 +08:00 va iPhone
    爽,今晚试试 resnet 。
    uxstone
        7
    uxstone  
       2020-11-19 09:27:34 +08:00   1
    Apple 杀疯了
    lollxxox
        8
    lollxxox  
       2020-11-19 09:34:43 +08:00
    希望 I 家 A 家和 N 家耗子尾汁,不要再挤牙膏.......
    chich14
        9
    chich14  
       2020-11-19 10:00:09 +08:00
    炼丹,风扇转了吗?
    CommandZi
        10
    CommandZi  
       2020-11-19 10:19:56 +08:00
    专用芯片,不能反映真实性能,下一个
    agagega
        11
    agagega  
       2020-11-19 10:37:36 +08:00
    能支持 NPU 吗?利用起来感觉会更猛啊
    unneeded
        12
    unneeded  
       2020-11-19 10:41:12 +08:00 via iPhone
    用自己机器都是玩票性质,现在 m1 的玩票性能起来了,对于初学者来说 n 卡笔记本似乎已经不是必须了
    nnqijiu
        13
    nnqijiu  
       2020-11-19 11:15:37 +08:00
    TensorFlow 不是已经放弃 mac 支持了吗?
    coolmenu
        14
    coolmenu  
       2020-11-19 11:34:48 +08:00
    以后能不能大量购买 M1 芯片,组一个并发网络。10w 的 cpu,比 1080ti 可是省电多啦!!
    lqf96
        15
    lqf96  
       2020-11-19 11:44:56 +08:00   2
    @ltltfuture 好希望早日支持 pytorch,不过 pytorch 似乎也已经在用 Metal Performance Shaders 加速训练和运行了( https://github.com/pytorch/pytorch/pull/46112 )...
    @agagega 目前 ML Compute 只支持 CPU 和 GPU,但是 ML Compute 里面有 ANE 相关的 symbol,所以不排除是目前 Neural Engine 的加速不成熟(因为 MLC 是 macOS 11 和 iOS 14 刚加进来的),以后可能就会支持...

    ```
    00007fff2a15aae2 t +[MLCDeviceANE hasANE]
    00007fff2a22b934 t +[MLCDeviceANE hasANE].cold.1
    00007fff2a15b672 t -[MLCDeviceANE .cxx_destruct]
    00007fff2a15ad57 t -[MLCDeviceANE allocateDeviceMemoryForTensor:]
    00007fff2a22bcad t -[MLCDeviceANE allocateDeviceMemoryForTensor:].cold.1
    00007fff2a15b05c t -[MLCDeviceANE broadcastTensor:]
    00007fff2a22c124 t -[MLCDeviceANE broadcastTensor:].cold.1
    00007fff2a15b0b1 t -[MLCDeviceANE broadcastTensor:batchSize:]
    00007fff2a22c1a3 t -[MLCDeviceANE broadcastTensor:batchSize:].cold.1
    00007fff2a15b309 t -[MLCDeviceANE commitAndWaitForCompletion:]
    00007fff2a22c51c t -[MLCDeviceANE commitAndWaitForCompletion:].cold.1
    00007fff2a15b35e t -[MLCDeviceANE commitAndWaitForCompletion:enableProfiling:graphExecutionTime:graphResultTensor:]
    00007fff2a22c59b t -[MLCDeviceANE commitAndWaitForCompletion:enableProfiling:graphExecutionTime:graphResultTensor:].cold.1

    ...
    ```
    sharpy
        16
    sharpy  
       2020-11-19 11:58:29 +08:00
    有问题,我安装了 mac 提供的 tf 包,运行 mnist demo 时,提示在 eager 模式下 gpu 速度慢。
    用 cpu 时耗时 2s,用 gpu 时耗时 9s 。
    wwqgtxx
        17
    wwqgtxx  
       2020-11-19 12:09:27 +08:00 via iPhone
    @sharpy 做性能测试本来就不该用 eager 模式,而且一般要多运行几个循环来去掉 gpu 初始化的时间
    tzm41
        18
    tzm41  
       2020-11-19 12:42:20 +08:00
    测了一下简单的 CNN,不知为何在我的 MBP 16 上 batch 之间会卡住。
    volvo007
        19
    volvo007  
       2020-11-19 15:16:39 +08:00 via iPhone
    Metal 的话,能外接 a 卡提速吗
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2542 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 01:59 PVG 09:59 LAX 18:59 JFK 21:59
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86