
1 dingyaguang117 2013 年 11 月 1 日 应该是内存到显存对拷的时候比较慢吧,感觉本来没有什么运算,这样拷进去比较一下,再拷出来 肯定慢 |
2 madeye 2013 年 11 月 1 日 建议贴出代码,我这儿有全套环境帮你做 Perf tuning。 另外一个开源的 CUDA grep 见这里: http://bkase.github.io/CUDA-grep/finalreport.html |
3 msg7086 2013 年 11 月 1 日 显卡强在并行密集运算,用途不太合适。 |
4 haoji OP |