
1 yangqi 2017-05-06 01:14:16 +08:00 |
2 aliipay OP @yangqi 看上去很厉害的样子,先慢慢研究下。 问题是多线程实现?我的程序本身是多线程了,cpu 已经满了,不知道能否提升性能 |
3 denghongcai 2017-05-06 01:38:02 +08:00 |
4 denghongcai 2017-05-06 01:39:56 +08:00 循环次数这么一点点就不要搞 OpenMP 了 |
5 aliipay OP @yangqi gcc version 4.8.5 20150623 warning: ignoring #pragma omp parallel [-Wunknown-pragmas] 我单独编译一个 demo 是正常的 加入到现有工程就报这个警告 |
6 Fishdrowned 2017-05-06 07:51:38 +08:00 via Android |
7 aliipay OP @Fishdrowned 这个试过了,能提高 10%左右 |
8 zk8802 2017-05-06 12:10:25 +08:00 via iPhone 开启优化之后,编译器应该可以自动进行 loop unrolling 的。你编译之后的汇编代码长什么样? |
9 zwzmzd 2017-05-06 13:01:07 +08:00 via iPhone |
10 billlee 2017-05-06 13:42:56 +08:00 你编译的时候加了 -march=native 吗? |
11 aliipay OP @billlee 每加,加了更慢 现在用的是-fprefetch-loop-arrays -g -ggdb -D__USE_ISOC99 -DNDEBUG -Ofast -fPIC -Wall -std=c++11 |
12 linux40 2017-05-07 09:34:19 +08:00 via Android 不考虑 memcpy 吗 |
14 linux40 2017-05-07 09:38:25 +08:00 via Android 不考虑 restrict 吗 |