Почему не работает распараллеливание потоков в gcc?

Здравствуйте!

В процессе попыток автоматического распараллеливания выполнения кода библиотеки ccv столкнулся с проблемой - отсутствием многопоточности. Для примера сделал отдельный файл и мучил его.
1) Файл
#include <stdio.h>
#define T 1000000
int main() {
    printf("HELO\n");
    long int i = 0;
    long int j = 0;
    for (i = 0; i < T; i++)
        for (j = 0; j < T; j++);
    printf("EHLO\n");
}

2) Команда используемая для компиляции:
gcc -floop-parallelize-all -ftree-parallelize-loops=4 hello.c -o ./hello_habr

3) Вывод при наличии ключа -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/4.6/lto-wrapper
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu/Linaro 4.6.3-1ubuntu5' --with-bugurl=file:///usr/share/doc/gcc-4.6/README.Bugs --enable-languages=c,c++,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-4.6 --enable-shared --enable-linker-build-id --with-system-zlib --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --with-gxx-include-dir=/usr/include/c++/4.6 --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --enable-gnu-unique-object --enable-plugin --enable-objc-gc --disable-werror --with-arch-32=i686 --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 4.6.3 (Ubuntu/Linaro 4.6.3-1ubuntu5) 
COLLECT_GCC_OPTIONS='-floop-parallelize-all' '-ftree-parallelize-loops=4' '-o' './hello_habr' '-v' '-mtune=generic' '-march=x86-64' '-pthread'
 /usr/lib/gcc/x86_64-linux-gnu/4.6/cc1 -quiet -v -imultilib . -imultiarch x86_64-linux-gnu -D_REENTRANT hello.c -quiet -dumpbase hello.c -mtune=generic -march=x86-64 -auxbase hello -version -floop-parallelize-all -ftree-parallelize-loops=4 -fstack-protector -o /tmp/ccCHjLGI.s
GNU C (Ubuntu/Linaro 4.6.3-1ubuntu5) version 4.6.3 (x86_64-linux-gnu)
	compiled by GNU C version 4.6.3, GMP version 5.0.2, MPFR version 3.1.0-p3, MPC version 0.9
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
ignoring nonexistent directory "/usr/local/include/x86_64-linux-gnu"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../../x86_64-linux-gnu/include"
#include "..." search starts here:
#include <...> search starts here:
 /usr/lib/gcc/x86_64-linux-gnu/4.6/include
 /usr/local/include
 /usr/lib/gcc/x86_64-linux-gnu/4.6/include-fixed
 /usr/include/x86_64-linux-gnu
 /usr/include
End of search list.
GNU C (Ubuntu/Linaro 4.6.3-1ubuntu5) version 4.6.3 (x86_64-linux-gnu)
	compiled by GNU C version 4.6.3, GMP version 5.0.2, MPFR version 3.1.0-p3, MPC version 0.9
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
Compiler executable checksum: 75e879ed14f91af504f4150eadeaa0e6
COLLECT_GCC_OPTIONS='-floop-parallelize-all' '-ftree-parallelize-loops=4' '-o' './hello_habr' '-v' '-mtune=generic' '-march=x86-64' '-pthread'
 as --64 -o /tmp/ccqL9j7e.o /tmp/ccCHjLGI.s
COMPILER_PATH=/usr/lib/gcc/x86_64-linux-gnu/4.6/:/usr/lib/gcc/x86_64-linux-gnu/4.6/:/usr/lib/gcc/x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/4.6/:/usr/lib/gcc/x86_64-linux-gnu/
LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/4.6/:/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../../lib/:/lib/x86_64-linux-gnu/:/lib/../lib/:/usr/lib/x86_64-linux-gnu/:/usr/lib/../lib/:/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../:/lib/:/usr/lib/
Reading specs from /usr/lib/gcc/x86_64-linux-gnu/4.6/libgomp.spec
COLLECT_GCC_OPTIONS='-floop-parallelize-all' '-ftree-parallelize-loops=4' '-o' './hello_habr' '-v' '-mtune=generic' '-march=x86-64' '-pthread'
 /usr/lib/gcc/x86_64-linux-gnu/4.6/collect2 --sysroot=/ --build-id --no-add-needed --as-needed --eh-frame-hdr -m elf_x86_64 --hash-style=gnu -dynamic-linker /lib64/ld-linux-x86-64.so.2 -z relro -o ./hello_habr /usr/lib/gcc/x86_64-linux-gnu/4.6/../../../x86_64-linux-gnu/crt1.o /usr/lib/gcc/x86_64-linux-gnu/4.6/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/4.6/crtbegin.o -L/usr/lib/gcc/x86_64-linux-gnu/4.6 -L/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/4.6/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/4.6/../../.. /tmp/ccqL9j7e.o -lgomp -lgcc --as-needed -lgcc_s --no-as-needed -lpthread -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/x86_64-linux-gnu/4.6/crtend.o /usr/lib/gcc/x86_64-linux-gnu/4.6/../../../x86_64-linux-gnu/crtn.o


Выполнение занимает больше 10 секунд, при этом нагружено только одно ядро. Из чего я смело сделал вывод, что распараллеливание не прошло.
Не подскажете ли, что я делаю не так?
  • Вопрос задан
  • 3641 просмотр
Решения вопроса 1
@alexanius
К сожалению, у меня сейчас gcc собран без поддержки распараллеливания, поэтому включаю телепатию.

В-первых прочитайте как работает автораспараллеливание. Например здесь.

Во-вторых есть подозрение, что без ключа -O3 данные флаги смысла не имеют.

В-третьих посмотрите дампы. Например по ключу -fdump-tree-parloops в данном случае. И вообще посмотрите в man'е gcc какие можно сбрасывать дампы. Они имеют префикс -fdump.

Если ни с -O3 не заработает, ни в дампах ничего полезного не найдёте, то спросите в рассылке gcc-help, там объяснят.
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
jcmvbkbc
@jcmvbkbc
"I'm here to consult you" © Dogbert
for (i = 0; i < T; i++)
        for (j = 0; j < T; j++);

На таком тестовом примере работу оптимизатора не увидеть никогда, потому что при -O0 оптимизатор не запускается, а при -О1,2,3 этот цикл будет выкинут целиком и заменён на i = T, j = T.
Ответ написан
@oleksandr_veles
Может имеет смысл смотреть в сторону OpenMP?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы