1

mpi と並行してコードを実行すると、実行時にコードに非常に奇妙な問題が発生します。

*** glibc detected *** ./QuadTreeConstruction: munmap_chunk(): invalid pointer: 0x0000000001fbf180 ***
======= Backtrace: =========
/lib/libc.so.6(+0x776d6)[0x7f38763156d6]
./QuadTreeConstruction(_ZN9__gnu_cxx13new_allocatorImE10deallocateEPmm+0x20)[0x423f04]
./QuadTreeConstruction(_ZNSt13_Bvector_baseISaIbEE13_M_deallocateEv+0x50)[0x423e72]
./QuadTreeConstruction(_ZNSt13_Bvector_baseISaIbEED2Ev+0x1b)[0x423c79]
./QuadTreeConstruction(_ZNSt6vectorIbSaIbEED1Ev+0x18)[0x4237d2]
./QuadTreeConstruction(_Z22findLocalandGhostCellsRK8QuadTreeRK6ArrayVIiES5_iRS3_S6_+0x849)[0x41dbbd]
./QuadTreeConstruction(main+0xa32)[0x41ca49]
/lib/libc.so.6(__libc_start_main+0xfe)[0x7f38762bcd8e]
./QuadTreeConstruction[0x41b029]

私のコードは、mpi ライブラリの内部にあるいくつかのエラーを valgrind でクリーンアップしています (私は OpenMpi を使用しており、これまで何度も見てきましたが、問題になったことはありません。http: //www.open-mpi.org/faq を参照してください)。 /?category=debugging#valgrind_clean )。シリアルで実行しているときは問題ありません。

gdb を使用してシステム コールの問題を突き止めることができましSIGABORTた。コードが壊れたときのスタックは次のとおりです。

0   raise   raise.c 64  0x7f4bd8655ba5  
1   abort   abort.c 92  0x7f4bd86596b0  
2   __libc_message  libc_fatal.c    189 0x7f4bd868f65b  
3   malloc_printerr malloc.c    6283    0x7f4bd86996d6  
4   __gnu_cxx::new_allocator<unsigned long>::deallocate new_allocator.h 95  0x423f04    
5   std::_Bvector_base<std::allocator<bool> >::_M_deallocate    stl_bvector.h   444 0x423e72    
6   std::_Bvector_base<std::allocator<bool> >::~_Bvector_base   stl_bvector.h   430 0x423c79    
7   std::vector<bool, std::allocator<bool> >::~vector   stl_bvector.h   547 0x4237d2    
8   findLocalandGhostCells  mpi_partition.cpp   249 0x41dbbd    
9   main    mpi_partition.cpp   111 0x41ca49    

これはメモリの破損のように聞こえますが、何が原因なのかまったくわかりません。基本的に、コードは次のような関数内で壊れます。

void findLocalandGhostCells(){
    std::vector<bool> foo(fooSize,false);

    // do stuff with foo; nothing crazy -- I promise

    return;
}

私が今何をすべきか知っている人はいますか?:(

4

1 に答える 1

1

ベクトル操作自体が正しく、狂っていないと確信している場合は、ベクトルのメンバーを段階的にトレースしてみてください。他の操作のいくつかがベクトルのメモリブロックを破壊した可能性があります。たとえば、ベクトルのメモリに侵入したmemcpy。

于 2012-08-16T05:49:26.993 に答える