一、問題描述
項目中一個C++程序要讀寫hbase的數據,按thrift接口規范編寫好代碼,在windows平台該程序運行正常。但在移植到linux平台后,在編譯鏈接時一直報undefined symbol錯誤,即使采用其它技術手段繞過這個錯通過編譯鏈接,運行時仍會出錯。
經檢查,出錯是因為一個模塊(lib_hbase_reader.so)中調用的三個接口與libthrift-0.10.0.so中提供的接口不一致引起的,使用ldd得到的信息為:
$ldd -r libhbase_reader.so ... libthrift-0.10.0.so => /usr/local/lib64/libthrift-0.10.0.so (0x00007f91ea5fb000) ...
undefined symbol: _ZN6apache6thrift5async25TConcurrentClientSyncInfo10getPendingERNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEERNS0_8protocol12TMessageTypeERi (./lib_hbase_reader.so)
undefined symbol: _ZN6apache6thrift9transport7TSocketC1ERKNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEEi (./lib_hbase_reader.so)
undefined symbol: _ZN6apache6thrift5async25TConcurrentClientSyncInfo13updatePendingERKNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEENS0_8protocol12TMessageTypeEi (./lib_hbase_reader.so)
以其中的getPending為例,在libthrift-0.10.0.so中提供的接口形式卻是:
$ nm -a /usr/local/lib/libthrift-0.10.0.so | grep getPending 0000000000046b10 T _ZN6apache6thrift5async25TConcurrentClientSyncInfo10getPendingERSsRNS0_8protocol12TMessageTypeERi
二、出錯原因
從出錯信息看,貌似是兩個so對某個類型產生了分歧,一個按__cxx11...,而另一個按基本類型。
看起來簡單,解決之路卻異常艱難,一度到了山窮水盡的地步。隔了一段時間后不得不重新面對,又經歷了很多艱難險阻,終於找到原因,原來與編譯所用的gcc版本密切相關:
- lib_hbase.reader.so與libthrift-0.10.0.so不是同一個版本的gcc編譯生成的,前一個因最近生成,使用的是gcc 7.3.0,而后一個是從svn庫拿到的老版本,使用的是gcc 4.8.5。
- 這就over了?遠遠沒有,運行程序的服務器如果不是同一版本,運行時一樣出錯!必須將運行服務器的gcc也升級到相同版本。
解決過程中還出現了種種小陷阱,不過最終都解決了。
三、關鍵步驟之:升級gcc
Linux默認的gcc版本是4.8.5,如果編譯某個模塊時用的是高版本gcc,就需將所有相關Linux服務器的gcc都進行升級。這里以7.3.0為例。
# wget http://mirrors.kernel.org/gun/gcc/gcc-7.3.0/gcc-7.3.0.tar.gz # tar -xvf gcc-7.3.0.tar.gz # cd gcc-7.3.0 # ./contrib/download_prerequisites # mkdir build # cd build # ../configure --enable-checking=release --enable-languages=c,c++ --disable-multilib # make # make install
make的時間會很長,可用make -j4開四個任務加快速度。/contrib/download_prerequisites對運行機不是必須的,這對內網環境是個好消息。
升級完后,還需要更新/usr/bin/目錄下的c++, g++, gcc*等文件,以及libstdc++.so.6。
# mv /usr/bin/c++ /usr/bin/c++.bak # mv /usr/bin/g++ /usr/bin/g++.bak # mv /usr/bin/gcc /usr/bin/gcc.bak # mv /usr/bin/gcc-ar /usr/bin/gcc-ar.bak # mv /usr/bin/gcc-nm /usr/bin/gcc-nm.bak # mv /usr/bin/gcc-ranlib /usr/bin/gcc-ranlib.bak # ln -s /usr/local/bin/c++ /usr/bin/c++ # ln -s /usr/local/bin/g++ /usr/bin/g++ # ln -s /usr/local/bin/gcc /usr/bin/gcc # ln -s /usr/local/bin/gcc-ar /usr/bin/gcc-ar # ln -s /usr/local/bin/gcc-nm /usr/bin/gcc-nm # ln -s /usr/local/bin/gcc-ranlib /usr/bin/gcc-ranlib # rm /lib64/libstdc++.so.6 # ln -s /usr/local/lib64/libstdc++.so.6.0.24 /lib64/libstdc++.so.6
這里采用的是“舊文件改名+建軟連接”的方式,還有一種方式是“拷貝新文件覆蓋”的方式。
完成后查看gcc版本:
# gcc -v
四、關鍵步驟之:重新編譯libthrift
如果gcc已升級,必須重新編譯libthrift,假設為0.10.0版,已有源碼包,不必再下載。
# tar -zxvf libthrift-0.10.0.tar.gz # cd libthrift-0.10.0 # ./configure --with-cpp --with-boost --without-python CPPFALGS=-std=c++11 # ./make # ./make install
特別注意:configure時必須加“CPPFALGS=-std=c++11”選項,否則錯誤依舊。在用gcc 7.3.0編譯時,會出很多警告信息,但貌似沒影響。
libthrift依賴的libboost則不需要重新編譯。
