通過cuda的sdk學習makefile


  最近在學習cuda編程,看了一些資料后,覺得差不多可以通過看sdk中的例子學習學習多GPU的編程了。當打開sdk后,發現里面的代碼往往是幾個代碼互相調用連接的。只能對里面的makefile進行make才能得到結果。於是開始了自學makefiled的艱辛道路。

  自己看了一些之后,能簡單的編譯運行多個c的程序了。但是關於main在cpp中的,並且調用cuda的文件還是不會寫makefile(比如:simpleMultiGPU)。最后幾經周折,在老師的幫助下,終於能直接編譯出來了。然后自己研究研究,能弄出main函數在cuda中的文件了(比如:simpleAtomicIntrinsics)。晚上再去的時候,終於寫出了兩者的makefile。

 

  首先,要知道,makefile是做什么用的(相信對於多數windows用戶都會很陌生)。

  簡單說來,Makefile的文件來完成並自動維護編譯工作,Makefile是用於自動編譯和鏈接的,一個工程有很多文件組成,每一個文件的改變都會導致工程的重新鏈接,但是不是所有的文件都需要重新編譯,Makefile中記錄有文件的信 息,在make時會決定在鏈接的時候需要重新編譯哪些文件。

  所以,我們花精力去學習如何寫makefile的原因也就很簡單了,就是讓編譯過程簡單化,畢竟總會碰到很多文件互相調用的情況。makefile帶來的好處就是—“自動化編譯”,一旦寫好,只需要一個make命令,整個工程完全自動編譯。

 

  Okay,通過上面的簡介,我們可以知道,想要寫makefile,能直接自己手動編譯多個文件的程序是前提(當然,sdk中有makefile,雖然寫法超簡單,可惜的是挺難懂,網上也沒有什么教程之類的,反正我是沒有搜到)。

 

閑話少說,步入正題。

  本人使用的是紅帽Linux,64位服務器,GPU性能1.3,cuda4.0

  首先,對main函數在cpp中,調用cu的文件,以sdk中的simpleMultiGPU為例。輸入以下命令

      gcc -c -I /usr/local/cuda/include simpleMultiGPU.cpp

nvcc -c simpleMultiGPU_kernel.cu

gcc -o simpleMultiGPU -L /usr/local/cuda/lib64 -lcuda -lcudart simpleMultiGPU.o simpleMultiGPU_kernel.o

第一行的-I是標明頭文件的目錄。編譯生成simpleMultiGPU.o的文件。

第二行生成simpleMultiGPU_kernel.o的文件

第三行,對兩個文件進行連接,生成simpleMultiGPU。之后,就可以運行./ simpleMultiGPU了~

注:

  1. 為了方便,我提前將/root/NVIDIA_GPU_Computing_SDK/shared/inc中shrUtils.h和shrQATest.h頭文件移動到simpleMultiGPU目錄中。
  2. 第三行-lcudart不能少

 

好了,下面讀者可以先自己試試simpleAtomicIntrinsics。只要記住在編譯.cu的時候,在nvcc –c后加-arch compute_11,貌似是對原子函數的要求吧,找了好久找的一個英文論壇上的。

 

我是這么寫的(同樣:shrQATest.h  shrUtils.h已經在目錄中):

         nvcc -c -arch compute_11 -I /usr/local/cuda/include simpleAtomicIntrinsics.cu

nvcc -c -arch compute_11 -I /usr/local/cuda/include/ simpleAtomicIntrinsics_kernel.cu

gcc -c simpleAtomicIntrinsics_gold.cpp

    nvcc -o simple -L /usr/local/cuda/lib64/ -lcuda -lcudart simpleAtomicIntrinsics.o simpleAtomicIntrinsics_gold.o

         后來又有試過,用*號可以縮略一下,將前兩句變為

                  

     nvcc -c -arch compute_11 -I /usr/local/cuda/include *.cu

 

好了,手動編譯部分過了,最難的那部分已經過去了,剩下的就是寫一個makefile的文件了,現在再看makefile,你會驚嘆,原來就這么簡單。

先給出simpleMultiGPU的makefile

# Makefile example for compiling cuda and linking cuda to cpp:



SOURCELOC =

UTILITYLOC =

NEWMOD =

PROGRAM = simpleMultiGPU

INCDIR= .



#

# Define the C compile flags

CCFLAGS = -I /usr/local/cuda/include

CC = gcc



# Define the Cuda compile flags

#

CUDAFLAGS=

CUDACC= nvcc



# Define Cuda objects

#

CUDA = simpleMultiGPU_kernel.o



# Define the libraries



SYSLIBS= -lc

USRLIB = -lcudart



# Define all object files



OBJECTS = \

simpleMultiGPU.o



install: simpleMultiGPU



# Define Task Function Program



all: simpleMultiGPU



# Define what Modtools is



simpleMultiGPU: $(OBJECTS) $(CUDA)

-$(CC) $(CCFLAGS) -o simpleMultiGPU -L/usr/local/cuda/lib64 -lcuda $(OBJECTS) $(CUDA) $(USRLIB) $(SYSLIBS)



# Modtools_Object codes



simpleMultiGPU.o: simpleMultiGPU.cpp

$(CC) $(CCFLAGS) -c simpleMultiGPU.cpp



.c.o:

$(CC) $(CFLAGS) -c $<



CUDAINCDIR= /usr/local/cuda/include

simpleMultiGPU_kernel.o: simpleMultiGPU_kernel.cu

$(CUDACC) -arch sm_13 $(CUDAFLAGS) -c simpleMultiGPU_kernel.cu



# end

 

然后試着自己寫寫simpleAtomicIntrinsics的。你會發現,只用改少許幾個地方,就能編譯通過~

 

# Makefile example for compiling cuda and linking cuda to cpp:



SOURCELOC =

UTILITYLOC =

NEWMOD =

PROGRAM = simpleAtomicIntrinsics

INCDIR= .



#

# Define the C compile flags

CCFLAGS=

CC= gcc



# Define the Cuda compile flags

#

CUDAFLAGS=

CUDACC= nvcc



# Define Cuda objects

#

CUDA = simpleAtomicIntrinsics.o

# simpleAtomicIntrinsics_kernel.o



# Define the libraries



SYSLIBS= -lc

USRLIB = -lcudart



# Define all object files



OBJECTS = \

simpleAtomicIntrinsics_gold.o



install: simpleAtomicIntrinsics



# Define Task Function Program



all: simpleAtomicIntrinsics



# Define what Modtools is



simpleAtomicIntrinsics: $(CUDA) $(OBJECTS)

-$(CUDACC) $(CUDAFLAGS) -o simple -L/usr/local/cuda/lib64 -lcuda $(CUDA) $(OBJECTS) $(USRLIB) $(SYSLIBS)



# Modtools_Object codes



simpleAtomicIntrinsics_gold.o: simpleAtomicIntrinsics_gold.cpp

$(CC) $(CCFLAGS) -c simpleAtomicIntrinsics_gold.cpp



.c.o:

$(CC) $(CCFLAGS) -c $<



CUDAINCDIR= /usr/local/cuda/include

simpleAtomicIntrinsics.o: simpleAtomicIntrinsics.cu

$(CUDACC) -arch compute_11 $(CUDAFLAGS) -c simpleAtomicIntrinsics.cu



simpleAtomicIntrinsics_kernel.o: simpleAtomicIntrinsics_kernel.cu

$(CUDACC) -arch compute_11 $(CUDAFLAGS) -c simpleAtomicIntrinsics_kernel.cu





# end

 

是不是突然覺得很簡單了?到這里會不會突然覺得,Makefile簡直就是讓計算機為人服務的一個典范。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM