cuda核函數再調用核函數，多層並行

本文轉載自查看原文 2017-05-26 11:31 1573

#include <stdio.h>



__global__ void childKernel(int i)
{
	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	printf("parent:%d,child:%d\n",i,tid);
	for(int j=i;j<i+10;j++)
	{
		printf(",%d",j);
	}
	printf("\n");
}

__global__ void kernel()
{

	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	childKernel<<<1,2>>>(tid);
}

int main()
{

	kernel<<<1,1>>>();
	cudaDeviceSynchronize();

return 0;
}

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 C++使用類調用CUDA核函數【小記錄】cv::cuda::Stream中取出cudaStream_t並用於核函數的計算 CUDA 9中張量核（Tensor Cores）編程高斯核函數 svm常用核函數 libsvm之核函數 SVM之核函數核函數邏輯回歸 SVM核函數理解cuda並行程序的規約思想