cuda核函数再调用核函数，多层并行

本文转载自查看原文 2017-05-26 11:31 1573

#include <stdio.h>



__global__ void childKernel(int i)
{
	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	printf("parent:%d,child:%d\n",i,tid);
	for(int j=i;j<i+10;j++)
	{
		printf(",%d",j);
	}
	printf("\n");
}

__global__ void kernel()
{

	int tid = blockIdx.x*blockDim.x+threadIdx.x;
	childKernel<<<1,2>>>(tid);
}

int main()
{

	kernel<<<1,1>>>();
	cudaDeviceSynchronize();

return 0;
}

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 C++使用类调用CUDA核函数【小记录】cv::cuda::Stream中取出cudaStream_t并用于核函数的计算 CUDA 9中张量核（Tensor Cores）编程高斯核函数 svm常用核函数 libsvm之核函数 SVM之核函数核函数逻辑回归 SVM核函数理解cuda并行程序的规约思想