今天,西安下雪了,2020年的第一场雪,比往年来的早些。依稀记得,2010年刚来西安上学时,第一场雪是12月24日,由于是在平安夜,所以还能记得,一晃都十年了……
在CUDA编程过程中,最易出错的部分就是内存的相关操作。时常出现的问题是:程序能够运行,但是其中的Kernel函数未能成功运行。这使得排错相对传统的C语言编程复杂。好在我们依旧可以使用最传统的方法:使用printf函数打印输出进行排查Bug。但是,printf函数在CUDA编程过程中,存在局限性。具体地说,运行在CPU上的代码和运行在GPU上的代码是异步的,运行在GPU核函数中的每个线程也是异步的。这使得printf函数的显示上比较复杂,不是那么直观。
这时,我们可以使用专门的错误检查库函数checkCudaError()
,注意需要包含头文件#include <helper_functions.h>
,#include <helper_cuda.h>
。在CUDA编程中,最容易出错的是就是内存分配cudaMalloc()
和cudaMemcpy()
。为了防止内存溢出,我们可以首先检查电脑中关于GPU的一些信息。这时,我们可以直接使用安装CUDA后自带的样例,具体位置在C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\1_Utilities\deviceQuery
中。我的个人电脑配置如图1:
在图1中,主要需要注意的有四点:
- Total amount of shared memory per block
- Total number of registers available per block
- Maximum number of threads per multiprocessor
- Maximum number of threads per block
在我们进行核函数配置和变量定义时需要注意上述四点。当然,我们还可以使用上述的checkCudaError
来检查内存操作是否正常。
当我们包含头文件#include <helper_functions.h>
,#include <helper_cuda.h>
可能会出现错误: 无法打开包括文件 helper_cuda.h。这时我们需要在项目中添加目录,具体操作为:右键项目-> 属性->配置属性->C/C++->常规->附加包含目录:
这里在目录中添加上述.h文件所在目录,默认目录为C:\ProgramData\NVIDIA Corporation\CUDA Samples\v10.1\common\inc
。这样我们就可以正常使用checkCudaError()
函数了,关于checkCudaError()
函数的使用,可以自行搜索官方文档。由于我只是最简单地使用,我主要参考了CUDA自带的例子,就足够了。