搜索资源列表
simpleTemplates.tar
- 这个范例是模板化的模板project.It的版本,也显示了如何正确的模板化动态分配共享内存阵列。-This sample is a templatized version of the template project.It also shows how to correctly templatize dynamically allocated shared memory arrays.
four-classical-cuda-examples
- cuda入门例子代码,从内存分配到数组倒置,每个都短小精悍,详细注释,已测试可以直接跑。-CUDA introductory example code from the memory allocated to the array inverted, each dapper, detailed notes, tests can be run directly.
cudaMallocAndMemcpy
- 在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy between host and device -- start
myFirstKernel
- 启动内核--从“myFirstKernel”模板开始。 Part1:使用指针d_a为内核的结果分配设备内存。 Part2:使用1-D的1-D网格来配置和启动内核 线程块。 Part3:让每个线程设置一个d_a的元素,如下所示: idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4:将d_a中的结果复制回主机指针h_a。 Part5:验证结果是否正
MyGA-master
- 将节点按内存情况排序 将任务按内存需求情况排序 规则:将内存需求最小的节点先行分配在内存剩余最多的节点上(Sort nodes by memory and tasks by memory requirements Rule: the node with the least memory requirement is allocated to the node with the most remaining memory)