CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 其它 搜索资源 - CUDA

搜索资源列表

  1. notepadPPcuda_config

    0下载:
  2. notepad++中cuda代码的高亮显示配置文件 喜欢轻量级编辑器的GPU代码开发者可能会用到,notepad++7.3.3上经过实测-the config file for cuda in the editor notepad++
  3. 所属分类:Editor

    • 发布日期:2017-12-11
    • 文件大小:33325
    • 提供者:lingfei
  1. dijkstra_cuda

    0下载:
  2. 采用cuda对dijkstra算法进行并行实现,性能提升7倍多。- U91C7 u75286 u5B09 u5B09 u7
  3. 所属分类:MPI

    • 发布日期:2017-12-12
    • 文件大小:4469
    • 提供者:shui123
  1. matrix_mul_cuda_2.cu

    0下载:
  2. 矩阵相乘的cuda实现 矩阵分块且使用shared memory-parallel version of matrix multiply
  3. 所属分类:MPI

    • 发布日期:2017-12-13
    • 文件大小:1662
    • 提供者:cc
  1. cudaMallocAndMemcpy

    0下载:
  2. 在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy between host and device -- start
  3. 所属分类:并行计算

    • 发布日期:2017-12-21
    • 文件大小:6144
    • 提供者:p-yang
  1. myFirstKernel

    0下载:
  2. 启动内核--从“myFirstKernel”模板开始。 Part1:使用指针d_a为内核的结果分配设备内存。 Part2:使用1-D的1-D网格来配置和启动内核 线程块。 Part3:让每个线程设置一个d_a的元素,如下所示: idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4:将d_a中的结果复制回主机指针h_a。 Part5:验证结果是否正
  3. 所属分类:并行计算

    • 发布日期:2017-12-21
    • 文件大小:6144
    • 提供者:p-yang
  1. reverseArray_singleblock

    0下载:
  2. 反向阵列(单块)-- 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_singleblock”模板开始 B: 只有一个线程块启动,以反转一个大小的数组 N = numThreads = 256个元素 C: 第1部分(共1个):所有你需要做的是实现内核的“reverseArrayBlock()” D:每个线程将单个元件移动到相反的位置, 从d_a指标读取输入,
  3. 所属分类:并行计算

    • 发布日期:2017-12-19
    • 文件大小:6144
    • 提供者:p-yang
  1. reverseArray_multiblock

    0下载:
  2. 反向阵列(multiblock): 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_multiblock”模板开始 B:多个256线程块启动,要颠倒大小为N,N / 256块的数组 第1部分:计算要启动的块数 第2部分:实现内核reverseArrayBlock 请注意,现在您必须同时进行计算 块内的相反位置 反向偏移到块的开始(Reverse array
  3. 所属分类:并行计算

    • 发布日期:2017-12-24
    • 文件大小:6144
    • 提供者:p-yang
  1. polar_BP_decoder.cu

    1下载:
  2. 本代码是基于GPU的polar码BP并行译码,主要完成基于GPU的并行译码功能,开发语言为CUDA C。(BP parallel decoding of polar codes based on GPU)
  3. 所属分类:并行计算

    • 发布日期:2017-12-21
    • 文件大小:2048
    • 提供者:npu
  1. 蒙特卡洛光子实验

    1下载:
  2. 基于WINDOWS平台下,VC,英特尔显卡的蒙特卡洛光子实验。(Based on the WINDOWS platform, VC, Intel graphics video Monte Carlo photon experiment.)
  3. 所属分类:并行计算

    • 发布日期:2017-12-20
    • 文件大小:30865408
    • 提供者:我亦追红
  1. 01_查询GPU设备

    0下载:
  2. cuda代码查询设备信息,基础实用的小例子代码(the code of cuda for querying the device)
  3. 所属分类:并行计算

    • 发布日期:2018-01-01
    • 文件大小:1024
    • 提供者:ScorpioMilo
  1. kernel

    0下载:
  2. 1,使用VS创建一个工程 2,复制文件代码 3、使用内核cuda函数使用内核cuda函数调试专用(Use kernel CUDA function to use kernel CUDA function to debug special-purpose)
  3. 所属分类:并行计算

    • 发布日期:2018-01-07
    • 文件大小:1024
    • 提供者:专研
  1. 4_GPUIntro

    0下载:
  2. GPU 基本介绍 包括GPU与GPGPU的兴起,GPU加速与高性能计算,Nvidia CUDA简介。(The Basic Introduction of GPU)
  3. 所属分类:并行计算

    • 发布日期:2018-04-19
    • 文件大小:16780288
    • 提供者:流行
« 1 2 ... 11 12 13 14 15 16»
搜珍网 www.dssz.com