搜索资源 - CUDA - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - CUDA

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

汇编语言

SCSI/ASPI

编译器/词法分析

磁盘编程

语音合成与识别

编辑器/阅读器

杀毒

中文信息处理

并行运算

书籍源码

Dephi控件源码

操作系统开发

中间件编程

MacOS编程

LabView编程

易语言编程

搜索资源列表

notepadPPcuda_config

0下载：
notepad++中cuda代码的高亮显示配置文件喜欢轻量级编辑器的GPU代码开发者可能会用到，notepad++7.3.3上经过实测-the config file for cuda in the editor notepad++
所属分类：Editor
- 发布日期：2017-12-11
- 文件大小：33325
- 提供者：lingfei

dijkstra_cuda

0下载：
采用cuda对dijkstra算法进行并行实现，性能提升7倍多。- U91C7 u75286 u5B09 u5B09 u7
所属分类：MPI
- 发布日期：2017-12-12
- 文件大小：4469
- 提供者：shui123

matrix_mul_cuda_2.cu

0下载：
矩阵相乘的cuda实现矩阵分块且使用shared memory-parallel version of matrix multiply
所属分类：MPI
- 发布日期：2017-12-13
- 文件大小：1662
- 提供者：cc

cudaMallocAndMemcpy

0下载：
在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。第1部分：为设备上的指标 d_a 和 d_b 分配内存。第2部分：将主机上的h_a复制到设备上的 d_a。第3部分：将设备从 d_a复制到 d_b。第4部分：将设备上的 d_b 复制回主机上的 h_a。第5部分：在主机上释放 d_a 和 d_b。额外部分：用cudaMallocHost代替malloc来分配h_a。(Copy between host and device -- start
所属分类：并行计算
- 发布日期：2017-12-21
- 文件大小：6144
- 提供者：p-yang

myFirstKernel

0下载：
启动内核--从“myFirstKernel”模板开始。 Part1：使用指针d_a为内核的结果分配设备内存。 Part2：使用1-D的1-D网格来配置和启动内核线程块。 Part3：让每个线程设置一个d_a的元素，如下所示： idx = blockIdx.x * blockDim.x + threadIdx.x d_a [idx] = 1000 * blockIdx.x + threadIdx.x Part4：将d_a中的结果复制回主机指针h_a。 Part5：验证结果是否正
所属分类：并行计算
- 发布日期：2017-12-21
- 文件大小：6144
- 提供者：p-yang

reverseArray_singleblock

0下载：
反向阵列(单块)-- 给定指针d_a中的输入数组{a0，a1，...，an-1}，将反向数组{an-1，an-2，...，a0}存储在指针d_b中 A: 从“reverseArray_singleblock”模板开始 B: 只有一个线程块启动，以反转一个大小的数组 N = numThreads = 256个元素 C: 第1部分（共1个）：所有你需要做的是实现内核的“reverseArrayBlock（）” D:每个线程将单个元件移动到相反的位置, 从d_a指标读取输入,
所属分类：并行计算
- 发布日期：2017-12-19
- 文件大小：6144
- 提供者：p-yang

reverseArray_multiblock

0下载：
反向阵列（multiblock）: 给定指针d_a中的输入数组{a0，a1，...，an-1}，将反向数组{an-1，an-2，...，a0}存储在指针d_b中 A: 从“reverseArray_multiblock”模板开始 B:多个256线程块启动,要颠倒大小为N，N / 256块的数组第1部分：计算要启动的块数第2部分：实现内核reverseArrayBlock 请注意，现在您必须同时进行计算块内的相反位置反向偏移到块的开始(Reverse array
所属分类：并行计算
- 发布日期：2017-12-24
- 文件大小：6144
- 提供者：p-yang

polar_BP_decoder.cu

1下载：
本代码是基于GPU的polar码BP并行译码，主要完成基于GPU的并行译码功能，开发语言为CUDA C。(BP parallel decoding of polar codes based on GPU)
所属分类：并行计算
- 发布日期：2017-12-21
- 文件大小：2048
- 提供者：npu

蒙特卡洛光子实验

1下载：
基于WINDOWS平台下，VC，英特尔显卡的蒙特卡洛光子实验。(Based on the WINDOWS platform, VC, Intel graphics video Monte Carlo photon experiment.)
所属分类：并行计算
- 发布日期：2017-12-20
- 文件大小：30865408
- 提供者：我亦追红

01_查询GPU设备

0下载：
cuda代码查询设备信息，基础实用的小例子代码(the code of cuda for querying the device)
所属分类：并行计算
- 发布日期：2018-01-01
- 文件大小：1024
- 提供者：ScorpioMilo

kernel

0下载：
1,使用VS创建一个工程 2，复制文件代码 3、使用内核cuda函数使用内核cuda函数调试专用(Use kernel CUDA function to use kernel CUDA function to debug special-purpose)
所属分类：并行计算
- 发布日期：2018-01-07
- 文件大小：1024
- 提供者：专研

4_GPUIntro

0下载：
GPU 基本介绍包括GPU与GPGPU的兴起，GPU加速与高性能计算，Nvidia CUDA简介。(The Basic Introduction of GPU)
所属分类：并行计算
- 发布日期：2018-04-19
- 文件大小：16780288
- 提供者：流行

« 1 2 ... 11 12 13 14 15 16»

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.