搜索资源列表
-
0下载:
针对LA在解决大规模优化问题时需要消耗大量的时间无法达到实时性的问题,结合GPU的高速并行性,本文提出了一种基于GPU(Graphics Processing Unit,GPU)加速的细粒度并行免疫算法。本算法借助CUJDA(Compute Unifled Device Architecture,CUDA)统一架构,将实现过程转化成CUDA线程块并行计算过程,使得免疫算法在GPU中加速执行,在取得较好的优化效果的同时,解决了细粒度并行的群体规模限制问题,提高了算法的运行速度。-Solution
-
-
0下载:
本文详细分析了Tesla GPU图形与计算架构和CUDA统一计算设备架构,详细描述了如何对计算任务进行并行分解,并通过CUDA的双层并行编程模型映射到Tesla GPU上。 在本文的实现部分,以软件开发流程为主线,描述了如何利用CUDA实现模式识别中的三种常用算法-The paper analyzed the Tesla GPU computing architecture and CUDA graphics and computing devices unified architecture,
-
-
0下载:
The latest generation of high-end video cards off er considerable
computing power using their 100–200 on-card processors, 0.3–1.0+ GB
of RAM, and fast inter-processor communications. One promising
application of this Graphics Processing Un
-
-
2下载:
稀疏矩阵的DIA/ELLPACK/COO/CSR/HYB表示形式,以及各表示形式下的稀疏矩阵乘法(稀疏大矩阵*矢量)的CUDA实现。对于矩阵中每一行稀疏元素个数较统一的情况,ELLPACK表示最佳,其次是HYB(ELL+COO)。
CUDA™ 是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™ 架构编写程序-Sparse matri
-
-
0下载:
本代码是CUDA C/C++编程入门者学习的,其中包括对GPU设备参数的获取代码,原子操作,流等代码。初学者掌握并行计算不错的入门程序-The code is CUDA C/C++ beginners to learn programming, including the GPU to get the code of the device parameters, atomic operation, flow, etc. code. Parallel Computing for beginners
-