搜索资源列表
-
0下载:
针对LA在解决大规模优化问题时需要消耗大量的时间无法达到实时性的问题,结合GPU的高速并行性,本文提出了一种基于GPU(Graphics Processing Unit,GPU)加速的细粒度并行免疫算法。本算法借助CUJDA(Compute Unifled Device Architecture,CUDA)统一架构,将实现过程转化成CUDA线程块并行计算过程,使得免疫算法在GPU中加速执行,在取得较好的优化效果的同时,解决了细粒度并行的群体规模限制问题,提高了算法的运行速度。-Solution
-
-
2下载:
稀疏矩阵的DIA/ELLPACK/COO/CSR/HYB表示形式,以及各表示形式下的稀疏矩阵乘法(稀疏大矩阵*矢量)的CUDA实现。对于矩阵中每一行稀疏元素个数较统一的情况,ELLPACK表示最佳,其次是HYB(ELL+COO)。
CUDA™ 是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™ 架构编写程序-Sparse matri
-
-
0下载:
本代码是CUDA C/C++编程入门者学习的,其中包括对GPU设备参数的获取代码,原子操作,流等代码。初学者掌握并行计算不错的入门程序-The code is CUDA C/C++ beginners to learn programming, including the GPU to get the code of the device parameters, atomic operation, flow, etc. code. Parallel Computing for beginners
-