资源列表
reverseArray_singleblock
- 反向阵列(单块)-- 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_singleblock”模板开始 B: 只有一个线程块启动,以反转一个大小的数组 N = numThreads = 256个元素 C: 第1部分(共1个):所有你需要做的是实现内核的“reverseArrayBlock()” D:每个线程将单个元件移动到相反的位置, 从d_a指标读取输入,
reverseArray_multiblock
- 反向阵列(multiblock): 给定指针d_a中的输入数组{a0,a1,...,an-1},将反向数组{an-1,an-2,...,a0}存储在指针d_b中 A: 从“reverseArray_multiblock”模板开始 B:多个256线程块启动,要颠倒大小为N,N / 256块的数组 第1部分:计算要启动的块数 第2部分:实现内核reverseArrayBlock 请注意,现在您必须同时进行计算 块内的相反位置 反向偏移到块的开始(Reverse array
mpi_mat_vect_time
- 使用mpi编写的进行矩阵乘法运算的并行程序。(An parallel program using MPI to realize the multiplication of matrices.)
yx
- 简单的mpi程序,提供简单的mpi框架新手说明(Simple MPI program, providing a simple MPI framework, new instructions)
Parallel Programming With Microsoft Visual C++
- Parallel Programming With Microsoft Visual C++
MatlabCuda
- 自己写的GPU并行程序和MATLAB 平台混合调用,适合初学者学习MATLAB 和GPU的并行编程(Write their own GPU parallel program and MATLAB platform mixed call, suitable for beginners to learn MATLAB and GPU parallel programming)
polar_BP_decoder.cu
- 本代码是基于GPU的polar码BP并行译码,主要完成基于GPU的并行译码功能,开发语言为CUDA C。(BP parallel decoding of polar codes based on GPU)
cuda memory management
- cuda内存管理 很有用的一个教程 希望有帮助(cuda memory management)
并行计算课件(pdf version)
- 学习并行计算的知识,熟悉掌握并行计算的应用范围。(Learning parallel computing knowledge, familiar with the scope of parallel computing applications.)
Cannon乘法
- 基于MPI的cannon算法,实现矩阵的相乘(Based on MPI's cannon algorithm, the multiplication of matrix is realized)
MPI
- MPI并行设计的梯形积分法,内含运行结果图片(老师作业的要求= =)(MPI parallel design trapezoidal integration method, containing the results of the operation picture)
第一次实验程序
- 矩阵乘法的不同循环方式的算法实现,比较了各种算法所用时间的长短(Matrix multiplication of different cycle mode algorithm, compared to the length of time used in various algorithms)