资源列表
matrix-vector_mpi.cpp.tar
- matrix vector multiplication using Cartesian topology mpi
01parallel_IO.tar
- example2 of parallel Posix read/ write into separate files in mpi
canon_fox_algorithm
- Parallel canon and fox algorithms
transpose.cpp.tar
- parallel traspose of matrix using mpi
matrix_mul_cuda_2.cu
- 矩阵相乘的cuda实现 矩阵分块且使用shared memory-parallel version of matrix multiply
chapter16
- Hadoop实战源码第16章cpp语言程序流程。-Hadoop code chapter16
duo
- 代码主要实现了单线程、多线程求π的计算方法,在集群上运行,比较时间。-The code mainly implements the single-thread, multithreaded method of calculating π, runs on the cluster, compares the time.
mpi-bitonic-sort-master
- Bitonic order implementation code with mpi usage
startParaller
- 并行运算,matlab函数,开始并行运算程序,很好用(Parallel operation, matlab function, start parallel computing program, very easy to use)
DAC
- digital to analog converter
Hands-on CUDA codes
- 用于CUDA方案的程序码说明,提供的练习有: cudaMallocAndMemcpy myFirstKernel reverseArray_singleblock reverseArray_multiblock reverseArray_multiblock_fast(Skeletons and solutions for hands-on CUDA codes, they are listed as the followings: cudaMallocAndMemcpy myFi
cudaMallocAndMemcpy
- 在主机和设备之间复制--从“cudaMallocAndMemcpy”模板开始。 第1部分:为设备上的指标 d_a 和 d_b 分配内存。 第2部分:将主机上的h_a复制到设备上的 d_a。 第3部分:将设备从 d_a复制到 d_b。 第4部分:将设备上的 d_b 复制回主机上的 h_a。 第5部分:在主机上释放 d_a 和 d_b。 额外部分:用cudaMallocHost代替malloc来分配h_a。(Copy between host and device -- start