搜索资源列表
Automatic-parallel-compiled
- 这是一篇很有价值的博士论文,对于并行化编译器中并行程序自动生成和性能优化技术进行了较深入的研究。 并行化的最终日标是生成符合日标机体系结构特点的高效并行程序,因此如何产生高效并行代码是并行化编译研究的一项重要内容。 这篇文章以并行化编译器KAP为研究背景,以分布内存结构为目标,研究了并行化过程中的通信优化和消息、传递类型并行程序自动生成问题;以共享内存结构为目标,研究了并行化产生的openMP程序的编译优化问题。通过测试确定了影响openMP程序性能的主要因素,从并行化生成OpenMP并
simulink&&CUDA
- 利用simulink的自动生成代码功能生成代码后,在VC2013上进行编译,然后调用CUDA程序(After generating code from Simulink's automatic generation of code, compiling on VC2013, then calling the CUDA program)