CUDA 软件开发包(SDK)代码范例
类型:
数据并行算法
性能策略
基于物理模型的模拟
图形互操作
CUDA高级课题
计算金融学
线性代数
CUDA 基本课题
图像/视频处理与数据压缩
具备多 GPU 支持的 Monte-Carlo O选项定价
本范例使用 Monte-Carlo 方法评估了特定系列欧洲期权的公平赎回价格,这一方法充分利用了系统中安装的所有支持 CUDA 的 GPU(图形处理器)。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
矩阵转置
高效矩阵转置。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Clock
本范例展示了如何使用 clock 函数准确衡量内核的性能。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Aligned Types
一个简单的测试,展示了在有序和无序结构之间巨大的访问速度差距。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
并行归约
并行和归约可对庞大数值进行求和运算。本范例展示了几项针对归约等并行算法的重要优化策略。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
asyncAPI
本范例使用 CUDA 流和事件在 CPU 与 GPU(图形处理器)上交替执行。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
simpleStreams
本范例展示了基于 memocopy 功能,使用 CUDA 流在设备和主机间进行交替内核执行。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
带宽测试
这是一个简单的测试程序,用于衡量 GPU(图形处理器)的 memcopy 带宽。它当前能够测量出设备到设备的复制带宽,主机到设备带宽(针对分页和分页锁定内存),以及设备到主机复制带宽(针对分页和分页锁定内存)。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Scan
本实例展示了并行前缀求和(也称作“scan”)的一种高效的 CUDA 实施途径。针对一个给定的数列,scan 可以计算出一个新的数列,其中每一个元素均为在输入列中该元素前面的所有元素的总和。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
大型数列 Scan
本实例展示了针对任意规模数列的并行前缀求和(也称作“scan”)的一种高效的 CUDA 实施途径。针对一个给定的数列,scan 可以计算出一个新的数列,其中每一个元素均为在输入列中该元素前面的所有元素的总和。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
© 2011
NVIDIA Corporation
|
Privacy Policy
|
Legal Info