CUDA 软件开发包(SDK)代码范例
类型:
数据并行算法
性能策略
基于物理模型的模拟
图形互操作
CUDA高级课题
计算金融学
线性代数
CUDA 基本课题
图像/视频处理与数据压缩
256-bin 直方图
本范例展示了高效的 256-bin 直方图实施过程。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
64-bin 直方图
本范例展示了高效的 64-bin 直方图实施过程。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
独立回旋
本范例采用高斯核,对一个 2D 信号进行了独立回旋过滤。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
基于材质的独立回旋
使用高斯核进行基于材质的独立 2D 回旋。用于同 convolutionSeparable 进行性能比较。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
双调排序
双调排序是一种非常简单的并行排序算法,非常适用于对少量元素进行排序,详细信息请参阅:
http://citeseer.ist.psu.edu/blelloch98experimental.html
。这一实施过程构建于以下信息之上:
http://www.tools-of-computing.com/tc/CS/Sorts/bitonic_sort.htm
.
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
N 体数值模拟
本范例展示了在 CUDA 中重力 N 体数值模拟的高效 All-pairs 模拟过程。具体过程参考了《GPU Gems 3》中“Fast N-Body Simulation with CUDA(使用 CUDA 进行快速 N 体模拟)”的内容。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
并行归约
并行和归约可对庞大数值进行求和运算。本范例展示了几项针对归约等并行算法的重要优化策略。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
Mandelbrot
本范例展示了使用 CUDA 来计算和显示 Mandelbrot 集。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
快速沃尔什转换
对任意合格长度(2 的幂)的批处理矢量进行自然(Hadamard)顺序的快速沃尔什转换。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Scan
本实例展示了并行前缀求和(也称作“scan”)的一种高效的 CUDA 实施途径。针对一个给定的数列,scan 可以计算出一个新的数列,其中每一个元素均为在输入列中该元素前面的所有元素的总和。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
大型数列 Scan
本实例展示了针对任意规模数列的并行前缀求和(也称作“scan”)的一种高效的 CUDA 实施途径。针对一个给定的数列,scan 可以计算出一个新的数列,其中每一个元素均为在输入列中该元素前面的所有元素的总和。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
© 2008
NVIDIA Corporation
|
Privacy Policy
|
Legal Info