CUDA 软件开发包(SDK)代码范例
类型:
数据并行算法
性能策略
基于物理模型的模拟
图形互操作
CUDA高级课题
计算金融学
线性代数
CUDA 基本课题
图像/视频处理与数据压缩
独立回旋
本范例采用高斯核,对一个 2D 信号进行了独立回旋过滤。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
基于材质的独立回旋
使用高斯核进行基于材质的独立 2D 回旋。用于同 convolutionSeparable 进行性能比较。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Black-Scholes 期权定价
本范例使用 Black-Scholes 公式评估了特定系列欧洲期权的公平赎回价格与回售价格。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
白皮书
下载 - Windows 版
下载 - Linux 版
双调排序
双调排序是一种非常简单的并行排序算法,非常适用于对少量元素进行排序,详细信息请参阅:
http://citeseer.ist.psu.edu/blelloch98experimental.html
。这一实施过程构建于以下信息之上:
http://www.tools-of-computing.com/tc/CS/Sorts/bitonic_sort.htm
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
标量集
本范例计算了给定集合的输入矢量对的标量集。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Clock
本范例展示了如何使用 clock 函数准确衡量内核的性能。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
多 GPU (图形处理器)
本应用程序展示了如何使用 CUDA API 来发挥多个 GPU(图形处理器)的性能。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Aligned Types
一个简单的测试,展示了在有序和无序结构之间巨大的访问速度差距。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
asyncAPI
本范例使用 CUDA 流和事件在 CPU 与 GPU(图形处理器)上交替执行。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
cudaOpenMP
本范例展示了如何使用 OpenMP API 来为多个 GPU(图形处理器)编写应用程序。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
simpleStreams
本范例展示了基于 memocopy 功能,使用 CUDA 流在设备和主机间进行交替内核执行。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
Simple Atomics
全局内存基本指令的简单演示。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
设备询问
本范例展示了系统中 CUDA 设备的属性。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单模板
本范例展示了模板项目的模板制作过程。它展示了如何正确对动态分配的共享显存数列进行规范化。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
带宽测试
这是一个简单的测试程序,用于衡量 GPU(图形处理器)的 memcopy 带宽。它当前能够测量出设备到设备的复制带宽,主机到设备带宽(针对分页和分页锁定内存),以及设备到主机复制带宽(针对分页和分页锁定内存)。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单材质(驱动程序版本)
一个简单范例,展示了在具备驱动程序 API 的 CUDA 中,材质的使用情况。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单材质
一个简单范例,展示了在 CUDA 中材质的使用情况。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
矩阵乘法(驱动程序版本)
本范例使用 CUDA 驱动程序 API 实施了矩阵乘法。该范例明确用于展示各种 CUDA 编程原理,而不是用来为矩阵乘法提供最高性能的通用内核。CUBLAS 提供了高性能矩阵乘法。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
模板
一个普通模板项目,可用来创建全新的 CUDA 项目。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单 CUFFT
CUFFT 使用范例。在本范例中,CUFFT 被用来使用一些滤波器来计算一些信号的 1D 回旋。该过程首先将信号和滤波器转换为频域,对二者做乘法,然后再将信号转换为时域。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单 Direct3D
一个简单程序,展示了 CUDA 和 Direct3D 之间的互操作性。该程序使用 CUDA 来修改顶点位置,并使用 Direct3D 来渲染几何形状。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
简单 OpenGL
一个简单程序,展示了 CUDA 和 OpenGL 之间的互操作性。该程序使用 CUDA 来修改顶点位置,并使用 OpenGL 来渲染几何形状。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
简单 CUBLAS
CUBLAS 使用范例。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
矩阵乘法
本范例依照编程指南的第 6 章实施了矩阵乘法。该范例明确用于展示各种 CUDA 编程原理,而不是用来为矩阵乘法提供最高性能的通用内核。CUBLAS 提供了高性能矩阵乘法。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
C++ 集成
本范例展示了如何将 CUDA 集成到现有的 C++ 应用程序中,即主机上的 CUDA 入口点仅仅是 C++ 代码要调用的一个函数,只有包含该函数的文件会使用 nvcc 进行编译。同时它也展示了可以通过 cpp 利用的矢量类型。
GeForce® 8 系列
Quadro® FX 5600
或更新版本
Tesla™
下载 - Windows 版
下载 - Linux 版
© 2008
NVIDIA Corporation
|
Privacy Policy
|
Legal Info