CUDA_全球百科

1 CUDA
2 技術細節

3 程序
4 備選方案

5 軟件
6 處理器

7 支持的 GPU

CUDA

CUDA，是Nvidia開發的一種編程接口（API），通過它程序部分可以由圖形處理器（GPU）處理。額外的計算能力以 GPU 的形式提供，在高度可并行化的程序流（高數據并行性）的情況下，GPU 通常比 CPU 的工作速度快得多。 CUDA主要用于科學技術計算。

技術細節

編輯

圖形處理器，僅用于圖形計算，也可作為使用 CUDA API 的協處理器使用。應用實例包括地震或地質問題的解決、電磁場的模擬或機器學習領域中神經網絡的訓練。 CUDA 在 SETI@home 項目中被用作伯克利網絡計算開放基礎設施 (BOINC) 的一部分。通常，它只能在（除其他條件外）計算可以高度并行化的情況下有效使用。

CUDA 技術可用于“GeForce 8”系列的顯卡和 Quadro FX 5600 的 Quadro 卡。Nvidia 的 Tesla 卡已針對高性能計算進行了優化，主要通過 CUDA 支持解決而且還有像 OpenCL 這樣的開放標準。有些甚至缺少顯示器連接。

自從收購了Ageia的PhysX技術后，Nvidia就不斷開發這項技術，并在CUDA上進行了重寫。

Nvidia 于 2015 年 3 月發布了 CUDA 7.0 版。

Nvidia 于 2015 年 9 月發布了 CUDA 7.5 版本。

CUDA 8.0 版本從 2016 年 9 月開始可用，全面支持新的 Pascal 系列。

CUDA 9.0 版本從 12 月更新到 9.1，從 3 月更新到 9.2，從 2017 年 9 月開始可用，它完全支持新的 Volta 系列。不再支持 FERMI。

CUDA 10 從 2018 年秋季開始支持圖靈架構。

CUDA 11 完全支持當前的 Ampere 架構。最小計算能力 3.5 僅支持部分 Kepler 卡。

程序

編輯

程序員目前將 C 用于 CUDA。還有編程語言 Perl、Python、Ruby、Java、Fortran 和 .NET 的包裝器，以及與 MATLAB、Mathematica 和 R 的連接。Nvidia 使用優化的 C 編譯器 Open64 創建了 CUDA。C++ 也可以使用，因為費米架構。

CUVID是一個用于解碼視頻的編程接口。

備選方案

編輯

其他 GPGPU 解決方案示例：

OpenCL 是由 Khronos Group 發起的開放標準，適用于所有顯卡，并且適用于大多數操作系統。
同樣由 Khronos Group 開發的開放式 Vulkan 標準也支持類似 OpenCL 的計算著色器。
DirectCompute：Microsoft 的 GPGPU 接口，集成到 DirectX API 中

軟件

編輯

最早支持 CUDA 的程序之一是 folding@home 客戶端，它成倍增加了生化計算的速度。 SETI@home 客戶端于 2008 年 12 月 17 日緊隨其后，將尋找外星生命的速度提高了 10 倍。 Nvidia 發布了 Badaboom 軟件，這是一種視頻轉換器，轉換視頻的速度比 CPU 計算快 20 倍。其他使用 CUDA 的程序是 TMPGEnc、Sorenson Squeeze 7、來自 CS4 的 Adob??e Photoshop（此處加速了濾鏡的使用）、來自 CS5.5 的 Adob??e Premiere Pro 和 Mathematica 8+ 以及 Nvidia 軟件 StyleGAN。

MSC/Nastran 2013+ 等仿真軟件有時使用 CUDA 會xxx加速；在大型模型上，GPU 內存太少可能會成為一個障礙。 OpenFoam 和 ANSYS 等其他xxx的 CFD 和 FEM 軟件使用 CUDA 來加速計算。由于在這些特殊的計算操作中 GPU 的效率比 CPU 更高，計算的功耗有時會降低。

處理器

編輯

圖形處理器 (GPU) 是具有特定于應用程序設計的處理器，因此 GPU 知道相當奇特的數據類型，例如具有定點的 9 位或 12 位，但通常沒有 32、48、64 或 80 的寄存器寬度通用 CPU 和 FPU（等）通用的位。因此，GPU 的指令集中通常不提供計算，例如根據 IEEE 754（64 位雙精度）的精度，必須使用軟件以相對復雜的方式進行模擬。因此，GPU 特別適合計算位寬相對較小的數據類型。

Z截至目前（2010 年），xxx批制造商已經在生產擴展 GPU，除了 GPU 所需的數據類型外，還支持通用數據類型和操作，例如 B. 用于直接計算符合 IEEE 754 標準的結果。作為目前xxx的制造商之一，Nvidia 提供了原生提供 32 位整數以及單精度和雙精度浮點數據格式的 Fermi 代 GPU。

另一個缺點是與計算機架構的連接。對于當前的 GPU，這通常是通過 PCIe 進行的，與處理器的直接連接相比，會導致更糟糕（更高）的延遲時間和更低的 I/O 吞吐率。因此，外包只對具有一定計算能力的功能才有價值——特別是如果 GPU 在指令集方面更適合這些任務（例如，對于大型矩陣）。

支持的 GPU

編輯

GPU 和卡支持的 CUDA 版本層級。

CUDA-SDK 6.5 版最后一次支持 Tesla 微架構。CUDA-SDK 8.0 版最后一次支持 Fermi 微架構。 CUDA-SDK 10.2 版最后一次支持部分 Kepler 微架構。

內容由匿名用戶提供，本內容不代表www.gelinmeiz.com立場，內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載，請注明出處：http://www.gelinmeiz.com/376463/