• CUDA

    編輯
    本詞條由“匿名用戶” 建檔。

    CUDA,是Nvidia開發的一種編程接口(API),通過它程序部分可以由圖形處理器(GPU)處理。 額外的計算能力以 GPU 的形式提供,在高度可并行化的程序流(高數據并行性)的情況下,GPU 通常比 CPU 的工作速度快得多。 CUDA主要用于科學技術計算。

    技術細節

    編輯

    圖形處理器,僅用于圖形計算,也可作為使用 CUDA API 的協處理器使用。 應用實例包括地震或地質問題的解決、電磁場的模擬或機器學習領域中神經網絡的訓練。 CUDA 在 SETI@home 項目中被用作伯克利網絡計算開放基礎設施 (BOINC) 的一部分。 通常,它只能在(除其他條件外)計算可以高度并行化的情況下有效使用。

    CUDA 技術可用于“GeForce 8”系列的顯卡和 Quadro FX 5600 的 Quadro 卡。Nvidia 的 Tesla 卡已針對高性能計算進行了優化,主要通過 CUDA 支持解決而且還有像 OpenCL 這樣的開放標準。 有些甚至缺少顯示器連接。

    自從收購了Ageia的PhysX技術后,Nvidia就不斷開發這項技術,并在CUDA上進行了重寫

    Nvidia 于 2015 年 3 月發布了 CUDA 7.0 版。

    Nvidia 于 2015 年 9 月發布了 CUDA 7.5 版本。

    CUDA 8.0 版本從 2016 年 9 月開始可用,全面支持新的 Pascal 系列。

    CUDA 9.0 版本從 12 月更新到 9.1,從 3 月更新到 9.2,從 2017 年 9 月開始可用,它完全支持新的 Volta 系列。 不再支持 FERMI。

    CUDA 10 從 2018 年秋季開始支持圖靈架構。

    CUDA 11 完全支持當前的 Ampere 架構。 最小計算能力 3.5 僅支持部分 Kepler 卡。

    程序

    編輯

    程序員目前將 C 用于 CUDA。 還有編程語言 Perl、Python、Ruby、Java、Fortran 和 .NET 的包裝器,以及與 MATLAB、Mathematica 和 R 的連接。Nvidia 使用優化的 C 編譯器 Open64 創建了 CUDA。C++ 也可以使用,因為費米架構。

    CUVID是一個用于解碼視頻的編程接口。

    備選方案

    編輯

    其他 GPGPU 解決方案示例:

    • OpenCL 是由 Khronos Group 發起的開放標準,適用于所有顯卡,并且適用于大多數操作系統
    • 同樣由 Khronos Group 開發的開放式 Vulkan 標準也支持類似 OpenCL 的計算著色器。
    • DirectCompute:Microsoft 的 GPGPU 接口,集成到 DirectX API 中

    軟件

    編輯

    最早支持 CUDA 的程序之一是 folding@home 客戶端,它成倍增加了生化計算的速度。 SETI@home 客戶端于 2008 年 12 月 17 日緊隨其后,將尋找外星生命的速度提高了 10 倍。 Nvidia 發布了 Badaboom 軟件,這是一種視頻轉換器,轉換視頻的速度比 CPU 計算快 20 倍。 其他使用 CUDA 的程序是 TMPGEnc、Sorenson Squeeze 7、來自 CS4 的 Adob??e Photoshop(此處加速了濾鏡的使用)、來自 CS5.5 的 Adob??e Premiere Pro 和 Mathematica 8+ 以及 Nvidia 軟件 StyleGAN。

    MSC/Nastran 2013+ 等仿真軟件有時使用 CUDA 會xxx加速; 在大型模型上,GPU 內存太少可能會成為一個障礙。 OpenFoam 和 ANSYS 等其他xxx的 CFD 和 FEM 軟件使用 CUDA 來加速計算。 由于在這些特殊的計算操作中 GPU 的效率比 CPU 更高,計算的功耗有時會降低。

    處理器

    編輯

    圖形處理器 (GPU) 是具有特定于應用程序設計的處理器,因此 GPU 知道相當奇特的數據類型,例如具有定點的 9 位或 12 位,但通常沒有 32、48、64 或 80 的寄存器寬度通用 CPU 和 FPU(等)通用的位。 因此,GPU 的指令集中通常不提供計算,例如根據 IEEE 754(64 位雙精度)的精度,必須使用軟件以相對復雜的方式進行模擬。 因此,GPU 特別適合計算位寬相對較小的數據類型。

    Z截至目前(2010 年),xxx批制造商已經在生產擴展 GPU,除了 GPU 所需的數據類型外,還支持通用數據類型和操作,例如 B. 用于直接計算符合 IEEE 754 標準的結果。 作為目前xxx的制造商之一,Nvidia 提供了原生提供 32 位整數以及單精度和雙精度浮點數據格式的 Fermi 代 GPU。

    CUDA

    另一個缺點是與計算機架構的連接。對于當前的 GPU,這通常是通過 PCIe 進行的,與處理器的直接連接相比,會導致更糟糕(更高)的延遲時間和更低的 I/O 吞吐率。 因此,外包只對具有一定計算能力的功能才有價值——特別是如果 GPU 在指令集方面更適合這些任務(例如,對于大型矩陣)。

    支持的 GPU

    編輯

    GPU 和卡支持的 CUDA 版本層級。

    CUDA-SDK 6.5 版最后一次支持 Tesla 微架構。CUDA-SDK 8.0 版最后一次支持 Fermi 微架構。 CUDA-SDK 10.2 版最后一次支持部分 Kepler 微架構。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/376463/

    (10)
    詞條目錄
    1. CUDA
    2. 技術細節
    3. 程序
    4. 備選方案
    5. 軟件
    6. 處理器
    7. 支持的 GPU

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久