NVIDIA CUDA Toolkit是一個(gè)專(zhuān)業(yè)的CUDA工具包,為用戶提供了專(zhuān)業(yè)的開(kāi)發(fā)環(huán)境,創(chuàng)建經(jīng)GPU加速的高性能應(yīng)用。使用這個(gè)工具包,可以在經(jīng)GPU加速的嵌入式系統(tǒng)、臺(tái)式工作站、企業(yè)數(shù)據(jù)中心、基于云的平臺(tái)和 HPC 超級(jí)計(jì)算機(jī)中開(kāi)發(fā)、優(yōu)化和部署應(yīng)用。借助多 GPU 配置中用于分布式計(jì)算的多項(xiàng)內(nèi)置功能,科學(xué)家和研究人員能夠開(kāi)發(fā)出可從單個(gè)GPU工作站擴(kuò)展到配置數(shù)千個(gè)GPU的云端設(shè)施的應(yīng)用。
軟件功能
GPU時(shí)間戳:開(kāi)始時(shí)間戳
方法:GPU方法名稱(chēng)。這是內(nèi)存副本的memcpy或GPU內(nèi)核的名稱(chēng)。
內(nèi)存副本的后綴描述了內(nèi)存?zhèn)鬏數(shù)念?lèi)型,例如memcpyDToHasync表示從設(shè)備內(nèi)存到主機(jī)內(nèi)存的異步傳輸
GPU時(shí)間:這是該方法在GPU上的執(zhí)行時(shí)間
CPU時(shí)間:這是啟動(dòng)該方法的GPU時(shí)間和CPU開(kāi)銷(xiāo)的總和。
在驅(qū)動(dòng)程序生成的數(shù)據(jù)級(jí)別,CPU時(shí)間僅是啟動(dòng)非阻塞方法的CPU開(kāi)銷(xiāo)。
對(duì)于阻塞方法,它是GPU時(shí)間和CPU開(kāi)銷(xiāo)的總和。
默認(rèn)情況下,所有內(nèi)核啟動(dòng)都是非阻塞的。
但是,如果啟用了任何探查器計(jì)數(shù)器,內(nèi)核啟動(dòng)將被阻止。
不同流中的異步內(nèi)存復(fù)制請(qǐng)求是非阻塞的
流ID:流的標(biāo)識(shí)號(hào)
僅適用于內(nèi)核方法的列
占用率:占用率是每個(gè)多處理器的活動(dòng)扭曲數(shù)與最大活動(dòng)扭曲數(shù)之比。
探查器計(jì)數(shù)器:請(qǐng)參閱探查器計(jì)數(shù)器部分以獲取支持的計(jì)數(shù)器列表
網(wǎng)格大?。貉豖,Y和Z維度的網(wǎng)格中的塊數(shù)在單列中顯示為[num_blocks_X num_blocks_Y num_blocks_Z]
塊大?。貉豖,Y和Z維度的塊中的線程數(shù)在單列中顯示為[num_threads_X num_threads_Y num_threads_Z]
dyn smem每塊:每塊動(dòng)態(tài)共享內(nèi)存大?。ㄒ宰止?jié)為單位)
每塊sta smem:每塊的靜態(tài)共享內(nèi)存大?。ㄒ宰止?jié)為單位)
每個(gè)線程的reg:每個(gè)線程的寄存器數(shù)
僅用于記憶復(fù)制方法的列
mem傳輸大小:內(nèi)存?zhèn)鬏敶笮。ㄒ宰止?jié)為單位)
主機(jī)內(nèi)存?zhèn)鬏旑?lèi)型:指定內(nèi)存?zhèn)鬏斒鞘褂谩翱煞猪?yè)”還是“頁(yè)面鎖定”內(nèi)存
更新內(nèi)容
NVIDIA幾年前首次推出的軟件開(kāi)發(fā)人員工具包經(jīng)歷了幾次轉(zhuǎn)型,其中最新的成果不到24小時(shí)就已揭曉。
在CUDA工具包,該公司決定將其命名創(chuàng)建,取得了功能支持和性能相當(dāng)?shù)娘w躍。
從2012年4月發(fā)布的4.2版本開(kāi)始,它一直躍升至5.0版。從4.0(2011年5月)到4.1(2012年1月)再到4.2的發(fā)展形成了鮮明的對(duì)比。
該軟件開(kāi)發(fā)工具包為C和C ++應(yīng)用程序創(chuàng)建者提供了一些新的可能性。
首先,可以使用NVCC單獨(dú)編譯和鏈接所有設(shè)備功能。這允許創(chuàng)建封閉源設(shè)備功能庫(kù),甚至允許那些庫(kù)啟動(dòng)用戶定義的設(shè)備回調(diào)函數(shù)。
鏈接器支持在此版本中是BETA,但客戶的反饋將使NVIDIA消除可能留下的任何錯(cuò)誤。
CUDA Toolkit 5.0的第二個(gè)功能是新的命令行分析器nvproof。通過(guò)提供有關(guān)應(yīng)用程序花費(fèi)時(shí)間最多的位置的摘要信息,它可以使優(yōu)化工作正確地集中在。
該版本的第三項(xiàng)資產(chǎn)是CUDA動(dòng)態(tài)并行,它允許GPU運(yùn)行的全局和設(shè)備功能使用“ <<<< >>>>>>語(yǔ)法啟動(dòng)內(nèi)核,并直接調(diào)用CUDA運(yùn)行時(shí)API例程。當(dāng)然,此功能以前存在,但僅存在于主機(jī)功能中。
第四個(gè)也是最后一個(gè)新功能是用于Linux和Mac OS的Nsight Eclipse Edition,這是一個(gè)集成的開(kāi)發(fā)環(huán)境用戶界面,使程序員可以開(kāi)發(fā),調(diào)試和優(yōu)化CUDA代碼。
總而言之,CUDA Toolkit 5.0為新的和改進(jìn)的程序打開(kāi)了大門(mén),這些程序能夠利用圖形處理單元的并行計(jì)算功能。
開(kāi)發(fā)人員可以從下面的鏈接之一下載適當(dāng)版本的軟件。
標(biāo)簽: 開(kāi)發(fā)環(huán)境
相關(guān)版本
下載地址
精品推薦
-
IntelliJ IDEA 2019
詳情 -
Microsoft VC++6.0安裝包
詳情 -
Microsoft VC++2015版運(yùn)行庫(kù)
詳情 -
VC++2019運(yùn)行庫(kù)
詳情 -
RobotStudio
詳情 -
Intel Visual Fortran
詳情 -
Microsoft Visual Studio 2022
詳情 -
Microsoft VC++2010運(yùn)行庫(kù)安裝包
詳情 -
源碼編輯器4.0
詳情 -
博途V18破解授權(quán)軟件
詳情 -
GX Works2
詳情 -
microsoft visual studio 2019免費(fèi)版
詳情 -
hypermill2021超級(jí)加密狗破解版
詳情 -
西門(mén)子博途v17破解版
詳情 -
星三好圖形化編程軟件官方最新版
詳情 -
VBSEdit9
詳情
-
6 源碼智造編輯器
裝機(jī)必備軟件
網(wǎng)友評(píng)論