面向 AI 推斷的 VCK5000 Versal 開發卡
產品描述
Xilinx? VCK5000 Versal? 開發卡基于 Xilinx 7nm Versal? ACAP 架構構建,旨在滿足需要高吞吐量 AI 推斷和信號處理計算性能的設計需求。
相較于當前服務器級 CPU,VCK5000 的計算能力提升了 100 倍,相較于當前服務器級 GPU,VCK5000 的 MLPerf 推斷性能更佳,并且支持標準化開發流程,VCK5000 是云計算加速和邊緣計算應用的理想開發平臺。
VCK5000 完全由 Vitis? AI 開發環境提供支持,包含優化的 IP、工具、庫、模型和示例設計等。它采用高效易用的設計理念,可在 VCK5000 上充分發揮人工智能加速的潛力。您可以使用 Python 或 C++ API 在幾分鐘內運行 Tensorflow、Pytorch 或 Caffe 模型,無需事先掌握任何 FPGA 硬件知識。
主要特性與優勢
優異的 AI 推斷平臺
145TOPS (Int8) @ $2,495
使用 AI 引擎進行 AI 推斷,在 MLPerf 1.0 上優于 nVidia T4 的性能
隨時可用的解決方案
帶兩個 DPU 變體解決方案的 Vitis AI 1.3(384 和 288 個 AIE 內核)
支持具有 50 多個模型的專區
自然語言 (BERT) 演示
MLPerf 提交 ResNet-50 演示(性能比 T4 高 11%)
使用 Vitis AI 啟動設計,開發板用戶指南
開發板特性
功耗與熱量
卡規格 | VCK5000 | |
---|---|---|
器件 | VC1902 | |
計算 | 有源 | 無源* |
INT8 TOPs(峰值) | 145 | 145 |
尺寸 | ||
高度 | 完整 | 完整 |
長度 | 完整 | 3/4 |
寬度 | 雙插槽 | 雙插槽 |
存儲器 | ||
片外內存容量 | 16 GB | 16 GB |
片外總帶寬 | 102.4 GB/s | 102.4 GB/s |
內部 SRAM 容量 | 23.9 MB | 23.9 MB |
內部 SRAM 總帶寬 | 23.5 TB/s | 23.5 TB/s |
接口 | ||
PCI Express | Gen3 x 16 / Gen4 x 8 | Gen3 x 16 / Gen4 x 8 |
網絡接口 | 2x QSFP28 (100GbE) | 2x QSFP28 (100GbE) |
邏輯資源 | ||
查找表 (LUT) | 899,840 | 899,840 |
最大總功率 | 225W | 225W |
散熱 | 活躍 | 無源 |