ZHCADU3A February 2024 – November 2024 AM62A1-Q1 , AM62A3 , AM62A3-Q1 , AM62A7 , AM62A7-Q1 , AM62P , AM62P-Q1 , DS90UB953A-Q1 , DS90UB960-Q1 , TDES960 , TSER953
我們?cè)诟鞣N應(yīng)用場(chǎng)景中對(duì)使用 V3Link 板和 AM62A SK 的四攝像頭設(shè)置進(jìn)行了測(cè)試,包括直接在屏幕上顯示、以太網(wǎng)流式傳輸(四個(gè) UDP 通道)、錄制到 4 個(gè)單獨(dú)的文件以及使用深度學(xué)習(xí)推理。在每個(gè)實(shí)驗(yàn)中,我們都會(huì)監(jiān)控幀速率和 CPU 內(nèi)核的利用率,從而探索整個(gè)系統(tǒng)的功能。
如前面的圖 4-4 所示,深度學(xué)習(xí)流水線使用 tiperfoverlay GStreamer 插件在屏幕底部以條形圖的形式顯示 CPU 內(nèi)核負(fù)載。默認(rèn)情況下,該圖每?jī)擅敫乱淮危岳寐拾俜直刃问斤@示負(fù)載。除了 tiperfoverlay GStreamer 插件之外,第二個(gè)可直接在終端上顯示內(nèi)核性能的選項(xiàng)是 perf_stats 工具(具有文件保存選項(xiàng))。此工具相比 tiperfoverlay 更精確,tiperfoverlay 會(huì)給 Arm 內(nèi)核和 DDR 帶來(lái)額外負(fù)載,以繪制圖形并在屏幕上疊加。perf_stats 工具主要用于收集本文檔中所述所有測(cè)試用例中的硬件利用率結(jié)果。這些測(cè)試中研究的一些重要處理內(nèi)核和加速器包括主處理器(四個(gè) A53 Arm 內(nèi)核,頻率為 1.25GHz)、深度學(xué)習(xí)加速器 (C7x-MMA,頻率為 850MHz)、具有 VISS 和多標(biāo)量(MSC0 和 MSC1)的 VPAC (ISP) 以及 DDR 操作。
表 5-1 展示了在三種用例中將 AM62A 與四個(gè)攝像頭一起使用時(shí)的性能和資源利用率,包括將四個(gè)攝像頭的視頻流式傳輸?shù)斤@示器、通過(guò)以太網(wǎng)進(jìn)行流式傳輸以及錄制到四個(gè)不同的文件。每個(gè)用例中都會(huì)執(zhí)行兩項(xiàng)測(cè)試:僅使用攝像頭和使用深度學(xué)習(xí)推理。此外,表 5-1 中的第一行顯示了只有操作系統(tǒng)在 AM62A 上運(yùn)行而沒(méi)有任何用戶應(yīng)用程序時(shí)的硬件利用率。在評(píng)估其他測(cè)試用例的硬件利用率時(shí),該值用作比較的基準(zhǔn)。如表所示,具有深度學(xué)習(xí)和屏幕顯示功能的四個(gè)攝像頭以 30FPS 的速率運(yùn)行,四個(gè)攝像頭的總速率為 120FPS。這種高幀速率只需深度學(xué)習(xí)加速器 (C7x-MMA) 滿容量的 86% 即可實(shí)現(xiàn)。此外,需要注意的是,在這些實(shí)驗(yàn)中,深度學(xué)習(xí)加速器的時(shí)鐘頻率為 850MHz,而不是 1000MHz,后者僅為最高性能的 85% 左右。
| 應(yīng)用 | 流水線(操作) | 輸出 | FPS 平均流水線 | FPS 總計(jì) | MPU A53(1.25GHz 時(shí))[%] | MCU R5 [%] | DLA (C7x-MMA)(850MHz 時(shí))[%] | VISS [%] | MSC0 [%] | MSC1 [%] | DDR 讀取 [MB/s] | DDR 寫入 [MB/s] | DDR 總計(jì) [MB/s] |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 無(wú)應(yīng)用 | 基線無(wú)操作 | 不適用 | 不適用 | 不適用 | 1.87 | 1 | 0 | 0 | 0 | 0 | 560 | 19 | 579 |
| 僅限攝像頭 | 流式傳輸?shù)狡聊?/strong> | 屏幕 | 30 | 120 | 12 | 12 | 0 | 70 | 61 | 60 | 1015 | 757 | 1782 |
| 以太網(wǎng)流式傳輸 | UDP:4 個(gè)端口 1920x1080 | 30 | 120 | 23 | 6 | 0 | 70 | 0 | 0 | 2071 | 1390 | 3461 | |
| 錄制到文件 | 4 個(gè)文件 1920x1080 | 30 | 120 | 25 | 3 | 0 | 70 | 0 | 0 | 2100 | 1403 | 3503 | |
| 具有深度學(xué)習(xí)功能的攝像頭 | 深度學(xué)習(xí):對(duì)象檢測(cè) MobV1-coco | 屏幕 | 30 | 120 | 38 | 25 | 86 | 71 | 85 | 82 | 2926 | 1676 | 4602 |
| 深度學(xué)習(xí):對(duì)象檢測(cè) MobV1-coco 和以太網(wǎng)流式傳輸 | UDP:4 個(gè)端口 1920x1080 | 28 | 112 | 84 | 20 | 99 | 66 | 65 | 72 | 4157 | 2563 | 6720 | |
| 深度學(xué)習(xí):對(duì)象檢測(cè) MobV1-coco 和錄制到文件 | 4 個(gè)文件 1920x1080 | 28 | 112 | 87 | 22 | 98 | 75 | 82 | 61 | 2024 | 2458 | 6482 |