找回密码
 注册
关于网站域名变更的通知
查看: 448|回复: 0
打印 上一主题 下一主题

【含案例源码】IMX8基于FlexSPI、PCIe与FPGA的高速通信开发详解!

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-9-2 14:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 Tronlong123 于 2021-9-2 15:12 编辑
, l; h1 U* I" j
/ L* v$ `7 t; ^
前 言
本文主要介绍i.MX 8M Mini基于FlexSPI、PCIe与FPGA的高速通信案例。
本文档适用开发环境:
Windows开发环境:Windows 7 64bit、Windows 10 64bit
虚拟机:VMware15.1.0
Linux开发环境:Ubuntu18.04.4 64bit
U-Boot:U-Boot-2020.04
Kernel:Linux-5.4.70
Linux SDK:5.4.70_2.3.0
*测试硬件平台:TLIMX8-EVM评估板(NXP i.MX 8M Mini)
. F  T# [& v2 S! f# l( ?4 J9 q. S

$ e6 }0 }; v: {& }9 A
图 1 TLIMX8-EVM评估板
案例一:主要演示ARM Cortex-A53通过FlexSPI接口读取FPGA(Spartan-6采集卡TL-HSAD-LX)发送的模拟数据,并进行校验,通过串口打印相关信息。实测速率为114.89MB/s。
案例二:主要演示ARM Cortex-A53通过PCIe接口与FPGA进行通信,实现对CameraLink相机图像的采集、编码和显示。实测传输帧率为60fps。
4 u' D: G( h; a6 A7 P" d
想要获取案例详细说明、源码的朋友请于评论区留言~
1 flexspi_read案例
1.1 案例说明
本案例主要演示ARM Cortex-A53通过FlexSPI接口读取FPGA(Spartan-6采集卡TL-HSAD-LX)发送的模拟数据,并进行校验,通过串口打印相关信息。
(1) 驱动默认配置FlexSPI为DDR模式(双边沿),配置FlexSPI的时钟源为400MHz,分频系数pre_divider和post_divider分别为2和5,此时FlexSPI的ROOT CLK时钟为400MHz/2/5 = 40MHz,DDR模式的传输时钟SCLK= ROOT SCLK/2 = 20MHz,数据位宽为8bit,即理论传输速率为40MB/s,实测速率为37.56MB/s。
(2) 驱动如配置FlexSPI为DDR模式(双边沿),配置FlexSPI的时钟源为400MHz,分频系数pre_divider和post_divider分别为1和3,此时FlexSPI的ROOT SCLK时钟为400MHz/1/3 = 133MHz,DDR模式的传输时钟SCLK = ROOT SCLK/2 = 66.5MHz,数据位宽为8bit,即理论传输速率为133MB/s,实测速率为114.89MB/s。
FPGA端:发送从0x00递增至0xFF的数据。
ARM端:读取数据并进行校验,打印误码率、读取速率和读取到的数据。
程序流程图如下:

5 B& c* a6 J- x
2 `/ A& E9 ^. H# E+ f$ Z
图 2
1.2 案例测试
2 b1 `: W1 E/ A5 A+ p( F+ n

" I9 ~$ k+ {1 T( F1 ?
图 3
请按照上图进行硬件连接,并将案例bin目录下的可执行文件flexspi_read、“driver\bin\”目录下驱动文件flexspi_imx8.ko、“dts\image\”目录下的设备树文件tlimx8-evm-flexspi.dtb拷贝至评估板文件系统。采集卡TL-HSAD-LX加载或固化“data_to_flexspi\bin\”目录下的.bit或.mcs文件。在评估板文件系统flexspi_read文件所在路径下,执行如下命令查询程序参数说明。
Target# ls
Target# ./flexspi_read -h
1 F' D6 l" i8 V4 s" l
1 y7 K9 o* v& B) i4 X1 k, ^
图 4
执行如下命令将默认使用的设备树tlimx8-evm.dtb进行备份,然后把tlimx8-evm-flexspi.dtb拷贝至“/run/media/mmcblk1p1/”目录并重命名为tlimx8-evm.dtb。
Target# cp
/run/media/mmcblk1p1/tlimx8-evm.dtb linux-tlimx8-evm.dtb//备份默认的tlimx8-evm.dtb,新文件名为linux-tlimx8-evm.dtb
Target# cp tlimx8-evm-flexspi.dtb /run/media/mmcblk1p1/tlimx8-evm.dtb
备注:更换设备树后,需重启评估板方可使设备树生效。
8 R6 K. r9 t& g2 x

* Q2 A& n0 n3 i# O& L7 |
图 5
1.2.1 功能测试
执行如下命令加载FlexSPI驱动。
Target# insmod flexspi_imx8.ko

# U5 a& R5 {3 o  [- L
( _( |+ H- K  [1 u5 c
图 6
执行如下命令进行测试。
Target# ./flexspi_read -a 0x08000000 -s 4096

9 I- k- B' {" k) `2 n) m

0 |8 G# p) f; b% [- J( t7 h
图 7
本次测试速率为37.56MB/s,误码率为0,与理论速率40MB/s接近。
备注:受限于测试板卡的硬件连接形式的影响,37.56MB/s是零误码率时的最高实测速率。
若读取小于或等于2048Byte的数据时,每次读完需清空FlexSPI的RX Buffer,否则下次读取的数据是缓存在Buffer中的旧数据。
Target# devmem2 0x30bb0000 w 0xFFFF7031
; K0 a; `0 ]/ D/ N" s! Y
6 P5 {1 j  c- Y6 r! b5 s; B
图 8
1.2.2 性能测试
执行如下命令卸载flexspi驱动,并重新加载驱动。同时采集卡TL-HSAD-LX重新加载或固化FPGA程序。
Target# rmmod flexspi_imx8
Target# insmod flexspi_imx8.ko pre_divider=1 post_divider=3
备注:pre_divider和post_divider为分频系数,详细说明请查阅驱动说明章节。
" M6 L/ q5 ~* ]

1 `& q  ?) K5 X+ i! [
图 9
执行如下命令进行测试。
Target# ./flexspi_read -a 0x08000000 -s 4096

1 Q- A& f4 `& f! }9 S
" A/ G& {8 V% G4 h4 T3 R
图 10
可以看到本次测试速率为114.89MB/s,与理论速率133MB/s接近。
备注:受限于测试板卡的硬件连接形式的影响,此速率下的误码率为99.8%。
1.3 案例关键代码
(1) main函数

6 [! v9 r2 u8 x7 w$ S( e& j

. `) t1 D+ I) j# X6 q. ?/ l
图 11
(2) 地址映射。
7 F- E& K( X' x
1 Y4 [/ q$ q' ]1 G, v( H( W3 d
图 12
(3) 读取数据。
# z( N. M% J! T0 i& w, P/ z) x
6 V6 j; i5 e. {
图 13
(4) 校验数据。
, |6 d5 I( s9 N0 \, k: }  R, I6 G

# t% ]( P% W; G2 r2 [- _
图 14
(5) 打印数据。

7 c6 S/ c# B3 U; _: D0 e* Z
" o2 N0 T# L' b2 j( ~% y
图 15
1.4 FPGA工程关键代码
(1) 端口IO定义
flexspi_sclk和flexspi_ss0_n为输入信号,flexspi_data和flexspi_data为输出信号。

2 t5 X, C+ t( w7 k3 E

  ^6 h- F1 Z/ a+ ~* w6 K
图 16
(2) 时钟输入信号flexspi_sclk设置为2倍频

4 J/ \6 ]. V$ C) E& _" ~" h
8 h! C; V  H! H5 }, b
图 17
(3) 数据发送

, H$ t  f4 m  C
8 Y- t9 H; D3 K& Y: \: _) z
图 18

7 r- {( }3 B/ h( Z

* E) h8 I. e3 y+ U# `4 @9 b; T# T
图 19
2 gst_pcie_enc案例
2.1 案例说明
本案例主要演示ARM Cortex-A53通过PCIe接口与FPGA进行通信,实现对CameraLink相机图像的采集、编码和显示。其中ARM端获取到的原始图像通过dma-buf机制,在采集、硬件编码和显示输出等功能中进行共享,可实现高效的图像数据“零拷贝”的录播方案。
FPGA端:
(1) 采集CameraLink相机图像;
(2) 通过XDMA IP实现为PCIe EP设备,RC端可通过PCIe接口访问FPGA端DDR以及对VDMA IP的寄存器进行配置。
ARM端:
(1) 作为PCIe RC设备,配置VDMA IP将图像存储到FPGA DDR指定位置、将图像从FPGA DDR通过XDMA搬运到ARM端DDR;
(2) 调用协处理器VPU进行H264硬件编码,并将编码后的数据存储到文件;
(3) 编码的同时,通过HDMI显示实时图像。
程序工作流程框图如下所示:

# a, s& L" M3 Y1 p- h; p

# e  v: \3 M$ O$ [+ q& \* B( p
图 20
2.2 案例测试
请参考下图,将创龙科技的TLCamerLinkF模块连接至TLK7-EVM评估板的FMC2接口,TLK7-EVM评估板J1跳线帽选择1.8V档位,以配置FMC IO的BANK电压为1.8V。将CameraLink相机的CL0通过数据线连接至TLCameraLinkF模块的CameraLink1接口。再将TLK7-EVM评估板的PCIe插到TLIMX8-EVM评估板的PCIe插槽上,使用HDMI线缆连接TLIMX8-EVM评估板的HDMI OUT接口至HDMI显示屏。

) N, N! M. Q4 T$ W8 J  b, I
6 c" d7 E. B3 V5 n! G3 u# Y
图 21
将该案例bin目录下的驱动文件xdma-video.ko拷贝至TLIMX8-EVM评估板文件系统中,并将案例bin目录下的.bit或.bin文件加载或固化到TLK7-EVM评估板。
评估板上电,可执行lspci命令检查PCIe连接是否正常。如不能获取到如下信息,请检查硬件连接和FPGA端是否正常运行。
Target# lspci
6 t+ t/ ^* j, \  @

! u7 Z: f: r/ p8 s6 s% R% S% U
图 22
Target# insmod xdma-video.ko debug=1
备注:“debug=1”表示打印帧率信息,可根据实际需求选择是否配置。若需修改分辨率和帧率,可执行命令“insmod xdma-video.ko width=1280 height=1024 fps=60”,具体的分辨率和帧率大小,请以相机实际可支持范围为准,分辨率参数需和相机分辨率参数匹配,帧率参数仅作用于软件上相机参数,不影响实际的相机帧率。
9 W0 j1 X, W( L

- s! P) n" a" G& z. l3 c; a
图 23
执行如下命令进行图像的采集、编码和显示,编码后的test.264文件将保存在当前目录下。
Target# gst-launch-1.0 -v -e v4l2src device=/dev/video1 ! "video/x-raw, format=(string)NV12, width=(int)1280, height=(int)1024" ! tee name=t ! queue ! vpuenc_h264 ! h264parse ! filesink location=test.264 t. ! queue ! waylandsink
其中"/dev/video1"为设备节点,请以实际节点为准,1280和1024为图像的宽和高。
7 t; N- t( ?, Z% W: B0 V& g# n

8 A/ _" a$ G! t* k6 e
图 24
执行成功后可观察到如下输出,串口不停打印帧率,并在HDMI显示器上观看到实时图像。
备注:帧率显示为61fps,是由于CameraLink相机输出的并不是标准的60fps图像。

$ w) Y7 ~! j  a

: G" m' A2 k. J. D. H
图 25
; A. a: ]5 c1 A% h/ f* w- u

5 J0 F5 T& F+ v4 U/ W/ X0 X  v9 g
图 26
按下“Ctrl+C”停止录制后,将在当前目录生成test.264文件,并可观察到实际帧率为59.954fps。

* s' S2 J+ m, r( M8 x6 n$ S' R9 Q
, S( ^# \' a7 E5 c5 O4 c- m$ R; f
图 27
执行如下命令播放编码后的视频,HDMI显示器显示对应图像。
Target# gst-play-1.0 test.264

8 K) Z, c2 H/ P$ g/ ~
( I/ f! I* c/ C3 x
图 28

8 q* R( a4 b2 x  `  ^) ?( U
4 x, o/ V) D3 c( ]* c$ ^5 b" P( G
图 29
播放结束后,将打印视频时长、帧率信息。

" j5 P: x5 @4 J; W% u2 n- C
" g- Z& c" K! z8 [  K' y
图 30
备注:由于码流文件中不包含播放帧率信息,因此在执行“gst-play-1.0 test.264”时未能按60fps进行播放。从串口打印信息可知,实际是以30fps进行播放,并且播放时长为录制时长的两倍。在录制时,将H264码流封装成MP4格式可解决此问题,因为封装成MP4格式时,播放帧率信息将被记录在MP4文件中。
执行如下命令,可将H264码流保存成MP4文件。
Target# gst-launch-1.0 -v -e v4l2src device=/dev/video1 ! "video/x-raw, format=(string)NV12, width=(int)1280, height=(int)1024" ! tee name=t ! queue ! vpuenc_h264 ! h264parse ! qtmux ! filesink location=test.mp4 t. ! queue ! waylandsink

2 ~0 v% b1 n+ Q% z5 K) O. A* ~
, z. J" N0 ^" u- X' u1 v  B' I; l
图 31

2 e  ?+ K/ i5 |

. W# ~2 x, L$ q* ^  d6 M$ w' _
图 32

- K. ~- o! W4 F3 r* _$ u
注意:H264码流保存成MP4文件,程序可正常工作,录制的视频文件播放帧率正常,但系统会出现概率性的丢帧。为了避免这种情况,在实际的应用编程中,建议将MP4的保存功能另外建立一个pipeline进行,或改用其它开源MP4库进行开发。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-24 06:21 , Processed in 0.156250 second(s), 22 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表