EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
如果您正在使用 MATLAB 建模数字信号处理( DSP)或者视频和图像处理算法,并且最终将其用于 FPGA 或 ASIC,本文可能将为你带来帮助。 从 MATLAB 生成 HDL 代码' T, C+ o* V( e7 T7 r1 w
FPGA 在通用处理器(GPP)和专用集成电路(ASIC)之间提供了很好的折中方案。GPP 是完全可编程的,但在功率和性能方面效率较低;ASIC 可实现专用的功能,并展现出最佳的功率和性能特性,但需要极其昂贵的设计验证和实现周期。FPGA 也用于 ASIC 工作流中的原型设计,以进行硬件验证和早期软件开发。 由于在运行高吞吐量、高性能的应用程序时,性能有了大幅度的提高,算法设计者越来越多地使用 FPGA 而不是传统的处理器来原型化和验证创新。然而,由于 MATLAB 简单易用的编程模型和丰富的分析和可视化能力,许多算法都是在其中实现的。当针对 FPGA 或 ASIC 时,这些 MATLAB 算法必须手动转换为 HDL。 对于许多精通软件编程的算法开发人员来说,掌握 FPGA 设计工作流是一项挑战。与软件算法开发不同,硬件开发要求并行思想。存在的其他障碍包括:学习 VHDL 或 Verilog 语言,掌握 FPGA 供应商的 IDE,理解深奥的术语,如“多周期路径”和“延迟平衡”等。 在这篇文章中,我将介绍一个从 MATLAB 转换为 FPGA 的简单路径。我将展示如何从 MATLAB 算法自动生成 HDL 代码,在 FPGA 上实现 HDL 代码,并使用 MATLAB 来验证您的 HDL 代码。 MATLAB 到硬件工作流
- O% ^3 @* U# r, U将 MATLAB 设计转换为硬件的过程包括以下步骤:0 X( k9 a. x6 j& m
1. 在 MATLAB 中建模您的算法——使用 MATLAB 来模拟、调试、迭代测试并优化设计。
+ w% b* h9 d7 t b: i% @2. 生成 HDL 代码——自动创建用于 FPGA 原型的 HDL 代码。
' v5 @+ o7 i4 k- ]* s9 J. V3. 验证 HDL 代码——重用您的 MATLAB test bench 来验证生成的 HDL 代码。% i) R! f" ?+ I& a1 { d' r
4. 创建和验证 FPGA 原型——在 FPGA 上实现和验证您的设计。 将 MATLAB 转换为硬件存在一些独特的挑战。MATLAB 代码是过程性的,可以高度抽象;它可以使用浮点数据,并且没有时间概念。复杂的循环可以从矩阵运算和工具箱函数推断出来。 在硬件中实现 MATLAB 代码包含以下操作: 将浮点 MATLAB 代码转换为具有优化位宽的定点 MATLAB 代码,以实现高效的硬件生成。 识别程序结构并将其映射到并发的经过面积和速度优化的硬件操作上。 通过添加时钟和时钟率来调度硬件中的操作,引入时间的概念。 创建资源共享架构来实现昂贵的操作符,如乘数和 for 循环体。 将大型持久化数组映射到硬件中的块RAM HDL Coder™ 可通过工作流自动化简化上述任务。 MATLAB 算法示例) c9 d/ x9 I1 ^. h4 w: z8 Z% I" z
让我们用MATLAB函数来实现直方图均衡化并完成此工作流。该算法在 MATLAB 中实现,通过变换灰度像中的值来增强图像对比度,使输出图像的直方图近似平坦。6 t S8 S C9 S: K9 l. w
type mlhdlc_heq.m % Histogram Equalization Algorithm
V' K" x) k$ |function [pixel_out] = mlhdlc_heq(x_in, y_in, pixel_in, width, height) persistent histogram
" I! D+ J, T1 t6 ^( Y' j$ tpersistent transfe RFunc ! n# d8 L- }9 Z, }- `3 {1 f
persistent histInd ) ]( W3 n% U: n8 C) S8 O* L8 ^4 }0 z
persistent cumSum if isempty(histogram)/ _8 _) u0 X7 T$ c* K2 h
histogram = zeros(1, 2^8);
# t Y( u& V/ L- X# y% L$ j0 wtransferFunc = zeros(1, 2^8);
- w2 P9 D) w: t4 u+ v5 B+ rhistInd = 0;8 C0 X, e. O0 x) p8 A
cumSum = 0;
3 |3 l4 Z! p# o/ C, @end % Figure out indices based on where we are in the frame7 R4 \: L/ V% I( `; Y
if y_in histInd = pixel_in + 1;2 P4 H& W+ m! O6 \ R
elseif y_in == height && x_in == 0 % first column of height+1
) T6 R- h1 v% _0 Z' {histInd = 1;2 ?3 D9 N5 {0 f" i* I& V
elseif y_in >= height % vertical blanking period
8 F- O1 z9 c0 N+ ]0 JhistInd = min(histInd + 1, 2^8);
. \& ]0 K R0 B7 M Q c9 Lelseif y_in histInd = 1;5 n2 _" Y: Z7 i- r* l' i. L8 s) B [+ P
end %Read histogram
6 `/ x8 a* p6 H2 nhistValRead = histogram(histInd); %Read transfer function+ k; ~2 j9 I8 ^# v* |$ I
transValRead = transferFunc(histInd); %If valid part of frame add one to pixel bin and keep transfer func val
0 Z/ O6 A9 P" ~9 pif y_in histValWrite = histValRead + 1; %Add pixel to bin; q# B3 ~; ]2 h/ U% Q8 O
transValWrite = transValRead; %Write back same value0 e! W6 ?6 U. L, }+ p4 z7 m5 i
cumSum = 0;- q/ t/ x% k) Y! S
elseif y_in >= height %In blanking time index through all bins and reset to zero) s- v/ V4 Z2 A2 c/ S
histValWrite = 0;9 G, s5 v8 D2 X# n
transValWrite = cumSum + histValRead;$ n) _( }! r" Z8 {/ \2 ^6 w L
cumSum = transValWrite;
) }- {- j4 e+ Belse- Y8 T9 i% [5 V8 h W
histValWrite = histValRead;
+ {4 k2 w0 ~; w& PtransValWrite = transValRead;9 d$ g5 P% k! ]# k- R- v; e3 o3 z
end %Write histogram' e! `/ Z9 k/ t2 S" _8 f2 D* {
histogram(histInd) = histValWrite; %Write transfer function1 _! h6 P. T6 ]% ?, [5 N1 o
transferFunc(histInd) = transValWrite; pixel_out = transValRead; MATLAB Test Bench 示例
1 ~7 H& y- t' ]4 x9 P5 m下面是一个 test bench,用于验证算法是否对示例图像起作用。(注意,此 testbench 使用 Image Processing Toolbox 的内置函数来读取原始图像,并在均衡后绘制转换的图像。)& F4 q; L: f; Z& I( a6 N" r$ |' U
type mlhdlc_heq_tb.m %% Test bench for Histogram Equalization Algorithm2 c# v/ s) H2 K. R
clear mlhdlc_heq;
5 ~9 m8 C6 q4 j, C8 q& etestFile = 'office.png';
" f/ K+ r# X. u$ V: L7 FRGB = imread(testFile); % Get intensity part of color image
/ Y9 d4 f" w9 U8 ~/ rYCBCR = rgb2ycbcr(RGB);( o' o, j' q: \$ u) T! V+ O; V4 t
imgOrig = YCBCR(:,:,1); [height, width] = size(imgOrig);# E1 @* f. e+ [/ f3 h. g
imgOut = zeros(height,width);# Y! L" g' G+ d
hBlank = 20;
# @: f+ h n) ^ ]. P1 X% make sure we have enough vertical blanking to filter the histogram B7 L5 |/ y) I9 y/ Z6 x
vBlank = ceil(2^14/(width+hBlank)); for frame = 1:21 w1 |; u5 z1 {+ V
disp(['working on frame: ', num2str(frame)]);
2 V* b, K( I" q ofor y_in = 0:height+vBlank-1
5 w* h# N9 z+ M4 q7 g$ `/ H%disp(['frame: ', num2str(frame), ' of 2, row: ', num2str(y_in)]);3 ^, ^" e- n z: k
for x_in = 0:width+hBlank-1
1 ?# J0 X+ G7 R, E% G/ \% Fif x_in pixel_in = double(imgOrig(y_in+1, x_in+1));
2 x" {; }- \$ j- N7 felse
4 p1 S9 [, s4 }/ Wpixel_in = 0;
7 \: p. e: N0 w2 A1 n1 S/ Oend [pixel_out] = mlhdlc_heq(x_in, y_in, pixel_in, width, height); if x_in imgOut(y_in+1,x_in+1) = pixel_out;( L" E. J ]9 P3 [2 J' J
end! V' h' U N% T$ o" O4 [
end$ w2 n- O3 `% h5 B W w9 @5 m: ^
end& p& k s9 L) ]' j
end % Make color image from equalized intensity image/ {9 }, n% E) P' f2 v
% Rescale image
) o$ E2 r' w p$ b" U! x2 EimgOut = double(imgOut);
1 Z5 t4 D5 G! h; D1 M X$ T5 ?imgOut(: ) = imgOut/max(imgOut(: ));
" b8 t, G! [% A0 [( WimgOut = uint8(imgOut*255); YCBCR(:,:,1) = imgOut;+ A0 ^. V u$ A) p$ ?1 Z
RGBOut = ycbcr2rgb(YCBCR); figure(1)# q$ s9 V _: K( k8 m1 u/ y
subplot(2,2,1); imshow(RGB, []);3 W4 V( @+ @$ [' S
title('Original Image');& S" I1 c- O2 I( H5 R# K
subplot(2,2,2); imshow(RGBOut, []);: u1 N' k) Q8 M3 e
title('Equalized Image');1 ?; |2 t ^) I) [$ G: |' ^
subplot(2,2,3); hist(double(imgOrig(: )),2^14-1);
1 ]6 F, Q' D; f! z t. a5 I! stitle('Histogram of original Image');
6 W- o0 H5 o O9 |# A* Ysubplot(2,2,4); hist(double(imgOut(: )),2^14-1);
* C& R; r* u5 K. ]# p3 I4 ktitle('Histogram of equalized Image'); 我们来仿真一下此算法,看看结果。 mlhdlc_heq_tb HDL Workflow Advisor* W+ b; V/ s) Q: x2 e
HDL Workflow Advisor(请参见下面的快照)有助于自动执行步骤,并提供从MATLAB到硬件的引导。您可以在 Workflow Advisor 的左窗格中看到工作流的以下关键步骤:; x' n! G& P8 _5 P
1. 定点转换$ Z% e5 a) b4 w/ X9 C( J
2. HDL 代码生成
, e, R; w. U! i/ S- p$ [6 n) X3. HDL 验证
) {+ H/ G" T' t7 m4. HDL 综合与分析 我们来详细看看工作流中的每个步骤。 定点转换5 O e: g Z4 C, I) O# }
信号处理应用程序通常使用 MATLAB 中的浮点运算来实现。但是,出于功耗、成本和性能的原因,在面向硬件时,需要将这些算法转换为使用定点运算。定点转换非常具有挑战性并且非常耗时,通常需要占用整个设计和实施时间的 25% 到 50%。HDL Coder™ 中用于浮点到定点自动转换的工作流可以极大地简化和加速转换过程。 浮点到定点转换工作流包括以下步骤:
- y, B: O& u0 v' g) P1. 验证浮点设计与代码生成兼容。
2 ?3 T9 ]$ n, B* e4 v4 A2. 根据计算范围,通过模拟 test bench 或通过静态分析(将传播设计范围以计算所有变量的派生范围)提出定点类型。. i1 l7 v# Q, K4 Y; @; c
3. 通过应用建议的定点类型生成定点 MATLAB 代码。
. \0 ]/ z S8 ^4. 验证生成的定点代码,并将生成的定点代码的数值精度与原始浮点代码进行比较。 请注意,此步骤是可选的。如果您的 MATLAB 设计已在定点实现,则可以跳过此步骤。 HDL 代码生成5 O; e% c& l( f
HDL 代码生成步骤通过定点 MATLAB 代码生成 HDL 代码。您可以生成实现 MATLAB 设计的 VHDL 或 Verilog 代码。除了生成可综合的HDL代码外,HDL Coder™ 还可生成各种报告,包括可帮助您在 MATLAB 代码和生成的 HDL 代码之间导航的可跟踪报告,以及在算法级别显示实现设计所需硬件资源(加法器、乘法器和 RAM)的资源利用率报告。 在代码生成期间,您可以指定各种优化选项来探索设计空间,而无需修改算法。在下面的“设计空间探索和优化选项”部分中,您可以看到如何修改代码生成选项以及如何针对速度或面积来优化设计。 HDL 验证: `7 ~0 O" _5 r `
独立 HDL test bench 的生成:
- o: t# M9 l! q2 {4 m: WHDL Coder™ 可通过您的 MATLAB 脚本生成 VHDL 和 Verilog test bench,以快速验证生成的 HDL 代码。您可以使用将激励应用于 HDL 代码的多个选项来自定义 HDL test bench。您还可以生成脚本文件,以自动执行在 HDL 模拟器中编译和模拟代码的过程。这些步骤有助于确保 MATLAB 仿真的结果与 HDL 仿真的结果相匹配。 HDL Coder™ 还与 HDL Verifier 一起使用,以自动生成两种类型的协同仿真 test bench: 基于 HDL 协同仿真的验证可与 mentorGraphics® ModelSim® 和 QuestaSim® 配合使用,其中 MATLAB 和 HDL 仿真可前后相接。 FPGA 在环仿真允许您与 FPGA 电路板严格同步地运行 MATLAB 仿真。您可以使用 MATLAB 将实际的数据输入到 FPGA 的设计中,并确保该算法在硬件中实现时能够达到预期的性能。 HDL 综合5 u$ T: r7 S `, l' F4 C
除了与语言相关的挑战外,FPGA 编程还需要使用复杂的 EDA 工具。从 HDL 设计中生成比特流并对 FPGA 进行编程可能是一项艰巨的任务。HDL Coder™ 通过为 Xilinx® 和 Altera® 创建用生成的HDL代码配置的项目文件,可在此处提供自动化。您可以使用工作流步骤在MATLAB 环境中综合 HDL 代码,查看综合结果,并迭代 MATLAB 设计以改善综合结果。 设计空间探索和优化选项
$ o# s3 }$ F; ~; G& E/ \3 m9 {HDL Coder™ 提供以下优化,以帮助您探索如何在设计空间的面积和速度之间进行权衡。您可以使用这些选项来探索各种架构并进行各种权衡,而不必手动重写算法。 速度优化 流水线:为了提高设计的时钟频率,HDL Coder 使您可以在设计中的各个位置插入流水线寄存器。例如,您可以在设计的输入和输出处以及在算法中给定 MATLAB 变量的输出处插入寄存器。 分布式流水线:HDL Coder 还提供了基于重定时的优化,可通过设计中的组合路径将延迟降到最小,以此自动移动插入的流水线寄存器,从而最大化时钟频率。 面积优化 RAM 映射:HDL Coder™ 将矩阵映射到硬件中的导线或寄存器。如果将持久性矩阵变量映射到寄存器,则它们会占用大量的FPGA面积。HDL Coder™会自动将持久性矩阵映射到块RAM,以提高面积效率。将MATLAB矩阵映射到块RAM的挑战在于,硬件中的块RAM通常具有一组有限的读写端口。HDL Coder™ 通过自动划分和调度矩阵读写来满足块 RAM 的端口限制,同时仍然遵循设计中的其他控制依赖性和数据依赖性来解决此问题。 资源共享:此优化可以识别并共享 MATLAB 代码中具有等效功能的乘法器操作。您可以控制设计中的乘数器共享量。 循环流:MATLAB 的 for 循环可在 VHDL 中创建一个 FOR_GENERATE 循环。循环主体在硬件中的复制次数与循环迭代次数相同。这会导致面积使用的低效。循环流优化会创建循环体的单个硬件实例,该实例在循环迭代之间进行时间多路复用。 常数乘法器优化:此设计级别的优化使用正则有符号数(CSD)技术将常数乘法器转换为移位和加法运算。 最佳实践方法 h, a. I" ~3 i4 o- I
现在,我们来看几个在面向 FPGA 来编写 MATLAB 代码时的最佳实践方法。 编写 MATLAB 设计时: 使用支持 HDL 代码生成的 MATLAB 代码生成子集。 使顶层接口尽可能简单。顶层功能的大小、类型和复杂性决定了在硬件中实现的芯片接口。 不要将大量并行数据传递到设计中。并行数据需要芯片上的大量 IO 引脚,并且可能无法综合。在典型的图像处理设计中,您应该将像素输入串行化,并在算法内部缓冲它们。 编写 MATLAB test bench 时: 从 test bench 函数调用设计。 彻底执行设计。这对于浮点到定点转换尤为重要,其中 HDL Coder™ 会根据 test bench 分配给变量的值来确定算法中变量的范围。您可以重复使用此测试工作台来生成 HDL test bench,以测试所生成的硬件。 在代码生成之前用 test bench 对设计进行仿真,以确保没有仿真错误,并确保所有必需的文件都在路径中。 结论
- ~ H6 l5 d4 q& [7 wHDL Coder™ 提供了在 FPGA 中实现算法的无缝工作流。在本文中,我向您展示了如何采用 MATLAB 图像处理算法、将其转换为定点、生成 HDL 代码、使用 test bench 验证生成的 HDL 代码,以及最终综合设计并在硬件中实现它。 通过本文对 HDL Coder™ 以及 MATLAB 转 HDL 代码生成和验证框架的简要介绍,我们希望能助您了解如何开始快速实施 MATLAB 设计和目标 FPGA。 - f7 v9 e0 `2 d2 O0 {
|