直方图统计的FPGA实现

直方图统计是图像处理算法中最基本和常见的算法之一,主要原理就是将图像中各个灰度级的像素个数进行计算并统计,这在一些对灰度特性进行统计的算法中比较常见。虽然直方图统计在MATLAB或软件中耗时也很少,但是现在随着FPGA的普及,更加快速的实现一些图像处理算法成为了主流。 
FPGA实现图像处理算法现在有几种主流的方式:1、HDL纯逻辑代码编写;2、基于System generator的模块搭建;3、Xilinx公司vivado套件中的HLS软件进行C/C++代码的转换。 
而本文主要采用第一种方法,即采用Verilog代码形式直接实现直方图统计算法。


  • 方法1:倍频操作
  • 方法2:相邻数据判断

倍频操作

直方图统计给人的第一反应就是按照软件中方法,设置256个寄存器,然后对每个像素大小进行判断后再对对应的寄存器进行+1,而在FPGA中可以充分利用内部RAM的完成这一操作。而在这边我们选用的是伪双端口RAM。 
在伪双端口RAM中,需要主要的是有两个设置选项: 
这里写图片描述 
1、Primitives Output Register 
这一设置主要是在RAM的输出端口添加一个寄存器,对输出的数据进行打一拍缓存操作。如果勾选上这个,在高频时钟情况下,可以有效的保证输出信号满足建立和保持时间。而RAM本身默认读出数据延时为一拍,则RAM读出数据的总延时为2个时钟单位。 
2、Operating Mode 
主要包括了No Change , Write First和Read First,顾名思义,主要指的读出数据的先后顺序。在No Change模式下,写操作不改变输出端数据,在Write First模式下,如果对同一地址进行读写,则先写后读,在Read First模式下,如果对同一地址进行读写,则先读后写。

倍频方式的代码如下:(本例程中未勾选Primitives Output Register,且Operating Mode设置为Write First)

module his_count(
input rst_n,
input clk_150M,      //  150M
input LVAL,      //data的伴随使能信号
input [7:0]data  // 输入2K的图像,连续数据流
    );

reg LVAL_temp1,LVAL_temp2;    
reg [7:0]data_temp1,data_temp2;

reg [20:0]addra; 
reg [7:0]dina;
reg ena,wea;

reg [20:0]addrb;
reg enb;
reg [8:0]count=9'd0;
wire [7:0]doutb;
wire clk_300M;
clk_wiz_1 clk_pll_inst
(
   // Clock in ports
   .clk_in1(clk_150M),      // 150M
   .clk_out1(clk_300M),     // 300M
   .reset(), // input reset
   .locked());      // output locked

//RAM的读出延时设为1
blk_mem_gen_1 L1 (
  .clka(clk_300M),    
  .ena(ena),      
  .wea(wea),   
  .addra(addra),  
  .dina(dina),    
  .clkb(clk_300M),    
  .rstb(),  
  .enb(enb),      
  .addrb(addrb), 
  .doutb(doutb)  
); 
 always @(posedge clk_150M or negedge rst_n)
 begin
    if(!rst_n) begin
        {LVAL_temp2,LVAL_temp1}<=2'd0;
        {data_temp2,data_temp1}<=16'd0;
    end else begin
        {LVAL_temp2,LVAL_temp1}<={LVAL_temp1,LVAL};
        {data_temp2,data_temp1}<={data_temp1,data};
    end
 end

 // 读模块
 always @(posedge clk_150M or negedge rst_n)
 begin
    if(!rst_n) begin
        enb<=0;
        addrb<=21'd0;
    end else begin
        enb<=LVAL;
        addrb<={14'd0,data};
    end
 end

 //写模块
 always @(posedge clk_300M or negedge rst_n)
 begin
    if(!rst_n) begin
        ena<=0;
        wea<=0;
        addra<=21'd0;
        dina<=8'd0;
    end else begin
        ena<=LVAL_temp2;
        wea<=LVAL_temp2;
        addra<={14'd0,data_temp2};
        dina<=doutb+1;
    end
 end

相邻数判断

相邻数判断主要通过判断前一个像素与之是否相同来改变RAM写入的数据。因为RAM的读出至少有一个延时,所以假如相邻的数遇到相同的情况,前一个数写入的数值无法被后一个数所读出,因此会遇到漏计数的情况。如果采用相邻数判断的方式,则可以避免倍频带来的时序问题。 
在本情况下,Operating Mode设置为Write First。且未勾选Primitives Output Register。 
代码如下:

module his_count(
input rst_n,
input clk_150M,      //  150M
input LVAL,      //data的伴随使能信号
input [7:0]data  // 输入2K的图像,连续数据流
    );

reg LVAL_temp2,LVAL_temp1;    
reg [7:0]data_temp2,data_temp1;

reg [20:0]addra; 
reg [7:0]dina;
reg ena,wea;

reg [20:0]addrb;
reg enb;
wire [7:0]doutb;
//RAM的读出延时设为1
blk_mem_gen_1 L1 (
  .clka(clk_150M),    
  .ena(ena),      
  .wea(wea),   
  .addra(addra),  
  .dina(dina),    
  .clkb(clk_150M),    
  .rstb(),  
  .enb(enb),      
  .addrb(addrb), 
  .doutb(doutb)  
); 
 always @(posedge clk_150M or negedge rst_n)
 begin
    if(!rst_n) begin
        {LVAL_temp2,LVAL_temp1}<=2'd0;
        {data_temp2,data_temp1}<=16'd0;
    end else begin
        {LVAL_temp2,LVAL_temp1}<={LVAL_temp1,LVAL};
        {data_temp2,data_temp1}<={data_temp1,data};
    end
 end

 // 读模块
 always @(posedge clk_150M or negedge rst_n)
 begin
    if(!rst_n) begin
        enb<=0;
        addrb<=21'd0;
    end else begin
        enb<=LVAL;
        addrb<={14'd0,data};
    end
 end

 //写模块
 always @(posedge clk_150M or negedge rst_n)
 begin
    if(!rst_n) begin
        ena<=0;
        wea<=0;
        addra<=21'd0;
        dina<=8'd0;
    end else if(data_temp2 == data_temp1)begin
        ena<=LVAL_temp2;
        wea<=LVAL_temp2;
        addra<={14'd0,data_temp2};
        dina<=doutb+2;
    end else begin
        ena<=LVAL_temp2;
        wea<=LVAL_temp2;
        addra<={14'd0,data_temp2};
        dina<=doutb+1;      
    end
 end