昨日实现了梯度场和频率场的计算。最大的感觉就是建立基础代码库的重要性。
如果使用opencv或者别的代码库,可能它也能实现一些功能,特别对于建立在感官上的效果,差别不大。但是,如果是用于数学计算的,特别是对于我现在还不是很清楚过程,也不是很清楚结果的算法来说,精确的、容易比对的代码更重要。在这种时候,我更愿意采取原始的、按照定义实现的计算方法。
在昨天的频度场计算中,我突破好几天的困扰,直接按照定义修改代码,比如计算频度场
int main( int argc, char** argv ) Mat src = imread2gray("E:\\template\\1.bmp"); src.convertTo(src,CV_8U);//255的运算 dst.create(src.size(),src.type()); unsigned char *lpSrc = NULL; unsigned char *lpOri = NULL; for (int y = 0;y<IMGH-1;y++) for (int x=0;x<IMGW-1;x++) lpOri = dst.ptr<uchar>(0) + y*IMGW + x; for(i = -r; i <= r; i++) // 为提高速度,步长为 if(y+i<1 || y+i>=IMGH-1) continue; for(j = -r; j <= r; j++) // 为提高速度,步长为 if(x+j<1 || x+j>=IMGW-1) continue; lpSrc = src.ptr<uchar>(0) + (y+i)*(IMGW) + x+j; vx = *(lpSrc + IMGW + 1) - *(lpSrc + IMGW - 1) + *(lpSrc + 1)*2 - *(lpSrc - 1)*2 + *(lpSrc - IMGW + 1) - *(lpSrc - IMGW - 1); vy = *(lpSrc + IMGW - 1) - *(lpSrc - IMGW - 1) + *(lpSrc + IMGW)*2 - *(lpSrc - IMGW)*2 + *(lpSrc + IMGW + 1) - *(lpSrc - IMGW + 1); lvx += vx * vy * 2;//sin(2sita) lvy += vx*vx - vy*vy;//cos(2sita) fAngle = atan2((float)lvy, (float)lvx); if(fAngle < 0) fAngle += 2*PI; fAngle = (fAngle*EPI*0.5 + 0.5); // 因为采用sobel算子,所以角度偏转了度,所以要旋转求得的角度 if(angle <= 0) angle += 180; *lpOri = (unsigned char)angle; *(lpOri + 1) = (unsigned char)angle; *(lpOri + IMGW) = (unsigned char)angle; *(lpOri + IMGW + 1) = (unsigned char)angle; imwrite("e:/sandbox/n1dst.bmp",dst); } 这样从结果的面上来看,已经是非常接近书中给出的效果了。 下一步,专门成立GOGVF项目作为GOCVHelper的一个部分,逐步地改造现有代码库,实现书中的效果。并且向GOGVF的按照定义实现做出努力。 2016年11月16日06:52:51 已经逐步移植代码,从梯度一直做到了增强。虽然现在的代码还有一些问题,但是基本不影响使用。并且生成了专门的GOGVF库,用于收集这方面的代码。
虽然这本书很精彩,里面的代码对于我来说都是右开创性的;但是不可否认很多地方,他的代码写的还是比较繁琐、冗余的,给阅读移植带来了不少困难。
int main( int argc, char** argv ) Mat src = imread2gray("E:\\template\\2.bmp"); Mat grad = getGrads(src); //梯度场 Mat org = getOrientMap(src); //方向场 segment(grad,seg); //对梯度场进行阈值,seg为分割结果 segment_clearEdge(src,org,seg);//反馈到src和org中了,这种方法倒也是方便 //cv::equalizeHist(src,equ); GaussSmooth(equ,gauss,0.4); 梯度图像,可以看到,在指纹比较密集的地方,梯度很强,而在背景区域,比较干净。
方向场。基本上是表示了指纹线段角度的变化。特别观察中间的位置,由255跳跃至0,是因为在中间的部分,指纹几乎是水平的。
gaobor增强,现在在细节部分还有一点问题,但是已经基本体现出来特点了。
这是我第一次自己写代码实现gabor的效果,也是深入理解gabor的一次。回头思考,指纹识别其实是很好的算法平台,因为采集到的图片,本身背景前景分割还是比较干净的;在以前,如果处理这样的图片,我可能会选择阈值分割这种直观的方法;在实现了frangi算法之后,很多时候我会拿frangi来实验一下,看看效果。但是这次试用gabor增强,应该说是给我增加了一种新的思路,以后的眼界会更宽阔。。
gaobor增强的核心,是对前面计算出来的梯度场中的“纹线方向进行平滑滤波,纹线
的竖直方向进行锐化滤波 ” 。那么首先就是要计算处正确的梯度场来。在本例中,图片质量比较好,能够通过几乎是定义计算的方法计算出正确稳定的梯度场(但是在其他很多地方,可能不能这样使用?用什么计算出正确的梯度场,作为一个专门的话题)。然后就是通过对梯度进行增强。这里才是实现gaobor的地方。这里贴出的是实现的代码,推导过程分帖说明。关键就是“量化“。
// angle: [in] 角度 (0 - 180) if(angle >= 173 || angle < 8) return ((angle-8)/15 + 1); void orientEnhance(Mat org,Mat& dst) int Hw[7] = {1, 1, 1, 1, 1, 1, 1}; // 纹线方向的垂直方向上进行锐化滤波的锐化滤波器 int Vw[7] = {-3, -1, 3, 9, 3, -1, -3}; BYTE *g_lpOrient = org.ptr<uchar>(0); BYTE *g_lpOrgFinger = dst.ptr<uchar>(0); BYTE *g_lpTemp = dst.ptr<uchar>(0); //BYTE *g_lpTemp = new BYTE[IMGW * IMGH]; for(y = 0; y < IMGH; y++) for(x = 0; x < IMGW; x++) lpDir = g_lpOrient + temp + x; lpSrc = g_lpOrgFinger + temp + x; if(y+g_DDSite[d][i][1] < 0 || y+g_DDSite[d][i][1] >= IMGH || x+g_DDSite[d][i][0] < 0 || x+g_DDSite[d][i][0] >= IMGW) sum += Hw[i]*(*(lpSrc + g_DDSite[d][i][1]*IMGW + g_DDSite[d][i][0])); *(g_lpTemp + temp + x) = (BYTE)(sum/hsum); *(g_lpTemp + temp + x) = 255; for(y = 0; y < IMGH; y++) for(x = 0; x < IMGW; x++) lpDir = g_lpOrient + temp + x; lpSrc = g_lpTemp + temp + x; d = (DDIndex(*lpDir)+6) % 12; if(y+g_DDSite[d][i][1] < 0 || y+g_DDSite[d][i][1] >= IMGH || x+g_DDSite[d][i][0] < 0 || x+g_DDSite[d][i][0] >= IMGW) sum += Vw[i]*(*(lpSrc + g_DDSite[d][i][1]*IMGW + g_DDSite[d][i][0])); *(g_lpOrgFinger + temp + x) = 255; *(g_lpOrgFinger + temp + x) = 0; *(g_lpOrgFinger + temp + x) = (BYTE)sum; *(g_lpOrgFinger + temp + x) = 255; } 了现在的代码,下一步就可以思考如何对自然环境下的许多图像进行增强了。
目前方向:图像拼接融合、图像识别 联系方式:jsxyhelu@foxmail.com