667彩票

當前位置: 首頁> 新聞中心 > 667彩票

智能图像处理,让機器視覺及其应用更智能高效

發布時間:2018-06-25

機器視覺(Machine Vision)是人工智能领域中发展迅速的一个重要分支,目前正处于不断突破、走向成熟的阶段。一般认为機器視覺“是通过光学装置和非接触传感器自动地接受和处理一个真实场景的图像,通过分析图像获得所需信息或用于控制机器运动的装置”,可以看出智能图像处理技术在機器視覺中占有举足轻重的位置。

 
 
?

智能图像处理是指一类基于计算机的自适应于各种应用场合的图像处理和分析技术,本身是一个独立的理论和技术领域,但同时又是機器視覺中的一项十分重要的技术支撑。

 

具有智能图像处理功能的機器視覺,相当于人们在赋予机器智能的同时为机器按上了眼睛,使机器能够“看得见”、“看得准”,可替代甚至胜过人眼做测量和判断,使得機器視覺系统可以实现高分辨率和高速度的控制。而且,機器視覺系统与被检测对象无接触,安全可靠。 

 

一、機器視覺技术

 

機器視覺的起源可追溯到20世纪60年代美国学者L.R.罗伯兹对多面体积木世界的图像处理研究,70年代麻省理工学院(MIT)人工智能实验室“機器視覺”课程的开设。到80年代,全球性機器視覺研究热潮开始兴起,出现了一些基于機器視覺的应用系统。90年代以后,随着计算机和半导体技术的飞速发展,機器視覺的理论和应用得到进一步发展。

 

进入21世纪后,機器視覺技术的发展速度更快,已经大规模地应用于多个领域,如智能制造、智能交通、医疗卫生、安防监控等领域。目前,随着人工智能浪潮的兴起,機器視覺技术正处于不断突破、走向成熟的新阶段。

 

在中国,機器視覺的研究和应用开始于20世纪90年代。从跟踪国外品牌产品起步,经过二十多年的努力,国内的機器視覺从无到有,从弱到强,不仅理论研究进展迅速,而且已经出现一些颇具竞争力的公司和产品。估计随着国内对機器視覺研究、开发和推广的不断深入,赶上和超越世界水平已不是遥不可及的事情了。

 

常见機器視覺系统主要可分为两类,一类是基于计算机的,如工控机或PC,另一类是更加紧凑的嵌入式设备。典型的基于工控机的機器視覺系统主要包括:光学系统,摄像机和工控机(包含图像采集、图像处理和分析、控制/通信)等单元。機器視覺系统对核心的图像处理要求算法准确、快捷和稳定,同时还要求系统的实现成本低,升级换代方便。

 

二、智能圖像處理技術

 

機器視覺的图像处理系统对现场的数字图像信号按照具体的应用要求进行运算和分析,根据获得的处理结果来控制现场设备的动作,其常见功能如下:

 

(1)圖像采集

 

图像采集就是从工作现场获取场景图像的过程,是機器視覺的第一步,采集工具大多为CCD或CMOS照相机或摄像机。照相机采集的是单幅的图像,摄像机可以采集连续的现场图像。就一幅图像而言,它实际上是三维场景在二维图像平面上的投影,图像中某一点的彩色(亮度和色度)是场景中对应点彩色的反映。这就是我们可以用采集图像来替代真实场景的根本依据所在。

 

如果相机是模拟信号输出,需要将模拟图像信号数字化后送给计算机(包括嵌入式系统)处理。现在大部分相机都可直接输出数字图像信号,可以免除模数转换这一步骤。不仅如此,现在相机的数字输出接口也是标准化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直接送入计算机进行处理,以免除在图像输出和计算机之间加接一块图像采集卡的麻烦。后续的图像处理工作往往是由计算机或嵌入式系统以软件的方式进行。

 

(2)圖像預處理

 

對于采集到的數字化的現場圖像,由于受到設備和環境因素的影響,往往會受到不同程度的幹擾,如噪聲、幾何形變、彩色失調等,都會妨礙接下來的處理環節。爲此,必須對采集圖像進行預處理。常見的預處理包括噪聲消除、幾何校正、直方圖均衡等處理。

 

通常使用时域或频域滤波的方法来去除图像中的噪声;采用几何变换的办法来校正图像的几何失真;采用直方图均衡、同态滤波等方法来减轻图像的彩色偏离。总之,通过这一系列的图像预处理技术,对采集图像进行“加工”,为体機器視覺应用提供“更好”、“更有用”的图像。

 

(3)圖像分割

 

圖像分割就是按照應用要求,把圖像分成各具特征的區域,從中提取出感興趣目標。在圖像中常見的特征有灰度、彩色、紋理、邊緣、角點等。例如,對汽車裝配流水線圖像進行分割,分成背景區域和工件區域,提供給後續處理單元對工件安裝部分的處理。

 

圖像分割多年來一直是圖像處理中的難題,至今已有種類繁多的分割算法,但是效果往往並不理想。近來,人們利用基于神經網絡的深度學習方法進行圖像分割,其性能勝過傳統算法。

 

(4)目標識別和分類

 

在制造或安防等行业,機器視覺都离不开对输入图像的目标进行识别和分类处理,以便在此基础上完成后续的判断和操作。识别和分类技术有很多相同的地方,常常在目标识别完成后,目标的类别也就明确了。近来的图像识别技术正在跨越传统方法,形成以神经网络为主流的智能化图像识别方法,如卷积神经网络(CNN)、回归神经网络(RNN)等一类性能优越的方法。

 

(5)目標定位和測量

 

在智能制造中,最常见的工作就是对目标工件进行安装,但是在安装前往往需要先对目标进行定位,安装后还需对目标进行测量。安装和测量都需要保持较高的精度和速度,如毫米级精度(甚至更小),毫秒级速度。这种高精度、高速度的定位和测量,倚靠通常的机械或人工的方法是难以办到的。在機器視覺中,采用图像处理的办法,对安装现场图像进行处理,按照目标和图像之间的复杂映射关系进行处理,从而快速精准地完成定位和测量任务。

 

(6)目標檢測和跟蹤

 

圖像處理中的運動目標檢測和跟蹤,就是實時檢測攝像機捕獲的場景圖像中是否有運動目標,並預測它下一步的運動方向和趨勢,即跟蹤。並及時將這些運動數據提交給後續的分析和控制處理,形成相應的控制動作。圖像采集一般使用單個攝像機,如果需要也可以使用兩個攝像機,模仿人的雙目視覺而獲得場景的立體信息,這樣更加有利于目標檢測和跟蹤處理。

 

三、機器視覺的应用

 

機器視覺应用广泛,如安防、制造、教育、出版、医疗、交通、军事领域等。在这些机器数额的应用中,智能图像处理都是不可或缺的,这里仅简要介绍其中几个方面的应用。

 

(1)智能制造

 

为了实现中国智能制造2025这一宏伟目标,离不开機器視覺。迅通科技为某知名汽车厂商装配流水线开发的车门限位器自动定位、检测和识别的系统。该系统通过智能图像识别方式,自动检测型号是否正确,定位是否准确,完全代替了人工操作,检测准确率达到100%。此前,每个工位需要4个工人用眼睛来检查、定位16种型号限位器,员工不仅很容易疲劳,还时常出现差错。

 

(2)教育考試

 

考試試卷時常發現因排版或印刷錯誤影響學生考試,利用智能圖像處理技術,機器自動對印刷後的試卷和原版試卷進行比對,發現不一致之處,會自動提示並報警,完全替代之前只能通過人工對試卷進行校驗。

 

(3)出版印刷

 

和教育考試類似,專業出版印刷廠由于印刷的圖書、報紙雜志,以及承接來自企業産品包裝和宣傳資料的種類多,數量大,排版和印刷中經常出錯。爲此,需安排不少專業人員進行校對,耗費大量的資金和時間。通過利用智能圖像處理技術進行自動校對,既提高了校對准確度,又縮短了校對時間,降低了印刷成本,縮短了出版物的交付周期。

 

(4)安防監控

 

这是当前备受機器視覺关注的一个领域。機器視覺打破了传统视频监控系统的限制,增加了系统的智能,使得智能视频分析得以逐步实现。以公共场所的视频监控为例,通过运用機器視覺技术,可以实现对可疑人物的自动检测、人臉識別、实时跟踪,必要时还可以实现多摄像机接连跟踪,同时发出告警,存储现场信息。

 

(5)智能交通

 

機器視覺在交通领域有着广泛的应用。例如,在高速公路上及卡口处,对来往车辆进行车型、牌照等识别,甚至对行驶车辆的违规行为进行识别。在汽车上对驾驶员面部图像进行分析,判断驾驶员是否处于疲劳驾驶状态。再如,无人驾驶汽车借助于機器視覺技术,使用摄像头、激光/毫米波/超声波雷达、GPS等感知道路环境信息,自动规划和控制车辆的安全行驶。

 

有数据显示,2016年全球機器視覺系统的市场规模约46亿美元, 2017年约50亿美元,预计2018年达到55亿美元,年增长率为10%左右。中国機器視覺市场的增长是从2010年开始的,2017年市场规模约68亿元,预计到2020年或达780亿元,市场增长率将超过100%。

 

四、技術瓶頸及今後的發展

 

在機器視覺的智能图像处理技术的发展中,还存在不少技术瓶颈,如:

 

1)稳定性:某种处理方法往往在研究和开发中表现良好,但在复杂多变的应用环境中,却不时地出现问题。例如人臉識別系统,在目标配合时识别率可高达95%以上,但在实际监控环境下,识别率就会大大下降。

 

2)實時性:如果圖像的采集速度、處理速度較慢,再加上新近引入的深度學習類算法,加大了系統實時處理的難度,跟不上機器運行和控制的節奏。

 

3)准确性:機器視覺系统要求图像识别和测量的准确性接近100%,任何微小的误差都有可能带来不可预测的后果。例如目标定位的误差会使装配出来的设备不符合要求。

 

4)系統能力:目前的嵌入式圖像處理系統,存在芯片的計算能力不足,存儲空間有限等問題,常常不能滿足運算量較大的圖像處理運算,如神經網絡的叠代運算,大規模矩陣運算等。

 

今后機器視覺中智能图像处理的发展主要体现在以下几个方面:

 

1)算法:傳統算法繼續不斷有所突破,新一波人工智能浪潮帶來不少新的性能優良的圖像處理算法,如深度學習(DL),卷積神經網絡(CNN),生成對抗網絡(GAN),等等。

 

2)實時性:出現更多結構新穎、資源充足、運算快速的硬件平台支撐,例如基于多CPU、多GPU的並行處理結構的計算機,海量存儲單元等。

 

3)嵌入式:新的高速的信號處理器陣列,超大規模FPGA芯片。

 

4)融合處理:從單圖像傳感器發展到多傳感器(多視點)的融合處理,可更加充分地獲取現場信息。還可融合多類傳感器,如圖像傳感器、聲音傳感器、溫度傳感器等共同完對現場目標定位、識別和測量。

 

总之,无论是“中国制造2025”还是“工业4.0”都离不开人工智能,离不开计算机视觉,而智能图像处理是機器視覺的核心技术,随着图像处理水平的不断提高,一定会有力地推动機器視覺的迅速发展。

 

關注微信

掃描二維碼,
關注迅通科技公衆號

 

020-87770041

廣州市越秀區先烈中路80號彙華商貿大廈12層

 

Copyright ? 广东迅通科技股份有限公司. All Rights Reserved. 粵ICP備:16062470號-1號 粵工商備P011806002990 Powered by Vancheer