前言:想要寫出一篇引人入勝的文章?我們特意為您整理了目標(biāo)檢測(cè)分類系統(tǒng)設(shè)計(jì)探究范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。
摘要:隨著科技水平的不斷發(fā)展,機(jī)器代替人進(jìn)行簡(jiǎn)單而繁瑣的工作是發(fā)展趨勢(shì)。綜合考慮能夠適用于各種不同場(chǎng)面的分類工作的潛力,本文設(shè)計(jì)了一種能夠通過攝像頭與機(jī)械臂對(duì)圖像物品進(jìn)行捕捉、抓取和分類的一體式智能交互機(jī)器人。
關(guān)鍵詞:視覺跟蹤;圖像識(shí)別;物品分類;深度學(xué)習(xí);YOLOv3
1引言
目前,目標(biāo)檢測(cè)算法主要包括傳統(tǒng)目標(biāo)檢測(cè)技術(shù)和深度學(xué)習(xí)目標(biāo)檢測(cè)技術(shù)。傳統(tǒng)的識(shí)別技術(shù)主要采用滑動(dòng)窗口實(shí)現(xiàn)圖片內(nèi)目標(biāo)搜索,檢測(cè)精度較低,具有較差的魯棒性。YOLOv3是一種快速、準(zhǔn)確的深度學(xué)習(xí)目標(biāo)檢測(cè)技術(shù)[1-2],在檢測(cè)速度與檢測(cè)精度方面具有較好的綜合性能,因此被廣泛應(yīng)用于近景目標(biāo)檢測(cè)。本文提出一種基于樹莓派的智能交互機(jī)器人控制系統(tǒng)設(shè)計(jì),通過樹莓派搭載攝像頭構(gòu)成機(jī)器人的視覺交互系統(tǒng),利用YOLOv3進(jìn)行目標(biāo)識(shí)別,將深度學(xué)習(xí)算法與智能交互機(jī)器人技術(shù)相結(jié)合,具有一定的創(chuàng)新性和研究?jī)r(jià)值。
2系統(tǒng)整體設(shè)計(jì)
2.1系統(tǒng)主體結(jié)構(gòu)
系統(tǒng)主體結(jié)構(gòu)包括以下部分:樹莓派攝像頭、樹莓派、STM32系統(tǒng)板、六舵機(jī)械臂、穩(wěn)壓模塊、驅(qū)動(dòng)模塊、電機(jī)、車模。
2.2工作原理
系統(tǒng)的整體控制結(jié)構(gòu)如圖1所示。樹莓派通過YOLOv3識(shí)別攝像頭讀取的圖片,識(shí)別物體所在位置并通過串口發(fā)送給STM32。STM32單片機(jī)再控制小車進(jìn)行運(yùn)動(dòng),通過多次的識(shí)別及運(yùn)動(dòng)后,當(dāng)物體所在位置在機(jī)械臂可以捕捉的范圍內(nèi)時(shí),小車停止運(yùn)動(dòng),控制機(jī)械臂對(duì)其進(jìn)行捕捉。捕捉成功后,機(jī)械臂再把物體擺放在給定的分類區(qū),完成一次捕捉分類任務(wù)。
3系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
智能交互機(jī)器人由車體、直流電機(jī)與驅(qū)動(dòng)模塊、控制與信息處理裝置、機(jī)械臂等部分組成,機(jī)械臂采用舵機(jī)驅(qū)動(dòng),機(jī)械結(jié)構(gòu)如圖2所示。機(jī)器人的總體結(jié)構(gòu)設(shè)計(jì)目標(biāo)如下:(1)在無人為外界因素干預(yù)的情況下,智能交互機(jī)器人能高效地自主運(yùn)行。(2)智能交互機(jī)器人的機(jī)械結(jié)構(gòu)和控制系統(tǒng)采用模塊化設(shè)計(jì),便于拆卸、修理和維護(hù)。(3)機(jī)械臂的設(shè)計(jì)采用串聯(lián)結(jié)構(gòu),不同關(guān)節(jié)不會(huì)相互影響,可以完成較好的傳動(dòng)精度和傳動(dòng)穩(wěn)定的設(shè)計(jì)要求。大扭矩舵機(jī)保證轉(zhuǎn)動(dòng)精度,單舵機(jī)控制單關(guān)節(jié),使得機(jī)械臂動(dòng)作簡(jiǎn)單,控制容易。(4)通過PWM同時(shí)驅(qū)動(dòng)四臺(tái)直流電機(jī)可對(duì)電機(jī)進(jìn)行直接控制。輸入信號(hào)采用光耦合進(jìn)行隔離,且具有欠壓保護(hù)功能。同時(shí)設(shè)計(jì)了靜電泄放回路,充分滿足電機(jī)驅(qū)動(dòng)要求。(5)主控采用STM32F103微處理和樹莓派4B,可以滿足系統(tǒng)的控制需要。(6)車體采用鋁制底盤,絕緣性較好,重心低,載重能力強(qiáng),保證智能交互機(jī)器人機(jī)械結(jié)構(gòu)的小巧輕便以及在運(yùn)行時(shí)性能的穩(wěn)定。
4系統(tǒng)軟件設(shè)計(jì)
4.1軟件流程
程序流程圖如圖3所示。系統(tǒng)軟件設(shè)計(jì)采用模塊化程序設(shè)計(jì)方法,包括系統(tǒng)初始化程序、攝像頭識(shí)別程序、機(jī)械臂控制程序和灰度循跡程序。樹莓派開機(jī)后首先進(jìn)行系統(tǒng)初始化操作,然后運(yùn)行相應(yīng)程序文件。STM32單片機(jī)控制直流電機(jī)通過灰度循跡來到目標(biāo)識(shí)別區(qū),隨后樹莓派運(yùn)行基于YOLOv3的深度學(xué)習(xí)圖像識(shí)別算法依次識(shí)別目標(biāo)物體。當(dāng)檢測(cè)到目標(biāo)物體后,樹莓派通過串口發(fā)送抓取命令,控制機(jī)械臂完成抓取動(dòng)作,并將物品擺放在預(yù)定分類區(qū)域,隨后智能交互機(jī)器人回到初始位置。
4.2串口與機(jī)械臂控制程序設(shè)計(jì)
樹莓派與STM32單片機(jī)之間采用串口通信進(jìn)行數(shù)據(jù)收發(fā),樹莓派識(shí)別出目標(biāo)位置信息并以字符串的形式通過串口發(fā)送給STM32單片機(jī)。通過不同的指令完成車體不同的動(dòng)作,實(shí)現(xiàn)上下位機(jī)的通訊與系統(tǒng)協(xié)調(diào)工作。智能交互機(jī)器人的機(jī)械臂由6個(gè)舵機(jī)構(gòu)成,分別控制機(jī)械臂的關(guān)節(jié)1到關(guān)節(jié)5以及底盤。機(jī)械臂的動(dòng)作控制依靠PWM控制舵機(jī)角度完成,通過STM32編程使得I/O口輸出的PWM波占空比持續(xù)變化,進(jìn)而使機(jī)械臂完成指定動(dòng)作。
4.3YOLOv3目標(biāo)檢測(cè)算法
YOLOv3是一種快速、準(zhǔn)確的深度學(xué)習(xí)目標(biāo)檢測(cè)技術(shù),在檢測(cè)速度與檢測(cè)精度方面具有較好的綜合性能。在進(jìn)行圖像特征提取時(shí),YOLOv3運(yùn)用了Darknet網(wǎng)絡(luò)結(jié)構(gòu)[3]。它與殘差網(wǎng)絡(luò)的工作原理相似,都是在層與層之間安排了快捷鏈路。YOLOv3進(jìn)行目標(biāo)識(shí)別時(shí)采用不同尺度的3個(gè)特征圖,包括32倍降采樣、16倍降采樣以及8倍降采樣,在多尺度featuremap上的檢測(cè)與SSD類似。YOLOv3通過route層把淺層特征調(diào)用起來,將4次下采樣后得到的淺層featuremap與16倍降采樣得到的featuremap進(jìn)行拼接,在深度學(xué)習(xí)網(wǎng)絡(luò)的同時(shí)學(xué)習(xí)深層和淺層特征,具有更好的表達(dá)效果。YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)如4所示[4]。YOLOv3通過多尺度檢測(cè)[5-6],顯著提高了mAP及小型物體的檢測(cè)精度,并且通過殘差網(wǎng)絡(luò)形成了更深的網(wǎng)絡(luò)層次。如果采用COCOmAP50作為評(píng)估指標(biāo),YOLOv3的表現(xiàn)相當(dāng)驚人。它的檢測(cè)速度是其他模型的很多倍。實(shí)際識(shí)別效果圖如5所示。
5結(jié)束語
本文研究的智能交互機(jī)器人主要運(yùn)用了YOLOv3深度學(xué)習(xí)算法,通過算法自動(dòng)檢測(cè)出圖片中物體的位置,分類出邊界框的物體的類別信息。主要運(yùn)用在對(duì)貨物進(jìn)行合理的分類擺放,把各種不同的貨物準(zhǔn)確地?cái)[放到合適的區(qū)域。通過該深度學(xué)習(xí),系統(tǒng)不僅可以使機(jī)器人能夠適用于各種不同的場(chǎng)景,而且YOLO算法的準(zhǔn)確性以及高速也能夠帶來很大的便利。
作者:楊炅坤 黃景林 陳玥名 朱胤愷 羅宇昊 單位:中國(guó)計(jì)量大學(xué)機(jī)電工程學(xué)院