[OpenR8 解決方案] Image_PCB_ResNetSSD512_Caffe (影像分析使用 SSD 512 演算法及 Caffe 函式庫進行 PCB 物件偵測)-20181213

一、Image_PCB_ResNetSSD512_Caffe

 

此 Image_PCB_ResNetSSD512_Caffe 是利用 Caffe 框架,速度比 Keras 快兩倍以上,與其他 Image_PCB_SSD512_Caffe 所不同的是使用 resNet 網路架構,再加上使用 SSD (Single Shot MultiBox Detector) 深度學習演算法來訓練模型,透過已訓練好的模型偵測 PCB 上面的電容,本次訓練圖片大小為 512 × 512。

主要流程如下圖1。

首先,我們需準備想要讓模型學習的影像,將影像中的目標框選起來,且將框選的框標記所屬類別,此目的是為了讓模型知道這個影像中框起來的物件是屬於何物。 接著透過OpenR8 Image_PCB_ResNetSSD512_Caffe 中 flow檔依序執行,自動產生兩個 txt 清單檔,以此讓模型知道有哪些檔案是要進行訓練測試,以及這些檔案中是分成哪幾種類別,做完這些前處理後,再執行訓練的 flow 檔,訓練完畢後,測試已經訓練好的 model。

 

圖1.SSD 偵測電容流程.png

圖1.SSD 偵測電容流程。

二、步驟一:前置處理 - 感興趣區域標記

 

圖1.1SSD 偵測電容流程.png

 

  1. 目的:

準備框選標記感興趣的區域。

  1. 內容介紹:

在影像中框選想要讓模型學習的物件。例如:想要讓模型學習電容就準備電容的影像,再將影像中的電容框選起來、標記為電容。如此一來,模型才會知道這個影像框起來的區域就是電容。以此類推,想要讓模型學習什麼東西,就準備好影像與框選好做標記的標記檔。

因此我們所需準備的檔案包含以下兩項

(1).影像 (想要讓模型學習的影像、想要測試模型準確度的影像)

(2). 標記影像目標位置的 xml 檔案 (框選後,會自動產生的檔案)

  1. 範例:

在此 Image_PCB_ResNetSSD512_Caffe 方案範例中:

偵測 PCB 中的電容,我們透過 labelImg.exe (下圖2) 將PCB影像中的目標電容框選標記,如下圖3 紅框是框選電容以及將其標記成 capacitor (電容) 的類別。標記完,儲存時會自動產生 .xml 檔案。

請將影像放置指定資料夾位置。如下圖4圖5。

【訓練】

影像請放置:solution/Image_PCB_ResNetSSD512_Caffe/data/train_image

xml 請放置:solution/Image_PCB_ResNetSSD512_Caffe/data/train_annotation

【測試】

影像請放置 solution/Image_PCB_ResNetSSD512_Caffe/data/test_image

xml 請放置 solution/Image_PCB_ResNetSSD512_Caffe/data/test_annotation

  1. 補充說明:

標記的軟體 labelImg.exe 已隨 OpenR8 檔案附上,其檔案路徑為openR8 > solution > Image_PCB_ResNetSSD512_Caffe > labelImg.exe,如下圖2,其使用方法可參考開源機器人俱樂部 [ezAI 簡單學 AI] labelImg 使用方法 (Windows 版本)

 

圖2.標籤工具所在位置.png

圖2.標籤工具所在位置。

 

圖3.標記影像中的目標物件.png

圖3.標記影像中的目標物件。

 

圖4.標籤完之影像與 xml 檔案放置位置-訓練.png

圖4.標籤完之影像與 xml 檔案放置位置-訓練。

 

圖5.標籤完之影像與 xml 檔案放置位置-測試.png

圖5.標籤完之影像與 xml 檔案放置位置-測試。

 

 

三、步驟二:前置處理 - 建立檔案位置的 txt 檔

 

圖5.1標籤完之影像與 xml 檔案放置位置-測試.png

 

  1. 目的:

定義 【訓練】 和 【測試】 的影像與其標記的位置。

  1. 使用說明:

【訓練】train.txt

步驟一:開啟 OpenR8,執行 R8.exe。

 

圖6.執行 R8.png

圖6.執行 R8.exe.

 

步驟二:選擇與開啟解決方案。

 

圖7.開啟解決方案.png

圖7.開啟解決方案。

 

步驟三:執行解決方案,產生 train.txt。

 

圖8.執行解決方案.png

圖8.執行解決方案。

 

圖9.產生 train.png

圖9.產生 train.txt。

 

【測試】

步驟一:開啟 OpenR8,執行 R8.exe。如上圖6。

步驟二:選擇與開啟解決方案。如下圖10。

 

圖10.選擇解決方案 測試.png

圖10.選擇解決方案 – 測試。

 

步驟三:執行 flow 檔,產生 test.txt。

 

圖11.執行解決方案.png

圖11.執行解決方案。

 

圖12.產生 test.png

圖12.產生 test.txt。

 

 

四、步驟三:前置處理 - 建立標籤類別 txt 檔

 

圖12.1產生 test.png

 

  1. 目的:

建立類別 txt,此目的是跟模型說我們這些資料要分成哪幾種類別,藉此讓模型可自行學習將影像進行偵測分類。

  1. 內容介紹: 請在 openR8/solution/Image_PCB_ResNetSSD512_Caffe/data 路徑下面建立【labelmap.prototxt】檔案。檔案內容格式如下:

item {

name: "none_of_the_above"

label: 0

display_name: "background"

}

item {

name: "類別標籤名字"

label: 1

display_name: "顯示此類別的名字"

}

……

item {

name: "類別標籤名字"

label: n

display_name: "顯示此類別的名字"

}

請注意:上述的【name】【display_name】請務必與【標記感興趣區域標記】的     xml 之類別名稱、數量相符合。舉例:標記時,分成貓、狗兩類,那麼上述的     【name】【display_name】務必與標記貓、狗的類別命名一致,如圖13。

 

圖13.舉例的 labelmap.prototxt.png

圖13.舉例的 labelmap.prototxt。

 

  1. 範例:

在 openR8/solution/Image_PCB_ResNetSSD512_Caffe/data 資料夾內的labelmap.prototxt,可透由 notepad++ 或記事本開啟檔案。如下圖14。 檔案內容如下圖15,可以看出我們將影像分類成 none_of_the_above (以上皆非) 以及 capacitor (電容) 兩類,其中個別標籤編號為 0 與 1。 如果要自行新增類別,請增加類別名稱及標籤號碼,可見如下圖15 (右)。

 

圖14.labelmap.prototxt 檔案路徑.png

圖14.labelmap.prototxt 檔案路徑。

 

圖15.labelmap內容示意圖 左 增加類別示意圖 右 .png

圖15.labelmap內容示意圖(左),增加類別示意圖(右)。

 

 

五、步驟四:前置處理 - annoset_to_lmdb

 

圖15.1labelmap內容示意圖 左 增加類別示意圖 右 .png

此步驟為將上面兩步驟已定義好的 txt 轉成後續訓練、測試模型所需的 lmdb 檔案。

 

  1. 使用說明:開啟與執行 annoset_to_lmdb flow 檔案

(1) 請【滑鼠雙擊 R8.exe】=>點選【檔案】=>【開啟】=>【OpenR8 > solution 下的 Image_PCB_ResNetSSD512_Caffe】=> 【3_annoset_to_lmdb.flow】。示意圖如下圖16圖17圖18。

(2) 請【點選執行】。如果存在舊的 lmdb 檔案,跳出是否移除時,請點選【是 ( Y ) 】,如下圖19。執行完成後,會產生 train_lmdb 與 test_lmdb。如下圖20圖21。

對於開啟軟體至載入解決方案有任何疑問可參閱【OpenR8 操作手冊】

 

圖16.r8.png

圖16.R8.exe

 

圖17.檔案開啟 annoset_to_lmdb.flow.png

圖17.檔案開啟 annoset_to_lmdb.flow

 

圖18.載入 annoset_to_lmdb.png

圖18.載入 annoset_to_lmdb

 

圖19.刪除 lmdb 檔.png

圖19.刪除 lmdb 檔。

 

圖20.執行完成.png

圖20.執行完成。

 

圖21.產生 train_lmdb 與 test_lmdb.png

圖21.產生 train_lmdb 與 test_lmdb

 

  1. annoset_to_lmdb 參數說明

 

圖22.輸入檔案 左 轉成輸出檔案 右 .png

圖22.輸入檔案(左)轉成輸出檔案(右)。

 

此項為設定輸入檔案的路徑與輸出 lmdb 的路徑,其檔案的項目如上圖22。 以下為此 flow 檔案之每個流程順序介紹,由上至下有分別為:

Caffe_初始化:Caffe 框架初始化。

檔案_刪除資料夾(圖23):當資料夾中存在舊的 lmdb 檔案資料夾,在開始產生新 lmdb 之前,需先將舊的檔案移除。(訓練用)

如下圖,流程區域點選【檔案_刪除資料夾】出現變數列表,函式列表出現該流程的參數,點擊【資料夾名稱(字串)】的編輯,此資料夾名稱的變數及顯示在變數區,此區域的【值】,【data/train_lmdb/】即為 lmdb 的資料夾。

 

圖23.檔案_刪除資料夾.png

圖23.檔案_刪除資料夾。

 

Caffe_物件偵測_創建訓練檔案(圖24):產生 lmdb 檔案。(訓練用)

 

圖24.Caffe_物件偵測_創建訓練檔案.png

圖24.Caffe_物件偵測_創建訓練檔案。

 

下面最後兩個【檔案_刪除資料夾】與【Caffe_物件偵測_創建訓練檔案】:為產生測試模型用的 lmdb,設定方式如上述產生訓練的 lmdb。

※補充:

【Caffe_物件偵測_創建訓練檔案】中的 enableShuffle 欄位,若其值為 True 時,會隨機打亂資料的排序,對訓練的效果會比較好,建議可以設為 True,enbleShuffle 的位置如圖25。

 

圖25.Caffe_物件偵測_創建訓練檔案的 enableShuffle 位置.png

圖25.Caffe_物件偵測_創建訓練檔案的 enableShuffle 位置。

 

 

六、步驟五:訓練模型 - train

 

圖25.1Caffe_物件偵測_創建訓練檔案的 enableShuffle 位置.png

介紹主要分兩部分,第一點先介紹如何開始做訓練,接著如果有興趣知道每一個流程方塊可觀看第二點之介紹此流程的詳細內容。

  1. 使用說明:訓練模型。

首先,使用 OpenR8【開啟 4_train.flow】檔案,載入 4_train,如下圖26圖27。

接著,按下【執行】開始訓練模型,此步驟需花一點時間等待程式建立模型。如下圖28。

當此執行完成後會產生訓練好的模型,其模型檔案生成放置,如下圖29。

路徑:OpenR8/solution/Image_PCB_ResNetSSD512_Caffe/data/

檔案名稱1:xxx.Caffemodel

檔案名稱2:xxx. Solverstate

如果裝置未支援 NVIDIA GPU。出現錯誤訊息。請照下圖30圖31操作。

 

圖26.4_train 檔案路徑.png

圖26.4_train 檔案路徑。

 

圖27.載入 4_train.png

圖27.載入 4_train。

 

圖28.執行 4_train 與其執行過程圖.png

圖28.執行 4_train 與其執行過程圖。

 

圖29.訓練完產生模型.png

圖29.訓練完產生模型。

 

圖30.沒有 GPU 的錯誤訊息 - 訓練.png

圖30.沒有 GPU 的錯誤訊息 - 訓練。

 

圖31.沒有 GPU 的設定方式 - 訓練.png

圖31.沒有 GPU 的設定方式 - 訓練。

 

  1. 3_train 流程與參數介紹:

►Caffe_初始化:Caffe 框架初始化。

►Caffe_訓練:

【CaffeObject】接續前面初始化的設定。

【GPU】用來訓練模型的裝置是否需使用 GPU 加速,如果是請將值改為 all;反之,請填空值。(如果選擇是,請確認裝置是否有 GPU)

【SolverPath】主要參數。此為 Caffe 訓練所需要的輸入檔 solver.prototxt,檔案內容包含訓練迭代的次數、訓練的參數以及樣本的清單等。如下圖32圖33。

【continueTrainModelPath】接續之前訓練好的模型繼續訓練。將值填入欲接續訓練的模型路徑,模型副檔名務必為 .caffemodel。

 

圖32.2_train 流程之 caffe_訓練.png

圖32.2_train 流程之 caffe_訓練。

 

圖33.solver.prototxt 內容示意圖.png

圖33.solver.prototxt 內容示意圖。

 

 

七、步驟六:測試各訓練階段的模型

 

  1. 目的:用於測試各階段模型的準確度,從中找出合適的模型,避免訓練過度擬合於訓練樣本,而導致測試樣本效果不佳。
  2. 使用說明 :

(1) 訓練樣本 : 【開啟 OpenR8】 => 【開啟與載入 5_train_result.flow】 => 【執行 flow】 => 【產生 train_result.txt】

(2) 測試樣本 : 【開啟 OpenR8】 => 【開啟與載入 6_test_result.flow】 => 【執行 flow】 => 【產生 test_result.txt】 

(3) 選擇合適的訓練次數模型 :

如圖34,從 train_result.txt 與 test_result.txt 兩個內容可以觀察出,模型在某個訓練次數階段的結果可以接受,或者在某個階段之後已達到收斂。因此,我們就選擇此次數的模型是較為合適。

 

圖34.train_result.txt 與 test_result.txt 內容.png

圖34.train_result.txt 與 test_result.txt 內容。

 

八、步驟七:使用已訓練好的模型進行推論 - inference

 

圖34.1train_result.txt 與 test_result.txt 內容.png

 

當模型已訓練好後,可以藉由這一個步驟使用已訓練好模型做推論。

先使用 OpenR8 開啟【7_inference】,載入檔案。如下圖35圖36 

  1. 使用流程說明:

►選擇欲測試的影像。如下圖37。

►選擇已訓練好的模型。如下圖38。

►觀看結果訊息。按下執行,透過已訓練好的模型,偵測出物件中目標的座標位置以及其類別,如下圖39。

►觀看結果訊息與影像。如果欲看到影像上面偵測出來的結果框,則按下偵錯(Debug) 顯示出物件偵測的結果。PCB 的影像上面有偵測出電容且將其框選出來,如下圖40。

如果裝置未支援 NVIDIA GPU。出現錯誤訊息。請照下圖41圖42操作。

 

圖35.7_inference.png

圖35.7_inference

 

圖36.載入 7_inference.png

圖36.載入 7_inference

 

圖37.7_inference 選擇測試影像.png

圖37.7_inference 選擇測試影像。

 

圖38.7_inference 選擇想要做推論的模型.png

圖38.7_inference 選擇想要做推論的模型。

 

圖39.7_inference 執行結果.png

圖39.7_inference 執行結果。

 

圖40.7_inference 偵錯結果.png

圖40.7_inference 偵錯結果。

 

圖41.錯誤訊息-顯示無 GPU.png

圖41.錯誤訊息-顯示無 GPU

 

圖42.無 NVIDIA GPU 設定方式.png

圖42.無 NVIDIA GPU 設定方式。

 

  1. 流程內容介紹

►Caffe_初始化:Caffe 框架初始化。

►影像_開啟:

【影像檔案名稱 (字串) 】欲推論測試的影像路徑。

【影像 (影像) 】依照上面影像檔案名稱將欲推論的影像讀入後,存至此變數。

►Caffe_物件偵測_讀取網路

【CaffeObject (物件) 】

【GPU (整數) 】是否開啟 GPU 加速。

【deployPath (字串) 】讀取網路結構模型。data/deploy.prototxt。

【caffeModelPath (字串) 】讀入已訓練好的模型 (副檔名為 .caffemodel )。

【labelPath (字串) 】讀取在使用 labelImg.exe 做標記時,所使用的類別檔。 data/predefined_classes.txt。

【meanFilePath (字串) 】

►Caffe_物件偵測_影像推論

【CaffeObject (物件) 】

【OutputResult (Json) 】將影像推論完後的結果以訊息存至此變數。

【GPU (整數) 】是否開啟 GPU 加速。

【影像 (影像) 】欲推論的影像。

【ConfidenceThreshold (浮點數) 】

►Json_列印

【json (Json) 】顯示 Caffe_物件偵測_影像推論的檢測結果訊息。

►影像_以 Json 畫方形 【影像 (影像) 】欲推論的影像。

【json (Json) 】推論出來的結果訊息。

【畫 Json 方形 (影像) 】將推論出來的結果訊息畫至欲推論的影像。

►偵錯_影像

【影像 (影像) 】顯示已畫上推論結果訊息的影像。

【縮放百分比 (整數) 】顯示圖的百分比。值為 200 表示 200 % (圖片放大一倍)、50 表示 50 % (圖片縮小一半),以此類推放大縮小。

 

 

九、步驟八:推論 - 8_inference_webcam

 

  1. 使用流程說明 :

當模型已經訓練好後,也可以透過 8_inference_webcam.flow 檔案進行 webcam 即時影像目標物偵測與辨識。

先使用 OpenR8 開啟【8_inference_webcam】。載入檔案。確認 【OpenCV_串流擷取_開啟】 webcam 的【裝置碼】(筆電鏡頭預設為 0,加裝的 webcam 為 1,依此類推)。按下執行。如下圖43圖44圖45圖46。

如果裝置未支援 NVIDIA GPU。出現錯誤訊息。請照上圖41圖42操作。

 

圖43.選擇 8_inference_webcam.png

圖43.選擇 8_inference_webcam

 

圖44.載入 8_inference_webcam.png

圖44.載入 8_inference_webcam

 

圖45.8_inference_webcam 確認 webcam 裝置碼.png

圖45.8_inference_webcam 確認 webcam 裝置碼。

 

圖46.執行 8_inference_webcam.png

圖46.執行 8_inference_webcam


延伸閱讀

1.
OpenR8 - 人人都會用的 AI 軟體 (下載)

[CP 值最好的 AI 人工智慧電腦熱賣中]
硬體採用最新最快的 Titan RTX, RTX-2080Ti-11G, 及 TESLA V100!
視窗圖控介面,易學易用。
硬體優勢:針對深度學習最佳化設計,且經過客戶端 24H 運作驗證。
軟體優勢:事先安裝人工智慧軟體及優化設定,每週提供最新 AI 演算法下載。
公司優勢:專業人工智慧機器人設計公司,資本額一億。
歡迎企業、學校、及公家機關大量採購。
可租用,歡迎來信或來電洽詢。
詳細資料請參閱以下網址: https://tw.leaderg.com/ai_computer