Home Explore 從零開始，成為 AI 圖像訓練師! 認證檢定教材

從零開始，成為 AI 圖像訓練師! 認證檢定教材

Published by 3Dfamily, 2023-08-08 08:23:04

Description: 我們結合過去幾年AI師資培訓的經驗及專家們的討論撰寫本書，本書採用淺顯易懂的方式帶領讀者們從認識AI、瞭解AI、訓練AI到運用AI，期盼讀者們透過這本書能了解AI及應用，並且能藉由學習本書通過AI認證考試，建立自己AI的新技能。

Keywords: 人工智慧,機器學習,電腦圖像處理

Read the Text Version

Pages:

二算力足夠的電腦：此類型的電腦通常已備妥相當程度的 GPU，以因應各種 AI 模型訓練問題。這類型的電腦能訓練各種難易度的題目，挑選網路模型的步驟如下：步驟一先確認題目的難易程度，若標記差異性大或不需大量圖片的題目，建議優先使用 40 至 60 層 (Xnet-1) 的神經網路模型，進行 AI 模型訓練，生成 AI 模型後驗證其結果；反之，標記差異性小或需要大量圖片的題目，建議優先使用 100 至 110 層 (Xnet-2) 的神經網路模型，進行 AI 模型訓練，生成 AI 模型後驗證其結果。步驟二根據驗證結果差異，會再選擇不同的神經網路模型，各種情況說明如下。 (1) 情況一、驗證結果符合需求：無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求：表示先前所選擇的神經網路層數不足，導致 AI 模型無法訓練起來，建議挑選多層數的神經網路，如 145 至 160 層 (XNet-3) 的網路模型。 (3) 情況三、驗證結果為過擬合 ( Overfitting ) ：過擬合是指 AI 模型在訓練結果表現得很好，但當提供新圖片時會表現不佳的現象。發生此情況時建議改挑選少層 (XNet-2) 的神經網路，避免過擬合情形發生影響 AI 模型訓練結果。步驟三根據不同的 AI 模型結果透過步驟二的情況進行調整，直到驗證結果符合需求。 151

二站在巨人的肩膀上 : 物件偵測應用案例案例一： AI 偵探—找出居家塵螨。塵螨是國人常見的過敏源，牠們主要生長在潮濕的環境中，由於臺灣四面環海屬於潮濕地型，十分適合塵螨生長。面對塵螨問題過去只能透過除濕或吸塵器方式杜絕塵螨，且塵螨體積過小無法用肉眼確認是否已清除乾淨，因此需要花費許多的時間與金錢處理，但成效卻是很有限。其實運用 AI 技術就可以輕鬆找出居家塵螨，導入過程也十分簡單。首先先用特殊相機拍攝取得大量塵螨照片並完成標記，接著將標記完成的資料放入 AI 模型中進行訓練，等待 AI 模型生成。最後將 AI 模型串接至相關程式，即完成 AI 塵螨檢測模組。塵蟎 APP 152 第八章不只分類，還要知道位置 : AI 物件偵測

透過手機與 AI 的結合，使用者開啟塵螨 APP 便能立即將家中塵螨一覽無遺，便能有效率的進行環境清潔減少塵螨所造成的不適。透過 APP 所蒐集的所有照片也能透過 APP 傳送至電腦中透過訓練強化 AI 模型，讓 AI 辨識能力持續強化。案例二： AI 品檢員—把關產品品質建立生產履歷買賣雙方的產品品質是如何把關呢？主要由買賣雙方依照合約規範各自檢測與把關產品品質。那為何會產生商品退貨或折讓呢？商品出貨時有時受到氣候或地形影響，讓商品送達時出現問題，發生這些問題時都是由賣方承擔，才會產生以上問題。 ? 153

導入 AI 擔任品檢員，不僅能減少培訓檢測人員的時間，也能持續提升檢測能力，更能經由串接看到賣方出貨的檢測過程並建立雙方承認的生產履歷，以保障雙方產品品質與日後毀損責任歸屬，並提升未來雙方的合作關係。 VisDB VisLab NG 國際管理系統標記 / 訓練 / 驗證產品數位化 OK ERP/MES 出貨人料檢生產紀錄生產紀錄生產紀錄生產紀錄人力組裝機械手臂組裝出貨檢生產生產流程 A 生產流程 B 生產流程 C 生產流程 D (VisCam) (VisCam) (VisCam) (VisCam) 品管不再受限場域數位化 ( 相片 ) 所有產品有跡可循買賣雙方產品複判 154 第八章不只分類，還要知道位置 : AI 物件偵測

案例三： AI 結帳員—店家結帳的好幫手大家應該都有到商店或賣場結帳的經驗，看到大排長龍的人群是否讓你失去享受購物的樂趣呢？也是否有過發生結帳的商品數量或金額出問題呢？傳統結帳相較 AI 結帳上仍有諸多不便，其中每年須開銷的員工教育訓練，新進人員訓練需要約 1 個月才會孰悉店家環境與機台操作。再者，店家商品與單價眾多，且不時會有促銷活動，店員有時會不小心出錯，讓客訴情形不斷發生。目前已有不少店家或賣場購置自助結帳機台以改善結帳問題，但消費者仍需花時間找尋商品條碼才能結帳或不孰悉操作，讓這些商家仍須配置人員在自助結帳機台附近，從旁協助消費者排除問題。其實店家可運用 AI 圖像辨識技術即可有效改善上述問題，其導入流程也十分容易，首先將各類商品照片拍照建檔，將檔案放入 AI 模型中進行訓練，生成專屬的 AI 模型檔案，最後再與自家的結帳系統串接即完成 AI 結帳系統。商品照片建檔匯入 AI 建立模型串接結帳系統 AI 結帳系統完成 155

AI 結帳系統導入完成後，消費者僅需將商品放置指定位置後，AI 將立即辨識出商品數量及價格與優惠資訊，消費者僅需確認有無問題，便可立即完成結帳，時間可從 1 分鐘縮短至 10 秒內完成，大幅降低結帳時間、人員培訓時間及成本。AI 不僅能縮短結帳時間，也能記錄消費資訊回饋給店家，並分析出各時段的熱門商品，以提升店家營業額度並降低過往透過傳統人員分析的時間與成本。後續店家若持續提供商品圖片讓 AI 進行訓練，更能提升 AI 辨識的精準度。 156 第八章不只分類，還要知道位置 : AI 物件偵測

實戰時間 1. 訓練自己的物件偵測模型以下透過實際的 AI 圖像模型訓練軟體進行操作，讓大家進一步認識 AI 圖像物件偵測，此次示範的軟體是由智泰科技所開發的 VisLab，操作說明如下。題目一：零售商品說明：AI 物件偵測具有即時辨識多種待測物件的特性，此特性很適合用於賣場或超商中，有助提升結帳速度與降低人員操作成本。接下來透過這生活中常見的商品做為 AI 題目來建置出 AI 零售商品的物件偵測模型。難度：簡單　標記種類：6　圖片總數：220 張　算力需求：無需 GPU 操作步驟如下： 157

步驟一在電腦桌面上新增資料夾，資料夾名稱為「零售商品」，接著在零售商品資料夾內新增四個子資料夾，分別命名為「train」、「test」、「verify」與「output」。步驟二將圖片分別放入「train」、「test」與「verify」資料夾中，圖片張數分別是 train 為 150 張、test 為 50 張與 verify 為 20 張，各種類圖片張數盡可能平均。步驟三開啟 VisLab 並點擊進入物件偵測的「標記工具」開始進行標記，順序如下： (1) 點擊「開新設定檔」出現目錄後點擊「參考目錄」，選取零售商品資料夾中的「train」資料夾按確定，將圖片匯入 VisLab 中。此處需留意頁數，每一頁顯示 100 張圖片，超過會新增頁數。 (2) 標記工具視窗上方有標記所用之相關工具彙整下表表圖。 158 第八章不只分類，還要知道位置 : AI 物件偵測

操作步驟如下：步驟一選擇所要標記的圖片後，點選新增標記圖示，並選擇分類標籤 ( 如圖示中的泡麵，選擇分類標籤「泡麵」 )。步驟二滑鼠游標鎖定標記目標的一角，接著按住滑鼠左鍵，以拖曳方式向對角線框住目標後，放開滑鼠左鍵。步驟三此時標記框呈現虛線狀態，可運用滑鼠調整標記框位置與大小。確認標記無問題後，將滑鼠游標移出標記框外，按一下滑鼠左鍵，即可完成標記。備註：標記過程軟體會自動儲存標記過的圖片，右邊 Image List 的圖片資訊會從白色轉為綠色，則表示已標記完成且紀錄。步驟四完成「train」資料夾標記後再重複順序 1 與 2 將「test」與「verify」資料夾中的圖片標記完成，完成標記後點擊左邊「回首頁」，點擊分類器的「訓練工具」。步驟五先將要訓練之資料夾匯入 VisLab，首先將「train」資料夾放入「訓練集」，接著將「test」資料夾放入「驗證集」，最後將「output」資料夾放入「輸出位置」，即完成資料匯入。 159

步驟六設定「網路模型、「影像資訊」及「學習參數」，因題目所辨識物件特徵明顯，根據前面網路模型挑選方式，優先以 40 至 60 層 (XNet-1) 的神經網路進行 AI 模型訓練，在 VisLab 軟體中選擇「VisNet-D1」。接著，此題目所使用的圖片尺寸最大為 1,920 x 1,080，為避免訓練不佳與訓練時間過長，將「影像寬」與「影像高」分別調整為 512 與 384，「影像深」設為 3 ( 3 指的是彩色 ) 。最後，「學習參數」設定「迭代」150 次、「批數量」設為 4 及「學習率」設為 1 x 10-4，接著點擊「開始訓練」，訓練時間與結果整理如下表。待 AI 模型生成完成後，點擊「回首頁」，結束訓練。 160 第八章不只分類，還要知道位置 : AI 物件偵測

步驟七點擊進入物件偵測「驗證工具」，將「verify」資料夾放入參考資料中，將「output」資料夾中的 AI 模型檔案 ( .pbz ) 放入 AI 模型檔，分類標籤系統會自行帶入，即完成資料佈署工作。接著分別將「預測門檻值」、「合併門檻值」與「比對 IOU」分別暫訂為 0.80、0.50 與 0.50( 數值越高表示辨識條件越嚴格 )，相關說明彙整於下表圖。點擊「開始分析」進行 AI 模型驗證，右下方 F 度量達 88.00% 161

分析完成後，會發現圖片的顏色會從白色變成藍色、紅色或黃色，主要是對應上方統計的顏色，如出現藍色表示圖片辨識正確、紅色表示圖片有漏檢情形或黃色表示圖片有過殺情形。若想瞭解各分類標籤辨識情形，可點選各分類標籤便能明白各標籤的辨識結果，使用者可針對想強化的標籤圖片再新增圖片數量進行訓練。 162 第八章不只分類，還要知道位置 : AI 物件偵測

備註：右上方統計有四個不同顏色的表格，其內容整理如下：真值： 5 正確數：3 漏檢： 2 過殺： 3 真值 = 正確數 + 漏檢數 163

透過上述的操作過程，大家是否已了解如何訓練出 AI 物件偵測模型了呢？大家也能應用此功能去偵測人流、產品檢測與商品結帳等，發揮大家創意來製作更多 AI 物件偵測的應用案例。 AI 模型訓練能否延續過去的 AI 模型持續訓練呢？可以的，在 VisLab 軟體中使用者可點選左邊「參數設定」，進入後在右上方的「遷移學習」並選取「自動」或「指定」，關閉「參數設定」視窗後點選開始訓練，即可接續先前 AI 模型成果進行訓練。 164 第八章不只分類，還要知道位置 : AI 物件偵測

實戰時間 2. 把模型導入檢測平台 AI 模型如同人的大腦記憶，光有大腦記憶是不夠的，需要搭配其他功能才可有效發揮大腦中的記憶並應用，AI 模型也是如此。上節透過 VisLab 軟體來生成 AI 模型，本節將運用與 VisLab 搭配的 VisCam ( AI 影像偵測模組 ) 執行實物辨識與串接。VisCam 中有三大功能分別是相機 ( camera ) 、資料夾 ( folder ) 及網路 ( web ) ，各自功能介紹與操作說明如下：一相機：將 AI 模型導入後，使用者可透過 webcam、實物投影機或筆電鏡頭即可進行實物辨識，操作方式如下： (1) 開啟 VisCam 軟體，透過左上角 ( 需取得與啟動產品金鑰才能開啟 ) 選擇相機功能。 (2) 點擊開啟相機設定，由於上節 AI 模型的訓練，所使用的影像資訊為 512 x 384，因此影像格式需要盡量找最接近的為優先，所以此次選擇 640 x 480，接著點擊下方啟動始完成相機設定。 165

備註：相機設定會根據使用者所安裝的相機規格不同，導致有部分功能選項與作者不同或無法使用。 (3) 接下來，點擊 AI 右邊的設定，即開啟 AI 設定功能。需要將上節所訓練的 AI 模型檔匯入此設定中，才能讓相機備有 AI 物件偵測的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、影像高、檢測門檻與使用 CPU，在此我們僅需輸入名稱 ( 零售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.80( 數值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ，其餘系統會自動匯入，完成後點擊 OK ， AI 模型便新增完成，接著點擊右上角的離開回到 VisCam 畫面。 166 第八章不只分類，還要知道位置 : AI 物件偵測

(4)AI 功能畫面出現零售商品 AI 模型，滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ，將 AI 模型佈署至 VisCam 中。此時，可拿這分類標籤中的六項零售商品放置鏡頭下進行即時辨識，即完成 AI 相機佈署與操作。 167

二資料夾 ( 需先取得與啟動產品金鑰 ) ：有時因題目關係，會需要將圖片放置於資料夾進行即時辨識以確認 AI 模型成效，相關操作步驟說明如下： (1) 開啟 VisCam 軟體，透過左上角選擇資料夾功能。 (2) 點擊開啟資料夾設定，可設定有資料夾 ( 圖片路徑 ) 、存檔路徑 ( 辨識資料結果存放路徑 ) 、Save PDF、OD-save xml ( 物件偵測專用 ) 與 SE-save mask ( 分割專用 ) ，本次 AI 模型以物件偵測為主，所以此次先勾選 Save PDF 與 OD-save xml，接著離開設定。 (3) 接著將需要檢測的零售商品圖片放入 VisCam 的 input 資料夾中後，離開資料夾。 168 第八章不只分類，還要知道位置 : AI 物件偵測

(4) 接下來，點擊 AI 右邊的設定，即開啟 AI 設定功能。需要將上節所訓練的 AI 模型檔匯入此設定中，才能讓相機備有 AI 物件偵測的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、影像高、檢測門檻與使用 CPU，在此我們僅需輸入名稱 ( 零售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻 0.80( 數值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ，其餘系統會自動匯入，完成後點擊 OK，AI 模型便新增完成，接著點擊右上角的離開回到 VisCam 畫面。 169

(5)AI 功能畫面出現零售商品 AI 模型，滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ，將 AI 模型佈署至 VisCam 中。 (6) 接著點擊啟動，AI 模型將自動辨識這些圖片，辨識結束後點擊停止，否則有其他圖片匯入 input 資料夾時，系統仍會即時辨識。 170 第八章不只分類，還要知道位置 : AI 物件偵測

(7) 最後，進入 VisCam 的 output 資料夾中，便可看到剛才圖片透過 AI 模型所辨識的結果將以 PDF 檔案呈現，點入即可看辨識詳細內容。 171

三網路 ( 需先取得與啟動產品金鑰 ) ：網路功能可將 AI 模型所辨識的結果串接至其他程式進行 AI 應用，操作步驟如下： (1) 開啟 VisCam 軟體，透過左上角選擇網路功能。 (2) 點擊開啟網路設定，可設定最大使用者與調整允許 IP 名單。備註：建議最大使用者別設定超過 5 位，否則執行起來辨識速度會遲緩。 (3) 離開網路設定，開啟 W i n d o w s 的「命令提示字元」，輸入「ipconfig」搜尋目前電腦的 IP4 位址，確認 IP 位址後在 VisCam 上的 IP 輸入 ( 如下圖 192.168.1.192) 且下方 Port 輸入 8080，即完成網路設定。 172 第八章不只分類，還要知道位置 : AI 物件偵測

(4) 接下來，點擊 AI 右邊的設定，即開啟 AI 設定功能。需要將上節所訓練的 AI 模型檔匯入此設定中，才能讓相機備有 AI 物件偵測的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、影像高、檢測門檻與使用 CPU，在此我們僅需輸入名稱 ( 零售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.80( 數值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ，其餘系統會自動匯入，完成後點擊 OK，AI 模型便新增完成，接著點擊右上角的離開回到 VisCam 畫面。 (5)AI 功能畫面出現零售商品 AI 模型，滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ，將 AI 模型佈署至 VisCam 中。 173

(6) 點擊「開啟網頁」，進入到分類展示效果網頁，點擊下方「選擇圖片」，選取所要放置的圖片後，點擊「AI 推論」立即出現 AI 模型辨識結果，且 VisCam 也會同步出現 AI 模型辨識結果。 174 第八章不只分類，還要知道位置 : AI 物件偵測

(7) 除了物件偵測效果展示外，也有 Web API 與範例程式供使用者進行串接。其中範例程式共有 python、javascript 與 C++ 讓大家參考並串接至相關應用程式。物件偵測 175

NOT E 176 第八章不只分類，還要知道位置 : AI 物件偵測

NOT E 177

9第章每一個像素都要檢測 : AI 影像分割一、哪些模型可以用呢 ? 常見的影像分割模型 -------180 二、站在巨人的肩膀上 : 影像分割應用案例 ----------184 三、實戰時間 1 : 訓練自己的影像分割模型 -----------185 四、實戰時間 2 : 把模型導入檢測平台 ---------------192 178 第九章每一個像素都要檢測 : AI 圖像分割

什麼是分割？影像分割是指將一張圖像分為多個區域或部分的過程，使得每個區域都包含具有相似特徵的像素。這些區域可以是物體、背景或物體的部分等，其目的是使圖像更容易被理解和處理。影像分割在許多應用領域中都非常重要，例如：醫學圖像分析、自動駕駛、物體識別、圖像檢索等。 Segmentation 分割 179

一哪些模型可以用呢 ? 常見的影像分割模型 AI 訓練所需要的模型，並非越深越好，而是應視使用者所選的題目難易度而定。簡單容易的題目通常是差異性較大，如：貓與狗、蘋果與香蕉或飛機與汽車等，其特徵容易識別，所以通常建議選用較少層數的神經網路進行模型訓練。反之，困難複雜的題目通常是指差異性較小，如：秋田犬與柴犬、蜜蘋果與富士蘋果或稻米種類等，其特徵不易識別，所以建議選用較多層數的神經網路模型進行模型訓練。選擇所需要的神經網路模型是對 AI 模型生成至關重要的步驟，上述雖說明了根據所選的題目難易度挑選神經網路，但現今神經網路如此多，應要如何挑選呢？以下為大家介紹如何挑選適合的神經網路，有助大家訓練 AI 模型能事半功倍。 180 第九章每一個像素都要檢測 : AI 圖像分割

神經網路模型會以層數表示網路模型的複雜度，隨著層數的增加，其網路模型越能捕捉到更抽象和複雜的特徵；但層數越多的網路模型會需要更高階的運算電腦、訓練需要更長的時間、圖片的畫質需要更高與容易產生過擬合，都將提高 AI 模型訓練的難度。我們將所有的神經網路區分成三大類，分別為邊緣運算、一般泛用以及深層計算，其中邊緣運算，這類網路模型是層數最少通常是少於 18 層的神經網路，主要用於算力有限或需要高速檢測的應用場景。再者，一般泛用這類網路模型其層數約在 40 至 160 層的神經網路，能應用在大部分的檢測需求，並且在一般電腦算力下能將檢測精度最大化。最後，深層計算這類網路模型其層數通常是超過 221 層的神經網路，適合應用在較為複雜的檢測問題，其所需要的電腦算力要求也較高。 181

大家若想嘗試自行訓練 AI 模型，以下針對初級使用者的相關建議：一算力不足的電腦：要透過 AI 進行模型訓練最低的 GPU（圖像顯示器）至少要具備 6GB 的記憶體，如：NVIDIA GTX 1060 ( 6GB ) 以上，低於此配備的 GPU 或未配置 GPU 的電腦都歸類在算力不足的電腦。這類型的電腦因算力受限，所以在神經網路的選擇上，不建議選用深層計算的神經網路模型進行訓練，且題目應以標記差異性大與不需大量圖片為主。挑選網路模型的步驟如下：步驟一優先選擇 40 至 60 層 (XNet-1) 的神經網路模型，進行 AI 模型訓練，生成 AI 模型後驗證其結果。步驟二根據驗證結果差異，會再選擇不同的神經網路模型，各種情況說明如下。 (1) 情況一、驗證結果符合需求：無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求：表示先前所選擇的神經網路層數不足，導致 AI 模型無法訓練起來，建議挑選多層數的神經網路，如 100 至 110 層 (XNet-2) 的網路模型。 (3) 情況三、驗證結果為過擬合 (Overfitting) ：過擬合是指 AI 模型在訓練結果表現得很好，但當提供新圖片時會表現不佳的現象。發生此情況時建議改挑選少層的神經網路，避免過擬合情形發生影響 AI 模型訓練結果。步驟三根據不同的 AI 模型結果透過步驟二的情況進行調整，直到驗證結果符合需求。 182 第九章每一個像素都要檢測 : AI 圖像分割

二算力足夠的電腦：此類型的電腦通常已備妥相當程度的 GPU，以因應各種 AI 模型訓練問題。這類型的電腦能訓練各種難易度的題目，挑選網路模型的步驟如下：步驟一先確認題目的難易程度，若標記差異性大或不需大量圖片的題目，建議優先使用 40 至 60 層 (XNet-1) 的神經網路模型，進行 AI 模型訓練，生成 AI 模型後驗證其結果；反之，標記差異性小或需要大量圖片的題目，建議優先使用 100 至 110 層 (XNet-2) 的神經網路模型，進行 AI 模型訓練，生成 AI 模型後驗證其結果。步驟二根據驗證結果差異，會再選擇不同的神經網路模型，各種情況說明如下。 (1) 情況一、驗證結果符合需求：無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求：表示先前所選擇的神經網路層數不足，導致 AI 模型無法訓練起來，建議挑選多層數的神經網路，如 145 至 160 層 (XNet-3) 的網路模型。 (3) 情況三、驗證結果為過擬合 (Overfitting) ：過擬合是指 AI 模型在訓練結果表現得很好，但當提供新圖片時會表現不佳的現象。發生此情況時建議改挑選少層 (XNet-2) 的神經網路，避免過擬合情形發生影響 AI 模型訓練結果。步驟三根據不同的 AI 模型結果透過步驟二的情況進行調整，直到驗證結果符合需求。 183

二站在巨人的肩膀上 : 影像分割應用案例 AI 訓練所需要的模型，並非越深越好，而是應視使用者所選的題目難易度而定。簡單容易的題目通常是差異性較大，如：貓與狗、蘋果與香蕉或飛機與汽車等，其特徵容易識別，所以通常建議選用較少層數的神經網路進行模型訓練。反之，困難複雜的題目通常是指差異性較小，如：秋田犬與柴犬、蜜蘋果與富士蘋果或稻米種類等，其特徵不易識別，所以建議選用較多層數的神經網路模型進行模型訓練。案例一： AI 醫療小幫手—檢視疾病情形大型醫療院所裡的醫生們每天都需要集中精神為民眾診斷與治療，但有時因為疲勞讓集中力下降，使得誤診情形發生，輕微的可能僅僅是給錯藥，嚴重的話患者可能會失去生命。導入 AI 分割能有效分擔醫師們的工作，導入過程十分容易，首先請醫師們蒐集並標記大量病兆圖片，接著設定好 AI 參數並執行模型訓練，等待 AI 模型生成後，與醫院看診系統串接，即可完成 AI 看診系統。導入 AI 影像分割讓 AI 成為醫生的小幫手，患者藉由 X 光、MRI、CT 掃描等影像讓 AI 立即分析與判斷初步病兆並回傳給主治醫師確認，將大幅提升診斷精準度與縮減候診時間。 184 第九章每一個像素都要檢測 : AI 圖像分割

實戰時間 1. 訓練自己的影像分割模型以下透過實際的 AI 圖像模型訓練軟體進行操作，讓大家進一步認識 AI 分割，此次示範的軟體是由智泰科技所開發的 VisLab，操作說明如下。題目一：形狀說明：AI 影像分割與其他功能主要的難度在於標記，需要將物件輪廓標記完整，AI 訓練與辨識才能完整。因此建議初學者先從「簡單」形狀開始孰悉分割標記操作，再延伸往多角度的形狀發展。物件原圖分割標記難度：簡單　標記種類：3　圖片總數：206 張　算力需求：無需 GPU 操作步驟如下： 185

步驟一在電腦桌面上新增資料夾，資料夾名稱為「形狀」，接著在形狀資料夾內新增四個子資料夾，分別命名為「train」、「test」、「verify」與「output」。步驟二將圖片分別放入「train」、「test」與「verify」資料夾中，圖片張數分別是 train 為 146 張、test 為 30 張與 Verify 為 30 張，各種類圖片張數盡可能平均。步驟三開啟 VisLab 並點擊進入分割的「標記工具」開始進行標記，順序如下： (1) 點擊「開新設定檔」出現目錄後點擊參考目錄，選取形狀資料夾中的「train」資料夾按確定，將圖片匯入 VisLab 中。此處需留意頁數，每一頁顯示 100 張圖片，超過會新增頁數。 (2) 標記工具視窗上方有標記所用之相關工具彙整下表。 186 第九章每一個像素都要檢測 : AI 圖像分割

標記工具操作步驟如下：步驟一選擇所要標記的圖片後，點選所需要使用的標記工具，並選擇分類標籤 ( 如圖示中的矩形，選擇分類標籤「矩形」 )。步驟二將滑鼠游標移至矩形的邊緣並按下滑鼠左鍵，接著沿著個轉折處按下滑鼠左鍵，最後將矩形外圍連接起來。步驟三此時標記框呈現虛線狀態，可運用滑鼠調整標記框位置與大小。確認標記無問題後，將滑鼠游標移出標記框外，按一下滑鼠左鍵，即可完成標記。 187

備註：標記過程軟體會自動儲存標記過的圖片。步驟四完成「train」資料夾標記後再重複步驟一至三將「test」與「verify」資料夾中的圖片標記完成，完成標記後點擊左邊「回首頁」，點擊分割的「訓練工具」。步驟五先將欲訓練之資料夾匯入 VisLab，首先將「train」資料夾放入「訓練集」，接著將「test」資料夾放入「驗證集」，最後將「output」資料夾放入「輸出位置」，即完成資料匯入。 188 第九章每一個像素都要檢測 : AI 圖像分割

步驟六設定「網路模型」、「影像資訊」及「學習參數」，因題目所辨識物件特徵明顯，根據前面網路模型挑選方式，優先以 40 至 60 層 (Xnet-1) 的神經網路進行 AI 模型訓練，在 VisLab 軟體中選擇 VisNet-S1。接著，此題目所使用的圖片尺寸最大為 200 X 200，為避免訓練不佳與訓練時間過長，將「影像寬」與「影像高」均調為 200，「影像深」設為 3 ( 3 指的是彩色 ) 。最後，學習參數設定「迭代」 150 次、「批數量」設為 2 及「學習率」設為 1 X 10-4，接著點擊開始訓練，訓練時間與結果整理如下表圖。待 AI 模型生成完成後，點擊「回首頁」，結束訓練。 189

步驟七點擊進入分類器「驗證工具」，將「verify」資料夾放入參考資料中，接著將「output」資料夾中的 AI 模型檔案 ( .pbz ) 放入 AI 模型檔，分類標籤系統會自行帶入，即完成資料佈署工作。點擊「開始分析」進行 AI 模型驗證，右下方準確率達 94.97% 若想瞭解各分類標籤辨識情形，可點選單類分類標籤便能明白各標籤的辨識結果，使用者可針對需加強的分類標籤新增圖片再進行訓練。 190 第九章每一個像素都要檢測 : AI 圖像分割

備註：右上方統計有四個不同顏色的表格，其內容整理如下：其中真值 = 正確數 + 漏檢數 AI 模型成績不如預期要如何提高呢？先透過驗證工具了解哪種分類標籤辨識成績較低，有幾種方式可改善 AI 模型成績： 1. 圖片過少：針對成績較低分類標籤蒐集大量圖片。 2. 標記有誤：進入標記工具重新修正標記再進行 AI 模型訓練即可。 3. 訓練次數不足：增加迭代。 4. 影像設定：確認圖片實際像素再修正影像寬與高。 191

實戰時間 2. 把模型導入檢測平台 AI 模型如同人的大腦記憶，光有大腦記憶是不夠的，需要搭配其他功能才可有效發揮大腦中的記憶並應用，AI 模型也是如此。上節透過 VisLab 軟體來生成 AI 模型，本節將運用與 VisLab 搭配的 VisCam ( AI 影像偵測模組 ) 執行實物辨識與串接。VisCam 中有三大功能分別是相機 ( camera ) 、資料夾 ( folder ) 及網路 ( web ) ，各自功能介紹與操作說明如下：一相機：將 AI 模型導入後，使用者可透過 webcam、實物投影機或筆電鏡頭即可進行實物辨識，操作方式如下： (1) 開啟 VisCam 軟體，透過左上角 ( 需取得與啟動產品金鑰才能開啟 ) 選擇相機功能。 (2) 點擊開啟相機設定，由於上節 AI 模型的訓練，所使用的影像資訊為 200 X 200，因此影像格式需要盡量找最接近的為優先，所以此次選擇 320 X 240，接著點擊下方啟動始完成相機設定。備註：相機設定會根據使用者所安裝的相機規格不同，導致有部分功能選項與作者不同或無法使用。 192 第九章每一個像素都要檢測 : AI 圖像分割

(3) 接下來，點擊 AI 右邊的設定，即開啟 AI 設定功能。需要將上節所訓練的 AI 模型檔匯入此設定中，才能讓相機備有 AI 分割的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、影像高、檢測門檻與使用 CPU，在此我們僅需輸入名稱 ( 形狀 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.70( 數值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ，其餘系統會自動匯入，完成後點擊 OK，AI 模型便新增完成，接著點擊右上角的離開回到 VisCam 畫面。 193

(4)AI 功能畫面出現形狀 AI 模型，滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ，將 AI 模型佈署至 VisCam 中。此時，可拿這分類標籤中的三種形狀放置鏡頭下進行即時辨識，即完成 AI 相機佈署與操作。 194 第九章每一個像素都要檢測 : AI 圖像分割

二資料夾 ( 需先取得與啟動產品金鑰 ) ：有時因題目關係，會需要將圖片放置於資料夾進行即時辨識以確認 AI 模型成效，相關操作步驟說明如下： (1) 開啟 VisCam 軟體，透過左上角選擇資料夾功能。 (2) 點擊開啟資料夾設定，可設定有資料夾 ( 圖片路徑 ) 、存檔路徑 ( 辨識資料結果存放路徑 ) 、Save PDF、OD-save xml ( 物件偵測專用 ) 與 SE-save mask ( 分割專用 ) ，本次 AI 模型以分割為主，所以此次先勾選 Save PDF 與將 SE-save mask，接著離開設定。 (3) 接著將需要檢測的形狀圖片放入 VisCam 的 input 資料夾中後，離開資料夾。 195

(4) 接下來，點擊 AI 右邊的設定，即開啟 AI 設定功能。需要將上節所訓練的 AI 模型檔匯入此設定中，才能讓相機備有 AI 分割的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、影像高、檢測門檻與使用 CPU，在此我們僅需輸入名稱 ( 形狀 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.70( 數值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ，其餘系統會自動匯入，完成後點擊 OK，AI 模型便新增完成，接著點擊右上角的離開回到 VisCam 畫面。 196 第九章每一個像素都要檢測 : AI 圖像分割

(5)AI 功能畫面出現形狀 AI 模型，滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ，將 AI 模型佈署至 VisCam 中。 (6) 接著點擊啟動，AI 模型將自動辨識這些圖片，辨識結束後點擊停止，否則有其他圖片匯入 input 資料夾時，系統仍會即時辨識。 197

(7) 最後，進入 VisCam 的 output 資料夾中，便可看到剛才圖片透過 AI 模型所辨識的結果將以 PDF 檔案呈現，點入即可看辨識詳細內容。 198 第九章每一個像素都要檢測 : AI 圖像分割

199

三網路 ( 需先取得與啟動產品金鑰 ) ：網路功能可將 AI 模型所辨識的結果串接至其他程式進行 AI 應用，操作步驟如下： (1) 開啟 VisCam 軟體，透過左上角選擇網路功能。 (2) 點擊開啟網路設定，可設定最大使用者與調整允許 IP 名單。備註：建議最大使用者別設定超過 5 位，否則執行起來辨識速度會遲緩。 (3) 離開網路設定，開啟 W i n d o w s 的「命令提示字元」，輸入「ipconfig」搜尋目前電腦的 IP4 位址，確認 IP 位址後在 VisCam 上的 IP 輸入 ( 如下圖 192.168.1.192) 且下方 Port 輸入 8080，即完成網路設定。 200 第九章每一個像素都要檢測 : AI 圖像分割

Pages:

3Dfamily

從零開始，成為 AI 圖像訓練師! 認證檢定教材

Like this book? You can publish your book online for free in a few minutes!

Create your own flipbook

TOP SEARCH

business design fashion music health life sports home marketing children

從零開始，成為 AI 圖像訓練師! 認證檢定教材

Keywords: 人工智慧,機器學習,電腦圖像處理

Read the Text Version

3Dfamily

TOP SEARCH

RELATED PUBLICATIONS