二 算力足夠的電腦:此類型的電腦通常已備妥相當程度的 GPU,以 因應各種 AI 模型訓練問題。這類型的電腦能訓練各種難易度的題目, 挑選網路模型的步驟如下: 步驟一 先確認題目的難易程度,若標記差異性大或不需大量圖片的題目,建 議優先使用 40 至 60 層 (Xnet-1) 的神經網路模型,進行 AI 模型訓練, 生成 AI 模型後驗證其結果;反之,標記差異性小或需要大量圖片的題 目,建議優先使用 100 至 110 層 (Xnet-2) 的神經網路模型,進行 AI 模 型訓練,生成 AI 模型後驗證其結果。 步驟二 根據驗證結果差異,會再選擇不同的神經網路模型,各種情況說明如下。 (1) 情況一、驗證結果符合需求:無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求:表示先前所選擇的神經網路層數不 足,導致 AI 模型無法訓練起來,建議挑選多層數的神經網路,如 145 至 160 層 (XNet-3) 的網路模型。 (3) 情況三、驗證結果為過擬合 ( Overfitting ) :過擬合是指 AI 模型在 訓練結果表現得很好,但當提供新圖片時會表現不佳的現象。發生 此情況時建議改挑選少層 (XNet-2) 的神經網路,避免過擬合情形 發生影響 AI 模型訓練結果。 步驟三 根據不同的 AI 模型結果透過步驟二的情況進行調整,直到驗證結果符 合需求。 151
二 站在巨人的肩膀上 : 物件偵測應用案例 案例一: AI 偵探—找出居家塵螨。 塵螨是國人常見的過敏源,牠們主要生長在潮濕的環境中,由於 臺灣四面環海屬於潮濕地型,十分適合塵螨生長。面對塵螨問題過去 只能透過除濕或吸塵器方式杜絕塵螨,且塵螨體積過小無法用肉眼確 認是否已清除乾淨,因此需要花費許多的時間與金錢處理,但成效卻 是很有限。 其實運用 AI 技術就可以輕鬆找出居家塵螨,導入過程也十分簡單。 首先先用特殊相機拍攝取得大量塵螨照片並完成標記,接著將標記完 成的資料放入 AI 模型中進行訓練,等待 AI 模型生成。最後將 AI 模型 串接至相關程式,即完成 AI 塵螨檢測模組。 塵蟎 APP 152 第八章 不只分類,還要知道位置 : AI 物件偵測
透過手機與 AI 的結合,使用者開啟塵螨 APP 便能立即將家中塵 螨一覽無遺,便能有效率的進行環境清潔減少塵螨所造成的不適。透 過 APP 所蒐集的所有照片也能透過 APP 傳送至電腦中透過訓練強化 AI 模型,讓 AI 辨識能力持續強化。 案例二: AI 品檢員—把關產品品質建立生產履歷 買賣雙方的產品品質是如何把關呢?主要由買賣雙方依照合約規範 各自檢測與把關產品品質。那為何會產生商品退貨或折讓呢?商品出 貨時有時受到氣候或地形影響,讓商品送達時出現問題,發生這些問 題時都是由賣方承擔,才會產生以上問題。 ? 153
導入 AI 擔任品檢員,不僅能減少培訓檢測人員的時間,也能持續 提升檢測能力,更能經由串接看到賣方出貨的檢測過程並建立雙方承 認的生產履歷,以保障雙方產品品質與日後毀損責任歸屬,並提升未 來雙方的合作關係。 VisDB VisLab NG 國際管理系統 標記 / 訓練 / 驗證 產品數位化 OK ERP/MES 出貨 人料檢 生產紀錄 生產紀錄 生產紀錄 生產紀錄 人力組裝 機械手臂組裝 出貨檢 生產 生產流程 A 生產流程 B 生產流程 C 生產流程 D (VisCam) (VisCam) (VisCam) (VisCam) 品管不再受限場域 數位化 ( 相片 ) 所有產品有跡可循 買賣雙方產品複判 154 第八章 不只分類,還要知道位置 : AI 物件偵測
案例三: AI 結帳員—店家結帳的好幫手 大家應該都有到商店或賣場結帳的經驗,看到大排長龍的人群是 否讓你失去享受購物的樂趣呢?也是否有過發生結帳的商品數量或金 額出問題呢? 傳統結帳相較 AI 結帳上仍有諸多不便,其中每年須開銷的員工教 育訓練,新進人員訓練需要約 1 個月才會孰悉店家環境與機台操作。 再者,店家商品與單價眾多,且不時會有促銷活動,店員有時會不小 心出錯,讓客訴情形不斷發生。 目前已有不少店家或賣場購置自助結帳機台以改善結帳問題,但 消費者仍需花時間找尋商品條碼才能結帳或不孰悉操作,讓這些商家 仍須配置人員在自助結帳機台附近,從旁協助消費者排除問題。 其實店家可運用 AI 圖像辨識技術即可有效改善上述問題,其導入 流程也十分容易,首先將各類商品照片拍照建檔,將檔案放入 AI 模型 中進行訓練,生成專屬的 AI 模型檔案,最後再與自家的結帳系統串接 即完成 AI 結帳系統。 商品照片建檔 匯入 AI 建立模型 串接結帳系統 AI 結帳系統完成 155
AI 結帳系統導入完成後,消費者僅需將商品放置指定位置後,AI 將立即辨識出商品數量及價格與優惠資訊,消費者僅需確認有無問題, 便可立即完成結帳,時間可從 1 分鐘縮短至 10 秒內完成,大幅降低結 帳時間、人員培訓時間及成本。AI 不僅能縮短結帳時間,也能記錄消 費資訊回饋給店家,並分析出各時段的熱門商品,以提升店家營業額 度並降低過往透過傳統人員分析的時間與成本。後續店家若持續提供 商品圖片讓 AI 進行訓練,更能提升 AI 辨識的精準度。 156 第八章 不只分類,還要知道位置 : AI 物件偵測
實 戰 時 間 1. 訓練自己的物件偵測模型 以下透過實際的 AI 圖像模型訓練軟體進行操作,讓大家進一步認 識 AI 圖像物件偵測,此次示範的軟體是由智泰科技所開發的 VisLab, 操作說明如下。 題目一:零售商品 說明:AI 物件偵測具有即時辨識多種待測物件的特性,此特性很 適合用於賣場或超商中,有助提升結帳速度與降低人員操作成本。接 下來透過這生活中常見的商品做為 AI 題目來建置出 AI 零售商品的物 件偵測模型。 難度:簡單 標記種類:6 圖片總數:220 張 算力需求:無需 GPU 操作步驟如下: 157
步驟一 在電腦桌面上新增資料夾,資料夾名稱 為「 零 售 商 品 」, 接 著 在 零 售 商 品 資 料 夾 內 新 增 四 個 子 資 料 夾, 分 別 命 名 為「train」、「test」、「verify」 與 「output」。 步驟二 將圖片分別放入「train」、「test」與「verify」資料夾中,圖片張數 分別是 train 為 150 張、test 為 50 張與 verify 為 20 張,各種類圖片張 數盡可能平均。 步驟三 開啟 VisLab 並點擊進入物件偵測的「標記工具」開始進行標記,順序 如下: (1) 點擊「開新設定檔」出現目錄後點擊「參考目錄」,選取零售商品 資料夾中的「train」資料夾按確定,將圖片匯入 VisLab 中。此處需 留意頁數,每一頁顯示 100 張圖片,超過會新增頁數。 (2) 標記工具視窗上方有標記所用之相關工具彙整下表表圖。 158 第八章 不只分類,還要知道位置 : AI 物件偵測
操作步驟如下: 步驟一 選擇所要標記的圖片後,點選新增標記圖示 ,並選擇分類標籤 ( 如圖 示中的泡麵,選擇分類標籤「泡麵」 )。 步驟二 滑鼠游標鎖定標記目標的一角,接著按住滑鼠左鍵,以拖曳方式向對 角線框住目標後,放開滑鼠左鍵。 步驟三 此時標記框呈現虛線狀態,可運用滑鼠調整標記框位置與大小。確認 標記無問題後,將滑鼠游標移出標記框外,按一下滑鼠左鍵,即可完 成標記。 備註:標記過程軟體會自動儲存標記過的圖片,右邊 Image List 的圖 片資訊會從白色轉為綠色,則表示已標記完成且紀錄。 步驟四 完成「train」資料夾標記後再重複順序 1 與 2 將「test」與「verify」 資料夾中的圖片標記完成,完成標記後點擊左邊「回首頁」,點擊分 類器的「訓練工具」。 步驟五 先將要訓練之資料夾匯入 VisLab,首先將「train」資料夾放入「訓練 集」,接著將「test」資料夾放入「驗證集」,最後將「output」資料 夾放入「輸出位置」,即完成資料匯入。 159
步驟六 設定「網路模型、「影像資訊」及「學習參數」,因題目所辨識物件 特徵明顯,根據前面網路模型挑選方式,優先以 40 至 60 層 (XNet-1) 的神經網路進行 AI 模型訓練,在 VisLab 軟體中選擇「VisNet-D1」。 接著,此題目所使用的圖片尺寸最大為 1,920 x 1,080,為避免訓練不 佳與訓練時間過長,將「影像寬」與「影像高」分別調整為 512 與 384,「影像深」設為 3 ( 3 指的是彩色 ) 。最後,「學習參數」設定「迭 代」150 次、「批數量」設為 4 及「學習率」設為 1 x 10-4,接著點擊「開 始訓練」,訓練時間與結果整理如下表。 待 AI 模型生成完成後,點擊「回首頁」,結束訓練。 160 第八章 不只分類,還要知道位置 : AI 物件偵測
步驟七 點擊進入物件偵測「驗證工具」,將「verify」資料夾放入參考資料中, 將「output」資料夾中的 AI 模型檔案 ( .pbz ) 放入 AI 模型檔,分類標 籤系統會自行帶入,即完成資料佈署工作。 接著分別將「預測門檻值」、「合併門檻值」與「比對 IOU」 分別暫 訂為 0.80、0.50 與 0.50( 數值越高表示辨識條件越嚴格 ), 相關說明 彙整於下表圖。 點擊「開始分析」進行 AI 模型驗證,右下方 F 度量達 88.00% 161
分析完成後,會發現圖片的顏色會從白色變成藍色、紅色或黃色,主 要是對應上方統計的顏色,如出現藍色表示圖片辨識正確、紅色表示 圖片有漏檢情形或黃色表示圖片有過殺情形。 若想瞭解各分類標籤辨識情形,可點選各分類標籤便能明白各標籤的 辨識結果,使用者可針對想強化的標籤圖片再新增圖片數量進行訓練。 162 第八章 不只分類,還要知道位置 : AI 物件偵測
備註: 右上方統計有四個不同顏色的表格,其內容整理如下: 真值: 5 正確數:3 漏檢: 2 過殺: 3 真值 = 正確數 + 漏檢數 163
透過上述的操作過程,大家是否已了解如何訓練出 AI 物件偵測模 型了呢?大家也能應用此功能去偵測人流、產品檢測與商品結帳等, 發揮大家創意來製作更多 AI 物件偵測的應用案例。 AI 模型訓練能否延續過去的 AI 模型持續訓練呢? 可以的,在 VisLab 軟體中使用者可點選左邊「參數設定」 ,進入後在右上方的「遷移學習」並選取「自動」或「指 定」,關閉「參數設定」視窗後點選開始訓練 ,即可接 續先前 AI 模型成果進行訓練。 164 第八章 不只分類,還要知道位置 : AI 物件偵測
實 戰 時 間 2. 把模型導入檢測平台 AI 模型如同人的大腦記憶,光有大腦記憶是不夠的,需要搭配其 他功能才可有效發揮大腦中的記憶並應用,AI 模型也是如此。 上節透過 VisLab 軟體來生成 AI 模型,本節將運用與 VisLab 搭配 的 VisCam ( AI 影像偵測模組 ) 執行實物辨識與串接。VisCam 中有 三大功能分別是相機 ( camera ) 、資料夾 ( folder ) 及網路 ( web ) ,各自功能介紹與操作說明如下: 一 相機:將 AI 模型導入後,使用者可透過 webcam、實物投影機或 筆電鏡頭即可進行實物辨識,操作方式如下: (1) 開啟 VisCam 軟體,透過左上角 ( 需取得與啟動產品金鑰才能開 啟 ) 選擇相機功能 。 (2) 點擊 開啟相機設定,由於上節 AI 模型的訓練,所使用的影像資 訊為 512 x 384,因此影像格式需要盡量找最接近的為優先,所以 此次選擇 640 x 480,接著點擊下方啟動始完成相機設定。 165
備註: 相機設定會根據使用者所安裝的相機規格不同,導致有部分功能選項 與作者不同或無法使用。 (3) 接下來,點擊 AI 右邊的設定 ,即開啟 AI 設定功能。需要將上 節所訓練的 AI 模型檔匯入此設定中,才能讓相機備有 AI 物件偵測 的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、 影像寬、影像高、檢測門檻與使用 CPU,在此我們僅需輸入名稱 ( 零售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.80( 數 值越高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ,其餘系統 會自動匯入,完成後點擊 OK , AI 模型便新增完成,接著點擊右 上角的離開回到 VisCam 畫面。 166 第八章 不只分類,還要知道位置 : AI 物件偵測
(4)AI 功能畫面出現零售商品 AI 模型,滑鼠左鍵快速點擊兩下 ( 點擊 後 AI 模型變成紅色 ) ,將 AI 模型佈署至 VisCam 中。此時,可拿 這分類標籤中的六項零售商品放置鏡頭下進行即時辨識,即完成 AI 相機佈署與操作。 167
二 資料夾 ( 需先取得與啟動產品金鑰 ) :有時因題目關係,會需要將 圖片放置於資料夾進行即時辨識以確認 AI 模型成效,相關操作步驟說 明如下: (1) 開啟 VisCam 軟體,透過左上角 選擇資料夾功能 。 (2) 點擊 開啟資料夾設定,可設定有資料夾 ( 圖片路徑 ) 、存檔路徑 ( 辨識資料結果存放路徑 ) 、Save PDF、OD-save xml ( 物件偵測專 用 ) 與 SE-save mask ( 分割專用 ) ,本次 AI 模型以物件偵測為主, 所以此次先勾選 Save PDF 與 OD-save xml,接著離開設定。 (3) 接著將需要檢測的零售商品圖片放入 VisCam 的 input 資料夾中 後,離開資料夾。 168 第八章 不只分類,還要知道位置 : AI 物件偵測
(4) 接下來,點擊 AI 右邊的設定 ,即開啟 AI 設定功能。需要將上 節所訓練的 AI 模型檔匯入此設定中,才能讓相機備有 AI 物件偵測 的即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、 影像寬、影像高、檢測門檻與使用 CPU,在此我們僅需輸入名稱 ( 零售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻 0.80( 數值越高 表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ,其餘系統會自動 匯入,完成後點擊 OK,AI 模型便新增完成,接著點擊右上角的離 開回到 VisCam 畫面。 169
(5)AI 功能畫面出現零售商品 AI 模型,滑鼠左鍵快速點擊兩下 ( 點擊 後 AI 模型變成紅色 ) ,將 AI 模型佈署至 VisCam 中。 (6) 接著點擊啟動,AI 模型將自動辨識這些圖片,辨識結束後點擊停止, 否則有其他圖片匯入 input 資料夾時,系統仍會即時辨識。 170 第八章 不只分類,還要知道位置 : AI 物件偵測
(7) 最後,進入 VisCam 的 output 資料夾中,便可看到剛才圖片透過 AI 模型所辨識的結果將以 PDF 檔案呈現,點入即可看辨識詳細內 容。 171
三 網路 ( 需先取得與啟動產品金鑰 ) :網路功能可將 AI 模型所辨識 的結果串接至其他程式進行 AI 應用,操作步驟如下: (1) 開啟 VisCam 軟體,透過左上角 選擇網路功能 。 (2) 點擊 開啟網路設定,可設定最大使用者與調整允許 IP 名單。 備註: 建議最大使用者別設定超過 5 位,否則執行起來辨識速度會遲緩。 (3) 離 開 網 路 設 定 , 開 啟 W i n d o w s 的 「 命 令 提 示 字 元 」 , 輸 入 「ipconfig」搜尋目前電腦的 IP4 位址,確認 IP 位址後在 VisCam 上的 IP 輸入 ( 如下圖 192.168.1.192) 且下方 Port 輸入 8080,即完 成網路設定。 172 第八章 不只分類,還要知道位置 : AI 物件偵測
(4) 接下來,點擊 AI 右邊的設定 ,即開啟 AI 設定功能。需要將上節 所訓練的 AI 模型檔匯入此設定中,才能讓相機備有 AI 物件偵測的 即時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影 像寬、影像高、檢測門檻與使用 CPU,在此我們僅需輸入名稱 ( 零 售商品 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.80( 數值越 高表示越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ,其餘系統會自 動匯入,完成後點擊 OK,AI 模型便新增完成,接著點擊右上角的 離開回到 VisCam 畫面。 (5)AI 功能畫面出現零售商品 AI 模型,滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ,將 AI 模型佈署至 VisCam 中。 173
(6) 點擊「開啟網頁」,進入到分類展示效果網頁,點擊下方「選擇圖 片」,選取所要放置的圖片後,點擊「AI 推論」立即出現 AI 模型 辨識結果,且 VisCam 也會同步出現 AI 模型辨識結果。 174 第八章 不只分類,還要知道位置 : AI 物件偵測
(7) 除了物件偵測效果展示外,也有 Web API 與範例程式供使用者進 行串接。其中範例程式共有 python、javascript 與 C++ 讓大家參 考並串接至相關應用程式。 物件偵測 175
NOT E 176 第八章 不只分類,還要知道位置 : AI 物件偵測
NOT E 177
9第 章 每一個像素都要檢測 : AI 影像分割 一、哪些模型可以用呢 ? 常見的影像分割模型 -------180 二、站在巨人的肩膀上 : 影像分割應用案例 ----------184 三、實戰時間 1 : 訓練自己的影像分割模型 -----------185 四、實戰時間 2 : 把模型導入檢測平台 ---------------192 178 第九章 每一個像素都要檢測 : AI 圖像分割
什麼是分割?影像分割是指將一張圖像分為多個區域或部分的過 程,使得每個區域都包含具有相似特徵的像素。這些區域可以是物體、 背景或物體的部分等,其目的是使圖像更容易被理解和處理。影像分 割在許多應用領域中都非常重要,例如:醫學圖像分析、自動駕駛、 物體識別、圖像檢索等。 Segmentation 分割 179
一 哪些模型可以用呢 ? 常見的影像分割模型 AI 訓練所需要的模型,並非越深越好,而是應視使用者所選的題 目難易度而定。簡單容易的題目通常是差異性較大,如:貓與狗、蘋 果與香蕉或飛機與汽車等,其特徵容易識別,所以通常建議選用較少 層數的神經網路進行模型訓練。反之,困難複雜的題目通常是指差異 性較小,如:秋田犬與柴犬、蜜蘋果與富士蘋果或稻米種類等,其特 徵不易識別,所以建議選用較多層數的神經網路模型進行模型訓練。 選擇所需要的神經網路模型是對 AI 模型生成至關重要的步驟,上 述雖說明了根據所選的題目難易度挑選神經網路,但現今神經網路如 此多,應要如何挑選呢?以下為大家介紹如何挑選適合的神經網路, 有助大家訓練 AI 模型能事半功倍。 180 第九章 每一個像素都要檢測 : AI 圖像分割
神經網路模型會以層數表示網路模型的複雜度,隨著層數的增加, 其網路模型越能捕捉到更抽象和複雜的特徵;但層數越多的網路模型 會需要更高階的運算電腦、訓練需要更長的時間、圖片的畫質需要更 高與容易產生過擬合,都將提高 AI 模型訓練的難度。 我們將所有的神經網路區分成三大類,分別為邊緣運算、一般泛 用以及深層計算,其中邊緣運算,這類網路模型是層數最少通常是少 於 18 層的神經網路,主要用於算力有限或需要高速檢測的應用場景。 再者,一般泛用這類網路模型其層數約在 40 至 160 層的神經網路, 能應用在大部分的檢測需求,並且在一般電腦算力下能將檢測精度最 大化。最後,深層計算這類網路模型其層數通常是超過 221 層的神經 網路,適合應用在較為複雜的檢測問題,其所需要的電腦算力要求也 較高。 181
大家若想嘗試自行訓練 AI 模型,以下針對初級使用者的相關建議: 一 算力不足的電腦:要透過 AI 進行模型訓練最低的 GPU(圖像顯示 器)至少要具備 6GB 的記憶體,如:NVIDIA GTX 1060 ( 6GB ) 以上, 低於此配備的 GPU 或未配置 GPU 的電腦都歸類在算力不足的電腦。 這類型的電腦因算力受限,所以在神經網路的選擇上,不建議選用深 層計算的神經網路模型進行訓練,且題目應以標記差異性大與不需大 量圖片為主。挑選網路模型的步驟如下: 步驟一 優先選擇 40 至 60 層 (XNet-1) 的神經網路模型,進行 AI 模型訓練, 生成 AI 模型後驗證其結果。 步驟二 根據驗證結果差異,會再選擇不同的神經網路模型,各種情況說明如下。 (1) 情況一、驗證結果符合需求:無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求:表示先前所選擇的神經網路層數不 足,導致 AI 模型無法訓練起來,建議挑選多層數的神經網路,如 100 至 110 層 (XNet-2) 的網路模型。 (3) 情況三、驗證結果為過擬合 (Overfitting) :過擬合是指 AI 模型在 訓練結果表現得很好,但當提供新圖片時會表現不佳的現象。發生 此情況時建議改挑選少層的神經網路,避免過擬合情形發生影響 AI 模型訓練結果。 步驟三 根據不同的 AI 模型結果透過步驟二的情況進行調整,直到驗證結果符 合需求。 182 第九章 每一個像素都要檢測 : AI 圖像分割
二 算力足夠的電腦:此類型的電腦通常已備妥相當程度的 GPU,以 因應各種 AI 模型訓練問題。這類型的電腦能訓練各種難易度的題目, 挑選網路模型的步驟如下: 步驟一 先確認題目的難易程度,若標記差異性大或不需大量圖片的題目,建 議優先使用 40 至 60 層 (XNet-1) 的神經網路模型,進行 AI 模型訓練, 生成 AI 模型後驗證其結果;反之,標記差異性小或需要大量圖片的題 目,建議優先使用 100 至 110 層 (XNet-2) 的神經網路模型,進行 AI 模 型訓練,生成 AI 模型後驗證其結果。 步驟二 根據驗證結果差異,會再選擇不同的神經網路模型,各種情況說明如下。 (1) 情況一、驗證結果符合需求:無須調整神經網路模型。 (2) 情況二、驗證結果未符合需求:表示先前所選擇的神經網路層數不 足,導致 AI 模型無法訓練起來,建議挑選多層數的神經網路,如 145 至 160 層 (XNet-3) 的網路模型。 (3) 情況三、驗證結果為過擬合 (Overfitting) :過擬合是指 AI 模型在 訓練結果表現得很好,但當提供新圖片時會表現不佳的現象。發生 此情況時建議改挑選少層 (XNet-2) 的神經網路,避免過擬合情形發 生影響 AI 模型訓練結果。 步驟三 根據不同的 AI 模型結果透過步驟二的情況進行調整,直到驗證結果符 合需求。 183
二 站在巨人的肩膀上 : 影像分割應用案例 AI 訓練所需要的模型,並非越深越好,而是應視使用者所選的題 目難易度而定。簡單容易的題目通常是差異性較大,如:貓與狗、蘋 果與香蕉或飛機與汽車等,其特徵容易識別,所以通常建議選用較少 層數的神經網路進行模型訓練。反之,困難複雜的題目通常是指差異 性較小,如:秋田犬與柴犬、蜜蘋果與富士蘋果或稻米種類等,其特 徵不易識別,所以建議選用較多層數的神經網路模型進行模型訓練。 案例一: AI 醫療小幫手—檢視疾病情形 大型醫療院所裡的醫生們每天都需要集中精神為民眾診斷與治 療,但有時因為疲勞讓集中力下降,使得誤診情形發生,輕微的可能 僅僅是給錯藥,嚴重的話患者可能會失去生命。 導入 AI 分割能有效分擔醫師們的工作,導入過程十分容易,首先 請醫師們蒐集並標記大量病兆圖片,接著設定好 AI 參數並執行模型訓 練,等待 AI 模型生成後,與醫院看診系統串接,即可完成 AI 看診系統。 導入 AI 影像分割讓 AI 成為醫生的小幫手, 患者藉由 X 光、MRI、CT 掃描等影像讓 AI 立 即分析與判斷初步病兆並回傳給主治醫師確 認,將大幅提升診斷精準度與縮減候診時間。 184 第九章 每一個像素都要檢測 : AI 圖像分割
實 戰 時 間 1. 訓練自己的影像分割模型 以下透過實際的 AI 圖像模型訓練軟體進行操作,讓大家進一步認 識 AI 分割,此次示範的軟體是由智泰科技所開發的 VisLab,操作說明 如下。 題目一:形狀 說明:AI 影像分割與其他功能主要的難度在於標記,需要將物件 輪廓標記完整,AI 訓練與辨識才能完整。因此建議初學者先從「簡單」 形狀開始孰悉分割標記操作,再延伸往多角度的形狀發展。 物件原圖 分割標記 難度:簡單 標記種類:3 圖片總數:206 張 算力需求:無需 GPU 操作步驟如下: 185
步驟一 在電腦桌面上新增資料夾,資料夾名稱為「形 狀」,接著在形狀資料夾內新增四個子資料夾, 分 別 命 名 為「train」、「test」、「verify」 與 「output」。 步驟二 將圖片分別放入「train」、「test」與「verify」資料夾中,圖片張數 分別是 train 為 146 張、test 為 30 張與 Verify 為 30 張,各種類圖片張 數盡可能平均。 步驟三 開啟 VisLab 並點擊進入分割的「標記工具」開始進行標記,順序如下: (1) 點擊「開新設定檔」出現目錄後點擊參考目錄,選取形狀資料夾中 的「train」資料夾按確定,將圖片匯入 VisLab 中。此處需留意頁數, 每一頁顯示 100 張圖片,超過會新增頁數。 (2) 標記工具視窗上方有標記所用之相關工具彙整下表。 186 第九章 每一個像素都要檢測 : AI 圖像分割
標記工具操作步驟如下: 步驟一 選擇所要標記的圖片後,點選所需要使用的標記工具 ,並選擇分類 標籤 ( 如圖示中的矩形,選擇分類標籤「矩形」 )。 步驟二 將滑鼠游標移至矩形的邊緣並按下滑鼠左鍵,接著沿著個轉折處按下 滑鼠左鍵,最後將矩形外圍連接起來。 步驟三 此時標記框呈現虛線狀態,可運用滑鼠調整標記框位置與大小。確認 標記無問題後,將滑鼠游標移出標記框外,按一下滑鼠左鍵,即可完 成標記。 187
備註: 標記過程軟體會自動儲存標記過的圖片。 步驟四 完成「train」資料夾標記後再重複步驟一至三將「test」與「verify」 資料夾中的圖片標記完成,完成標記後點擊左邊「回首頁」,點擊分 割的「訓練工具」。 步驟五 先將欲訓練之資料夾匯入 VisLab,首先將「train」資料夾放入「訓練 集」,接著將「test」資料夾放入「驗證集」,最後將「output」資料 夾放入「輸出位置」,即完成資料匯入。 188 第九章 每一個像素都要檢測 : AI 圖像分割
步驟六 設定「網路模型」、「影像資訊」及「學習參數」,因題目所辨識物 件特徵明顯,根據前面網路模型挑選方式,優先以 40 至 60 層 (Xnet-1) 的神經網路進行 AI 模型訓練,在 VisLab 軟體中選擇 VisNet-S1。接著, 此題目所使用的圖片尺寸最大為 200 X 200,為避免訓練不佳與訓練 時間過長,將「影像寬」與「影像高」均調為 200,「影像深」設為 3 ( 3 指的是彩色 ) 。最後,學習參數設定「迭代」 150 次、「批數量」 設為 2 及「學習率」設為 1 X 10-4,接著點擊開始訓練,訓練時間與 結果整理如下表圖。 待 AI 模型生成完成後,點擊「回首頁」,結束訓練。 189
步驟七 點擊進入分類器「驗證工具」, 將「verify」資料夾放入參考資料中, 接著將「output」資料夾中的 AI 模型檔案 ( .pbz ) 放入 AI 模型檔, 分類標籤系統會自行帶入,即完成資料佈署工作。點擊「開始分析」 進行 AI 模型驗證,右下方準確率達 94.97% 若想瞭解各分類標籤辨識情形,可點選單類分類標籤便能明白各標籤 的辨識結果,使用者可針對需加強的分類標籤新增圖片再進行訓練。 190 第九章 每一個像素都要檢測 : AI 圖像分割
備註: 右上方統計有四個不同顏色的表格,其內容整理如下: 其中真值 = 正確數 + 漏檢數 AI 模型成績不如預期要如何提高呢? 先透過驗證工具了解哪種分類標籤辨識成績較低,有幾 種方式可改善 AI 模型成績: 1. 圖片過少:針對成績較低分類標籤蒐集大量圖片。 2. 標記有誤:進入標記工具重新修正標記再進行 AI 模型 訓練即可。 3. 訓練次數不足:增加迭代。 4. 影像設定:確認圖片實際像素再修正影像寬與高。 191
實 戰 時 間 2. 把模型導入檢測平台 AI 模型如同人的大腦記憶,光有大腦記憶是不夠的,需要搭配其 他功能才可有效發揮大腦中的記憶並應用,AI 模型也是如此。 上節透過 VisLab 軟體來生成 AI 模型,本節將運用與 VisLab 搭配 的 VisCam ( AI 影像偵測模組 ) 執行實物辨識與串接。VisCam 中有三 大功能分別是相機 ( camera ) 、資料夾 ( folder ) 及網路 ( web ) ,各 自功能介紹與操作說明如下: 一 相機:將 AI 模型導入後,使用者可透過 webcam、實物投影機或 筆電鏡頭即可進行實物辨識,操作方式如下: (1) 開啟 VisCam 軟體,透過左上角 ( 需取得與啟動產品金鑰才能 開啟 ) 選擇相機功能 。 (2) 點擊 開啟相機設定,由於上節 AI 模型的訓練,所使用的影像資 訊為 200 X 200,因此影像格式需要盡量找最接近的為優先,所以 此次選擇 320 X 240,接著點擊下方啟動始完成相機設定。 備註: 相機設定會根據使用者所安裝的相機規格不同,導致有部分功能選項 與作者不同或無法使用。 192 第九章 每一個像素都要檢測 : AI 圖像分割
(3) 接下來,點擊 AI 右邊的設定 ,即開啟 AI 設定功能。需要將上節 所訓練的 AI 模型檔匯入此設定中,才能讓相機備有 AI 分割的即時 辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像寬、 影像高、檢測門檻與使用 CPU,在此我們僅需輸入名稱 ( 形狀 ) 、 模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.70( 數值越高表示越嚴 格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ,其餘系統會自動匯入,完 成後點擊 OK,AI 模型便新增完成,接著點擊右上角的離開回到 VisCam 畫面。 193
(4)AI 功能畫面出現形狀 AI 模型,滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ,將 AI 模型佈署至 VisCam 中。此時,可拿這分類 標籤中的三種形狀放置鏡頭下進行即時辨識,即完成 AI 相機佈署與 操作。 194 第九章 每一個像素都要檢測 : AI 圖像分割
二 資料夾 ( 需先取得與啟動產品金鑰 ) :有時因題目關係,會需要將 圖片放置於資料夾進行即時辨識以確認 AI 模型成效,相關操作步驟說 明如下: (1) 開啟 VisCam 軟體,透過左上角 選擇資料夾功能 。 (2) 點擊 開啟資料夾設定,可設定有資料夾 ( 圖片路徑 ) 、存檔路徑 ( 辨識資料結果存放路徑 ) 、Save PDF、OD-save xml ( 物件偵測專 用 ) 與 SE-save mask ( 分割專用 ) ,本次 AI 模型以分割為主,所 以此次先勾選 Save PDF 與將 SE-save mask,接著離開設定。 (3) 接著將需要檢測的形狀圖片放入 VisCam 的 input 資料夾中後,離 開資料夾。 195
(4) 接下來,點擊 AI 右邊的設定 ,即開啟 AI 設定功能。需要將上 節所訓練的 AI 模型檔匯入此設定中,才能讓相機備有 AI 分割的即 時辨識功能。功能介面會看到名稱、模式、模型、分類標籤、影像 寬、影像高、檢測門檻與使用 CPU,在此我們僅需輸入名稱 ( 形狀 ) 、模型 ( 上節的 AI 模型檔 ) 、檢測門檻暫訂 0.70( 數值越高表示 越嚴格 ) 與使用 CPU ( 若無 GPU 請勾選 ) ,其餘系統會自動匯入, 完成後點擊 OK,AI 模型便新增完成,接著點擊右上角的離開回到 VisCam 畫面。 196 第九章 每一個像素都要檢測 : AI 圖像分割
(5)AI 功能畫面出現形狀 AI 模型,滑鼠左鍵快速點擊兩下 ( 點擊後 AI 模型變成紅色 ) ,將 AI 模型佈署至 VisCam 中。 (6) 接著點擊啟動,AI 模型將自動辨識這些圖片,辨識結束後點擊停止, 否則有其他圖片匯入 input 資料夾時,系統仍會即時辨識。 197
(7) 最後,進入 VisCam 的 output 資料夾中,便可看到剛才圖片透過 AI 模型所辨識的結果將以 PDF 檔案呈現,點入即可看辨識詳細內 容。 198 第九章 每一個像素都要檢測 : AI 圖像分割
199
三 網路 ( 需先取得與啟動產品金鑰 ) :網路功能可將 AI 模型所辨識 的結果串接至其他程式進行 AI 應用,操作步驟如下: (1) 開啟 VisCam 軟體,透過左上角 選擇網路功能 。 (2) 點擊 開啟網路設定,可設定最大使用者與調整允許 IP 名單。 備註: 建議最大使用者別設定超過 5 位,否則執行起來辨識速度會遲緩。 (3) 離 開 網 路 設 定 , 開 啟 W i n d o w s 的 「 命 令 提 示 字 元 」 , 輸 入 「ipconfig」搜尋目前電腦的 IP4 位址,確認 IP 位址後在 VisCam 上的 IP 輸入 ( 如下圖 192.168.1.192) 且下方 Port 輸入 8080,即完 成網路設定。 200 第九章 每一個像素都要檢測 : AI 圖像分割
Search
Read the Text Version
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 109
- 110
- 111
- 112
- 113
- 114
- 115
- 116
- 117
- 118
- 119
- 120
- 121
- 122
- 123
- 124
- 125
- 126
- 127
- 128
- 129
- 130
- 131
- 132
- 133
- 134
- 135
- 136
- 137
- 138
- 139
- 140
- 141
- 142
- 143
- 144
- 145
- 146
- 147
- 148
- 149
- 150
- 151
- 152
- 153
- 154
- 155
- 156
- 157
- 158
- 159
- 160
- 161
- 162
- 163
- 164
- 165
- 166
- 167
- 168
- 169
- 170
- 171
- 172
- 173
- 174
- 175
- 176
- 177
- 178
- 179
- 180
- 181
- 182
- 183
- 184
- 185
- 186
- 187
- 188
- 189
- 190
- 191
- 192
- 193
- 194
- 195
- 196
- 197
- 198
- 199
- 200
- 201
- 202
- 203
- 204
- 205
- 206
- 207
- 208
- 209
- 210
- 211
- 212
- 213
- 214
- 215
- 216
- 217
- 218
- 219
- 220
- 221
- 222
- 223
- 224
- 225
- 226
- 227
- 228
- 229
- 230
- 231
- 232
- 233
- 234
- 235
- 236
- 237
- 238
- 239
- 240
- 241
- 242
- 243
- 244
- 245
- 246
- 247
- 248
- 249
- 250
- 251
- 252
- 253
- 254
- 255
- 256
- 257
- 258
- 259
- 260
- 261
- 262
- 263
- 264
- 265
- 266
- 267
- 268
- 269
- 270