ຄາໍ ຂອບໃຈ ການຂຽນບດົ ວທິ ະຍານພິ ນົ ລະດບັ ປະລນິ ຍາໂທ ສະບບັ ນີປ້ ະສົບຜນົ ສໍາເລດັ ໄປດວ້ ຍດໂີ ດຍການຮ່ວມມຂື ອງ ຫຼາຍພາກສ່ວນທງັ ຈາກບຸກຄນົ ແລະ ການຈັດຕັ້ີງ ກໍຍ້ອນວ່າໄດ້ຮັບຄວາມຊວ່ ຍເຫືຼອ, ການເອາົ ໃຈໃສ່ ແລະ ໃຫຄ້ ໍາ ແນະນາໍ ໃນການດັດແປງແກໄ້ ຂຂບໍີ້ ກົ ຜ່ອງການຕກົ ເຫຍ່ ເສຍຫາຍຂອງຂໍມ້ີ ນູ ຕ່າງໆ ເຊິ່ງແມນ່ ໄດຮ້ ັບການຊວ່ ຍເຫຼືອ ຈາກອາຈານທິ່ເີ ປນັ ທປ່ິີ ຶກສາທງັ ສອງທ່ານຄ:ື ອຈ.ປອ ນ.ລດັ ສະໝີ ຈດິ ຕະວງົ ແລະ ອຈ.ປທ ສມົ ມດິ ທມຸ ມາລີ ທິີ່ ໄດ້ຊວ່ ຍໃຫ້ຄາໍ ປກຶ ສາ ແລະ ແກ້ໄຂຂໍ້ີບກົ ຜອ່ ງຕ່າງໆຂອງບດົ ຄນີົ້ ຄ້ວານຈີ້ ນົ ເຮດັ ໃຫ້ການຂຽນວິທະຍານິພນົ ສໍາເລດັ ຢ່າງສມົ ບນູ . ຂ້າພະເຈີ້າົ ເປນັ ນັກສກຶ ສາປະລນິ ຍາໂທ ພາກວຊິ າ ວິທະຍາສາດຄອມພວິ ເຕີ ຄະນະວິທະຍາຊາດທາໍ ມະຊາດ ມະຫາວທິ ະຍາໄລແຫ່ງຊາດ ໃນນາມເປນັ ຜູຂ້ ຽນບດົ ຂໍສະແດງຄວາມຮບູ້ ຸນຄຸນ ແລະ ຂໍຂອບໃຈເປັນຢາ່ ງສງູ ມາຍງັ ອາຈານໃນພາກວຊິ າ ວິທະຍາສາດຄອມພິວເຕີ, ຄະນະວທິ ະຍາຊາດທາໍ ມະຊາດ ໃນການສິດສອນຄວາມຮ້ໃູ ນ ຂະແໜງຕ່າງໆ ແລະ ໄດຖ້ ່າຍທອດຄວາມຮູອ້ ນັ ມີຄາ່ ໃຫຂ້ ້າພະເຈົີາ້ ໃນຊວ່ ງໄລຍະເວລາທີິ່ໄດສ້ ຶກສາຮໍາ່ິ ຮຽນຢໃູ່ ນ ມະຫາວິທະຍາໄລແຫງ່ ນ.ີ້ ພອ້ ມກັນນີ້, ກສໍ ະແດງຄໍາຂອບໃຈນໍາບນັ ດາໝ່ຄູ ນູ່ ກັ ສກຶ ສາປະລນິ ຍາໂທທ່ິີໄດຮ້ ຽນນາໍ ກັນ ມາທຸກທາ່ ນ ທິ່ໄີ ດໃ້ ຫ້ຄວາມຊວ່ ຍເຫືອຼ , ຮກັ ແພງ ແລະ ສາມັກຄີກນັ ໃນການອາໍ ນວຍຄວາມສະດວກໃນທກຸ ໆດາ້ ນ ເປັນຢາ່ ງດີ ເຮດັ ໃຫຂ້ ້າພະເຈ້ີົາສາມາດຂຽນວິທະຍານິພນົ ນລ້ີ ລຸ ວ່ ງສໍາເລັດໄປດວ້ ຍດີ. ຂໍສະແດງຄໍາຂອບໃຈ ແລະ ຄວາມຮບູ້ ນຸ ຄນຸ ມາຍງັ ການຈັດຕງັີ້ ຂອງໂຮງໝໍ 5 ເມສາ ກົມໃຫຍ່ພະລາທກິ ານ ກະຊວງປອ້ ງກັນຄວາມສະຫງບົ ທໄີ່ິ ດ້ອໍານວຍຄວາມສະດວກຕ່າງໆໃນການລງົ ໄປເກັບກາໍ ຂມີໍ້ ນູ ໃນຄີງ້ັ ນີ້ ແລະ ຂໍ ຂອບໃຈມາຍັງອໍານວຍການໂຮງໝໍ 5 ເມສາທ່ານ ດຣ ນ.ພດຸ ມາລາ ພນັ ທະມດິ ທີເິ່ ຫນັ ດີໃຫຂ້ າ້ ພະເຈີາ້ົ ເອົາຂໍມີ້ ນູ ຈາກ ຫ້ອງວິເຄາະ ເພິອື່ ນາໍ ໄປໃຊ້ໃນການຂຽນບດົ ຄົີ້ນຄ້ວາ. ຂຂໍ ອບໃຈມາຍັງພິ່ໍ, ແມ່, ອາ້ ຍ, ເອອ້ີຶ ຍ, ນອ້ ງທໃ່ິ ຫ້ການຊຸກຍູ້ ສິົງ່ ເສມີ , ໃຫກ້ ໍາລັງໃຈ, ໃຫຄ້ າໍ ແນະນໍາ ແລະ ແລກປ່ຽນຄາໍ ຄດິ ຄໍາເຫັນໃຫ້ຂາ້ ພະເຈີາົ້ . ທ້າຍສຸດນ້ີ ຂອໍ ວຍພອນໄຊໃຫ້ບນັ ດາທ່ານ, ຈງົ່ິ ມີສກຸ ຂະພາບເຂັມ້ີ ແຂງປະສະຈາກໂລກໄພ, ປະສົບຜນົ ສາໍ ເລັດໃນໜາ້ ທີກ່ິ ານງານ ແລະ ມຄີ ວາມຜາສກຸ ໃນຄອບຄວົ ຕະຫອຼ ດໄປ. ຮຽນດ້ວຍຄວາມເຄາົ ລົບນບັ ຖຢື ່າງສູງ ທ້າວ ດາວເພດັ ວໄິ ລນາມ i
ບົດຄດັ ຫຍ້ີໍ ໃນວທິ ະຍານພີ ົນສະບບັ ນມ້ີ ຈີ ດຸ ປະສງົ ເພອິື່ ສກຶ ສາຂນີັ້ ຕອນວທິ ີການຂດຸ ຄນ້ີົ ຂໍ້ີມູນ (Data Mining) ໂດຍນໍາ ໃຊວ້ ທິ ີ ແລະ ເຕັກນກິ ການຈໍາແນກຂ້ີມໍ ນູ ໃນຮບູ ແບບທີິ່ມກີ ານຝກຶ ສອນເຊິ່ງເປັນໜງຶິ່ ໃນເຕັກນກິ ໃນການຂດຸ ຄນ້ົີ ຂ້ີໍ ມນູ (Data Mining) ເຊງ່ິ ໄດ້ແບ່ງຂໍມີ້ ນູ ອອກເປນັ ສອງຊຸດຍອ່ ຍຄື: ຊຸດຂມ້ີໍ ນູ ການຝຶກສອນ ແລະ ຊດຸ ຂີມໍ້ ນູ ການທດົ ສອບ, ຊດຸ ຂີໍມ້ ູນການຝຶກສອນໃຊເ້ ພອ່ິື ສາ້ ງຮູບແບບ (Model) ສວ່ ນຊຸດຂມີໍ້ ູນການທດົ ສອບໃຊ້ເພິ່ອື ຫາປະສດິ ຕິພາບ ຂອງຮູບແບບ (Model) ໂດຍການປະເມນີ ປະສດິ ທິພາບຂອງຮູບແບບແມນ່ ໃຊມ້ າຕິຣດສບັ ສນົ (Confusion Matrix) ເຊິງ່ ຂ້ມີໍ ນູ (Data Set) ໃນການຄ້ີນົ ຄ້ວາຄງັ້ີ ນີແ້ ມ່ນໄດ້ນໍາໃຊຜ້ ນົ ການກວດເລອື ດໃນຊ່ວງປີ 2019-2020 ຂອງໂຮງໝໍ 5 ເມສາ ໃນຫອ້ ງວິເຄາະວິທະຍາ ມາເປັນຂ້ມໍີ ນູ ໃນການວໄິ ຈຄງັີ້ ນ້ີ ເຊິ່ງໄດ້ນໍາໃຊວ້ ທິ ີການຂດຸ ຄນ້ົີ ຂໍ້ມີ ນູ (Data Mining) ໃນສາມຮູບແບບຄື: ການຕັດສິນໃຈແບບຕົນ້ີ ໄມ້ (Decision Tree), ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network), ການຈາໍ ແນກແບບ Naive Bayes ແລະ ໃຊ້ເຄິອ່ື ງມໂື ປຣແກຣມ (Orange Tool) ໃນ ການຈໍາແນກຜົນຂອງການຄົ້ີນຄວ້ າ, ຫັຼງຈາກນນ້ີັ ນາໍ ເອາົ ຮບູ ແບບທດີິ່ ທີ ິີສ່ ດຸ ມາເປນັ ຕວົ ຕນີ້ົ ແບບ (Model) ໃນການ ພດັ ທະນາໂປຣແກຣມ. ຈາກຜນົ ການທົດລອງສາມາດສະແດງຜນົ ທິີ່ໄດຮ້ ັບຄ:ື ຈາກຂມ້ີໍ ູນ Data set 1543 ຄນົ , ທມ່ິີ ຄີ າ່ ຄວາມສຽ່ ງ Risk 742 ຄົນ ແລະ ບສິໍ່ ຽ່ ງ Non-Risk 801 ຄນົ , ເຊງ່ິ ໃນຮບູ ແບບການຕັດສນິ ໃຈແບບຕນ້ົີ ໄມ້ (Decision Tree) ມີຄວາມຊດັ ເຈນ 97.1%, ໃນຮູບແບບເຄອື ຂ່າຍປະສາດທຽມ (Neural Network) ມີຄວາມຊັດເຈນ 90.4% ແລະ ການຈາໍ ແນກແບບ Naive Bayes ມີຄວາມຊັດເຈນ 88.2% ແລວ້ ເອົາຮບູ ແບບ (Model) ທີມິ່ ີຄວາມຊດັ ເຈນ ສດຸ ຄ:ື ຮບູ ແບບການຕດັ ສນິ ໃຈແບບຕົ້ນີ ໄມ້ (Decision Tree) ມາເປັນໂຕຕນີ້ົ ແບບໃນການພດັ ທະນາໂປຣແກຣມ. ii
Abstract The purpose of this dissertation to study the procedures of data mining methods using methods and techniques in a trained format, which is part of the data mining techniques, which are divided into two sub-sets: The training data set and test data set, the training data set used to create the model while the test data set used to find the effectiveness of the model by evaluating the effectiveness of the model is using a confusion matrix The data in this research are based on the results of blood tests during the period 2019-2020 in the laboratory of Hamesa hospital as data in this research. It uses Data Mining in three ways: Decision Tree, Neural Network, Naive Bayes and Orange Tool to analyze of the research, then take the best model into the prototype in program development. From the experimental results so the results can be as follows: From the data set of 1543 people, the risk value is 742 people and the non-risk person is 801 people. In the Decision Tree format with 97.1% accuracy, in the Neural Network with 90.4% and in the Naive Bayes mode with 88.2% accuracy, then take the model the most accurate is: Decision Tree as a model for program development. iii
ສາລະບານ ຄາໍ ຂອບໃຈ................................................................................................................................. i ບົດຄດັ ຫຍີ້ໍ ................................................................................................................................ii Abstract ................................................................................................................................iii ສາລະບານ................................................................................................................................ iv ສາລະບານຕາຕະລາງ................................................................................................................... vi ສາລະບານຮບູ .......................................................................................................................... vii ຄໍາສບັ ຫຍໍ້ີ ..............................................................................................................................viii ພາກທີ 1 ບົດນໍາ ........................................................................................................................ 1 1.1 ຄວາມເປນັ ມາ ແລະ ສະພາບບນັ ຫາ ...................................................................................... 1 1.2 ຄໍາຖາມຄົີນ້ ຄວາ້ ............................................................................................................... 2 1.3 ຈດຸ ປະສົງ ....................................................................................................................... 2 1.4 ສມົ ມດຸ ຖານ.................................................................................................................... 3 1.5 ຜົນປະໂຫຍດຂອງການສຶກສາ.............................................................................................. 3 ພາກທີ 2 ທບົ ທວນເອກະສານ ແລະ ຂອບເຂດແນວຄວາມຄດິ .............................................................. 4 2.1 ທບົ ທວນເອກະສານ ແລະ ທິດສະດີທີິ່ກຽ່ ວຂ້ອງ....................................................................... 4 2.1.1 ຂໍີມ້ ນູ ກ່ຽວກັບເລອື ດ ........................................................................................................ 4 2.1.2 ການຂດຸ ຄນົີ້ ຂມໍີ້ ູນ (DATA MINING) .............................................................................. 6 2.1.3 ຂັີ້ນຕອນການຂດຸ ຄ້ນີົ ຂ້ີໍມູນ ................................................................................................. 6 2.1.4 ເຕັກນິກການຂດຸ ຄີ້ນົ ຂໍມີ້ ູນ .................................................................................................. 8 2.1.5 ການແບ່ງປະເພດ ແລະ ການຄາດຄະເນ (CLASSIFICATION AND PREDICTION) .............................. 8 2.1.6 ການວິເຄາະເພ່ອືິ ຈດັ ກຸ່ມ (CLUSTERING ANALYSIS) ............................................................... 8 2.1.7 ການວເິ ຄາະຄວາມສາໍ ພນັ (ASSOCIATION ANALYSIS) ............................................................ 8 2.1.8 ການແບງ່ ປະເພດດວ້ ຍຕົີ້ນໄມ້ການຕດັ ສນິ ໃຈ (DECISION TREE CLASSIFICATION).......................... 9 2.1.9 ສວ່ ນປະກອບຂອງຕົີ້ນໄມ້ການຕັດສິນໃຈ................................................................................. 9 2.1.10 ເຄອື ຂ່າຍປະສາດທຽມ (NEURAL NETWORK) .................................................................... 10 2.1.11 ACTIVATION FUNCTION ............................................................................................ 10 2.1.12 ການຈໍາແນກປະເພດແບບ NAIVE BAYES .......................................................................... 11 2.1.13 ພາສາ (SQL) ............................................................................................................. 12 2.1.14 ຊອບແວຂດຸ ຄ້ນົີ ຂມໍີ້ ູນ (ORANGE TOOL) ............................................................................ 12 2.1.15 K-FOLD CROSS VALIDATION...................................................................................... 13 2.1.16 CONFUSION MATRIX................................................................................................. 13 2.2 ທົບທວນບົດຄນ້ົີ ຄວາ້ ວິທະຍາສາດທິກ່ີ ່ຽວຂ້ອງ ....................................................................... 14 iv
2.3 ຂອບເຂດແນວຄວາມຄດິ .................................................................................................. 16 ພາກທີ 3 ວທິ ີການສຶກສາ.......................................................................................................... 17 ການອອກແບບການສກຶ ສາ................................................................................................ 17 3.1.1 ການກໍານດົ ເນ້ີອື ໃນ ........................................................................................................ 17 3.1.2 ການຄັດເລືອກພ້ນີື ທ.່ິີ ...................................................................................................... 17 3.1.3 ໄລຍະເວລາການສຶກສາ ................................................................................................... 17 3.2 ຂມ້ີໍ ນູ ການສກຶ ສາ ............................................................................................................ 17 3.2.1 ບັນດາຂໍີມ້ ນູ ການສຶກສາ ................................................................................................... 18 3.2.2 ວທິ ເີ ກບັ ກາໍ ຂໍີ້ມູນ .......................................................................................................... 18 3.2.3 ເຄອິ່ື ງມືທນິ່ີ ໍາໃຊ້ເກບັ ກໍາຂີ້ມໍ ູນ............................................................................................. 19 3.3 ການວິເຄາະຂມ້ີໍ ນູ ແລະ ການອະທິບາຍຜນົ ............................................................................ 19 3.3.1 ການສາ້ ງແບບຈໍາລອງຕນີ້ົ ໄມຕ້ ັດສນິ ໃຈ (DECISION TREE MODEL)........................................... 22 3.3.2 ການສາ້ ງແບບຈາໍ ລອງເຄອື ຂາ່ ຍປະສາດທຽມ (NEURAL NETWORK MODEL) ............................... 26 3.3.3 ການສ້າງແບບຈໍາລອງ NAIVE BAYES MODEL................................................................... 27 3.3.4 ຂີ້ັນຕອນການນໍາຂີ້ໍມູນເຂີາົ້ ໃນ (ORANGE TOOL) ................................................................... 29 3.3.5 ຖານຂມໍ້ີ ູນທໃ່ິີ ຊ້ໃນການພັດທະນາໂປຣແກຣມ......................................................................... 31 ພາກທີ 4 ຜນົ ການສຶກສາ ແລະ ການສນົ ທະນາ .............................................................................. 34 4.1 ຜນົ ການສກຶ ສາ............................................................................................................... 34 4.1.1 ຜົນຂມໍີ້ ນູ TRAINING SCORE ......................................................................................... 39 4.1.2 ຜນົ ຂໍມີ້ ນູ TEST SCORE ................................................................................................ 40 4.1.3 ຜນົ ການພັດທະນາລະບົບ................................................................................................. 41 4.2 ການສົນທະນາ............................................................................................................... 46 ພາກທີ 5 ສະຫຼຸບ, ຂີຈໍ້ ໍາກັດ ແລະ ຂແີ້ໍ ນະນາໍ ໃນການສຶກສາ ................................................................. 47 5.1 ສະຫຼຸບຜນົ ໃນການສກຶ ສາ.................................................................................................. 47 5.2 ຂຈໍີ້ ໍາກດັ ໃນການສກຶ ສາ..................................................................................................... 48 5.3 ຂ້ີໍແນະນໍາໃນການສກຶ ສາ ................................................................................................... 48 ເອກະສານອ້າງອີງ...................................................................................................................... 49 ເອກະສານຊອ້ ນທ້າຍ.................................................................................................................. 51 v
ສາລະບານຕາຕະລາງ ຕາຕະລາງທີ 2.1: ສະແດງໃຫ້ເຫັນຄວາມໝາຍແຕ່ລະຄ່າຂອງເມັດເລອື ດ................................................... 5 ຕາຕະລາງທີ 2.2: Confusion Matrix ......................................................................................... 14 ຕາຕະລາງທີ 3.1: ແຜນພາບການກາໍ ນດົ ເນີ້ືອໃນຂອງບດົ ຄນ້ົີ ຄວ້ າ........................................................... 17 ຕາຕະລາງທີ 3.2: ຂໍ້ມີ ນູ ແລະ ລາຍລະອຽດທ່ຈິີ ະນາໍ ມາຄົນ້ີ ຄວ້ າໃນບດົ ນ້ີ ................................................ 18 ຕາຕະລາງທີ 3.3: ແບບຢາ່ ງຂໍມີ້ ນູ ທ່ິີໄດຜ້ ່ານ Preprocessing .............................................................. 21 ຕາຕະລາງທີ 3.4: ຄາ່ ລະດບັ ເລືອດ Risk........................................................................................ 21 ຕາຕະລາງທີ 3.5: ຄ່າລະດັບເລືອດ Non-Risk ................................................................................ 22 ຕາຕະລາງທີ 3.6: ແບບຢາ່ ງຂໍມ້ີ ນູ ທິ່ຈີ ະມາເຮດັ ແບບຕີ້ົນໄມ້.................................................................. 22 ຕາຕະລາງທີ 3.7: ຄາ່ ຂອງ RBC ທຽບໃສ່ Level (Risk, Non-Risk)................................................. 23 ຕາຕະລາງທີ 3.8: ຄາ່ ຂອງ HGB ທຽບໃສ່ Level (Risk, Non-Risk) ................................................ 23 ຕາຕະລາງທີ 3.9: ຄ່າຂອງ HCT ທຽບໃສ່ Level (Risk, Non-Risk)................................................. 24 ຕາຕະລາງທີ 3.10: ຄາ່ ຂອງ WBC ທຽບໃສ່ Level (Risk, Non-Risk).............................................. 24 ຕາຕະລາງທີ 3.11: ຄ່າຂອງ PLT ທຽບໃສ່ Level (Risk, Non-Risk) ............................................... 25 ຕາຕະລາງທີ 3.12: ແບບຢາ່ ງຂມໍີ້ ນູ ທຈ່ີິ ະມາເຮດັ Naive Bayes........................................................... 27 ຕາຕະລາງທີ 3.13: ຄາ່ ຂອງ RBC ທຽບໃສ່ Level (Risk, Non-Risk) ການຄິດໄລຄ່ າ່ Probability ......... 27 ຕາຕະລາງທີ 3.14: ຄາ່ ຂອງ HGB ທຽບໃສ່ Level (Risk, Non-Risk) ການຄດິ ໄລ່ຄ່າ Probability......... 28 ຕາຕະລາງທີ 3.15: ຄາ່ ຂອງ HCT ທຽບໃສ່ Level (Risk, Non-Risk) ການຄິດໄລ່ຄາ່ Probability ......... 28 ຕາຕະລາງທີ 3.16: ຄາ່ ຂອງ WBC ທຽບໃສ່ Level (Risk, Non-Risk) ການຄິດໄລຄ່ າ່ Probability........ 28 ຕາຕະລາງທີ 3.17: ຄາ່ ຂອງ PLT ທຽບໃສ່ Level (Risk, Non-Risk) ການຄດິ ໄລຄ່ າ່ Probability.......... 29 ຕາຕະລາງທີ 3.18: Tb_ Patient ຂມີໍ້ ນູ ຄນົ ເຈບັ .............................................................................. 31 ຕາຕະລາງທີ 3.19: Tb_ Test ຂ້ໍມີ ນູ ການກວດເລອື ດຄົນເຈບັ ............................................................. 32 ຕາຕະລາງທີ 3.20: Tb_TestDetail ຂີ້ໍມນູ ລາຍລະອຽດການກວດເລອື ດ............................................... 32 ຕາຕະລາງທີ 3.21: Tb_Login ຂີມໍ້ ູນການເຂົີາ້ ໃຊລ້ ະບບົ ................................................................... 33 ຕາຕະລາງທີ 4.1: ສະແດງຜນົ ຂໍີມ້ ນູ ແລະ ຜນົ ຂອງການກວດເລອື ດ (CBC) ........................................... 34 ຕາຕະລາງທີ 4.2: ສະແດງຜນົ ຂີໍມ້ ນູ ເພດ (1=ຊາຍ, 0=ຍງິ ) ................................................................ 35 ຕາຕະລາງທີ 4.3: ສະແດງຜນົ ຂໍ້ມີ ນູ Level..................................................................................... 39 ຕາຕະລາງທີ 4.4: ຜນົ ຂອງ Confusion Matrix Test and Score ການຕດັ ສິນໃຈແບບຕ້ນີົ ໄມ້.................. 39 ຕາຕະລາງທີ 4.5: ຜນົ ຂອງ Confusion Matrix Test and Score ເຄອື ຂ່າຍປະສາດທຽມ........................ 40 ຕາຕະລາງທີ 4.6: ຜນົ ຂອງ Confusion Matrix Test and Score Naive Bayes ................................. 40 ຕາຕະລາງທີ 4.7: ຜນົ ຂອງ Confusion Matrix Predictions ການຕັດສນິ ໃຈແບບຕີົນ້ ໄມ້ ....................... 40 ຕາຕະລາງທີ 4.8: ຜນົ ຂອງ Confusion Matrix Predictions ເຄືອຂ່າຍປະສາດທຽມ ............................. 41 ຕາຕະລາງທີ 4.9: ຜນົ ຂອງ Confusion Matrix Predictions Naive Bayes....................................... 41 ຕາຕະລາງທີ 5.1: ສະຫຼຸບຜນົ ລວມຂອງການຄນ້ົີ ຄວ້ າ ......................................................................... 47 vi
ສາລະບານຮບູ ຮບູ ທີ 2.1: ຮູບເມດັ ເລືອດ ..................................................................................................................... 5 ຮບູ ທີ 2.2: ແຜນວາດການຂດຸ ຄນ້ົີ ຂີມ້ໍ ູນໃນການຄນ້ີົ ຫາຄວາມຮູ້.................................................................... 7 ຮບູ ທີ 2.3: ຕ້ີນົ ໄມກ້ ານຕັດສິນໃຈ ..........................................................................................................10 ຮບູ ທີ 2.4: ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network) ..........................................................................10 ຮບູ ທີ 2.5: Activation Function (Udeme, 2018)............................................................................11 ຮບູ ທີ 2.6: ຊອບແວຂດຸ ຄີ້ນົ ຂ້ໍມີ ນູ (ORANGE) .................................................................................13 ຮບູ ທີ 3.1: ແຜນພາບລວມແບບການສຶກສາ ແລະ ອະທິບາຍຜົນ.......................................................... 20 ຮູບທີ 3.2: ແບບຈາໍ ລອງຕນ້ີົ ໄມ້ຕັດສນິ ໃຈ....................................................................................... 25 ຮູບທີ 3.3: ສະແດງໃຫ້ເຫັນແບບຂີໍ້ມນູ ໃນ Neural Network ມີຜນົ ອອກຢູ່ສອງຄາ່ Non-Risk ແລະ Risk . 26 ຮູບທີ 3.4: ການປບັ ຄາ່ Neural Network ໃນ Orange.................................................................... 26 ຮບູ ທີ 3.5: ການເອົາຂ້ີໍມນູ ເຂາີົ້ Orange .......................................................................................... 29 ຮູບທີ 3.6: ໂຄງສາ້ ງ Diagram ຂອງຖານຂໍີ້ມນູ ............................................................................... 33 ຮບູ ທີ 4.1: ຜນົ ການກະຈາຍຂອງເພດ ............................................................................................ 35 ຮບູ ທີ 4.2: ຜນົ ການກະຈາຍຂອງອາຍຸ ............................................................................................ 36 ຮບູ ທີ 4.3: ຜນົ ການກະຈາຍຂອງ RBC ......................................................................................... 36 ຮູບທີ 4.4: ຜນົ ການກະຈາຍຂອງ HGB......................................................................................... 37 ຮູບທີ 4.5: ຜນົ ການກະຈາຍຂອງ HCT ......................................................................................... 37 ຮູບທີ 4.6: ຜນົ ການກະຈາຍຂອງ WBC ........................................................................................ 38 ຮບູ ທີ 4.7: ຜນົ ການກະຈາຍຂອງ PLT .......................................................................................... 38 ຮູບທີ 4.8: ຜນົ ການກະຈາຍຂອງ Level ........................................................................................ 39 ຮບູ ທີ 4.9: ໜ້າຟອມຫັກຼ ............................................................................................................ 42 ຮູບທີ 4.10: ຟອມຈດັ ການຂີ້ໍມນູ ຄນົ ເຈບັ ........................................................................................ 42 ຮບູ ທີ 4.11: ຟອມປອ້ ນຂມ້ໍີ ນູ ເລອື ດຕາ່ ງໆ....................................................................................... 43 ຮບູ ທີ 4.12: ຟອມຄໍານວນຜົນການກວດເລອື ດ ................................................................................ 44 ຮບູ ທີ 4.13: ສະແດງຜນົ ການກວດເລອື ດ ....................................................................................... 45 vii
ຄໍາສັບຫຍໍີ້ CBC: Complete Blood Count RBC: Red Blood Cell HGB: Hemoglobin HCT: Hematocrit WBC: White Blood Cell Count PLT: Platelet Count viii
ພາກທີ ບດົ ນາໍ 1.1 ຄວາມເປນັ ມາ ແລະ ສະພາບບນັ ຫາ ປດັ ຈບຸ ນັ ປະລິມານຂມໍີ້ ູນກ່ຽວກບັ ສຸຂະພາບນັບມນື້ີ ັບເພິ່ມີ ຂຶີນ້ ເລອື້ີ ຍໆ ດງັ່ິ ນນັ້ີ ຜູ້ຄນ້ີົ ຄວ້າຈຶິ່ງໄດ້ມີແນວຄດິ ຍາກສກຶ ສາຂໍ້ີມນູ ການກວດສຸຂະພາບໂດຍຜ່ານການກວດເລອື ດ (ໂລຫິດວິທະຍາ) ເຊງິ່ ເປນັ ຂນ້ີັ ຕອນໜຶິ່ງໃນການວິ ນິໄສພະຍາດຈາກຄົນເຈັບເປນັ ຕວົ ຊວ່ ຍໃນການລະບອຸ າການ ແລະ ສາເຫດຂອງການເກດີ ພະຍາດຕ່າງໆ, ເປນັ ປະໂຫຍດຫຼາຍໃຫແ້ ພດໝໍ ຫືຼ ຜ້ຊູ ຽ່ ວຊານໃນການປນ່ິ ປວົ ພະຍາດຂອງຜູ້ປວ່ ຍ. ເພອິື່ ປະໂຫຍດ ແລະ ຊ່ວຍໃນການ ຄາດຄະເນພະຍາດໂດຍການນາໍ ໃຊ້ເຕັກນກິ ການຂດຸ ຄົນີ້ ຂມີ້ໍ ນູ (Data Mining) ເປນັ ຂນ້ັີ ຕອນການວເິ ຄາະຂມ້ີໍ ນູ ທິ່ມີ ີ ປະລມິ ານມະຫາສານ (Big Data) ນຍິ ົມໃຊ້ໃນການພັດທະນາຂໍີ້ມນູ ຂາ່ ວສານໃນຫຼາຍຂະແໜງການໃນນນີັ້ ຂະແໜ ງການແພດ ເພາະວ່າມັນເປນັ ຕົວຊວ່ ຍໃນການຕດັ ສນິ ໃຈ ແລະ ຄາດການຜົນທິີ່ຈະໄດ້ຮບັ ຈາກການຕັດສິນໃຈ, ເພິ່ມີ ຄວາມໄວໃນການວເິ ຄາະຖານຂມໍ້ີ ູນຂະໜາດໃຫຍ່. ການຄາດຄະເນຜນົ ການເກີດເຫດການລວ່ ງໜາ້ ໄດ້ ຈະເປັນປະໂຫຍດຕຂ່ິໍ ະແໜງການທາງເສດຖະກິດສງັ ຄົມ, ການລົງທຶນ ແລະ ການແພດ ໂດຍການນາໍ ເອົາຂ້ີມໍ ນູ ທມ່ີິ ີຢ່ແູ ລວ້ ມາເປນັ ຕົວຊວ່ ຍໃຫ້ຜູຊ້ ່ຽວຊານວເິ ຄາະ ແລະ ວາງ ແຜນການລວ່ ງໜາ້ ເພິືອ່ ເພິ່ມີ ປະສດິ ຕພິ າບ ເຊິງ່ ຂໍມ້ີ ນູ ທາງດາ້ ນການກວດເລອື ດນີຈ້ ະໄດນ້ າໍ ໃຊ້ເຕກັ ນິກການຂຸດຄນີົ້ ຂ້ີໍ ມນູ (Data Mining) ເຊ່ິງປະກອບດວ້ ຍເຕກັ ນກິ ການຈໍາແນກປະເພດຂໍີມ້ ນູ (Classification) ນາໍ ໃຊກ້ ານຕັດສນິ ໃຈແບບຕີົ້ນໄມ້ (Decision Tree), ນາໍ ໃຊ້ເຄອື ຂ່າຍປະສາດທຽມ (Neural Network) ແລະ ນາໍ ໃຊ້ Naive Bayes ນາໍ ໃຊ້ໂປຣແກຣມເຄ່ິືອງມື (Orange Tool) ເຄືອ່ິ ງມໃື ນການຂຸດຄນີົ້ ຂໍີ້ມນູ ແລະ ເອາົ ຂໍີ້ມນູ ການກວດເລອື ດ (Complete Blood Count: CBC) ເຊງ່ິ ເປນັ ຂີໍ້ມນູ (Dataset) ທີໄິ່ ດ້ມາຈາກໂຮງໝໍ 5 ເມສາ ເຊງິ່ ນບັ ຕ້ີັງແຕ່ປິ 2019-2020. ໂຮງໝໍ 5 ເມສາ ໄດສ້ າ້ ງຕ້ງັີ ຂນ້ີຶ ໃນປີ 1983 ຕັ້ງີ ຢບູ່ າ້ ນ ພະໂພ, ເມືອງ ສສີ ດັ ຕະນາກ, ນະຄອນຫຼວງວຽງຈນັ . ຊ່ງິຶ ຕອນນ້ີັນໄດໃ້ ສ່ຊວິ່ື ່າ ໂຮງໝໍ 109 ເປນັ ໂຮງໝລໍ ດັ ຖະບານ ຂອງປະເທດ ສປປ ລາວ, ເປັນໂຮງໝຂໍ ອງຕາໍ ຫຼວດ ແລະ ເປັນໂຮງໝຂໍ ະໜາດກາງ ທ່ິີຮບັ ໃຊບ້ ລໍ ກິ ານປນິ່ ປວົ ຄນົ ເຈັບທິ່ວົ ໄປ, ພະນັກງານຕາໍ ຫວຼ ດ, ລູກເມຍຕໍາຫວຼ ດ ແລະ ບລໍ ກິ ານປນິ່ ປວົ ນກັ ໂທດທວົ່ິ ປະເທດ, ມາຮອດປີ 2012 ໄດປ້ ່ຽນຊິ່ມື າເປັນ ໂຮງໝໍ 5 ເມສາ ຊງິ່ຶ ໄດຂ້ ນຶີ້ ກບັ ກົມ ໃຫຍພ່ ະລາທິການ ປກສ ຈນົ ເຖງິ ປະຈບຸ ັນ ຊ່ງິຶ ປະຈບຸ ນັ ນີ້ພາຍໃນໂຮງໝໍ 5 ເມສາ ມີພະນັກງານທັງໝດົ 358 ສະຫາຍ, ໃນນນີ້ັ ມີຊນັ້ີ ພອັ 01 ສະຫາຍ, ຍງິ 01 ສະຫາຍ, ມຊີ ີັນ້ ພັທ 25 ສະຫາຍ, ຍງິ 18 ສະຫາຍ, ຊນັ້ີ ພັຕ 25 ສະຫາຍ, ຍງິ 19 ສະຫາຍ, ຊນ້ັີ ຮອ 30 ສະຫາຍ, ຍງິ 19 ສະຫາຍ, ຊນີ້ັ ຮທ 45 ສະຫາຍ, ຍງິ 34 ສະຫາຍ, ຊັີ້ນ ຮຕ 58 ສະຫາຍ, ຍງິ 43 ສະຫາຍ, ຊນ້ັີ ວທ 44 ສະຫາຍ, ຍງິ 32 ສະຫາຍ, ຊ້ັີນ ສອ 13 ສະຫາຍ, ຍງິ 12 ສະຫາຍ , ຊ້ັີນ ສທ 02 ສະຫາຍ, ຍິງ 0 ສະຫາຍ, ຊ້ີນັ ສຕ 0 ສະຫາຍ, ຊັ້ນີ I ມີ 0 ສະຫາຍ ແລະ ມີຊນັ້ີ II 114 ສະຫາຍ, ຍງິ 78 ສະຫາຍ. ໂຮງໝໍ 5 ເມສາ ປະກອບມີທງັ ໝົດ 17 ພະແນກຄື: ພະແນກລງັ ສວີ ທິ ະຍາ (ປນິ່ ປວົ ຄນົ ເຈບັ ໂດຍການນໍາໃຊ້ ເຄິອື່ ງສອ້ ງລງັ ສິີ ແລະ ເຄອື່ິ ງສອ້ ງເອໂກ), ພະແນກບລໍ ຫິ ານຈດັ ຕງັີ້ -ສັງລວມ (ຄມຸ້ ຄອງອປຸ ະກອນເຄິືອ່ ງໃຊ້ພາຍໃນ ໂຮງໝໍ, ການເງນິ , ລດົ ຂນົ ສງິ່ົ ຄນົ ເຈບັ ແລະ ຊບັ ຊອ້ ນພະນັກງານເລອິື່ ນຂນັ້ີ ຊນັ້ີ ຕໍາແໜງ), ພະແນກພາຍນອກ (ປິ່ນປວົ ຄົນເຈັບທມ່ິີ ອີ າການເຈບັ ເປັນທາງພາຍນອກຮາ່ ງກາຍ ແລະ ຜາ່ ຕັດຂະໜາດນອ້ ຍ-ໃຫຍ່), ພະແນກປນ່ິ ປວົ 1
ເດັກ (ປນ່ິ ປວົ ພະຍາດເດັກນ້ອຍໂດຍສະເພາະ), ພະແນກປິນ່ ປວົ ພະນັກງານ (ປນິ່ ປວົ ພະນກັ ງານຕາໍ ຫຼວດ ຫືຼ ຄອບຄົວ), ພະແນກພາຍໃນ (ປນິ່ ປວົ ຄນົ ເຈບັ ທເິ່ີ ປນັ ພະຍາດທາງໃນຮ່າງກາຍຕວົ ຢາ່ ງ ພະຍາດວນັ ນະໂລກ, ໄຂ້ຍງຸ້ ເປັນຕົນີ້ ), ພະແນກພະຍາບານ (ຄຸ້ມຄອງພະຍາບານທັງໝດົ ພາຍໃນໂຮງໝໍ), ພະແນກວາງຢາສະຫບົຼ -ຟນີ້ື ຟູຊບີ (ເປນັ ພະແນກຜູ້ຊວ່ ຍທ່ານໝໃໍ ນການວາງຢາສະຫຼົບເພອິ່ື ຜ່າຕດັ ຕາ່ ງໆ ແລະ ເປນັ ບອ່ ນພກັ ຟີື້ນຄົນເຈັບຫງຼັ ຜາ່ ຕັດ), ພະແນກແຂ້ວ (ປນິ່ ປວົ ພະຍາດກ່ຽວກບັ ແຂວ້ ໂດຍສະເພາະ), ພະແນກກວດເຂດນອກ-ສກຸ ເສນີ (ປນິ່ ປວົ ຄົນເຈັບ ຈາກອາການເບີອ້ື ງຕີົນ້ ໂດຍມໜີ າ້ ທິີ່ສິງ່ົ ໄປປ່ິນປົວແຕລ່ ະແພກຕາມອາການຄົນເຈບັ ), ພະແນກມໍລະສຸມ (ປນິ່ ປວົ ຄນົ ເຈບັ ທມ່ິີ ອີ າການຮຸ່ນແຮງສຽງຕໍິ່ການເສຍຊວິ ິດ), ພະແນກວເິ ຄາະ (ມໜີ ້າທ່ີນິ າໍ ຜົນການກວດເລອື ດ, ຍ່ຽວ ແລະ ອາຈົມມາວເິ ຄາະຫາພະຍາດ), ພະແນກອອກລກູ -ພະຍາດຍງິ -ແມ່ ແລະ ເດັກ (ເປນັ ພະແນກເກດີ ລກູ , ພກັ ຟີື້ນຄນົ ເຈັບຫງັຼ ຈາກເກດີ ລູກ ແລະ ປນິ່ ປວົ ພະຍາດຂອງຜຍູ້ ງິ ), ພະແນກການຢາ (ເປນັ ບອ່ ນສະໜອງຢາໃຫ້ຄົນເຈບັ ແລະ ຄຸມ້ ຄອງຢາຕ່າງໆພາຍໃນໂຮງໝໍ), ພະແນກບລໍ ຫິ ານການແພດ (ຄມຸ້ ຄອງແພດໝ,ໍ ພະຍາບານ, ຊັກລດີ ອຸປະກອນ ນງຸ່ ຖຂື ອງໂຮງໝໍ) ພະແນກກາຍະບາໍ ບັດ (ປນິ່ ປວົ ຄນົ ເຈບັ ດວ້ ຍເຄອິື່ ງນວດໄຟຟ້າ, ຝັງເຂີມັ້ ແລະ ບໍາບດັ ), ພະແນກ ປະກນັ ສັງຄມົ (ຄມຸ້ ຄອງພະນັກງານຜທູ້ ີິມ່ ີບດັ ປະກັນສງັ ຄມົ ) ດິງ່ັ ນນ້ີັ ໃນນາມຜູຄ້ ນີົ້ ຄວ້າຈ່ງິຶ ເຫນັ ວາ່ ການເຮັດວິໄຈໂດຍນໍາໃຊ້ເຕັກນກິ ການຂດຸ ຄນີ້ົ ຂໍມ້ີ ນູ (Data Mining) ເຂາ້ີົ ມາຊວ່ ຍ ໃນດາ້ ນການແພດເພື່ອິ ເປນັ ປະໂຫຍດ ແລະ ຊ່ວຍໃນການຄາດເດາົ ພະຍາດໃຫໄ້ ດຮ້ ັບຜນົ ດີ ນນັ້ີ ບໍິ່ແມ່ນ ເລືິ່ອງງາ່ ຍດາຍ, ຍັງເປນັ ສິງ່ ທີທ່ິ ້າທາຍ ແລະ ໜ້າສົນໃຈຫາຼ ຍໃນກໍລະນສີ ຶກສາຄັ້ງີ ນ້ມີ ຄີ ວາມສໍາຄັນເປນັ ຢ່າງຍິງ່ ເພາະ ນອກຈາກຈະຊວຍ່ ໃຫ້ແພດໝໍປະຍັດເວລາ, ປະຍັດແຮງງານແລ້ວຍງັ ຊວຍ່ ໃຫມ້ ີຄວາມຈະແຈ້ງໃນການໃນການຄາດ ເດາົ ພະຍາດໃຫໄ້ ດຮ້ ັບຜນົ ດີ. 1.2 ຄາໍ ຖາມຄ້ີົນຄວ້າ ເພ່ອືິ ໃຫ້ບັນລຄຸ າດໝາຍ ແລະ ຈຸດປະສງົ ໃນການເຮດັ ບດົ ຄ້ີົນຄວ້ າຄີງ້ັ ນສ້ີ າມາດຕອບຄາໍ ຖາມລມຸ່ ນໄີ້ ດ້: 1. ຜນົ ຂອງການກວດເລືອດໃນ 3 ຮບູ ແບບ ການຕດັ ສິນໃຈແບບຕີົ້ນໄມ້ (Decision Tree), ເຄອື ຂາ່ ຍ ປະສາດທຽມ (Neural Network) ແລະ ການຈາໍ ແນກປະເພດແບບ Naive Bayes ໂຕໃດມີ ປະສິດຕພິ າບດີກວ່າກັນ. 2. ຖາ້ ນໍາເອາົ ຜົນການກວດເລອື ດມາເຮັດຂດຸ ຄນ້ົີ ຂມ້ໍີ ູນ (Data mining) ຈະມີຂນັີ້ ຕອນແນວໃດ. 1.3 ຈດຸ ປະສງົ ງານວໄິ ຈນີ້ໄດກ້ ໍານົດຈດຸ ປະສງົ ຂອງການສກຶ ສາໄວ້ດງັິ່ ນີ້: 1. ເພືິອ່ ຄາດຄະເນໂອກາດເກດີ ພະຍາດຈາກຜນົ ການກວດເລືອດໃນຮບູ ແບບການຝກຶ ສອນ. 2. ເພ່ອືິ ສກຶ ສາຂນີ້ັ ຕອນຫັກຼ ການ ແລະ ວິທີການໃຊ້ເຕກັ ນກິ ການຂຸດຄນ້ີົ ຂໍ້ມີ ນູ (Data mining). 3. ເພິືອ່ ສຶກສາ ແລະ ປຽບທຽບການຕດັ ສນິ ໃຈແບບຕີ້ົນໄມ້ (Decision Tree), ເຄອື ຂ່າຍປະສາດ ທຽມ (Neural Network) ແລະ ການຈໍາແນກປະເພດແບບ Naive Bayes. 4. ເພື່ິອພັດທະນາຮບູ ແບບ (Model) ໄປນໍາໃຊ້ເຂົາີ້ ໃນການສ້າງໂປຣແກຣມ. 2
1.4 ສມົ ມຸດຖານ ໃນການເຮດັ ບດົ ຄນົ້ີ ຄວ້ າຄ້ັງີ ນີ້ໄດຕ້ ງັີ້ ສມົ ມຸດຖານທ່ິີວ່າ 1. ຜນົ ຂອງການກວດເລອື ດມຄີ ວາມສຽ່ ງຕກໍິ່ ານເກດີ ພະຍາດຫຼາຍປານໃດ. 2. ຜົນຂອງການນໍາໃຊອ້ ນັ ກໍລດິ ທມຶ (Algorithms) ຂອງ 3 ຮບູ ແບບ ການຕັດສິນໃຈແບບຕົີ້ນໄມ້ (Decision Tree), ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network) ແລະ ການຈໍາແນກປະເພດແບບ Naive Bayes ຈະມີປະສິດທິພາບຖືກຕອ້ ງປານໃດ. 1.5 ຜົນປະໂຫຍດຂອງການສຶກສາ ຜນົ ປະໂຫຍດທ່ຄີິ າດວາ່ ຈະໄດຮ້ ບັ ຈາກຜູ້ຄນົ້ີ ຄ້ວາ ຄ້ີງັ ນີປ້ ະກອບມ:ີ 1. ສາມາດນາໍ ເອາົ ຜນົ ວໄິ ຈນ້ີໄປເປັນບອ່ ນອ້າງອງີ ໃນການສກຶ ສາໃນດ້ານການຂດຸ ຄນົີ້ ຂ້ມໍີ ນູ (Data Mining). 2. ສາມາດຮູ້ເຕກັ ນກິ ການນໍາໃຊຂ້ ັີນ້ ຕອນການເຮັດ ແລະ ວທິ ກີ ານຕດັ ສນິ ໃຈແບບຕນ້ີົ ໄມ້ (Decision Tree), ເຄືອຂາ່ ຍປະສາດທຽມ (Neural Network) ແລະ ການຈາໍ ແນກປະເພດແບບ Naive Bayes. 3. ສາມາດນໍາເອົາຜົນການວິໄຈ ໄປເປນັ ແນວທາງໃນການເຮດັ ການຄາດຄະເນໂອກາດການ ການເກີດ ພະຍາດໃນຂະແໜງສຸກຂະພາບ (Health Care). 3
ພາກທີ ທບົ ທວນເອກະສານ ແລະ ຂອບເຂດແນວຄວາມຄດິ 2.1 ທບົ ທວນເອກະສານ ແລະ ທິດສະດທີ ີກິ່ ຽ່ ວຂອ້ ງ 2.1.1 ຂມໍ້ີ ນູ ກຽ່ ວກບັ ເລອື ດ ເລອື ດເປນັ ຂອງເເຫຼວເປັນໂຕກາງຕິດຕລ່ໍິ ະວາ່ ງເຊວຂອງຮ່າງກາຍ ແລະ ມີເມດັ ເລອື ດເປນັ ເຊວລອຍຢູ່ ໃນຮາ່ ງກາຍ, ໃນຮາ່ ງກາຍປະກອບມີເລືອດຢປູ່ ະມານ 7-8% ຂອງນີໍ້າໜກັ ຮາ່ ງກາຍປະລມິ ານເລືອດແຕກຕາ່ ງກັນໄປ ຕາມອາຍ,ຸ ຂະໜາດ, ນາ້ໍີ ໜກັ , ເພດ ແລະ ສະພາວະຂອງສຂຸ ະພາບ ເລືອດມສີ ີແດງມຄີ ວາມແໜ້ນກວາ່ ນ້ີໍາ 5 ເທິ່ົາມີ ອຸນຫະພູມປະມານ 37.8 ອົງສາ ມລີ ດິ ເປນັ ດ່າງເລັກໜ້ອຍ ແລະ ມີກິນ່ ຄາວ (Thima, 2010) ເລອື ດມໜີ າ້ ທິ່ີເປັນຂະບວນການຂົນສົິງ່ ອົກຊີແຊນ, ອາຫານ, ພູມຕາ້ ນທານ, ສາ້ ງໂປຣຕິນ, ເປັນໂຕ ສ້າງລະບບົ ປ້ອງກນັ ຕົວດວ້ ຍລະບບົ ພມູ ຄຸ້ມກນັ , ເຮັດໜາ້ ທີຄວບຄ້ມຸ ຄວາມສມົ ດນຸ ຂອງຮາ່ ງກາຍ ແລະ ຄວບຄຸມ້ ອນຸ ຫະພມູ ຂອງຮາ່ ງກາຍ ເຊິ່ງມເີ ມດັ ເລອື ດ (Blood Cell) ປະກອບໄປດ້ວຍ: ເມດັ ເລືອດແດງ, ເມັດເລອື ດຂາວ ແລະ ເກັດເລອື ດ. ເມັດເລືອດແດງ: ຖກື ສາ້ ງໄວໃ້ ກບ້ ລໍ ິເວນໄຂກະດູກຂອງຮາ່ ງກາຍຕາມບອ່ ນຕາ່ ງໆບເິໍ່ ທາ່ົິ ກນັ ໄຂກະດກູ ທິີ່ມີປະສິດທພິ າບໃນຮ່າງກາຍໄດ້ແກ່ ໄຂກະດກູ ໂຜງເອິກ, ກະດກູ ຂ້າງຊ້າຍ-ຂວາ, ກະດູກສນັ ຫງັຼ ແລະ ກະດູກ ກະໂຫລກຫົວ ອດັ ຕາການສ້າງປ່ຽນແປງໄດ້ຂນຶ້ີ ກບັ ປະລມິ ານອກົ ຊີແຊນໃນເລືອດ, ຖ້າອກົ ຊີແຊນຕ່ິໍາ ຫືຼ ຮາ່ ງກາຍ ສູນເສຍເລືອດ ຈະມີຜນົ ເລງັ ສ້າງໃຫ້ໄຂກະດູກສ້າງເມດັ ເລືອດແດງເພມິ່ີ ຂີນ້ຶ ມນັ ມໜີ ້າທນີ່ິ າໍ ອົກຊແີ ຊນໄປລຽ້ ງເຊວ ຕ່າງໆຂອງຮ່າງກາຍ, ນໍາເອາົ ທາດການຊອີ ົກຊິດ ሺଶሻອອກຈາກເຊວໄປສປູ່ ອດ. ເມັດເລືອດຂາວ: ມີຂະໜາດໃຫຍ່ກວ່າເຊວເມັດເລືອດແດງ ສາມາດລອຍຜ່ານເລອື ດຜອຍໄດ້, ຈໍາ ນວນເມດັ ເລືອດຂາວປົກກະຕມິ ປີ ະມານ 5,000-11,000 ເຊວ ຈໍານວນເມດັ ເລອື ດຂາວປຽ່ ນໄປຕາມອາຍ,ຸ ເພດ ແລະ ສະພາວະອນຶິ່ ໆ ເມັດເລອື ດຂາວມີການສ້າງອອກມາຕະຫຼອດຄ້າຍກັບເມດັ ເລືອດແດງ ມອີ າຍປຸ ະມານ 13 ມີື້, ມໜີ າ້ ທິ່ີທໍາລາຍເຊີອ້ື ໂລກເມອິື່ ມີສງິ່ ແປກປອມເຂາ້ົີ ມາສຮູ່ າ່ ງກາຍ, ເມດັ ເລອື ດຂາວຈະຖືກຜະລດິ ມາອດັ ຕະໂນມດັ ເພິືອ່ ກຽມພອ້ ມທາໍ ລາຍເຊີ້ອື ໂລກ. ເກັດເລອື ດ: ມີຮບູ ຮ່າງກມົ ແບນມີຂະໜາດ 2-4 ໄມຄອນນອ້ ຍກວາ່ ເມດັ ເລອື ດຂາວ ແລະ ເມັດເລອື ດ ແດງ ປກົ ກະຕຈິ ະມເີ ກັດເລືອດປະມານ 250,000-300,000 ເຊວ ມີໜາ້ ທີິຄ່ ວບຄ້ມຸ ຄວາມສມົ ດຸນພາຍໃນລອດ ເລືອດ (Hemostasis) ແລະ ຊວ່ ຍໃນການຍບັ ຍງັີ້ ການຫຼຸດຂາດຂອງເສນັີ້ ເລອື ດໄດ້ ຊວ່ ຍໃຫ້ເລອື ດເເຂງໂຕ ດງັິ່ ນນີັ້ ຖ້າມີປະລມິ ານຂອງເກດັ ເລອື ດທ່ິຫີ ຼາຍເກນີ ໄປອາດເຮັດໃຫ້ເກດີ ການແຂງຂອງເລືອດໄດງ້ ່າຍ ກງົ ກັນຂ້າມຫາກມີ ປະລິມານໜອ້ ຍເກີນໄປຈະສງິົ່ ຜນົ ໃຫເ້ ກດີ ການຫ້າມເລອື ດ ເລອື ດໄຫຼບ່ິ ຢິ່ໍ ຸດ. 4
ຮບູ ທີ 2.1: ຮບູ ເມດັ ເລືອດ ແຫງິຼ່ ທມ່ີິ າ: (Thima, 2010) ຕາຕະລາງທີ 2.1: ສະແດງໃຫເ້ ຫັນຄວາມໝາຍແຕລ່ ະຄາ່ ຂອງເມດັ ເລືອດ ລາໍ ດບັ ຕາ່ິໍ Low ສູງ High RBC ຂາດທາດເຫຼກັ , ວິຕາມິນບີ 12, ໂຟເລດ (Iron, ຂາດນ້ໍາີ (Dehydration), ໄຕມີຄວາມຜດິ Vitamin B12, or Folate Deficiency), ໄຂ ປົກກະຕິ (Renal Problems), ໂລກ ກະດູກຖກື ທໍາລາຍ (Bone Marrow Damage), ປອດ ຫືຼ ໂລກຫວົ ໃຈແຕກ່ າໍ ເນດີ ເສຍເລອື ດ (Trauma) (Pulmonary or Congenital Heart Disease) HGB ຂາດທາດເຫກຼັ , ວິຕາມິນບີ 12, ໂຟເລດ (Iron, ຂາດນ້ີາໍ (Dehydration), ໄຕມີຄວາມຜດິ HCT Vitamin B12, or Folate Deficiency), ໄຂ ປກົ ກະຕິ (Renal Problems), ໂລກ ປອດ ຫຼື ໂລກຫວົ ໃຈແຕກ່ າໍ ເນດີ ກະດູກຖກື ທໍາລາຍ (Bone (Pulmonary or Congenital Heart Marrow Damage) Disease) WBC ພູມຄຸ້ມກັນບງິົ່ ພອງ (Autoimmune Illness), ການ ຕດິ ເຊອືີ້ ແບັກທເີ ລຍ (Bacterial ສ້າງໄຂກະດກູ ລົມ້ີ ເຫວຼ (Bone Marrow Failure), Infection), ອັກເສບ (Inflammation), ເຄມີບາໍ ບດັ (Chemotherapy), ຕດິ ເຊອີ້ື ໄວຮັສ ມະເຮງັ (Cancer), ມະເຮັງເມດັ ເລອື ດ (Viral Infections) ຂາວ (leukemia), ອອກກາໍ ລງັ ກາຍທ່ີິຮນຸ່ ແຮງ (Intense Exercise), ຄວາມຄຽດ (Stress), ຕອມໝວກໄຕຜິດປົກກະຕິ (Corticosteroids) PLT ຕດິ ເຊື້ີອໄວຮສັ (Viral Infections), ໂລກພູມຄ້ມຸ ມະເຮັງເມດັ ເລອື ດ (Leukemia), ໄຂ ກັນ (Lupus), ມະເຮັງເມດັ ເລືອດຂາວ ກະດກູ ເຮດັ ວຽກຜດິ ປກົ ກະຕິ ເນອິື່ ງຈາກມີ 5
(Leukemia), ເຄມບີ າໍ ບັດ (Chemotherapy), ເຊວງອກຜດິ ປກົ ກະຕິໃນໄຂກະດກູ ເລອື ດຈາງຂາດວິຕາມນິ ບີ 12 (Pernicious (Myeloproliferative Disorders Anemia due to Vitamin B12 Deficiency) which cause blood cells to grow abnormally in bone marrow), ການອກັ ເສບ (Inflammatory Conditions) ໃນການກວດເລອື ດເພອ່ືິ ປະເມນີ ຄວາມສົມບນູ ຂອງເມດັ ເລອື ດ CBC ໃນຮ່າງກາຍເປນັ ການກວດ ເບືອ້ີ ງຕ້ນົີ ຂອງຮ່າງກາຍ, ຕິດຕາມຜນົ ການຮັກສາລວມທັງວນິ ໄິ ສພະຍາດໂດຍສະເພາະພະຍາດທາງເລືອດ ຫຼື ການ ປ່ຽນແປງຂອງເລອື ດເຊງ່ິ ໃນຍຸກປດັ ຈບຸ ັນນ້ີການກວດແມນ່ ໄດນ້ າໍ ໃຊເ້ ຄອ່ືິ ງວເິ ຄາະເລືອດແບບອດັ ຕະໂນມດັ ແລະ ມີ ຫກັຼ ການວັດແທກເຊວເມດັ ເລອື ດແບບ (Electrical Impedance) ເປນັ ການກວດເມດັ ເລືອດແບບອາໄສກະແສ ໄຟຟ້າ ແລະ ແບບ (Light Scattering) ເປນັ ການກວດເມດັ ເລືອດແບບອາໄສແສງ ໂດຍຈະກວດສອບເມັດເລອື ດ ແດງ, ເມດັ ເລອື ດຂາວ ແລະ ເກັດເລືອດ (Sirin , Nurunart, & Suntree, 2021) 2.1.2 ການຂດຸ ຄນົີ້ ຂມ້ີໍ ນູ (Data Mining) ການຂຸດຄນ້ີົ ຂມ້ີໍ ນູ (Data Mining) ຫືຼ ເອນີ້ ວ່າເປນັ ການຊອກຫາຄວາມຮູ້ ໃນຖານຂີມໍ້ ນູ (Knowledge Discovery in Databases - KDD) ແມນ່ ເຕກັ ນກິ ສາໍ ລັບວເິ ຄາະຂມໍ້ີ ນູ ເພອ່ິື ຊອກຫາຮບູ ແບບ (Pattern) ເປັນຂນ້ີັ ຕອນການສະກດັ ເອາົ ຄວາມຮູ້ອອກຈາກຂໍມ້ີ ນູ ຂະໜາດໃຫຍ່, ຄວາມສໍາພນັ ຂອງຂໍີມ້ ນູ ທ່ີິຖືກ ເຊືິ່ອງໄວ້ໃນຊດຸ ຂມ້ີໍ ນູ ນ້ີັນ ໂດຍອງີ ໃສຕ່ າມຫຼກັ ສະຖຕິ ິ ແລະ ການຮຽນຮຂູ້ ອງຄອມພວິ ເຕີ ແລວ້ ນໍາຜນົ ວິເຄາະ ທ່ີິໄດໄ້ ປໃຊ້ເພອິ່ື ການຕດັ ສິນໃຈ ໃນການຮຽນຮູ້ຂອງຄອມພວິ ເຕີເພອ່ິື ໃຫ້ໃກ້ຄຽງກັບສະໝອງມະນດຸ (Machine Learning) ແບງ່ ອອກເປັນ 2 ແບບຄື: ການຮຽນຮູ້ແບບມກີ ານສອນ (Supervised Learning) ເປັນການຮຽນຮູ້ ຈາກຂ້ມີໍ ູນທິີ່ມີຜູ້ສອນ ຫຼື ເວີ້າົ ໄດວ້ າ່ ຂ້ມໍີ ນູ ນັນ້ີ ມກີ ານກາໍ ນດົ ຄ່າ ຫືຼ ຄາໍ ຕອບ ແລະ ການຮຽນຮແູ້ ບບບໍິ່ມກີ ານສອນ (Unsupervised Learning) ເປັນການຮຽນຮແູ້ ບບບ່ມິໍ ຜີ ສູ້ ອນ ຫຼື ເວ້ີົາໄດວ້ າ່ ຂໍມີ້ ນູ ນນີ້ັ ບມິໍ່ ກີ ານກໍານດົ ຄ່າຊງ່ິຶ ສ່ວນ ຫາຼ ຍເປັນຂ້ມີໍ ູນທາໍ ມະຊາດທ່ີພິ ບົ ໄດ້ທວ່ົິ ໄປ (Suphamon , 2018) 2.1.3 ຂນີ້ັ ຕອນການຂດຸ ຄນົ້ີ ຂມໍີ້ ນູ ການຂຸດຄນ້ີົ ຂໍມີ້ ນູ ມຂີ ີ້ັນຕອນຫຼກັ ຢູ່ 3 ຂ້ນັີ ຕອນຄ:ື 1. Preprocessing ແມ່ນຂນັີ້ ຕອນການກະກຽມຂ້ີໍມູນ ຊິ່ຶງຂມີໍ້ ນູ ທ່ິກີ ະກຽມນີ້ນັ ຈະຕອ້ ງຄັດຈ້ອນຂໍ້ີ ມນູ ທິີ່ບ່ິກໍ ່ຽວຂ້ອງ (Noise Data) ອອກຈາກແຫິຼ່ງຂມໍ້ີ ູນດບິ ເພື່ິອໃຫ້ໄດຂ້ ້ມໍີ ູນທິີມ່ ີຄວາມສາໍ ພນັ ກນັ ໃນຂີັນ້ ຕອນນີ້ ແບ່ງອອກເປັນຂນ້ັີ ຕອນຍອ່ ຍດງ່ັິ ນ:້ີ ─ Data Cleaning ແມນ່ ຂ້ີັນຕອນການຈໍາກດັ ເອົາຂີໍມ້ ນູ ທິ່ບີ ກິໍ່ ່ຽວຂອ້ ງ ຫຼື ຂໍີ້ມູນທີິ່ບເິໍ່ ປນັ ປະໂຫຍດອອກ. ─ Data Integration ແມນ່ ຂນີ້ັ ຕອນການລວມເອາົ ຂ້ມໍີ ູນຫຼາຍແຫ່ງຼິ ເຂ້ົາີ ໃຫເ້ ປນັ ຂໍມ້ີ ນູ ຊດຸ ດຽວ. ─ Data Selection ແມນ່ ຂ້ນັີ ຕອນການດຶງເອາົ ຂມ້ໍີ ູນສາໍ ລບັ ການວເິ ຄາະຈາກແຫຼງ່ິ ທ່ບີິ ນັ ທຶກໄວ້, ເລອື ກຂີມ້ໍ ນູ ທ່ີິ ມຄີ ວາມສາໍ ພນັ ກນັ ແລະ ເປັນປະໂຫຍດຕິກ່ໍ ານນາໍ ໃຊ້. ─ Data Transformation ແມນ່ ຂ້ີັນຕອນການປຽ່ ນຂ້ມໍີ ນູ ໃຫ້ເໝາະສົມກບັ ການນໍາໃຊ້. 6
2. Data Mining ແມນ່ ຂ້ັີນຕອນທນິີ່ ໍາເອາົ ຂໍີມ້ ູນທພິ່ີ ອ້ ມແລວ້ ມາສ້າງແບບຈາໍ ລອງ ໂດຍຕອ້ ງເລືອກ ເຕກັ ນກິ ທີິ່ເໝາະສົມກັບແບບຊຸດຂໍີ້ມນູ ເພ່ິືອພຈິ າລະນາຈາກບັນຫາ. 3. Post processing ເປນັ ຂນ້ີັ ຕອນສດຸ ທາ້ ຍຂອງການຂດຸ ຄນົີ້ ຂມີໍ້ ນູ , ເປນັ ຂນ້ັີ ຕອນການປະເມນີ ຜນົ ແລະ ນາໍ ສິງ່ ທີໄິ່ ດ້ມານາໍ ສະເໜີໃນຮບູ ແບບຂອງການນາໍ ໃຊ້ງານ ຖາ້ ໃນຂີັ້ນຕອນນີ້ຫາກທົດສອບ (Test) ແລ້ວບເິໍ່ ປັນ ທິ່ີໜ້າພໍໃຈ ຈະຕ້ອງທໍາການຈັດການແບບຂມີໍ້ ູນໃໝ່ (ກຽມຂມໍ້ີ ູນໃໝ່) ເພອ່ິື ໃຫ້ໄດ້ຄາ່ ຄວາມຖກື ຕອ້ ງ (Accuracy) ຫາຼ ຍທິ່ີສຸດ, ການຫາຄ່າຄວາມຄາດເຄອ່ິື ນໃນການຄາດຄະເນຫາຄາ່ ຜດິ ຜາດໜອ້ ຍທີິ່ສດຸ (Error) ຫາກຄາ່ ຄວາມ ຖກື ຕ້ອງຍັງໜ້ອຍຢູ່ ຫຼື ຄວາມຜດິ ພາດຍງັ ມຢີ ູ່ ຫງຼັ ຈາກກຽມຂ້ີໍມນູ ຊດຸ ໃໝ່ອາດຈາໍ ເປັນຕ້ອງເລອື ກເຕັກນກິ ໃໝໃ່ ນ ການເຮັດຂດຸ ຄນ້ົີ ຂໍມ້ີ ນູ ໃໝ່ ແລະ ໃນສວ່ ນຂອງຂນີ້ັ ຕອນນີແ້ ບງ່ ເປນັ ຂ້ັນີ ຕອນຍອ່ ຍດງັ່ິ ນີ້: ─ Pattern Evaluation ແມນ່ ຂນັີ້ ຕອນການປະເມນີ ຮບູ ແບບທໄິ່ີ ດ້ຮບັ ຈາກການຂດຸ ຄນ້ີົ ຂ້ມໍີ ນູ ─ Knowledge Representation ແມນ່ ຂະບວນການໃນການນ າສະເໜຄີ ວາມຮ້ທູ ່ິີໄດຄ້ ້ນີົ ພບົ ໂດຍການນໍາໃຊ້ເຕກັ ນກິ ການນໍາສະເໜີເພ່ືອິ ໃຫເ້ ຂາີ້ົ ໃຈ, ສະດວກຕ່ິໍການນໍາໃຊງ້ ານເຊນິັ່ : ການປ້ອນຂມ້ໍີ ູນເຂາ້ີົ ແລະ ການສະແດງຜນົ ເປັນຕີົ້ນ (Jiawei, Micheline, & Jian, 2012) ຮູບທີ 2.2: ແຜນວາດການຂຸດຄີົນ້ ຂ້ໍີມນູ ໃນການຄນົີ້ ຫາຄວາມຮູ້ ແຫິງ່ຼ ທິ່ມີ າ: (Jiawei, Micheline, & Jian, 2012) 7
2.1.4 ເຕກັ ນກິ ການຂດຸ ຄນີ້ົ ຂມີໍ້ ນູ ເນອິື່ ງຈາກການຂຸດຄີົນ້ ຂມີ້ໍ ນູ (Data Mining) ເປນັ ເຕັກນິກໃນການຄ້ີນົ ຫາຄວາມຮຈູ້ າກຂມ້ີໍ ູນຂະໜ າດໃຫຍ່, ການຂຸດຄົ້ນີ ຂມີ້ໍ ູນຈງ່ຶິ ເປັນການໂຮມເອົາເອກະສານດາ້ ນຕ່າງໆ ຫຼາຍຂະແໜງໂຮມໄວ້ນາໍ ກັນໂດຍບຈ່ິໍ ໍາກັດ ວທິ ີການທີິ່ຈະໃຊ້, ຕົວຢ່າງ: ການໃຊ້ວຽກງານດາ້ ນເຕັກໂນໂລຢີຖານຂ້ໍມີ ນູ (Database Technology), ດ້ານ ວິທະຍາສາດຂມໍີ້ ນູ ຂາ່ ວສານ (Information Science), ດ້ານສະຖຕິ ິ (Statistics) ແລະ ດ້ານຂະບວນການຮຽນຮູ້ (Machine Learning) ເປນັ ຕນົ້ີ ກິໃ່ໍ ຫເ້ ກີດຂະບວນການຄົ້ນີ ຫາຄວາມຮໃູ້ ນແບບຕ່າງໆໂດຍແບບການຄ້ນົີ ຫາ ຄວາມຮູ້ແບບມີຫັຼກການ (Ukrit , 2003). 2.1.5 ການແບງ່ ປະເພດ ແລະ ການຄາດຄະເນ (Classification and Prediction) ເປັນຂະບວນການທີ່ໃິ ຊໃ້ ນການຫາພາບແບບຈໍາລອງຂອງຊດຸ ຂມີໍ້ ູນທີມິ່ ຄີ ວາມໃກ້ຄຽງກນັ ຫືຼ ຄ້າຍຄື ກັນຫຼາຍທິີສ່ ດຸ ເພິືອ່ ໃຊໃ້ ນການຄາດເດາົ ຊດຸ ຂອງຂ້ໍີມນູ ວ່າຢ່ໃູ ນປະເພດໃດຂອງຊດຸ ຂມ້ີໍ ູນທ່ິີໄດແ້ ບ່ງໄວແ້ ລ້ວ, ຊງິ່ຶ ຊດຸ ຂ້ີໍ ມນູ ທແ່ີິ ບງ່ ໄວເ້ ກີດຈາກການຮຽນຮູຈ້ າກຊດຸ ຂ້ມໍີ ນູ ທມີິ່ ີຢູ່ແລ້ວ (Training Data) ແບບຈາໍ ລອງທເີ່ິ ກີດຈາກການຮຽນ ຮູ້ ສາມາດສະແດງໄດ້ຫາຼ ຍແບບເຊນິັ່ (Classification Rules, IF-THEN) ການຄາໍ ນວນແບບການຕັດສນິ ໃຈ ຕົີ້ນໄມ້ (Decision Tree) ການໃຊສ້ ດູ ທາງຄະນດິ ສາດ (Mathematical Formula) ຫຼື ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network) ເປນັ ຕີນົ້ . 2.1.6 ການວເິ ຄາະເພອືິ່ ຈດັ ກມຸ່ (Clustering Analysis) ການວເິ ຄາະເພິື່ອຈດັ ກຸ່ມ ຈະແຕກຕາ່ ງຈາກການຈັດປະເພດ ແລະ ການຄາດຄະເນ ຊ່ງຶິ ຈະວິເຄາະກ່ຽວ ກັບຂອບເຂດຂີໍມ້ ນູ ທີິຄ່ ້າຍຄກື ັນຫາຼ ຍທສ່ິີ ດຸ , ເປນັ ການຈັດກຸມ່ ທິ່ີແບ່ງປະເພດໂດຍບ່ໍມິ ກີ ານລະບຊຸ ່ກືິ ຸ່ມ ໃນຊວ່ ງຂອງ ການສອນ, ແບບຈາໍ ລອງໂດຍທວິ່ົ ໄປແລວ້ ວິທີການ ແບບນຈີ້ ະໃຊກ້ ບັ ການຈດັ ແບ່ງຂໍ້ີມນູ ທີິບ່ ຮິໍ່ ູ້ວ່າຈະຈດັ ປະເພດ ເຂາ້ີົ ກັນແບບໃດດີ ແລະ ການເຮັດວິເຄາະນີ້ຈະສາມາດບງົິ່ ບອກເຖິງຊ່ຂືິ ອງກມຸ່ ທ່ິແີ ບງ່ ຂຶີນ້ ໄດ້. ໃນການວິເຄາະເພິື່ອຈັດ ກຸມ່ ນີນ້ັ ອາໄສພນ້ີື ຖານຂອງຄວາມຄ້າຍຄືກັນຫຼາຍທສ່ິີ ຸດ ແລະ ຄວາມຄກື ນັ ໜອ້ ຍທ່ສິີ ດຸ ຂອງກຸ່ມ, ໝາຍຄວາມວ່າຂີໍ້ ມນູ ທຈິ່ີ ດັ ໄວໃ້ ນກຸມ່ ດຽວກັນຈະມຄີ ວາມຄືກນັ ສງູ ຫາຼ ຍ ແຕ່ຈະແຕກຕາ່ ງກນັ ກບັ ຂໍີ້ມູນທີຖິ່ ກຶ ຈດັ ໄວ້ ຄນົ ລະກ່ມຸ ຕວົ ຢາ່ ງຂອງການວເິ ຄາະເພືິ່ອຈດັ ກມຸ່ ໄດ້ແກ່: ການຫາຄ່າສະເລຍ່ K (K-mean Algorithm), ການລວມ ເເລະ ການ ແບງ່ ກ່ມຸ ໂດຍຈັດລໍາດັບຊີັ້ນ (Agglomerative And Divisive Hierarchical Clustering) ແລະ ການລໍາ ດັບຕໍາແໜງເພືິ່ອສະແດງໂຄງສາ້ ງການຈັດກ່ມຸ (Ordering Points To Identify The Clustering Structure) ເປນັ ຕີນ້ົ . 2.1.7 ການວເິ ຄາະຄວາມສາໍ ພນັ (Association Analysis) ການວເິ ຄາະຄວາມສາໍ ພນັ ເປນັ ແບບການຄນົ້ີ ຄວາມຮູ້ໂດຍການຫາສ່ງິ ທເ່ິີ ອ້ິນີ ວາ່ : “ກົດຄວາມຂອງສໍາ ພັນ (Association rules)” ຊ່ິຶງຈະສະແດງຄວາມສາໍ ພນັ ຂອງຄາ່ ທ່ິມີ ີຄວາມສາໍ ພນັ ແລະ ມເີ ງອິ່ື ນໄຂທ່ິີກົງກນັ ກັບຂໍີ້ ກໍານດົ ແລະ ລກັ ສະນະຂອງຂີມໍ້ ູນທມີິ່ ີການຮຽນຮ້ໃູ ນພາບຂອງ Market Basket ຫຼື ການຊຂ້ີື າຍ (Transaction) ໃນການເຮັດວເິ ຄາະຄວາມສໍາພນັ ທີິ່ເກີດຂນີຶ້ ນຈ້ີ າໍ ເປນັ ທຈ່ີິ ະຕ້ອງກໍານົດຄາ່ ສະໜັບສະໜູນ (Support), ແລະ ຄ່າ ຄວາມໝນ້ັີ ໃຈ (Confidence) ຊິ່ງຶ ຈະເປນັ ໂຕກໍານົດວາ່ ກດົ ທິເີ່ ກີດຂຶີນ້ ນີ້ັນມຄີ ວາມສໍາພັນກນັ ໃນລະດັບໃດ ແລະ ຍງັ ເປນັ ການຊວ່ ຍຢັບຢີ້ັງການເກດີ ກດົ ທີ່ບິ ໍ່ິຈໍາເປັນ ຫືຼ ກົດທິມີ່ ຄີ ວາມກຽ່ ວຂ້ອງກັນໜອ້ ຍຫາຼ ຍ ຕົວຢາ່ ງເຕກັ ນິກຂອງການ ວເິ ຄາະຄວາມສາໍ ພນັ ໄດແ້ ກ່ ການວເິ ຄາະແບບ Market Basket Analysis, ການຄາໍ ນວນແບບ The Apriorism Algorithm ແລະ ກດົ ຄວາມສາໍ ພັນແບບຫຼາຍລະດບັ (Multilevel Association Rules) ເປນັ ຕົ້ນີ . 8
2.1.8 ການແບງ່ ປະເພດດວ້ ຍຕນີົ້ ໄມກ້ ານຕດັ ສນິ ໃຈ Decision TreeClassification ການຕັດສນິ ໃຈແບບຕ້ນີົ ໄມ້ (Decision Tree) ເປນັ ຕົນ້ີ ໄມປ້ ະກອບໄປດວ້ ຍໂນດແທນຄນຸ ລກັ ສະນະ ແລະ ໂນດລຸ່ມສດຸ ແທນໝວດໝູ່ ການສ້າງກງິ່ ສາຂາຈະພິຈາລະນາຈາກຄ່າຄວາມຈງິ ຂອງຄນຸ ລກັ ສະນະ ໂດຍຄາ່ ທິ່ໃີ ຊ້ຈະມາຈາກການຄາໍ ນວນຈາກຄ່າ Information Gain ການສາ້ ງຕນົ້ີ ໄມຕ້ ດັ ສນິ ໃຈ C4.5 ໃຊຄ້ າ່ ມາດຕະຖານອດັ ຕາສ່ວນ (Gain Ratio) ເພອື່ິ ເລອື ກຄນຸ ລັກສະນະທ່ີິຈະໃຊເ້ ປັນຮາກ ຫືຼ ໂນດຖາ້ ໃຊ້ຊຸດຂໍ້ມີ ນູ M ປະກອບດວ້ ຍຄາ່ ທ່ເີິ ປນັ ໄປໄດຄ້ ື {ଵǡଶǡǥǡ୬} ແລະ ໃຫຄ້ ວາມໜ້າຈະເປັນທີຈ່ິ ະເກີດຄາ່ ଵ ມີຄາ່ ເທ່ິາົ ກບັ ሺ୧ሻຈະໄດຄ້ ່າ (Information Gain) ຂອງ M ຂຽນແທ່ນດວ້ ຍ ሺሻ(Pornpon, 2009) ሺሻൌσ୬୧ୀଵെሺ୧ሻଶሺ୧ሻ(2.1) I(M): ແມນ່ ຄາ່ (Information Gain) ሺ୧ሻ: ແມນ່ ຄາ່ ຄວາມໜາ້ ຈະເປນັ ທິ່ີເກດີ ຂນີື້ T: ແມນ່ ຄ່າກງ່ິ ໄມ້ທຈ່ີິ ະແຕກອອກ ຄ່າກິ່ງໄມ້ຄື T ເປນັ ຄນຸ ລກັ ສະນະທເ່ິີ ປນັ ໂນດຄື x ມຄີ ່າທັງໝດົ ທເ່ິີ ປນັ ໄປໄດ້ n ຄາ່ ໂນດປັດຈບຸ ນັ ຈະ ແບ່ງຕວົ ຢ່າງ T ອອກຕາມກິງ່ ໄມເ້ ປນັ ሼଵǡଶǡǥǡ୬ሽຕາມຄາ່ ທີິເ່ ປນັ ໄປໄດຂ້ ອງ x. ດັິ່ງນີັ້ນຈງ່ຶິ ສາມາດຄາໍ ນວນຄາ່ (Information Gain) ຫງຼັ ຈາກແບ່ງຕາມຄນຸ ລັກສະນະ ແລະ ຄາ່ ມາດຕະຖານເກນ ຂອງຄນຸ ລັກສະນະ x ୶ሺሻൌσ୬୲ୀଵȁȁ୲భȁȁሺଵሻ(2.2) ሺሻൌሺሻെ୶ሺሻ(2.3) ການຄໍານວນຄາ່ ການແຍກຂ້ໍີມູນ (Split Information) ຂອງຄນຸ ລັກສະນະແຕລ່ ະໂຕຖ້າໃຫ້ T ຄຊື ຸດ ຂອງຕົວຢ່າງເມອື່ິ ແບງ່ ຕົວຢາ່ ງນຕີ້ າມຄນູ ລັກສະນະ x ຈະໄດຊ້ ຸດຂອງຕົວຢາ່ ງຍອ່ ຍໃນແຕລ່ ະກິ່ງໄມ້ ຄື ሼଵǡଶǡǥǡ୬ሽຈໍານວນ n ຊຸດຕາມຄ່າທເ່ິີ ປນັ ໄປໄດໃ້ ນຄນຸ ລະນະ x ເມ່ອືິ ຄໍານວນຄາ່ (Split Information) ໄດ້ ສດູ ൌσ୲୬ୀଵȁȁ୲భȁȁ݈ଶ݃ȁȁ୲భȁȁ(2.4) ຄາໍ ນວນຄ່າມາດຕະຖານອດັ ຕາສວນເກນ (Gain ratio) ໄດຈ້ າກ Gain Ratio = Gain – Split (2.5) Information ທາ້ ຍສດຸ ຈງິຶ່ ເລອື ກຄາ່ Gain ratio ສູງສຸດເປນັ ຄຸນລັກສະນະເລີ່ມິ ຕີົນ້ ແລະ ເລອື ກຄຸນ ລກັ ສະນະຖັດໄປຕາມຄ່າ Gain ratio ນອ້ ຍລງົ ຕາມລາໍ ດັບ. 2.1.9 ສວ່ ນປະກອບຂອງຕນົີ້ ໄມກ້ ານຕດັ ສນິ ໃຈ 1. ໂນດ (Node) ແມນ່ ຄນຸ ລັກສະນະຕາ່ ງໆເປນັ ຂໍ້ມີ ນູ ທິແ່ີ ຍກຂີໍ້ມນູ ວ່າຈະໄປໃນທດິ ທາງໃດເຊງິ່ ທີິຢ່ ູ່ ສູງສດູ ເອີ້ນວາ່ (Root Node) 2. ກິ່ງໄມ້ (Branch) ແມ່ນຄນຸ ລກັ ສະນະໃນໂນດທີແ່ິ ຕກອອກມາ ໂດຍ ຈໍານວນຂອງກງ່ິ ໄມຈ້ ະເທິ່າົ ກບັ ຄຸນສົມບດັ ຂອງໂນດ. 3. ໃບ (Leaf) ແມ່ນກມຸ່ ຂອງຜນົ ໃນການຈາໍ ແນກຂອງຂ້ໍີມນູ . 9
Node Branch Leaf ຮບູ ທີ 2.3: ຕົີນ້ ໄມກ້ ານຕັດສິນໃຈ 2.1.10 ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network) ເຄອື ຂາ່ ຍປະສາດທຽມເປນັ ແບບຈໍາລອງທິ່ຮີ ຽນແບບການເຮດັ ວຽກຄາ້ ຍຄື ເສ້ີັນປະສາດຂອງມະນດຸ ເພືິອ່ ໃຫ້ສາມາດຕັດສນີ ໃຈບນັ ຫາບາງຢ່າງໄດ້ເຊນ່ັິ ດຽວກັນ ກບັ ມະນດຸ ເຮາົ ເຊງິ່ ປະກອບດວ້ ຍໂຄງສ້າງທາງ Neural ໄດ້ຖກື ການຈາໍ ລອງຢູ່ໃນຊນີ້ັ ທີມ່ິ ໂີ ຄງສາ້ ງ ທິ່ີປະກອບດ້ວຍຕົວຮບັ ຂໍີ້ມນູ (Input Layer), ຊນີ້ັ ທ່ີເິ ຊອິື່ ງໄວ້ (Hidden Layers) ແລະ ຊ້ນັີ ສະແດງຜນົ (Output Layer) ໃນແຕ່ລະຊ້ີັນປະກອບດວ້ ຍໂນດ (Nodes) ແລະ ໃນຊນັີ້ ທິີ່ ເຊ່ອືິ ງໄວປ້ ະກອບດວ້ ຍຊ້ນັີ ທສິີ່ ່ງິົ ຕວົ ແປດາ້ ນນອກ Output ໃນລະຫວ່າງຊນີ້ັ ແຕ່ລະຊ້ີນັ ຈະມກີ ານເຊືິ່ອມຕິໍ່ (Link), ແຕ່ການເຊິືອ່ ມຕິຈໍ່ ະມີຄ່ານ້າີໍ ໜັກ (Weights) ສະເພາະສໍາລບັ ການເຮັດໜາ້ ທີ່ິຄ່າຄວາມເຂ້ມັີ ແຂງ (Strength) ຂອງ ການເຊິອ່ື ມຕໍ່ິແບບເຊວປະສາດຄ້າຍຄືສະໝອງຂອງມະນດຸ ໂຄງສ້າງຂອງເຄອື ຂາ່ ຍປະສາດທຽມ ແມ່ນສະແດງຢູ່ໃນ ຮບູ ດງ່ິັ ລຸ່ມນີ້ (Orawan, 2016) Hidden Input Output ຮູບທີ 2.4: ເຄືອຂາ່ ຍປະສາດທຽມ (Neural Network) 2.1.11 Activation Function ຮູບແບບເຄອື ຂ່າຍປະສາດທຽມນນັ້ີ ຕ້ອງປະກອບໄປດວ້ ຍການເລອື ກ Activation Function ທ່ີິສົມ ເຫດສມົ ຜນົ ກັບຊດຸ ຂ້ມໍີ ນູ ທິ່ີນາໍ ເອາົ ທົດສອບໂດຍຫັກຼ ໆ Activation Function ທນິີ່ ິຍົມໃຊຈ້ ະມີຫາຼ ຍສະນີ້ນັ ຄວນ 10
ເລອື ກໃຫເ້ ໝາະສມົ ເພອື່ິ ສະດວກໃນການເຮັດຮບູ ແບບ (Model) ເຊງ່ິ ປະກອບມ:ີ Sigmoid, Tanh, ReLu (Udeme, 2018) Sigmoid Function ເປນັ ຟງັ ຊັນທີິ່ເປັນເສັນີ້ ໂຄງ້ (Curve) ລັກສະນະຄາ້ ຍຄຮື ບູ ໂຕ S ໂດຍມຄີ ່າ ລະຫວາ່ ງ 0-1 ເໝາະສມົ ກບັ ການໃຊ້ງານທິີ່ຕ້ອງການ Output ວ່າ 1=Yes, 0=No. ɐሺሻൌଵାଵୣష౮ (2.5) Tanh Function ຫືຼ ມຊີ ິ່ືເອນີ້ ວ່າ Hyperbolic Tangent Activation Function ເປນັ ຟງັ ຊນັ ທ່ິີ ປບັ ປງຸ ແກໄ້ ຂໃຫດ້ ກີ ວ່າ (Sigmoid Function) ລັກສະນະຄາ້ ຍຄືຮບູ ໂຕ S ເປນັ ການເອົາ Sigmoid ມາຄູນສອງ ໃຫ້ຢດື ຈາກ 0-1 ເປນັ 0-2 ሺݔሻ(2.6) ReLu Function ຫຍີໍ້ມາຈາກ Rectified Linear Unit ເປນັ ຟງັ ຊນັ ທີ່ມິ ີລກັ ສະນະເສັນີ້ ສະແດງເປັນ ເສັີ້ນຊ,່ືິ ຖ້າ Input ເປນັ ບວກ Slope ຈະເທົາ່ິ ກບັ 1 ຕະຫຼອດເຮດັ ໃຫ້ Gradient ບສໍິ່ ູນຫາຍສງົິ່ ຜນົ ເຮັດໃຫກ້ ານ ຝກຶ ສອນແບບຈໍາລອງໄດໄ້ ວຂນ້ຶີ . ሺͲǡݔሻ(2.7) ຮູບທີ 2.5: Activation Function (Udeme, 2018) 2.1.12 ການຈາໍ ແນກປະເພດແບບ Naive Bayes ເປນັ ການຈາໍ ແນກປະເພດຂໍີ້ມນູ ທີິ່ໃຊຫ້ ກຼັ ການຄວາມໜາ້ ຈະເປນັ ໄປໄດ້ (ຄາດການລວ່ ງໜ້າ) ຊງຶ່ິ ຢູ່ ພີື້ນຖານທດິ ສະດຂີ ອງ Bayes ຖກື ພັດທະນາໂດຍທາ່ ນ Thomas Bayes ສວ່ ນການເກດີ ຂອງເຫດການຕາ່ ງໆນນ້ີັ ມັນຕ້ອງເປັນເອກະລາດຕິໍ່ກນັ (Independence) ຫືຼ ເອີ້ນວາ່ ເປັນການຈດັ ໝວດໝ່ໂູ ດຍໃຊຫ້ ັຼກການຄວາມໜາ້ ຈະ ເປັນໄປໄດເ້ ຂາ້ີົ ມາຊ່ວຍໃນການຄາໍ ນວນ (Richard & Michael, 2003) 11
ܲሺܿȁݔሻൌሺ௫ȁሺሻ௫ሻሺሻ(2.8) ሺ
ȁሻൌሺݔଵȁܿሻכሺݔଶȁܿሻכǥǥǤכሺݔȁܿሻܲכሺܿሻ(2.9) C ແມນ່ Class X ແມນ່ Attribute P ແມນ່ ຄວາມໜາ້ ຈະເປນັ ຂອງເຫດການ (Probability) P(c|x) ແມນ່ ຄວາມໜ້າຈະເປນັ ໄປໄດຂ້ ອງເຫດການທິີ່ C ເປນັ Class ແລະ ມີ x ເປັນ Attribute ሺ
ሻແມນ່ ຄວາມໜາ້ ຈະເປັນຂອງເຫດການທ່ີຈິ ໍານວນ Class C ທີ່ິຈະເກີດຂນ້ຶີ ሺሻແມນ່ ຄວາມໜ້າຈະເປນັ ຂອງເຫດການທ່ີິຈາໍ ນວນ Attribute x ທຈ່ີິ ະເກດີ ຂນີຶ້ 2.1.13 ພາສາ (SQL) SQL ຫຍ້ມໍີ າຈາກ (Structured Query Language) ແມນ່ ພາສາການຂຽນໂປແກຣມ ເພອ່ິື ຈດັ ການ ກັບຖານຂໍ້ມີ ູນໂດຍສະເພາະ ເປນັ ພາສາຂຽນໂປຣແກຣມຈັດການຖານຂີມໍ້ ນູ ພີື້ນຖານທນ່ີິ ຍິ ມົ ໃຊແ້ ຜຫ່ າຼ ຍ ແລະ ເປນັ ລະບົບເປດີ (Open Source), ໝາຍຄວາມວາ່ ຮົາສາມາດໃຊ້ ຄໍາສ່ງັິ SQL ກັບທກຸ ຊະນດິ ຂອງຖານຂມໍ້ີ ນູ ນອກຈາກ ນນັີ້ SQL ຍັງແມນ່ ໂປແກຣມຖານຂມ້ໍີ ູນທີ່ິມີໂຄງສາ້ ງພາສາທີິມ່ ຄີ ວາມເຂາີົ້ ໃຈງ່າຍ ແລະ ສາມາດປະຕິບັດວຽກງານທ່ີິ ສັບສນົ ໂດຍມພີ ຽງສອງສາມຄາໍ ສ່ັິງໃນການຂຽນໂປແກຣມ SQL ເທາິ່ົ ນີນ້ັ ມນັ ສາມາດແບ່ງອອກເປນັ 4 ປະເພດການ ເຮດັ ວຽກ (Hans-Petter, 2017) ດງິັ່ ນີ້: 1. Select query ເພອິື່ ດງຶ ເອາົ ຂ້ີໍມນູ ມາສະແດງຜນົ . 2. Update query ປບັ ປງຸ ແລະ ເພອິື່ ແກໄ້ ຂຂໍ້ມີ ນູ . 3. Insert query ແມ່ນໃຊເ້ ພືິອ່ ເພີິ່ມຂໍ້ີມນູ . 4. Delete query ແມ່ນໃຊ້ເພອ່ິື ລບຶ ຂ້ີໍມູນຈາກມັນ. 2.1.14 ຊອບແວຂດຸ ຄນ້ ຂມ້ ນູ (Orange Tool) ຊອບແວຂດຸ ຄີນ້ົ ຂີມໍ້ ນູ ORANGE ແມນ່ ຖກື ພດັ ທະນາໂດຍນັກວິທະຍາສາດ ຢມູ່ ະຫາວທິ ະຍາໄລ ຂອງ Ljubljana ໃນປີ 1997 ປະເທດສະໂລເວເນຍ ໂດຍໃຊ້ພາສາການຂຽນໂປແກຣມ Python, Cython, C ++ ແລະ C. ສະພາບແວດລ້ອມກາບຟກິ ແລະ ອນິ ເຕີເຟດຂອງໂປແກຣມໄດ້ຖກື ພັດທະນາໂດຍໃຊ້ ໄລເບລີ Python ແລະ Qt3 ນີ້ແມນ່ ຊອບແວໜິ່ຶງ ທິຊ່ີ ວ່ ຍໃນການສ້າງ Data Mining, ເໝາະສມົ ສາໍ ລບັ ການວິເຄາະຂ້ີໍມນູ ຂອງຜເູ້ ລ່ີມິ ຕີົ້ນ ແລະ ຜຊູ້ ່ຽວຊານ ເປນັ ການຂດຸ ຄ້ນີົ ຂີ້ມໍ ູນໂດຍຜາ່ ນການຂຽນໂປແກຣມຮບູ ພາບ ຫຼື Python Scripting ເປັນສວ່ ນປະກອບ ສໍາລບັ ການຮຽນຮເູ້ ຄືິ່ອງຈກັ (Machine Learning), Orange ເປນັ ຊອບແວແບບ (Visual Programming) ດ່ງັິ ນນັີ້ ລກັ ສະນະການເຮດັ ວຽກສວ່ ນໃຫຍຈ່ ງິຶ່ ເປນັ ແບບ Drag and Drop ຄກື ານໃຊ້ ເມາ້ົີ ໃນການເລອື ກ ແລະ ລາກວາງໃສໜ່ າ້ ຈຫໍ ກັຼ , ຫຼັງຈາກນນີ້ັ ກໍານົດຄ່າ Parameter ຕາ່ ງໆທກິີ່ ່ຽວຂອ້ ງ (Demšar & Zupan, 2012) 12
ຮູບທີ 2.6: ຊອບແວຂຸດຄີນົ້ ຂໍມ້ີ ນູ (ORANGE) 2.1.15 K-fold Cross Validation k-fold ແມນ່ ໃຊ້ເພ່ອິື ທດົ ສອບປະສດິ ຕພິ າບແບບຈໍາລອງ ແລະ ໃຊເ້ ພືິອ່ ໃຫໄ້ ດ້ຜນົ ທິທີ່ ົດສອບ Model ໃຫມ້ ຄີ ວາມໜ້າເຊືອິ່ ຖ,ື ການວດັ ຄາ່ ຄວາມຖືກຕອ້ ງແບບ k-fold ນຈີ້ ິຶ່ງນຍິ ົມໃຊ້ຫຼາຍໃນບດົ ງານວໄິ ຈຕາ່ ງໆ , ຫກຼັ ການຂອງມັນແມ່ນການແບ່ງຂມ້ີໍ ູນອອກເປັນສ່ວນໆເທົ່ິາໆກນັ ແບບ Random ຄື: ແບງ່ 5 ສ່ວນ, 10 ສວ່ ນ ແລະ 15 ສວ່ ນ, ໂຕເລກ {5, 10, 15} ເຮົາເອນີ້ ວາ່ ຄາ່ K ດງິັ່ ນ້ັີນຈຶິ່ງເອນ້ີ ຊື່ວິ ່າ (k-fold Cross Validation) ຖາ້ ເລືອກ K=5 ໝາຍຄວາມວ່າແບ່ງຂ້ໍີມນູ ອອກເປນັ 5 ສວ່ ນເພິອື່ ມາ Train Model ແລະ Test Model (Pacharawongsakda, 2015) ການໃຊ້ k-fold: ຖ້າ K=5 ເຮາົ ຈະ Train & Test 6 ຮອບ ແບງ່ ຂມີ້ໍ ນູ ເປນັ 5 ຊອ່ ງ {1,2,3,4,5} ຮອບທີ 1: train {1,2,3,4} ແລະ test {5} ຮອບທີ 2: train {1,2,3,5} ແລະ test {4} ຮອບທີ 3: train {1,2,5,4} ແລະ test {3} ຮອບທີ 4: train {1,5,3,4} ແລະ test {2} ຮອບທີ 5: train {5,2,3,4} ແລະ test {1} ຮອບທີ 6 ຮອບສດຸ ທ້າຍເປນັ ການ train ໂດຍນໍາໃຊ້ All Data {1,2,3,4,5} ເພ່ືິອສາ້ ງ Final Model ກັບຄາ່ Hyperparameters ທິ່ດີ ີທ່ິສີ ດຸ ຈາກການທົດສອບ 5 ຮອບຂ້າງເທງິ . 2.1.16 Confusion Matrix ມາຕຣິ ດສບັ ສນົ (Confusion Matrix) ເປນັ ໂຕຊ່ວຍໃນການສະຫຼຸບປະສດິ ຕພິ າບຂອງແບບຈໍາລອງ ແລະ ຈາໍ ແນກປະເພດ, ລັກສະນະເປນັ ແບບເລກມາຕິຣດ 2x2 ຖ້າ Class ເປີ້ົາໝາຍມີ 3 ຄາ່ ໝາຍຄວາມວາ່ Confusion Matrix ຈະເປນັ ເລກມາຕຣິ ດ 3x3 ເປນັ ຕີ້ົນ. ໃນການປະເມີນປະສດິ ຕິພາບໄດ້ນນ້ີັ ຕອ້ ງມີ 4 ຄ່າຄ:ື Precision, Recall, Accuracy ແລະ F1 (Pagon Gatchalee, 2019) ໂດຍຄາໍ ນວນອອກມາຢູ່ໃນລກັ ສະນະ ອດັ ຕາສວ່ ນຮ້ອຍ (%) 13
ሺΨሻൌା(2.10)
ሺΨሻൌା(2.11)
ሺΨሻൌ
ା (2.12) ାାା ͳሺΨሻൌʹכቀ୰୰ୣୣୡୡ୧୧ାכୱୱୖୖ୧୧ୣୣ୭୭ୡୡ୬୬ୟୟቁ(୪୪2୪୪.13) ຕາຕະລາງທີ 2.2: Confusion Matrix ¾ True Positive (TP) ຄສື ງິ່ ທິີ່ໂປຣແກຣມ Predict “ເປນັ ຈງິ ” ແລະ ມີຄ່າເປນັ “ຖກື ´ ¾ True Negative (TN) ຄສື ິງ່ ທິໂ່ີ ປຣແກຣມ Predict “ເປັນຈງິ ” ແລະ ມຄີ າ່ ເປນັ “ຜດິ ´ ¾ False Positive (FP) ຄສື ິ່ງທ່ໂີິ ປຣແກຣມ Predict “ບ່ໍິເປນັ ຈງິ ” ແລະ ມຄີ ່າເປນັ “ຖືກ´ ¾ False Negative (FN) ຄືສງິ່ ທີ່ິໂປຣແກຣມ Predict “ບ່ໍເິ ປນັ ຈິງ” ແລະ ມຄີ ່າເປນັ “ຜດິ ´ 2.2 ທບົ ທວນບດົ ຄນ້ີົ ຄວາ້ ວທິ ະຍາສາດທກີິ່ ຽ່ ວຂອ້ ງ ຫວົ ຂໍ້ີ ³ການຄາດຄະເນການເປນັ ເນອີ້ື ງອກໃນເລອື ດ ແລະ ຂມີໍ້ ນູ ຜນົ ການກວດເລອື ດນໍາໃຊ້ເຕັກນິກການຂດຸ ຄົ້ນີ ຂ້ມໍີ ນູ ´ ລະບບົ ການຮກັ ສາສຂຸ ະພາບຂອງມະນຸດນັນີ້ ມຈີ າໍ ນວນມະຫາສານເປນັ ຂໍີ້ມູນໃຫຍ່ ການຂຸດຄນົີ້ ຂມໍ້ີ ນູ ແມນ່ ຂະບວນການຄິດໄລ່ຂອງຮູບແບບການຮຽນຮ້ໃູ ນຊດຸ ສະຖຕິ ິເຊນ່ິັ : ພະຍາດເລອື ດ, ມຂີ ໍ້ີມູນການທດົ ສອບຫາຼ ຍ ຢ່າງທ່ີສິ າມາດເກັບໄດຈ້ າກຄົນເຈບັ ຂອງພວກເຂາົ . ບນັ ດາການຊອກຄົີນ້ ຫາ ແລະ ການສາ້ ງຂ້ມີໍ ນູ ຈາກສະຖິຕທິ າງ ການແພດ ໂດຍການນາໍ ໃຊ້ເຕກັ ນິກການຂດຸ ຄົ້ີນຂມີ້ໍ ນູ ນ້ີັນ ມຄີ ວາມຈາໍ ເປັນໃນຂີໍ້ມູນທາງການແພດຫາຼ ຍ, ເຊິງ່ ສາມາດ ຊ່ວຍໃນການກວດຫາພະຍາດຕ່າງໆໃນໄລຍະເລິມ່ີ ຕນົີ້ ຫືຼ ກອ່ ນເກີດພະຍາດນ້ີນັ ໃນບດົ ຄນ້ົີ ຄວ້ ານ້ີ, ພວກເຂົາໄດ້ ນາໍ ໃຊ້ເຕກັ ນິກການຂດຸ ຄ້ົີນຂໍມີ້ ນູ ເພອ່ືິ ແກ້ໄຂການເຊອ່ືິ ມຕໍລິ່ ະຫວາ່ ງຄວາມເປນັ ເອກະລັກຂອງການກວດເລືອດ. (ໂລກ ເລອື ດຈາງ) ແລະ ການໄຄບ່ ວມຂອງເລອື ດ, ເພອືິ່ ບອກລວ່ ງໜາ້ ກ່ຽວກບັ ພະຍາດດ່ິັງກ່າວໃນໄລຍະເລີ່ມິ ຕີ້ນົ , ເຊ່ິງ ສາມາດ ພັດທະນາຄວາມສາມາດໃນການປິນ່ ປົວ. ຈຸດປະສ່ິົງຂອງການທົດລອງຂອງພວກເຂາົ ແມ່ນເພືິ່ອຜະລດິ ແມ່ ແບບ ແລະ ແອັບທີິ່ສາມາດແຈງ້ ໃຫ້ຄົນເຈັບຮູ້ຜົນກວດ ສໍາລັບບດົ ນຈ້ີ ະເປນັ ວິທີການ ແລະ ຂນ້ີັ ຕອນການເຮດັ ຂຸດຄນົ້ີ ຂີໍມ້ ນູ (Abinaya & Sumathi, 2018) ຫົວຂີ້ໍ ³ຄາດຄະເນຄວາມສ່ຽງຂອງພາວະແຊກຊອ້ ນຂອງໂລກເບາົ ຫວານ ໂດຍການນໍາໃຊ້ເຕກັ ນກິ ການຂຸດ ຄົີ້ນຂໍມີ້ ນູ ´ໂລກເບົາຫວານເປນັ ໂລກໜ່ງຶິ ທ່ິີມຄີ ວາມຮາ້ ຍແຮງຫາຼ ຍ ແລະ ເຮັດໃຫ້ຄວາມດນັ ເລອື ດສູງເປນັ ອັນຕະລາຍ ທສ່ິີ ຸດສາໍ ລບັ ຄນົ ເຈບັ ທເ່ິີ ປນັ ໂລກເບາົ ຫວານ. ໂລກເບາົ ຫວານສວ່ ນຫາຼ ຍແມນ່ ເກດີ ມາຈາກຮາ່ ງກາຍທຜ່ິີ ະລດິ ຮໂໍ ມນ ແລະ ອນິ ຊລູ ິນບ່ິໍພຽງພທໍ ຈິ່ີ ະເອົານໍີ້າຕານໃນເລືອດໄປສສູ່ ວ່ ນຕາ່ ງໆຂອງຮ່າງກາຍ, ສົງິ່ ຜນົ ໃຫ້ເກດີ ການອດຸ ຕນັ ຂອງນາີໍ້ 14
ຕານໃນເສີັນ້ ເລືອດແດງ ສ່ງິ ນສີ້ າມາດເຮັດໃຫ້ເກດີ ພະຍາດ ແລະ ອາການຕ່າງໆ. ອາການແຊກຊ້ອນໃນອະໄວຍະວະ ຕ່າງໆຕິ່ໄໍ ປນນີ້ ກັ ຄ້ນີົ ຄວ້າສນົ ໃຈຮຽນຮູກ້ ່ຽວກັບອາການແຊກຊອ້ ນຂອງ (Hypertension) ທ່ມິີ ກັ ຈະເກດີ ຂນີ້ື ພອ້ ມ ກັນ. ໃນຜູປ້ ວ່ ຍໂລກເບາົ ຫວານທມີິ່ ີຄວາມດັນເລອື ດສງູ ພວກເຂາົ ໄດຄ້ ນ້ີົ ຄວາ້ ສຶກສາຂ້ີມໍ ູນຂອງຜເູ້ ປນັ ໂລກເບາົ ຫວານ ກັບຜນົ ການກວດສຂຸ ະພາບເປນັ ປະຈໍາປີ ດວ້ ຍການວດັ ແທກຄວາມດັນ ດວ້ ຍເຕັກນກິ ການຈດັ ແບງ່ ປະເພດຂີ້ມໍ ນູ (Classification) ຈາກຮູບແບບແຜນວາດຕ້ນີົ ໄມ້ຕັດສິນໃຈ (Decision Tree) ແລະ ການຈດັ ແບງ່ Class (k- NN) ວເິ ຄາະ ແລະ ຄາດເດາົ ຄວາມສ່ຽງຂອງພະຍາດຂອງຄົນເຈັບຄວາມດນັ ເລອື ດສູງ ໂດຍວິທີການຮບູ ແບບແຜນ ວາດຕີ້ົນໄມ້ຕັດສນິ ໃຈມຄີ ວາມແມນ່ ຍາີໍ້ ຫຼາຍກວ່າການ Class (k-NN) ສງູ ເຖິງ 92.08% (Rungruedee & Chumwatana, 2017) ຫວົ ຂີໍ້ ³ການປຽບທຽບເຕກັ ນກິ ການຈດັ ປະເພດແຕກຕ່າງກັນໂດຍໃຊ້ WEKA ສໍາລບັ ຂມ້ີໍ ນູ ຜນົ ການກວດ ເລືອດ´ ຜູ້ຊ່ຽວຊານດ້ານການແພດຕ້ອງການວິທີການຄາດເດາົ ທໜ່ີິ າ້ ເຊ່ິອື ຖືໃນການວນິ ິໄສຂ້ມໍີ ນູ ກ່ຽວກບັ ຜນົ ການ ກວດເລອື ດ. ເພອ່ືິ ຫຼຸດຜ່ອນຂ້ີມໍ ນູ ຈາໍ ນວນຫວຼ ງຫາຼ ຍກຽ່ ວກບັ ຄນົ ເຈບັ ແລະ ສະພາບການປນ່ິ ປວົ ທາງການແພດຂອງ ພວກເຂາົ . ໂດຍທິວ່ົ ໄປແລວ້ ໃນການຂຸດຄນ້ີົ ຂມ້ໍີ ນູ (ບາງຄງ້ັີ ເອ້ີນວ່າການຊອກຂມ້ໍີ ນູ ຫືຼ ການຄນົີ້ ພບົ ຄວາມຮູ້) ເພິນ່ີ ສຶກ ສາກ່ຽວກບັ ສດູ ການຄິດໄລກ່ ານຈດັ ປະເພດຕ່າງໆ. ທິດສະດຕີ ້ນົີ ຕໍຈດຸ ປະສງົ ເພື່ິອສະແດງໃຫເ້ ຫນັ ເຕກັ ນກິ ການ ປຽບທຽບຂອງສດູ ການຄດິ ໄລກ່ ານຈດັ ປະເພດຮບູ ແບບທ່ແີິ ຕກຕ່າງກນັ ໂດຍໃຊ້ (Waikato Environment for Knowledge) ເປນັ ເຄືິ່ອງມືໃນການວິເຄາະຜນົ ຫຼື ເອນີ້ ໂດຍຫຍີ້ໍວາ່ ໂປຣແກຣມ WEKA ແລະ ຄົີນ້ ພົບວາ່ ສດູ ໃດທເີ່ິ ໝາະສົມທສິ່ີ ຸດ ສາໍ ລບັ ຜໃູ້ ຊທ້ ກ່ິີ າໍ ລງັ ເຮດັ ວຽກກຽ່ ວກບັ ຂມີ້ໍ ນູ ຜນົ ການກວດເລອື ດ ໃນການນາໍ ໃຊຮ້ ບູ ແບບທສີ່ິ ະເໜີ ໃຫ້ ທາ່ ນໝໍຄນົ ໃໝ່ ຫືຼ ຄົນເຈບັ ສາມາດຄາດເດາົ ຂມໍ້ີ ນູ ກ່ຽວກັບຜນົ ການກວດເລອື ດໄດ້ຜາ່ ນ Mobile App ທ່ິີ ສາມາດບງ່ິົ ມະຕິ ແລະ ສະແດງຜນົ ກຽ່ ວກບັ ຂໍມ້ີ ນູ ການກວດເລອື ດ. ສດູ ການຄດິ ໄລ່ທິດີ່ ີທສ່ີິ ຸດໂດຍອງີ ໃສຂ່ ມ້ໍີ ນູ ກຽ່ ວ ກບັ ເມດັ ເລອື ດແມນ່ ການຈັດປະເພດແບບຕ້ນີົ ໄມ້ J48 ໂດຍມຄີ ວາມຖືກຕ້ອງ 97,16% ແລະ ເວລາທັງໝດົ ທໃີິ່ ຊໃ້ ນ ການກິ່ສໍ ້າງຕົວແບບແມ່ນຢູ່ 0.03 ວິນາທ,ີ ສ່ວນປະເພດແບບ Naïve Bayes ໂດຍມຄີ ວາມຖກື ຕ້ອງ 29,71% (Md. Nurul Amin & Md. Ahsan Habib, 2015) ຫວົ ຂ້ີໍ ³ການປຽບທຽບປະສິດຕິພາບໃນການຄາດຄະເນໂອກາດການເປັນໂລກເບາົ ຫວານ´ ການສກຶ ສາ ປຽບທຽບປະສດິ ທພິ າບໂອກາດການເກີດຂອງ ພະຍາດເບາົ ຫວານສາໍ ລັບໂຮງໝແໍ ຫງ່ ໜຶງິ່ ໂດຍໃຊວ້ ິທີການຈັດ ປະເພດ 6 ແບບຄ:ື ວິທີການຫາຄວາມໃກ້ຄຽງ (k-nearest neighbor), ຕດັ ສນິ ໃຈແບບຕນ້ີົ ໄມ້ (Decision tree), ວທິ ີເຄອື ຂາ່ ຍປະສາດທຽມ (Artificial neural network), ວທິ ີການແບບ (Support vector machine SVM), ວິທີການແບບ ໄບນາລີ (Binary logistic regression) ແລະ ວທິ ກີ ານ (Naïve Bayes) ໃນການປຽບທຽບຜນົ ຂອງວທິ ຈີ ໍາແນກກມຸ່ ທງັ ໝດົ ທັງ 6 ວທິ ຈີ ະໃຊຄ້ ່າຄວາມຊດັ ເຈນສະເລຍ່ Mean Absolute Error (MAE) ແລະ ຄາ່ ຄວາມຄາດເຄອ່ິື ນກາໍ ລງັ ສອງສະເລຍ່ Mean Square Error (MSE) ຜນົ ການສຶກສາພບົ ວ່າວິທີການເຄອື ຂ່າຍ ປະສາດທຽມ ມີຄ່າຄວາມຖຶກຕອ້ ງ ຄ່າຄວາມຊດັ ເຈນສະເລ່ຍ ແລະ ຄາ່ ຄວາມຄາດເຄິ່ືອນກໍາລງັ ສອງສະເລ່ຍດທີ ສ່ິີ ຸດ ຄື 95,94%, 0,0491% ແລະ 0,0396% ຕາມລາໍ ດບັ (Saichon Sinsomboonthong, 2018) 15
2.3 ຂອບເຂດແນວຄວາມຄດິ ຜວູ້ ໄິ ຈໄດ້ກາໍ ນດົ ເອາົ ຂມໍ້ີ ູນການກວດເລອື ດຢູ່ໃນຊວ່ ງປີ 2019-2020. 1. ໄດກ້ າໍ ນົດເອາົ ການແບ່ງປະເພດ ແລະ ການຄາດຄະເນ (Classification and Prediction) ຢູ່ໃນ 03 ຮບູ ແບບຄື: ຕ້ີນົ ໄມຕ້ ດັ ສນິ ໃຈ (Decision Tree), ເຄອື ຂ່າຍປະສາດທຽມ (Neural Network) ແລະ ການຈໍາແນກແບບ Naive Bayes. 2. ໄດກ້ າໍ ນົດເອາົ Orange Tool ເປນັ ໂຕເຮດັ ການຂດຸ ຄນົີ້ ຂີ້ມໍ ນູ (Data Mining). 16
ພາກທີ ວທິ ກີ ານສກຶ ສາ 3.1 ການອອກແບບການສກຶ ສາ 3.1.1 ການກາໍ ນດົ ເນອ້ືີ ໃນ ໃນການຄົີນ້ ຄວ້ າໃນຄງັ້ີ ນີ້ແມນ່ ກໍານົດເອົາຜົນຂີມໍ້ ນູ ການກວດເລອື ດໃນຊວ່ ງປີ 2019-2020 ຈາໍ ນວນ 1543 ຄົນທີຜ່ິ າ່ ນການກວດເລອື ດໂຕຈງິ , ນາໍ ໃຊ້ເຕັກນິກການປະມວນຜນົ ແລະ ຂດຸ ຄີົນ້ ຂ້ີໍມູນ (Data Mining) ນນັີ້ ໄດ້ນາໍ ໃຊ້ 3 ຮບູ ແບບຄື: ການຕດັ ສິນໃຈແບບຕີົນ້ ໄມ້ (Decision Tree), ເຄືອຂາ່ ຍປະສາດທຽມ (Neural Network) ແລະ ການຈໍາແນກປະເພດແບບ Naive Bayes. ສ່ວນໂປຣແກຣມ Orange ໃຊເ້ ຮດັ Train Model ແລະ Test Model ເພ່ິອື ຫາຄວາມຊດັ ເຈນຂອງ Model ແລວ້ ເອົາຮບູ ແບບທດິີ່ ທີ ສີ່ິ ດຸ ມາເປນັ ໂຕຕົີນ້ ແບບໃນການ ສ້າງໂປຣແກຣມຄາໍ ນວນຜົນການກວດເລອື ດ (ຄວາມສ່ຽງທີຈິ່ ະເກີດພະຍາດ). ຕາຕະລາງທີ 3.1: ແຜນພາບການກາໍ ນົດເນອືີ້ ໃນຂອງບົດຄົ້ີນຄວ້ າ ຄາດຄະເນ ອ າດເ ດີ ະຍາດ າ ນ ານ ວດເລືອດ ດຍນາໃຊເ້ ຕັ ນ ານຂດຸ ຄນ້ ຂມ້ ນູ (Data set) ເຕັ ນ (Data Mining) ເຄ່ ອື ງມື (Orange) ານ ດັ ທະນາລະບບ (Decision Tree) ເອາຂມ້ ນູ ໃນປີ 2019- (Neural Network) Train Model & Test 2020 ານວນ 1,543 ຄນ (Naive Bayes) Model 3.1.2 ການຄດັ ເລອື ກພນືີ້ ທ່ີິ ການສຶກສາຄີນ້ົ ຄວ້ າໃນບົດນແີ້ ມນ່ ເລືອກພື້ນີ ທຢິີ່ ໃູ່ ນຂອບເຂດສະຖານທີຂ່ິ ອງໂຮງໝໍ 5 ເມສາພະແນກ ວເິ ຄາະວິທະຍາ, ກົມໃຫຍພ່ ະລາທກິ ານ. 3.1.3 ໄລຍະເວລາການສກຶ ສາ ສາໍ ລບັ ການສກຶ ສາຄນົີ້ ຄວ້ າໃນບົດນີ້ຈະໃຊ້ເວລາຕາມແຜນການດໍາເນີນງານຄນີົ້ ຄວ້ າ ແລະ ໄລຍະເວລາ ເຊິງ່ ຈະເລ່ິີມຕ້ີງັ ແຕເ່ ດືອນ ກຸມພາ ຫາເດືອນ ພະຈິກ ປີ 2021. 3.2 ຂີ້ມໍ ນູ ການສກຶ ສາ ການເກັບກໍາຂ້ມໍີ ນູ ການສຶກສາ ແມນ່ ນໍາໃຊ້ແບບຂເໍ ອາົ ຂມີໍ້ ູນແບບສໍາເນົາ (copy) ເອກະສານສວ່ ນໃຫຍຂ່ ີມ້ໍ ນູ ຈະເປັນແບບຕວົ ໜງັ ສື ແລະ ເປນັ ຕົວເລກບ່ໍມິ ຮີ ູບພາບ, ເອກະສານເປນັ Excel ມຈີ າໍ ນວນ 1543 ຄນົ . ສາມາດນໍາມາເຮັດບດົ ຄນີົ້ ຄວ້ າບົດວິໄຈໃນຄັ້ງີ ນຢີ້ າ່ ງຖຶກຕ້ອງຕາມກດົ ລະບຽບຂອງໂຮງໝໍ ແລະ ໄດຮ້ ັບ ອະນຍຸ າດໃຫ້ເອາົ ຂໍມ້ີ ນູ ນີ້ ມາໃຊໃ້ ນການສຶກສາຄນີົ້ ຄວ້ າວໄິ ຈ, ໂດຍຂມໍີ້ ນູ ທໄ່ີິ ດມ້ າໄດຮ້ ັບເຫນັ ດຈີ າກຂີ້ັນເທິງ (ອາໍ ນວຍການໂຮງໝໍ 5 ເມສາ). 17
3.2.1 ບນັ ດາຂມີໍ້ ນູ ການສກຶ ສາ ໂດຍຜວູ້ ິໄຈໄດກ້ າໍ ນົດເອົາບນັ ດາຂມ້ີໍ ນູ ທິ່ຜີ ່ານການລົງສກຶ ສາໂຕຈງິ ຈາກຂີ້ມໍ ນູ ທຜິ່ີ ່ານເຄອືິ່ ງວເິ ຄາະເມດັ ເລືອດ ມາແລ້ວ ມາເກບັ ໄວ້ໃນໂປຣແກຣມເກັບກໍາຂ້ມໍີ ູນ ລະອຽດໂດຍຈະສະແດງໃຫ້ເຫນັ ໃນຕາຕະລາງດ່ງິັ ນີ:້ ຕາຕະລາງທີ 3.2: ຂີ້ມໍ ູນ ແລະ ລາຍລະອຽດທຈ່ິີ ະນາໍ ມາຄົ້ນີ ຄວ້ າໃນບົດນີ້ ລ/ດ ຂ້ໍີມນູ ຄວາມໝາຍ ລະດັບປົກກະຕິ ຫວົ ໜ່ວຍ ປະເພດ 1 Name ຊືິ່ - - Text ອາຍຸ - - Number 2 Age ເພດ - 0,1 Number ເມັດເລືອດແດງ Number 3 Sex 4.2 - 5.5 106/uL 4 RBC 5 HGB ເຮໂມໂກບຼ ີນ 12 ¤16 g/dL Number 6 HCT ເຮມາໂຕຊດິ 37 – 47 % Number 7 WBC ເມດັ ເລືອດຂາວ 5,000 - 11,000 103/uL Number 8 PLT ປະລມິ ານເກັດເລອື ດ 140-400 103/uL Number 9 Level ຄວາມສ່ຽງ No-Risk, Risk - Text ເພືິອ່ ຈະສຶກສາ ແລະ ຫາຂອບເຂດຄວາມສ່ຽງນນ້ັີ ໄດ້ກໍານົດເອາົ ຄາ່ ມາດຕະຖານທ່ຈີິ ະເປນັ ຄວາມສ່ຽງ ໄວເ້ ປນັ ແຕ່ລະກລໍ ະນີດ່ິັງນີ້: ກໍລະນີ 1: ເມດັ ເລອື ດແດງ (RBC) ຕ້ອງຢູ່ໃນລະດບັ 4.2-5.5 106/ul ຖາ້ ໜ້ອຍກວ່າ ຫຼື ສງູ ກວ່າຄ່າ ມາດຕະຖານ ຈະຢໃູ່ ນສະຖານະມີຄວາມສຽ່ ງ. ກລໍ ະນີ 2: ເຮໂມໂກບຼ ນີ (HGB) ຕອ້ ງຢໃູ່ ນລະດບັ 12¤16 g/dl ຖ້າໜອ້ ຍກວ່າ ຫືຼ ສງູ ກວ່າຄາ່ ມາດຕະຖານ ຈະຢູໃ່ ນສະຖານະມີຄວາມສ່ຽງ. ກລໍ ະນີ 3: ເຮມາໂຕຊິດ (HCT) ຕ້ອງຢູ່ໃນລະດບັ 37–47 % ຖາ້ ໜອ້ ຍກວ່າ ຫຼື ສງູ ກວາ່ ຄາ່ ມາດຕະຖານ ຈະຢໃູ່ ນສະຖານະມີຄວາມສ່ຽງ. ກລໍ ະນີ 4: ເມດັ ເລືອດຂາວ (WBC) ຕອ້ ງຢູ່ໃນລະດັບ 5,000 - 11,000 103/ul ຖ້າໜ້ອຍກວາ່ ຫືຼ ສູງກວ່າຄ່າມາດຕະຖານ ຈະຢູ່ໃນສະຖານະມີຄວາມສ່ຽງ. ກລໍ ະນີ 5: ປະລິມານເກັດເລືອດ (PLT) ຕອ້ ງຢໃູ່ ນລະດັບ 140-400 103/ul ຖ້າໜອ້ ຍກວາ່ ຫຼື ສູງ ກວາ່ ຄາ່ ມາດຕະຖານ ຈະຢໃູ່ ນສະຖານະມຄີ ວາມສຽ່ ງ. 3.2.2 ວທິ ເີ ກບັ ກາໍ ຂມີ້ໍ ນູ ຂ້ມີໍ ນູ ທ່ິີຈະນາໍ ເຂ້ົີາມາໃຊໃ້ ນການວິເຄາະຄັ້ີງນີ້ປະກອບມີ ຜນົ ຂ້ໍມີ ູນການກວດເລອື ດປີ 2019-2020 ເຊິ່ງປະກອບໄປດ້ວຍຂໍມ້ີ ນູ ເລືອດທິຢ່ີ ໃູ່ ນເກນປກົ ກະຕິ ແລະ ບໍິປ່ ກົ ກະຕິ (ເລອື ດຕ່ິໍາ-ສງູ ), ສ່ວນວິທີໃນການເກບັ ກາໍ ຂໍ້ມີ ນູ ຂອງການຄົ້ນີ ຄວ້ າໃນຄງັີ້ ນແີ້ ມນ່ ຜູ້ວໄິ ຈໄດຮ້ າ່ ງເອກະສານຂຂໍ ໍ້ີມູນ ແລະ ຢນື ໃບຄາໍ ຮອ້ ງຂຂໍ ີ້ມໍ ນູ ຈາກພາກສວ່ ນທິີ່ ກ່ຽວຂ້ອງ ແລະ ໄດ້ສໍາເນາົ (Copy) ເອົາຂ້ີໍມນູ ຈາກຫ້ອງວິເຄາະເລືອດ. 18
3.2.3 ເຄອິື່ ງມທື ນ່ິີ າໍ ໃຊເ້ ກບັ ກາໍ ຂມ້ໍີ ນູ ອຸປະກອນທນ່ິີ ໍາໃຊໃ້ ນການຄນົ້ີ ຄວ້ າປະກອບມ:ີ ຄອມພວິ ເຕີ 02 ເຄອ່ືິ ງ 1. Desktop-3UV68M2 ໃຊ້ໃນການເຮັດຂຸດຄົ້ີນຂໍີ້ມູນ (Data Minning) RAM: 8 Gb Hard Disk: 1 Tb CPU: core i3 (2.10 Ghz extend 2.6 Ghz) OS: Window 10 Pro 64bit 2. Laptop-D19FGRPL ໃນການພດັ ທະນາລະບບົ RAM: 8 Gb Hard Disk: 1 Tb CPU: core i5 (3.00 Ghz extend 4.5 Ghz) OS: Window 10 Home 64bit 3. ໂປຣແກຣມທິນ່ີ ໍາໃຊ້ໃນການຄນ້ົີ ຄວ້ າປະກອບມີ: Microsoft Visio 2019 ໃຊ້ອອກແບບຮບູ ພາບ ແລະ ຕາຕະລາງຕາ່ ງໆ Visual Studio 2013 & Visual Studio Code ໃຊ້ຂຽນໂຄດ ແລະ ສ້າງໂປຣແກຣມ Microsoft SQL 2019 ໃຊ້ເປນັ ບອ່ ນຈດັ ເກບັ ຂມ້ໍີ ູນ ຫຼື ຖານຂມ້ີໍ ນູ Orange 3.29.3 ໃຊເ້ ຮດັ ຂດຸ ຄນົີ້ ຂ້ມໍີ ນູ (Data Minning) 4. ສະເປກັ ຄອມພວິ ເຕີຂນີັ້ ຕິາໍ່ ທຈ່ີິ ະນໍາໃຊ້ໂປຣແກຣມການກວດເລອື ດ RAM: 2 Gb, Hard Disk: 500 Tb, CPU: 2.00 Ghz 3.3 ການວເິ ຄາະຂມ້ີໍ ນູ ແລະ ການອະທບິ າຍຜນົ ຜູຄ້ ນົີ້ ຄວ້ າບົດນີ້ໄດເ້ ຮດັ ໄປຕາມທິດສະດຂີ ອງເຕັກນກິ ການຂຸດຄນີົ້ ຂ້ມໍີ ນູ ໂດຍໄດເ້ ລືອກເອົາຂີ້ມໍ ູນທຈ່ິີ ໍາເປນັ ແລະ ເປນັ ປະໂຫຍດ ຕັດເອາົ ຂໍ້ີມນູ ທບ່ິີ ໍິ່ຄບົ ແລະ ຂີ້ໍມນູ ທ່ິບີ ເໍ່ິ ປັນປະໂຫຍດອອກ ເພິືອ່ ສະດວກໃນການໄປນໍາໃຊ້ ເຊິງ່ ຫຼັກໆແລ້ວເຮາົ ສາມາດຈາໍ ແນກຂມໍີ້ ນູ ອອກເປນັ 3 ໝວດໃຫຍໄ່ ດ້ແກ:່ ເມດັ ເລອື ດແດງ, ເມດັ ເລືອດຂາວ ແລະ ເກັດເລອື ດ. ຂັີ້ນຕອນທຈິີ່ ະເຮດັ (ສໍາລບັ ບດົ ຄົ້ີນຄວ້ ານ)້ີ ແມນ່ ເອາົ ຂໍີ້ມນູ ມາແລ້ວມາຜ່ານຂະບວນການສະກັດເອາົ ຂມີໍ້ ນູ ແບບ (Data Mining KDD) ໂດຍຜ່ານ 5 ຂນ້ັີ ຕອນຫຼກັ ໆດງັ່ິ ນີ:້ ຂັີ້ນຕອນທິີ່ 1: ໄດເ້ ກບັ ກາຂໍ້ມີ ູນຜົນການກວດເລອື ດ (Database Hematology) ໃນຫ້ອງວເິ ຄາະ. ຂ້ີັນຕອນທິີ່ 2: ຈາກນ້ັນີ ເອາົ ຂມ້ີໍ ນູ ມາເຂີາ້ົ ຂະບວນການເຮັດຕາມທດິ ສະດີ ແລະ ຫັຼກການຂດຸ ຄ້ີົນຂມີໍ້ ນູ (Data Mining) ວດັ ແທກຂ້ີໍມູນກຽ່ ວກບັ ຕວົ ປຽ່ ນຕ່າງໆທີ່ສິ ນົ ໃຈເຂາົີ້ ໃນລະບົບ, ເພືິ່ອໃຊຂ້ ້ີມໍ ນູ ດງັ່ິ ກາ່ ວເປັນການຂດຸ ຄນີົ້ ຂໍີ້ ມນູ (Data Mining) ແລະ ຊວ່ ຍໃຫເ້ ຮາົ ສາມາດຕອບ-ຄ າຖາມທິີ່ກ າລັງຄົນ້ີ ຄວ້ າ ແລະ ກໍານົດແນວຄວາມຄດິ ຂອງການທົດສອບ ແລະ ປະເມີນຜນົ . Data Cleaning: ຂນັີ້ ຕອນທີ່ິຕ້ອງໄດ້ສະກັດເອາົ ຂໍີ້ມນູ ທບີິ່ ິໍກ່ ່ຽວຂ້ອງ ຫືຼ ຂມ້ີໍ ນູ ທ່ິີບປິ່ໍ ະໂຫຍດອອກ. (ຂີມ້ໍ ູນທີິ່ ໄດ້ຕັດອອກໄປປະກອບມຂີ ໍີ້ມນູ ລາຄາໃນການກວດ, ຂ້ີມໍ ນູ ການກວດອາຈມົ (KOPA), ຂມ້ີໍ ູນກວດນີໍາ້ ຍຽ່ ວ ແລະ ຂ້ໍີ ມນູ ທິບີ່ ຖິໍ່ ືກຕ້ອງ ຫືຼ ບິໍ່ຄບົ ). Data Integration: ຂີ້ັນຕອນການລວມເອົາຂີໍ້ມນູ ຫຼາຍແຫິ່ຼງເຂີາົ້ ໃຫ້ເປັນຂມໍີ້ ນູ ຊດຸ ດຽວ (ໄດນ້ າໍ ເອາົ ມນູ ໃນ ແຕລ່ ະບ່ອນທີມິ່ ກີ ານຈັດເກບັ ຜນົ ການກວດເລອື ດຄ:ື ຫ້ອງວເິ ຄາະເລືອດ). 19
Data Selection: ຂນັ້ີ ຕອນການດງຶ ເອາົ ຂີ້ມໍ ນູ ສ າລບັ ການວເິ ຄາະຈາກແຫງ່ິຼ ທບີິ່ ັນທກຶ ໄວ້ ເລອື ກຂີໍມ້ ນູ ທ່ິີ ມີ ຄວາມສາໍ ພນັ ກນັ ແລະ ເປນັ ປະໂຫຍດຕິໍກ່ ານນາໍ ໃຊ້. Data Transformation: ຂັນ້ີ ຕອນການປ່ຽນຂໍີ້ມູນໃຫເ້ ໝາະສມົ ກບັ ການນາໍ ໃຊ້ໂດຍຜວູ້ ໄິ ຈໄດກ້ າໍ ນົດເອາົ ຂໍີ້ ມູນດິັງ່ ນີ້ ຂ້ມໍີ ູນຜນົ ການກວດເລອື ດປະກອບມ:ີ ເພດ (Sex), ເມດັ ເລອື ດແດງ (Red Blood Cell Count: RBC), ເຮໂມໂກບຼ ິນ (Hemoglobin: HGB), ເຮມາໂຕຊດິ (Hematocrit: HCT), ເມດັ ເລອື ດຂາວ (White Blood Cell Count: WBC), ເກັດເລອື ດ (Platelets: PLT), ເຊິ່ງຜວູ້ ໄິ ຈຈະນໍາເອົາມູນໄປຈດັ ເກັບໃນຖານຂ້ໍີມນູ . ຂັີ້ນຕອນທິ່ີ 3: ນໍາຂ້ໍີມູນທິີ່ຜ່ານການເຮັດຂດຸ ຄນ້ົີ ຂີໍມ້ ູນມາແລວ້ ຈດັ ເກບັ ໃນຖານຂມ້ີໍ ນູ ເຊງ່ິ ຜູຄ້ ນົ້ີ ຄວ້ າໄດ້ເລອື ກ ໃຊ້ໂປຣແກຣມ SQL ມາເປນັ ຕົວຈັດເກບັ ຂີໍ້ມນູ . ຂັນີ້ ຕອນທ່ິີ 4: ການນໍາໃຊ້ຂໍມີ້ ນູ ໃນຄີງັ້ ນີ້ ຈະເປັນຮບູ ແບບການຮຽນຮແູ້ ບບມີການສອນ (Supervised Learning) ແລະ ເລືອກນໍາໃຊ້ Algorithm Of Data Mining ໃນການຄາດຄະເນຜນົ ທີໄິ່ ດຮ້ ບັ ໂດຍເລອື ກ 03 ແບບ Algorithm ຄື: ການຕັດສນິ ໃຈແບບຕນ້ີົ ໄມ້ (Decision Tree), ເຄອື ຂາ່ ຍປະສາດທຽມ (Neural Network) ແລະ ການຈໍາແນກປະເພດແບບ Naive Bayes. ຂ້ນີັ ຕອນທ່ິີ 5: ສດຸ ທາ້ ຍແມ່ນນາໍ ຂ້ີໍມນູ ທັງໝົດມາເຂີົ້າໂປຣແກຣມ Orange ຈະເປນັ ເຄອ່ືິ ງມືໃນການຫາຜົນຄ້ີັງ ນ້ີເຊງິ່ ແມ່ນໄດນ້ ໍາເອາົ ຂ້ີມໍ ນູ ທງັ 03 ຮບູ ແບບການຕັດສິນໃຈແບບຕນົີ້ ໄມ້ (Decision Tree), ເຄອື ຂ່າຍປະສາດທຽມ (Neural Network) ແລະ ການຈໍາແນກປະເພດແບບ Naive Bayes ນັີນ້ ມາເຂ້າົີ ໂປຣແກຮມ Orange ເພິືອ່ ມາ ຊ່ວຍທດົ ສອບ ແລະ ປະເມນີ ຜນົ ເພອືິ່ ຫາຄວາມຈະແຈ້ງໃນການໃນການຄາດຄະເນຜນົ ທຈ່ິີ ະຮບັ ແລະ ຫາປະສດິ ຕິ ພາບຂອງແຕ່ລະຮບູ ແບບ, ເພືອິ່ ໄດຮ້ ບູ ແບບທດ່ິີ ສີ ຸດໄປເປນັ ໂຕຕົນີ້ ແບບໃນການພດັ ທະນາໂປຣແກຣມ. ຮບູ ທີ 3.1: ແຜນພາບລວມແບບການສຶກສາ ແລະ ອະທບິ າຍຜົນ 20
ສາໍ ລບັ ຊິ່ືຜກູ້ ວດເລືອດນນັີ້ ທີສ່ິ ະແດງໃນຕາຕະລາງຂາ້ ງລ່ມຸ ນ້ີ ຈະສະແດງໃຫ້ເຫັນເປນັ ຕົວເລກກອ່ ນ ເນອືິ່ ງ ຈາກຜົນການກວດເລອື ດຈະເປນັ ຊ່ິື ແລະ ນາມສະກຸນຈງິ ຂອງຜູທ້ ່ມິີ າໃຊບ້ ໍລິການ ດິ່ັງນ້ັີນຜຄູ້ ້ົນີ ຄ້ວາຈງຶ ຂສໍ ະຫງວນຊືິ່ ໄວ້ ໃຊຕ້ ົວເລກແທນ່ . ຕາຕະລາງທີ 3.3: ແບບຢາ່ ງຂ້ີມໍ ນູ ທີໄ່ິ ດຜ້ ່ານ Preprocessing Name 1 2 3 4 5 6 7 8 Age 50 44 46 36 50 46 47 40 Sex 1 1 1 1 1 1 1 1 RBC 4.96 4 4.43 4.4 4.93 4.23 4.66 5.78 HGB 13 13 14 14 14 14 15 15 HCT 39 40 14 40 41 41 44 46 WBC 5900 5900 7000 7770 9100 6000 7100 6570 PLT 223 202 244 198 400 280 194 236 ຈາກຂ້ມໍີ ນູ ຂອງຄົນເຈັບ 8 ຄນົ ຂ້າງເທງິ ເຮົາສາມາດທຽບໃສກ່ ລໍ ະນີຄວາມສຽ່ ງທໄິີ່ ດວ້ າງໄວ້ຕາມ 5 ກໍລະນີ ຄວາມສຽ່ ງນນ້ັີ ເຮົາສາມາດແຍກໄດໃ້ ຫ້ເຫນັ ຕາມຕົວຢ່າງຄາ່ ລະດບັ ເລືອດບປິ່ໍ ົກກະຕິ ແລະ ປກົ ກະຕິດ່ງິັ ນ:້ີ ຕາຕະລາງທີ 3.4: ຄາ່ ລະດບັ ເລອື ດ Risk Risk Name 1 2 3 4 6 8 Age 50 44 46 36 46 40 Sex 1 1 1 1 1 1 RBC 4.96 4 4.43 4.4 4.23 5.78 HGB 13 13 14 14 14 15 HCT 39 40 14 40 41 46 WBC 5900 5900 7000 7770 6000 6570 PLT 223 202 244 198 280 236 21
ຕາຕະລາງທີ 3.5: ຄ່າລະດັບເລືອດ Non-Risk Non-Risk Name 5 7 47 Age 50 1 4.66 Sex 1 15 44 RBC 4.93 7100 194 HGB 14 HCT 41 WBC 9100 PLT 400 3.3.1 ການສາ້ ງແບບຈາໍ ລອງຕນີົ້ ໄມຕ້ ດັ ສນິ ໃຈ (Decision Tree Model) ການນາໍ ເອາົ ຂມໍີ້ ນູ ມາເພືອ່ິ ມາສາ້ ງຕົ້ນີ ໄມ້ນນ້ີັ ແມນ່ ເຮາົ ໄດນ້ າໍ ເອາົ ຂີໍມ້ ູນໃນ Dataset ທ່ິຜີ ່ານຂະບວນ ການ Preprocessing ມາແລວ້ ເອາົ ມາຄໍານວນຕາມທດິ ສະດີຕນົ້ີ ໄມ້ຕັດສນິ ໃຈ ເຊິງ່ ສະແດງໃຫ້ເຫນັ ຮບູ ແບບ ການຄາໍ ນວນຈາກຕົວຢາ່ ງ 9 ຄນົ ເພອິື່ ສ້າງແບບຕນີົ້ ໄມ້ ກອ່ ນອນຶ່ິ ຕ້ອງຊອກຫາຄາ່ ການແຕກ Gini ຂອງແຕ່ລະຄ່າໂດຍ ອງີ ໃສ່ກັບຄວາມສໍາພນັ Risk ແລະ Non-Risk ຕາຕະລາງທີ 3.6: ແບບຢາ່ ງຂໍີ້ມນູ ທີິຈ່ ະມາເຮດັ ແບບຕີົ້ນໄມ້ No RBC HGB HCT WBC PLT Level 1 4.6 13 41 9700 282 Non-Risk 2 4.6 13 38 5400 233 Risk 3 5.2 14 43 7000 233 Risk 4 5.2 14 43 5400 282 Risk 5 6.7 12 38 7000 233 Risk 6 4.6 12 38 5400 233 Non-Risk 7 6.7 12 41 7000 282 Risk 8 5.2 14 43 9700 282 Risk 9 4.6 13 41 5400 282 Risk 22
ຂມໍີ້ ູນຈາກ 9 ຕວົ ຢ່າງຂ້າງເທິງທີິ່ຢູ່ໃນຊຸດຂ້ີໍມນູ ຈງິ ມາເປັນຕວົ ແບບໃນການຄໍານວນຫາຄ່າການແຕກ ຂອງກິງ່ ໃບ, ໂດຍຈະນໍາໃຊ້ສດູ ຕາມທິດສະດຂີ ອງຕີ້ນົ ໄມ,້ ໂດຍຄດິ ໄລຈ່ າກຄ່າຂອງແຕລ່ ະ RBC, HBC, HCT, WBC, PLT ທຽບໃສ່ກັບ Level ທີິມ່ ລີ ະດັບເປັນ Risk ແລະ Non-Risk ເພອ່ິື ສະແດງໃຫ້ເຫນັ ວທິ ກີ ານຄາໍ ນວນ ດງ່ິັ ລຸມ່ ນ:້ີ ຈາກຂມີໍ້ ູນຕາຕະລາງທີ 3.5 ເຮາົ ໄດຄ້ ່າມາເພິ່ອື ຊອກຫາ RBC ຄ່າຂອງ Gini ແລະ ຄາ່ Gini split ດັິ່ງ ລຸ່ມນີ້: ຕາຕະລາງທີ 3.7: ຄາ່ ຂອງ RBC ທຽບໃສ່ Level (Risk, Non-Risk) Level RBC Risk Non-Risk 4.6 2 2 5.2 3 0 6.2 2 0 ʹଶ ʹଶ ݅ܩሺܴ݊݅ܥܤൌͶǤሻൌͳെ൬Ͷ൰ െ൬Ͷ൰ ൌͲǤͷ ݅ܩሺܴ݊݅ܥܤൌͷǤʹሻൌͳെ൬͵͵൰ଶെ൬͵Ͳ൰ଶൌͲ ʹଶ Ͳଶ ݅ܩሺܴ݊݅ܥܤൌǤʹሻൌͳെ൬ʹ൰ െ൬ʹ൰ ൌͲ ݅ܩ௦݊݅ሺܴ௧ܤሻܥൌ൬Ͷͻ൰ሺͲǤͷሻ൬͵ͻ൰ሺͲሻ൬ʹͻ൰ሺͲሻൌͲǤʹʹ ຈາກຂ້ໍີມູນຕາຕະລາງທີ 3.5 ເຮົາໄດຄ້ ່າມາເພືິອ່ ຊອກຫາ HBC ຄາ່ ຂອງ Gini ແລະ ຄາ່ Gini split ດງິ່ັ ລຸ່ມນີ້: ຕາຕະລາງທີ 3.8: ຄາ່ ຂອງ HGB ທຽບໃສ່ Level (Risk, Non-Risk) Level HGB Risk Non-Risk 13 2 1 14 3 0 12 2 1 ݅ܩሺ݊ܤܩ݅ܪൌͳ͵ሻൌͳെ൬͵ʹ൰ଶെ൬ͳ͵൰ଶൌͲǤͶͶ ͵ଶ Ͳଶ ݅ܩሺ݊ܤܩ݅ܪൌͳͶሻൌͳെ൬͵൰ െ൬͵൰ ൌͲ ݅ܩሺ݊ܤܩ݅ܪൌͳʹሻൌͳെ൬͵ʹ൰ଶെ൬͵ͳ൰ଶൌͲǤͶͶ 23
݅ܩ௦݊݅ሺܪ௧ܤܩሻൌ൬ͻ͵൰ሺͲǤͶͶሻ൬͵ͻ൰ሺͲሻ൬ͻ͵൰ሺͲǤͶͶሻൌͲǤʹͻ͵ ຈາກຂີມ້ໍ ູນຕາຕະລາງທີ 3.5 ເຮາົ ໄດຄ້ ່າມາເພອ່ືິ ຊອກຫາ HCT ຄາ່ ຂອງ Gini ແລະ ຄ່າ Gini split ດ່ງິັ ລຸ່ມນີ້: ຕາຕະລາງທີ 3.9: ຄ່າຂອງ HCT ທຽບໃສ່ Level (Risk, Non-Risk) Level HCT Risk Non-Risk 38 2 1 41 2 1 43 3 0 ʹଶ ͳଶ ݅ܩሺ݊݅ൌ͵ͺሻൌͳെ൬͵൰ െ൬͵൰ ൌͲǤͶͶ ݅ܩሺ݊݅ൌͶͳሻൌͳെ൬͵ʹ൰ଶെ൬͵ͳ൰ଶൌͲǤͶͶ ͵ଶ Ͳଶ ݅ܩሺ݊݅ൌͶ͵ሻൌͳെ൬͵൰ െ൬͵൰ ൌͲ ݅ܩ௦݊݅ሺ௧ሻൌ൬͵ͻ൰ሺͲǤͶͶሻ൬ͻ͵൰ሺͲǤͶͶሻ൬͵ͻ൰ሺͲሻൌͲǤʹͻ͵ ຈາກຂມ້ີໍ ູນຕາຕະລາງຂ້າງທີ 3.5 ເຮົາໄດຄ້ າ່ ມາເພິ່ອື ຊອກຫາ WBC ຄ່າຂອງ Gini ແລະ ຄາ່ Gini split ດິ່ງັ ລມຸ່ ນ້ີ: ຕາຕະລາງທີ 3.10: ຄາ່ ຂອງ WBC ທຽບໃສ່ Level (Risk, Non-Risk) Level WBC Risk Non-Risk 5400 3 1 7000 3 0 9700 1 1 ݅ܩሺ݊݅ൌͷͶͲሻൌͲͳെ൬͵Ͷ൰ଶെ൬ͳͶ൰ଶൌͲǤ͵ͷ ͵ଶ Ͳଶ ݅ܩሺ݊݅ൌͲͲሻൌͲͳെ൬͵൰ െ൬͵൰ ൌͲ ݅ܩሺ݊݅ൌͻͲሻൌͲͳെ൬ʹͳ൰ଶെ൬ͳʹ൰ଶൌͲǤͷ Ͷ ͵ʹ ݅ܩ௦݊݅ሺ௧ሻൌ൬ͻ൰ሺͲǤ͵ሻͷ൬ͻ൰ሺͲሻ൬ͻ൰ሺͲǤͷሻൌͲǤʹ 24
ຈາກຂ້ໍີມູນຕາຕະລາງທີ 3.5 ເຮາົ ໄດ້ຄ່າມາເພື່ອິ ຊອກຫາ PLT ຄ່າຂອງ Gini ແລະ ຄ່າ Gini split ດັງ່ິ ລຸມ່ ນີ້: ຕາຕະລາງທີ 3.11: ຄ່າຂອງ PLT ທຽບໃສ່ Level (Risk, Non-Risk) Level PLT Risk Non-Risk 233 3 1 282 4 1 ݅ܩሺ݊݅ൌʹ͵ሻ͵ൌͳെ൬͵Ͷ൰ଶെ൬Ͷͳ൰ଶൌͲǤ͵ͷ Ͷଶ ͳଶ ݅ܩሺ݊݅ൌʹͺሻʹൌͳെ൬ͷ൰ െ൬ͷ൰ ൌͲǤ͵ʹ Ͷͷ ݅ܩ௦݊݅ሺ௧ሻൌ൬ͻ൰ሺͲǤ͵ሻͷ൬ͻ൰ሺͲǤ͵ʹሻൌͲǤ͵ͶͶ ຈາກຜົນການຄດິ ໄລໃ່ ຫຮ້ ູ້ໄດວ້ າ່ Non-Risk (RBC, HBC, HCT, WBC, PLT) ທມີິ່ ີເມດັ ເລອື ດ ໃນກຸ່ມ Normal ທິ່ມີ ີຄວາມສາໍ ພັນກບັ Node ທິີເ່ ປນັ Risk (RBC, HBC, HCT, WBC, PLT) ທ່ມິີ ີເມດັ ເລືອດໃນກຸ່ມ High or Low ຜນົ ຂອງການສຶກສາຄາ່ ທີມ່ິ ຜີ ົນຕ້ອງຄວາມສຽ່ ງ ແລະ ບສໍິ່ ່ຽງເຮົາສາມາດຈດັ ຮບູ ແບບ ຕນ້ົີ ໄມໄ້ ດ້ດງັ່ິ ນີ້: ຮບູ ທີ 3.2: ແບບຈາໍ ລອງຕ້ີນົ ໄມຕ້ ັດສິນໃຈ 25
3.3.2 ການສາ້ ງແບບຈາໍ ລອງເຄອື ຂາ່ ຍປະສາດທຽມ (Neural NetworkModel) ຫຼັງຈາກຜາ່ ນຂະບວນການຂດຸ ຄ້ນີົ ຂ້ໍີມນູ ແລວ້ ເຮົາຈະໄດຂ້ ໍມີ້ ນູ Data set ຂອງຜນົ ການກວດເລອື ດນາໍ ເອາົ ຂ້ມີໍ ນູ ມາສາ້ ງໃນຮູບແບບເຄອື ຂ່າຍປະສາດທຽມ ໂດຍນໍາຂມ້ີໍ ູນການກວດເລືອດມາເປັນຕົວປອ້ ນຂ້ີໍມນູ ເຂ້ົາີ Input layer ແລະ ຊອກຫາຄ່າຄວາມເປັນໄປໄດ້ ຫຼື ຄນຸ ນະສມົ ບດັ ຂອງຂໍີມ້ ູນໃນ Hidden layer ຈາກນັ້ີນນໍາຂມໍີ້ ນູ ອອກ ມາຫາຄວາມສຽ່ ງ Output layer. ຮູບທີ 3.3: ສະແດງໃຫເ້ ຫນັ ແບບຂມ້ີໍ ູນໃນ Neural Network ມີຜນົ ອອກຢສູ່ ອງຄາ່ Non-Risk ແລະ Risk ສໍາລັບການປບັ ຄາ່ Activation Function ແມນ່ ໃຊ້ Relu ເພອື່ິ ເອາົ ຄາ່ ໃດໆນນ້ີັ ທີມິ່ ຄີ ່າໜອ້ ຍ ກ່ວາ ຫຼື ສງູ ກວ່ າ ຈະມີຄາ່ ເປນັ Risk ແລະ ຄ່າລະດບັ ປກົ ກະຕິ Non-Risk, ສວ່ ນ Hidden layers ມີຢູ່ 100 layers ແລະ ໃຊກ້ ານ Solver ຫືຼ Optimizer ແມນ່ ໃຊຫ້ ກຼັ ການຂອງ Adam ສະແດງດງ່ິັ ຮູບລຸ່ມນີໃ້ ນການປບັ ຄ່າໃນໂປຣ ແກຣມ Orange Tool ຮບູ ທີ 3.4: ການປບັ ຄາ່ Neural Network ໃນ Orange 26
3.3.3 ການສາ້ ງແບບຈາໍ ລອງ Naive Bayes Model ນາໍ ເອົາຂໍີ້ມນູ ທິີຜ່ າ່ ນການເຮດັ Preprocessing ມາແລວ້ ເຂົີາ້ ການຄໍານນວນ ແລະ ມາເຮດັ Naive Bayes ໂດຍເລືອກເອົາຂມ້ີໍ ູນຕວົ ຢ່າງ 9 ໂຕມາເຮດັ ເພືິ່ອຈະສະແດງໃຫ້ເຫັນເຖງິ ວທິ ກີ ານຄາໍ ນວນ ໃຫ້ເຫັນຄວາມ ສ່ຽງ ແລະ ບໍສິ່ ຽ່ ງດງິ່ັ ລມຸ່ ນີ:້ ຕາຕະລາງທີ 3.12: ແບບຢ່າງຂມ້ ນູ ທ່ ີ ະມາເຮັດ Naive Bayes No RBC HGB HCT WBC PLT Level 1 4.6 13 41 9700 282 Non-Risk 2 4.6 13 38 5400 233 Risk 3 5.2 14 43 7000 233 Risk 4 5.2 14 43 5400 282 Risk 5 6.7 12 38 7000 233 Risk 6 4.6 12 38 5400 233 Non-Risk 7 6.7 12 41 7000 282 Risk 8 5.2 14 43 9700 282 Risk 9 4.6 13 41 5400 282 Risk ຈາກຂີ້ໍມູນຕາຕະລາງທີ 3.11 ເຮາົ ໄດຄ້ າ່ ມາເພ່ືິອຊອກຫາ RBC ຄາ່ ຄວາມໃກ້ຄຽງດງິັ່ ນີ້: ຕາຕະລາງທີ 3.13: ຄາ່ ຂອງ RBC ທຽບໃສ່ Level (Risk, Non-Risk) ການຄິດໄລຄ່ າ່ Probability Level Probability of attribute given the class RBC Risk Non-Risk P(RBC|Risk) P(RBC|Non-Risk) 22 4.6 30 2/7 = 0.285 2/2 = 1 5.2 20 3/7 = 0.428 0/2 = 0.00 6.7 2/7 = 0.285 0/2 = 0.00 27
ຈາກຂີ້ໍມນູ ຕາຕະລາງທີ 3.11 ເຮົາໄດ້ຄາ່ ມາເພອ່ິື ຊອກຫາ RBC ຄ່າຄວາມໃກ້ຄຽງດງ່ິັ ນ້ີ: ຕາຕະລາງທີ 3.14: ຄາ່ ຂອງ HGB ທຽບໃສ່ Level (Risk, Non-Risk) ການຄດິ ໄລຄ່ ່າ Probability Level Probability of attribute given the class HGB Risk Non-Risk P(HGB|Risk) P(HGB|Non-Risk) 21 13 30 2/7 = 0.285 1/2 = 0.5 14 21 3/7 = 0.428 0/2 = 0.00 12 2/7 = 0.285 0/2 = 0.00 ຈາກຂ້ມໍີ ນູ ຕາຕະລາງທີ 3.11 ເຮາົ ໄດຄ້ າ່ ມາເພິອື່ ຊອກຫາ HCT ຄາ່ ຄວາມໃກຄ້ ຽງດິ່ັງນີ້: ຕາຕະລາງທີ 3.15: ຄາ່ ຂອງ HCT ທຽບໃສ່ Level (Risk, Non-Risk) ການຄິດໄລ່ຄາ່ Probability Level Probability of attribute given the class HCT Risk Non-Risk P(HCT|Risk) P(HCT|Non-Risk) 21 38 21 2/7 = 0.285 1/2 = 0.5 41 30 2/7 = 00.285 1/2 = 0.5 43 3/7 = 0.428 0/2 = 0.00 ຈາກຂໍີ້ມູນຕາຕະລາງທີ 3.11 ເຮົາໄດ້ຄ່າມາເພອ່ິື ຊອກຫາ WBC ຄ່າຄວາມໃກ້ຄຽງດງິ່ັ ນີ້: ຕາຕະລາງທີ 3.16: ຄ່າຂອງ WBC ທຽບໃສ່ Level (Risk, Non-Risk) ການຄດິ ໄລຄ່ ່າ Probability Level Probability of attribute given the class WBC Risk Non-Risk P(WBC|Risk) P(WBC|Non-Risk) 31 5400 30 3/7 = 0.428 1/2 = 0.5 7000 11 3/7 = 0.428 0/2 = 0.00 9700 1/7 = 0.142 1/2 = 0.5 28
ຈາກຂມີ້ໍ ູນຕາຕະລາງທີ 3.11 ເຮາົ ໄດ້ຄາ່ ມາເພືິອ່ ຊອກຫາ PLT ຄ່າຄວາມໃກຄ້ ຽງດງັ່ິ ນ້ີ: ຕາຕະລາງທີ 3.17: ຄ່າຂອງ PLT ທຽບໃສ່ Level (Risk, Non-Risk) ການຄດິ ໄລ່ຄາ່ Probability Level Probability of attribute given the class PLT Risk Non-Risk P(PLT|Risk) P(PLT|Non-Risk) 233 3 1 3/7 = 0.428 1/2 = 0.5 282 4 1 4/7 = 0.571 1/2 = 0.5 3.3.4 ຂນ້ັີ ຕອນການນາໍ ຂມໍີ້ ນູ ເຂາີ້ົ ໃນ (OrangeTool) Orange ເປັນເຄ່ິອື ງມືທ່ີິໃຊໃ້ ນການອອກແບບການແບ່ງກຸມ່ ຂອງຂີໍມ້ ນູ ເປນັ ໂປຣແກຣມວເິ ຄາະຂີ້ມໍ ນູ ໂດຍອີງໃສ່ Function ຕ່າງໆທມິີ່ ີຢູ່ ແລະ ນກັ ວິເຄາະກ່ໍສິ າມາດສ້າງເງອື່ິ ນໄຂຕາ່ ງໆໄດ້ໃນລັກສະນະຂອງຂ້ີມໍ ູນ ແລະ ໃຫ້ຢໃູ່ ນຮບູ ແບບທຕີ່ິ ້ອງການຕາມນັກວິເຄາະຢາກໄດ.້ ໃຊ້ Orange Tool: ນາໍ ຂ້ີໍມນູ ເຂາົີ້ File Import ເລອື ກຂໍີ້ມນູ ທິເ່ີ ປັນເປ້ີົາໝາຍ Select Columns ຄຂື ້ີໍ ມນູ Non-Risk ແລະ Risk, Data Sampler ນໍາໃຊຮ້ ບູ ແບບການຕັດສນິ ໃຈແບບຕີນ້ົ ໄມ້, Neural Network ແລະ Naive Bayes ສະແດງໃຫເ້ ຫນັ ດິັງ່ ຮບູ ລຸ່ມນີ້: ຮູບທີ 3.5: ການເອາົ ຂ້ໍີມນູ ເຂີົ້າ Orange 29
ຂ້ນັີ ຕອນການນໍາໃຊເ້ ຄິອື່ ງມໃື ນໂປຣແກຣມ Orange ເພືິ່ອນາໍ ມາ Test and Scrore 1. ເອົາ File CBC_2019-2020.csv ເຂີາົ້ ຟງັ ຊນ້ັີ File Import CSV 2. ຂ້ໍມີ ູນເຂົີ້າຄໍາສັິ່ງ Select Columns ໃນນເ້ີ ຮົາເລອື ກຄລໍ ມັ Level ເປນັ ເປີາ້ົ ໝາຍເຊິງ່ ມີ 2 ຄ່າ ຄື Risk ແລະ Non-Risk 3. ຂມ້ີໍ ນູ ເຂາ້ີົ ຄໍາສງ່ັິ Data Sampler ເພອິ່ື ແບ່ງຂໍີ້ມນູ 70% ໄປ ຝກຶ ສອນ ແລະ ແບງ່ ຂມໍີ້ ນູ 30% ໄປທດົ ສອບ. 4. ເອາົ ຂໍີ້ມນູ ເຂາ້ີົ Sampler-Data ໃຊ້ Tree ເຊງ່ິ ເປນັ ແບບຕນ້ີົ ໄມ້ຕັດສນິ ໃຈ (Decision Tree) 5. ເອົາຂໍ້ມີ ູນເຂົີ້າ Sampler-Data ໃຊ້ Naive Bayes ເຊງ່ິ ເປນັ ແບບ Naive Bayes 6. ເອາົ ຂໍມ້ີ ນູ ເຂາ້ີົ Sampler-Data ໃຊ້ Neural Network ເຊິງ່ ເປນັ ເຄອື ຂ່າຍປະສາດທຽມ (Neural Network) 7. ເອົາຂມ້ີໍ ນູ ເຂາ້ີົ Learner ໃຊ້ Tree ໃຊ້ຄາໍ ສງິັ່ Test and Scrore ໂດຍປບັ ຄາ່ K=10 8. ເອາົ ຂມ້ີໍ ນູ ເຂາົີ້ Learner ໃຊ້ Naive Bayes ໃຊ້ຄາໍ ສັ່ິງ Test and Scrore ໂດຍປບັ ຄາ່ K=10 9. ເອົາຂ້ມີໍ ູນເຂີ້ົາ Learner ໃຊ້ Neural Network ໃຊຄ້ ໍາສັິງ່ Test and Scrore ໂດຍປບັ ຄາ່ K=10 10. ໃຊ້ຄາໍ ສິງັ່ Data Sampler ເອົາຂ້ໍມີ ນູ ເຂາົີ້ Sampler-Data ໃຊ້ຄາໍ ສ່ງັິ Test and Scrore ຂ້ີໍ ມູນ 70% ເພອ່ິື ເປນັ ຂໍີ້ມນູ ໃນການຝກຶ ສອນ ແລະ ຄາດຄະເນຜົນ. 11. ນໍາຜົນ Evaluation Result ໃຊຄ້ ໍາສັງິ່ Confusion Matrix Test Model ເພ່ອິື ເຫນັ ຈາໍ ນວນຜນົ ທ່ິີຖກຶ ຕ້ອງ ແລະ ບຖໍ່ິ ກື ຕອ້ ງ ຂັີ້ນຕອນການນາໍ ໃຊ້ເຄອ່ິື ງມໃື ນໂປຣແກຣມ Orange ເພ່ິອື ນໍາມາ Predictions 1. ເອົາ File CBC_2019-2020.csv ໃຊ້ຄໍາສງັິ່ File Import CSV 2. ຂມ້ີໍ ນູ ເຂາົີ້ ຄາໍ ສງ່ິັ Select Columns ໃນນເ້ີ ຮົາເລອື ກຄໍລັມ Level ເປນັ ເປີ້າົ ໝາຍເຊິ່ງມີ 2 ຄ່າ ຄື Risk ແລະ Non-Risk 3. ຂ້ີໍມນູ ເຂົ້າີ ຄາໍ ສັິ່ງ Data Sampler ເພອື່ິ ແບ່ງຂໍີມ້ ູນ 70% ໄປ Test and Scrore ແລະ ແບງ່ ຂໍີ້ ມນູ 30% ໄປ Predictions 4. ເອາົ ຂ້ມໍີ ນູ ເຂົີ້າ Sampler-Data ໃຊ້ Tree ເຊງິ່ ເປນັ ແບບຕນ້ີົ ໄມຕ້ ັດສນິ ໃຈ (Decision Tree) 5. ເອົາຂມ້ີໍ ນູ ເຂາີົ້ Sampler-Data ໃຊ້ Naive Bayes ເຊິງ່ ເປນັ ແບບ Naive Bayes 6. ເອາົ ຂ້ມໍີ ນູ ເຂ້າີົ Sampler-Data ໃຊ້ Neural Network ເຊິ່ງເປັນເຄືອຂາ່ ຍປະສາດທຽມ (Neural Network) 7. ເອາົ ຂໍ້ີມນູ ເຂົີ້າ Model- Predictors ໃຊ້ Tree ໃຊ້ຄໍາສງ່ິັ Predictions 8. ເອົາຂໍ້ີມນູ ເຂີົ້າ Model- Predictors ໃຊ້ Naive Bayes ໃຊຄ້ າໍ ສງ່ິັ Predictions 30
9. ເອົາຂມີ້ໍ ູນເຂາົີ້ Model- Predictors ໃຊ້ Neural Network ໃຊ້ຄໍາສງັິ່ Predictions 10. ຂ້ມໍີ ນູ ເຂີົາ້ ຄໍາສງ່ິັ Data Sampler ຂີ້ໍມນູ Remaining Data-Data ໃຊ້ຄາໍ ສ່ິງັ Predictions ຂ້ມໍີ ນູ 30% ເພອື່ິ ເປັນຂມ້ີໍ ູນໃນການທົດສອບ ແລະ ຄາດຄະເນຜົນ. 11. ນໍາຜນົ Evaluation Result ໃຊ້ຄໍາສງິັ່ Confusion Matrix Predictions ເພອິື່ ເຫັນຈາໍ ນວນຜນົ ທຖ່ິີ ກຶ ຕ້ອງ ແລະ ບໍິ່ຖືກຕ້ອງ 3.3.5 ຖານຂມີໍ້ ນູ ທໃິ່ີ ຊໃ້ ນການພດັ ທະນາໂປຣແກຣມ ຖານຂມໍ້ີ ນູ ທິີຈ່ ະນໍາເອາົ ໄປເປນັ ຕົວແບບໃນການພດັ ທະນາລະບົບໃນບດົ ຄນີົ້ ຄວ້ າຄງ້ີັ ນ້ີ ແມນ່ ໄດອ້ ີງໃສ່ ຜນົ ຄວາມຖກຶ ຕອ້ ງຫາຼ ຍທສີິ່ ດຸ ຂອງຮບູ ແບບຈໍາລອງໃດໜຶງ່ິ ເຊນິັ່ : Decision Tree Model, Neural Network Model, Naive Bayes Model ທມິ່ີ ີຄວາມຊັດເຈນ ຫືຼ ເປເີ ຊັນ (%) ຄວາມຖກຶ ຕ້ອງຫຼາຍກ່ວາໝ່ມູ າເປນັ ໂຕຕົນ້ີ ແບບໃນການພດັ ທະນາເຊິ່ງຖານຂ້ີໍມູນຈະປະກອບໄປດວ້ ຍຂີ້ໍມນູ ຄນົ ເຈບັ , ຄາ່ ຂອງເມດັ ເລອື ດ ແລະ ຄໍານວນຜນົ ຫາ ຄວາມສຽ່ ງ, ລາຍລະອຽດຂອງ Data Dictionary ຂອງແຕລ່ ະຖານຂ້ໍີມນູ ສະແດງໃຫ້ເຫັນລາຍລະອຽດດ່ັິງນ້ີ: ຖານຂມໍ້ີ ູນຄນົ ເຈັບເປັນບ່ອນໄວຈ້ ດັ ເກບັ ຂີມ້ໍ ນູ ພືນ້ີ ຖານຂອງຄນົ ເຈບັ ທິ່ີມາໃຊ້ບໍລິການພາຍໃນໂຮງໝໍ, ເປນັ ບ່ອນບນັ ທືກ ແລະ ຈດັ ການຂໍ້ມີ ູນຄນົ ເຈບັ ຕາຕະລາງທີ 3.18: Tb_ Patient ຂ້ມໍີ ນູ ຄນົ ເຈບັ ລ/ດ Field Data Field Allow Key Description Reference Name Type Size Null 1 PatientID nchar 10 No PK ລະຫດັ ຄນົ ເຈບັ 2 FullName nvarchar 250 No ຊືິ່ ແລະ ນາມສະກຸນ 3 Sex nvarchar 10 Yes ເພດ 4 DateBorn date Yes ວນັ ເດືອນປເີ ກດີ 5 Age int Yes ອາຍຸ 6 Address nvarchar 150 Yes ບ້ານ 7 City nvarchar 150 Yes ເມືອງ 8 Province nvarchar 150 Yes ແຂວງ 9 Telephone int Yes ເບໂີ ທ 10 Job nvarchar 50 Yes ອາຊີບ 11 Remark nvarchar 150 Yes ໝາຍເຫດ 31
ຖານຂໍີມ້ ູນຈດັ ເກັບຜນົ ການກວດເລອື ດຂອງຄົນເຈັບໃຊໄ້ ວ້ບນັ ທກື ແລະ ຈດັ ການຂໍ້ີມນູ ການກວດ ເລອື ດ, ເຊືອ່ິ ມຕລ່ໍິ ະຫວ່າງຕາຕະລາງຂີ້ມໍ ູນຄົນເຈັບ. ຕາຕະລາງທີ 3.19: Tb_ Test ຂ້ໍມີ ນູ ການກວດເລອື ດຄນົ ເຈບັ ລ/ດ Field Name Data Field Allow Key Description Reference Type Size Null 1 TestID nchar 10 No PK ລະຫດັ ຄ່າກວດ 2 PatientID nchar 10 No FK ລະຫັດຄົນເຈບັ Tb_ 3 Datetest nvarchar 10 No Patient ວນັ ທເີ ດອື ນປີ ກວດ 4 RedBlood nvarchar 50 No ເມດັ ເລອື ດແດງ 5 Hemoglobin nvarchar 50 No ເຮໂມໂກບຼ ີນ 6 Hematocrit nvarchar 50 No ເຮມາໂຕຊິດ 7 Whiteblood nvarchar 50 No ເມດັ ເລືອດຂາວ No 8 Platelet nvarchar 50 ປະລິມານເກັດ ເລືອດ ຖານຂໍມ້ີ ນູ ລາຍລະອຽດການກວດເລືອດໃຊໄ້ ວບ້ ນັ ທືກ ແລະ ຈັດການຂມ້ີໍ ນູ ລາຍລະອຽດການກວດ ເລອື ດ, ເຊິອື່ ມຕ່ິລໍ ະຫວາ່ ງຕາຕະລາງຂີມໍ້ ນູ ການກວດເລອື ດ. ຕາຕະລາງທີ 3.20: Tb_TestDetail ຂມ້ີໍ ນູ ລາຍລະອຽດການກວດເລອື ດ ລ/ດ Field Name Data Type Field Allow Key Description Reference Size Null 1 TestDetailID nchar 10 No PK ລະຫັດຜນົ ກວດ 2 TestID nchar 10 No FK ລະຫດັ ຄາ່ ກວດ Tb_ Test 3 Datetest nvarchar 10 No ວນັ ທເີ ດອື ນປີ 50 No ກວດ 4 lvRedBlood nvarchar 50 No ລະດັບເມດັ ເລືອດ 50 No ແດງ 5 lvHemoglobin nvarchar 50 No ລະດັບເຮໂມໂກຼ ບີນ 6 lvHematocrit nvarchar ລະດັບເຮມາໂຕ ຊດິ 7 lvWhiteblood nvarchar ລະດບັ ເມດັ ເລອື ດ ຂາວ 32
8 lvPlatelet nvarchar 50 No ລະດັບປະລມິ ານ 9 Resutl nvarchar 50 No ເກັດເລອື ດ ຜນົ ກວດ ຖານຂມໍີ້ ນູ ການເຂ້ົີາໃຊ້ລະບົບພາຍໃນໂປຣແກຣມ ຕາຕະລາງທີ 3.21: Tb_Login ຂ້ມໍີ ູນການເຂີົາ້ ໃຊ້ລະບົບ ລ/ດ Field Name Data Type Field Allow Key Description Reference Size Null 1 Username nvarchar 50 No Pk ຊິຜ່ື ູ້ໃຊ້ 2 Password nvarchar 50 No ລະຫັດຜາ່ ນ ການພັດທະນາລະບບົ ການກວດເລືອດ ແລະ ສະແດງຜນົ ຂອງການຄາໍ ນວນເລອື ດ ໄດນ້ າໍ ໃຊ້ຖານຂີໍ້ ມນູ Sql ເພືອ່ິ ເປນັ ບອ່ ນເກບັ ກໍາລາຍລະອຽດສໍາລບັ ແຕ່ລະບກຸ ຄນົ ເຊນັ່ິ : ຊືິ່ ແລະ ນາມສະກຸນ, ວັນເດອື ນປີເກດີ , ອາຍຸ , ບາ້ ນ, ເມອື ງ, ແຂວງ, ເບໂີ ທ, ອາຊບີ ແລະ ເກບັ ກາໍ ການກວດເລືອດເພ່ອືິ ນໍາຜນົ ເລືອດມາຄໍານວນຫາຄວາມສຽ່ ງ ດ່ິງັ ລາຍລະອຽດ ໂຄງສາ້ ງ Diagram ຂອງຖານຂ້ມໍີ ນູ ລມຸ່ ນ:້ີ ຮູບທີ 3.6: ໂຄງສາ້ ງ Diagram ຂອງຖານຂີໍ້ມນູ 33
ພາກທີ ຜນົ ການສກຶ ສາ ແລະ ການສນົ ທະນາ 4.1 ຜົນການສຶກສາ ຂີມ້ໍ ູນທງັ ໝດົ 1543 ຄນົ ຢູ່ໃນປີ 2019-2020 ເມ່ືິອຜາ່ ນການຂຸດຄົ້ນີ ຂ້ີໍມູນ (Data Mining) ໄດ້ຜົນເປນັ ຂ້ໍີ ມູນຂອງເພດຊາຍ 1327 ທຽບເທ່ິົາກັບ (86%) ເພດຍິງ 216 ທຽບເທ່າົິ ກັບ (14%) ສະເລຍ່ ອາຍເຸ ທາົິ່ ກັບ 47.4±6.8 ຜົນຄາ່ ຂອງການກວດເລອື ດ CBC ມຄີ ່າສະເລຍ່ ຢໃູ່ ນເກນປກົ ກະຕິ RBC, HGB, HCT, WBC, PTL ມຄີ າ່ ສະເລ່ຍເທິາົ່ ກບັ (51.98%) ແລະ ມີຄາ່ RBC, HGB, HCT, WBC, PTL ສະເລຍ່ ຢ່ໃູ ນຄວາມສ່ຽງ (48.02%) ຕາຕະລາງທີ 4.1: ສະແດງຜນົ ຂມີ້ໍ ູນ ແລະ ຜນົ ຂອງການກວດເລອື ດ (CBC) ຂີ້ໍມູນທວ່ິົ ໄປ Min. Max. ຈໍານວນຂີໍມ້ ນູ (%) ເພດ 1 = ຊາຍ, 0 = ຍງິ ຊາຍ 29 70 ຍິງ 3.55 8.1 1327 (86%) ອາຍຸ (ປ)ີ mean±SD 7.9 18.6 216 (14%) RBC: Red blood cell mean±SD 25 58 47.4±6.8 HGB: Hemoglobin mean±SD 2900 74000 5.17±0.671 HCT: Hematocrit mean±SD 95 615 13.625±1.487 WBC: White blood cell mean±SD 42.039.4±4.099 PLT: Platelet count mean±SD 6984.323±3021.995 Level 249.756±60.529 Non-Risk Risk 801 (51.98%) (n = 1543) 742 (48.02%) 34
ສະແດງຄາ່ Sex ການກະຈາຍ Distributions ຂອງຂີມໍ້ ູນ: ເພດ (1=ຊາຍ, 0=ຍງິ ) ຕາຕະລາງທີ 4.2: ສະແດງຜົນຂ້ີໍມນູ ເພດ (1=ຊາຍ, 0=ຍງິ ) n=216 ຍງິ (in group) (overall) Non-Risk 84 38.89% 5.44% Risk 132 61.11% 8.55% n=1327 ຊາຍ (in group) (overall) Non-Risk 718 54.11% 46.53% Risk 609 45.89% 39.47% ຮູບທີ 4.1: ຜນົ ການກະຈາຍຂອງເພດ 35
ສະແດງຄ່າ Age ການກະຈາຍ Distributions ຂອງຂໍມ້ີ ນູ : ອາຍຸ Age < 50, ມຄີ ່າ Non-Risk = 459, Risk = 435 ສະເລ່ຍເທິ່ົາ n=894 (57.94%) ແລະ Age t50, ມີຄາ່ Non-Risk = 343, Risk = 306ສະເລຍ່ ເທົິ່າ n=649 (42.06%) ຮບູ ທີ 4.2: ຜນົ ການກະຈາຍຂອງອາຍຸ ສະແດງຄ່າ RBC ການກະຈາຍ Distributions ຂອງຂມ້ໍີ ນູ : RBC < 4.2, ມຄີ າ່ Non-Risk= 0, Risk= 70 ສະເລຍ່ ເທາ່ິົ n=70 (4.54%) ແລະ 4.2 dRBC < 5.6, ມຄີ າ່ Non-Risk= 765, Risk = 344 ສະເລຍ່ ເທົິ່າ n=1109 (71.87%), RBC t5.6 ມີຄ່າ Non-Risk= 0, Risk= 364 ສະເລຍ່ ເທິົາ່ n=364 (23.59%) ຮບູ ທີ 4.3: ຜນົ ການກະຈາຍຂອງ RBC 36
ສະແດງຄາ່ HGB ການກະຈາຍ Distributions ຂອງຂມໍີ້ ນູ : HGB < 12, ມຄີ ່າ Non-Risk= 0, Risk= 154 ສະເລຍ່ ເທິ່າົ n=154 (9.98%) ແລະ 12 dHGB < 16, ມຄີ ່າ Non-Risk= 801, Risk = 566ສະເລ່ຍ ເທົິ່າ n=1367 (88.59%), HGB t16 ມຄີ າ່ Non-Risk= 0, Risk= 22 ສະເລຍ່ ເທົິ່າ n=22 (1.43%) ຮູບທີ 4.4: ຜນົ ການກະຈາຍຂອງ HGB ສະແດງຄ່າ HCT ການກະຈາຍ Distributions ຂອງຂມີໍ້ ູນ: HCT < 37, ມຄີ າ່ Non-Risk= 0, Risk= 137 ສະເລ່ຍເທົາ່ິ n=137 (8.88%) ແລະ 37 dHCT < 48, ມີຄາ່ Non-Risk= 801, Risk = 513 ສະເລຍ່ ເທົິາ່ n=1314 (85.16%), HCT t48 ມຄີ ່າ Non-Risk= 0, Risk= 92 ສະເລ່ຍເທິ່າົ n=92 (5.96%) ຮູບທີ 4.5: ຜນົ ການກະຈາຍຂອງ HCT 37
ສະແດງຄ່າ WBC ການກະຈາຍ Distributions ຂອງຂໍີ້ມນູ : WBC < 5000, ມີຄາ່ Non-Risk= 0, Risk= 25 ສະເລຍ່ ເທາົິ່ n=25 (1.62%) ແລະ 5000 dWBC < 11000, ມີຄ່າ Non-Risk= 801, Risk = 693 ສະເລ່ຍເທາ່ິົ n=1494 (96.82%), WBC t11000 ມຄີ າ່ Non-Risk= 0, Risk= 24 ສະເລຍ່ ເທິາົ່ n=24 (1.56%) ຮບູ ທີ 4.6: ຜນົ ການກະຈາຍຂອງ WBC ສະແດງຄາ່ PLT ການກະຈາຍ Distributions ຂອງຂມໍ້ີ ນູ : PLT < 140, ມຄີ າ່ Non-Risk= 0, Risk= 34 ສະເລຍ່ ເທາ່ິົ n=34 (2.20%) ແລະ 140 dPLT < 400, ມີຄາ່ Non-Risk= 801, Risk = 628 ສະເລຍ່ ເທາິ່ົ n=1429 (96.69%), PLT t400 ມຄີ ່າ Non-Risk= 0, Risk= 17 ສະເລ່ຍເທິາົ່ n=17(1.10%) ຮບູ ທີ 4.7: ຜນົ ການກະຈາຍຂອງ PLT 38
ສະແດງຄາ່ ການກະຈາຍ Distributions ຂອງຂ້ີໍມນູ : Level ຕາຕະລາງທີ 4.3: ສະແດງຜົນຂມ້ໍີ ນູ Level n=1523 (in group) (overall) 51.91% Non-Risk 801 100% 48.09% Risk 742 100% ຮູບທີ 4.8: ຜນົ ການກະຈາຍຂອງ Level 4.1.1 ຜນົ ຂມີ້ໍ ນູ Training Score ຜນົ ຂໍີ້ມູນການຕັດສນິ ໃຈແບບຕນີົ້ ໄມ້ (Decision Tree) ຜົນຂີມໍ້ ນູ ທິີ່ Predicted ຖືກຕ້ອງຂອງ (Non-Risk= 567) ແລະ Predicted ບຖິ່ໍ ກື 5,ຂໍ້ີມູນທີິ່ Predicted (Risk= 479) ແລະ Predicted ບ່ຖິໍ ກື 30, (ຂມ້ີໍ ນູ n=1081, Non-Risk = 572, Risk = 509) ຕາຕະລາງທີ 4.4: ຜນົ ຂອງ Confusion Matrix Test and Score ການຕດັ ສນິ ໃຈແບບຕີນົ້ ໄມ້ Predicted Acutual Non-Risk Risk Non-Risk 567 5 30 479 Risk 39
Search