Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

Published by 3Hmoob Start Up, 2022-04-18 02:32:41

Description: กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

Keywords: กรอบการวิเคราะ,หาข้อมูลขนาดให่ญภาครัฐ

Search

Read the Text Version

องค์ประกอบท่สี าม คือ โมเดลคานวณหาสถานที่ท่องเที่ยวท่ีคล้ายคลึงกัน (Similarity Analysis) เพื่อ แนะนาสถานทีท่ ่องเทย่ี วทีย่ ังไม่แพรห่ ลาย หรอื ไม่มีขอ้ มูลการไปเท่ียวมากนักในเมืองรอง ความคล้ายคลึงในทีน้ี อาจมีความหมายในหลายมิติ เช่น อยู่จังหวัดใกล้ๆกัน ขนาดสถานท่ีท่องเท่ียวพอๆกัน หรือเป็นประเภทวัด ประเภทภูเขา เหมือนกัน องค์ประกอบน้ีจะช่วยเสริมองค์ประกอบท่ีสอง โดยนอกจากระบบ AI จะแนะนา สถานท่ีท่องเที่ยวในเมืองรองเข้ามาแนะนาเพิ่มด้วย โดยยังอิงกับกลุ่มเชิงพฤติกรรมและรสนิยมของ นักท่องเที่ยวคนใหม่ (นาย ก.) ซึ่งในการวิเคราะห์เราจะใช้ข้อมูลจากกระทรวงการท่องเที่ยวและกีฬา ท่ีมีการ สารวจขอ้ มูลแหล่งท่องเที่ยวและกจิ กรรมกวา่ 8,000 รายการ ระบบ AI เพือ่ แนะนานกั ทอ่ งเที่ยวน้ี อาจมีการปรับเปล่ียนข้อมูลท่ีใช้เพื่อสร้างระบบให้มีประสิทธิภาพ และประสิทธิผลตามความเหมาะสม ซึ่งขอ้ มลู จากแหล่งอ่ืนๆ ที่สามารถนามาชว่ ยในการวเิ คราะห์ไดแ้ ก่  ข้อมูลจากหน่วยงานภาครัฐ เช่น ข้อมูลโรงแรมท่ีจดทะเบียนจากกระทรวงมหาดไทยและข้อมูล สารวจจากสานักงานสถิติแห่งชาติ, ข้อมูลการเข้าออกประเทศของนักท่องเท่ียวจากสานักงาน ตรวจคนเข้าเมอื ง, ข้อมูลการเข้าพักโรงแรมของนักท่องเที่ยวจากกระทรวงการท่องเท่ียวและกีฬา, รวมถึงข้อมูลอื่นๆ ที่ได้มีการเก็บรวบรวมไว้ในฐานข้อมูลของการท่องเที่ยวแห่งประเทศไทย และกระทรวงการทอ่ งเทยี่ วและกีฬา  ข้อมูลจากแหล่งข้อมูลภายนอก เช่น ข้อมูลเที่ยวบินทั่วโลกจาก IATA (International Air Transport Association), ข้อมูลการเข้าพักใน Airbnb โดยบริษัท AirDNA, ข้อมูลบนสื่อ สังคมออนไลน์ เช่น Instagram และ Wongnai, ข้อมูลการค้นหาเก่ียวกับประเทศไทยจาก Google Trends, ข้อมูลการใช้จ่ายของนักท่องเท่ียวจากบริษัทเครดิตการ์ด เช่น Mastercard, Visa ระบบการแนะนาสถานที่ท่องเท่ียวอัตโนมัตินี้ สามารถนาไปสู่การพัฒนาแอปพลิเคชันหรือหน้า เว็บไซต์ท่ีการท่องเท่ียวแห่งประเทศไทย หรือกระทรวงการท่องเท่ียวและกีฬา ใช้เสริมกับระบบท่ีมีอยู่แล้วได้ เพอื่ เปิดใหผ้ ู้คนจากทัว่ โลกสามารถเข้ามาใช้ระบบน้ีเพ่ือค้นหาและวางแผนการเข้ามาเท่ียวในประเทศไทย โดย ระบบสามารถช่วยเพิ่มพูนความพึงพอใจและกระตุ้นการใช้จ่ายของนักท่องเท่ียว ในขณะเดียวกันสามารถ กระจายนกั ทอ่ งเทย่ี วไปยงั เมืองรองใหมๆ่ ไดด้ ว้ ย 6.2 การวเิ คราะหส์ ่อื สงั คมออนไลน์และพัฒนาเครื่องมือเพ่ือรวบรวมข้อมูลสารวจความคิดเห็นของภาครัฐ : กรณีศึกษาเนต็ ประชารฐั กรณีศึกษาของสานักงานสถิติแห่งชาติ ภายใต้กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม ทาการศึกษา พัฒนาเคร่ืองมือหรือแพลตฟอร์มสาหรับการสารวจความคิดเห็นและความพึงพอใจต่อนโยบายต่างๆ ของ รัฐบาล โดยใช้โครงการเน็ตประชารัฐ ของกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม เป็นกรณีศึกษานาร่อง สาหรับการทดสอบแพลตฟอร์มนี้ ในปัจจุบันการทาสารวจเกี่ยวกับความความเห็นและความพึงพอใจของ ประชาชนดาเนนิ การโดยการสง่ เจา้ หน้าท่ลี งพื้นท่เี พ่อื พบประชาชนกลุ่มตัวอย่างโดยตรง และทาการเก็บข้อมูล ผ่านทางแบบสอบถามทเี่ ปน็ กระดาษ หรือผ่านแท็บเล็ตของเจ้าหน้าท่ี ซ่ึงวิธีการดังกล่าวใช้กาลังคน เวลา และ 41

งบประมาณค่อนข้างมาก โครงการน้ีจึงมุ่งเน้นการสร้างเครื่องมือสาหรับการทาการสารวจในลักษณะดังกล่าว โดยนาเทคโนโลยีดิจิทัลมาพัฒนากระบวนการสารวจใหม้ ปี ระสทิ ธิภาพมากย่ิงข้ึน โดยแพลตฟอร์มนี้มุ่งเน้นการ ใช้ข้อมูลท่ีมีอยู่ในโลกดิจิทัลอยู่แล้วนั่นคือ 1) ข้อมูลความพึงพอใจหรือความคิดเห็นในรูปแบบของภาษาเขียน จากส่ือสังคมออนไลน์ 2) ข้อมูลการใช้งานเน็ตประชารัฐจากเครื่องแม่ข่ายผู้ให้บริการเน็ตประชารัฐ 3) การ สารวจข้อมูลผา่ นการตอบแบบสอบถามออนไลน์ โดยมีการเลือกกลุ่มท่ีจะสารวจด้วยเทคโนโลยีการตลาดแบบ ดจิ ทิ ัล โดยแบบสอบถามออนไลน์จะใชส้ าหรบั ประเดน็ ที่ไม่พบในสื่อสงั คมออนไลน์ รูปที่ 6.3 แสดงแหล่งข้อมูล และกรอบวธิ ีการ รปู ที่ 6.3 โครงสร้างแพลตฟอร์มสาหรบั การสารวจความคิดเห็นของประชาชนแบบดิจทิ ัล สาหรับการวิเคราะห์ข้อมูลและสารวจในประเด็นต่างๆ จะอ้างอิงจากแบบสอบถามเดิมท่ีดาเนินการ โดยสานักงานสถิติแห่งชาติ ในการสารวจความคิดเห็นของประชาชนท่ีมีต่อโครงการเน็ตประชารัฐ โดยนา ข้อมูลจากแพลตฟอร์มนเี้ ทียบกับขอ้ มูลจากวธิ ีเดิมเพอ่ื หาความเหมือนหรือความตา่ งกันในลักษณะแนวโน้มของ ขอ้ มูล (Correlation) จากการศึกษาแบบสอบถามพบว่ามีข้อมูลทั้งหมด 5 ประเด็นด้วยกัน คือ 1) ข้อมูลลักษณะทาง ประชากรของผู้ใชง้ านเน็ตประชารฐั 2) ประสิทธิภาพการใช้งานและปัญหาที่พบในการใช้งาน 3) วัตถุประสงศ์ การใช้เน็ตประชารัฐของประชาชน 4) บริการอื่น ๆ ที่ประชาชนอยากให้มีผ่านทางเน็ตประชารัฐ เช่น การฝึกอบรมเก่ียวกับใช้เน็ตสาหรับการค้าขาย 5) ค่าบริการท่ีเหมาะสมสาหรับการต่อเน็ตประชารัฐเข้าบ้าน โดยตรง การใช้ข้อมูลจากแหล่งที่มีอยู่แล้วในโลกดิจิทัลต่างๆ จะสามารถนามาใช้ตอบในท้ัง 5 ประเด็นนี้ได้ ดังน้ี 1) ประเด็นข้อมูลลักษณะทางประชากรของผู้ใช้งานเน็ตประชารัฐ เน่ืองจากในการใช้งานเน็ตประชารัฐ จะต้องมีการเข้าสู่ระบบและลงทะเบียนด้วยบัตรประชาชน ในอนาคตจะสามารถเช่ือมโยงข้อมูลเหล่านี้กับ ระบบสารสนเทศของสานักทะเบียนราษฎร์ กรมการปกครองเพื่อเก็บข้อมูลเก่ียวกับผู้ใช้ได้ 2) ประสิทธิภาพ การใชง้ านและวตั ถุประสงศ์การใชง้ าน สามารถนาข้อมูลจากสื่อสังคมออนไลน์และบันทึกการใช้งานจากเครื่อง แม่ข่ายผู้ให้บริการได้ โดยข้อมูลจากสื่อสังคมออนไลน์จะอยู่ในรูปแบบของความคิดเห็นและความพึงพอใจ ประเด็นท่ีพบว่ามีการกล่าวถึงในสื่อสังคมออนไลน์ คือ ความเร็ว ความเสถียร วัตถุประสงศ์การใช้งาน ความ เหมาะสมของจุดติดต้ัง Wi-Fi ฟรี โดยข้อมูลที่เก็บน้ันจะเป็นข้อมูล 2 ปีย้อนหลังจากเว็บไซต์และส่ือสังคม 42

ออนไลน์ทั้งหมด 74 แห่ง ข้อมูลเหล่าน้ีเก็บโดยการใช้โปรแกรม Web Crawler และสามารถแสดงผลใน รูปแบบของ Dashboard ที่อัปเดตโดยอัตโนมัติดังตัวอย่างในรูปที่ 6.4 สาหรับข้อมูลบันทึกการใช้งานจาก เครื่องแมข่ า่ ย (Server Log) จะสามารถบ่งบอกได้อย่างชัดเจนว่าประชาชนใช้เน็ตประชารัฐเพ่ือทากิจกรรมใด หรอื มีวัตถปุ ระสงศ์การใชง้ านอย่างไร โดยข้อมูลบนั ทึกนี้เป็นข้อมูลท่ีเกิดจากการใช้งานจริง และสามารถถูกจัด กลุ่มวิเคราะห์การใช้งานได้หลากหลาย เช่น ช่วงเวลาที่เข้าใช้เน็ตประชารัฐ หรือพ้ืนท่ีท่ีเข้าใช้งาน เป็นต้น ดงั ตวั อยา่ งในรปู ที่ 6.4 สาหรับประเด็น 4) บริการอ่ืนๆ ท่ีประชาชนอยากให้มีผ่านทางเน็ตประชารัฐ เช่น การฝึกอบรม เกี่ยวกับใช้เน็ตสาหรับการค้าขาย 5) ค่าบริการท่ีเหมาะสมสาหรับการต่อเน็ตประชารัฐเข้าบ้านโดยตรง เป็นข้อมูลท่ีไม่พบในสื่อสังคมออนไลน์และบันทึกการใช้งานจากระบบแม่ข่าย จึงอาจยังจาเป็นต้องเก็บข้อมูล ดังกล่าวในรูปแบบของแบบสอบถาม แต่อยู่ในรูปแบบของแบบสอบถามออนไลน์ โดยสามารถออกแบบให้ใน ทุกครั้งที่มีการเชื่อมต่ออินเทอร์เน็ตจากเน็ตประชารัฐ จะมีแบบสอบถามส้ันๆ ให้ผู้ใช้ตอบก่อนการใช้งาน โดยการตอบคาถามสามารถออกแบบการสุ่มข้อถาม 4-5 คาถามจาก 20 คาถามที่ต้องการทราบข้อมูล และอาจใช้เทคโนโลยี AI เขามาช่วยในการเลือกคาถามท่ีเหมาะสมกับผู้ตอบ จากการดาเนินการดังกล่าวใน เบ้ืองต้นของการศึกษาพบว่าในข้อมูลที่ได้จากแบบสอบถามด้วยวิธีเดิมมีแนวโน้มในทิศทางเดียวกันกับข้อมูล จากแหล่งตา่ ง ๆ ทนี่ ามาใชใ้ นแพลตฟอร์มจากกรณศี ึกษาในคร้ังน้ี ภาพตวั อยา่ ง บันทึกการใช้งานจากเครอ่ื งแม่ข่ายผู้ใหบ้ รกิ าร ภาพ Dashboard สรปุ การวเิ คราะหอ์ ารมณ์/ความรสู้ ึก (Sentimental analysis) ของข้อความจากภาษาทเ่ี ขียน รูปท่ี 6.4 ตัวอยา่ ง Dashboard และ ไฟล์บันทึกการใช้งาน 6.3 การจดั ทาเครอ่ื งมอื ประเมินช่วยคัดกรองผู้กระทาผิดที่มีโอกาสย้อนกลับไปกระทาผิดซา้ กระทรวงยุติธรรมเห็นความสาคัญของการใช้ประโยชน์ข้อมูลโดยเฉพาะการนาผลของการวิเคราะห์ ข้อมูลมาพัฒนางานด้านกระบวนการยุติธรรม โดยในเบ้ืองต้น กระทรวงยุติธรรมมีความร่วมมือกับกระทรวง ดิจทิ ลั เพ่ือเศรษฐกิจและสังคมในการกาหนดโจทย์การวิเคราะห์ข้อมูลขนาดใหญ่ รวมถึงการวิเคราะห์คัดเลือก ข้อมูลในเบอื้ งต้นสาหรับการจัดทาโจทย์ และเตรียมข้อมูลสาหรับการวิเคราะห์ในเชิงลึก ซ่ึงผลของการกาหนด โจทย์คอื การวเิ คราะห์เชิงพยากรณ์ชว่ ยคัดกรองผกู้ ระทาผดิ ซา้ ในเบื้องต้นได้มีการศึกษาข้อมูลจากฐานข้อมูลหลักของ 3 หน่วยงาน คือ กรมราชทัณฑ์ กรมคุม ประพฤติและกรมพินิจและคุ้มครองเด็กและเยาวชน โดยทา Exploratory Data Analysis และสร้างเป็น 43

Dashboard เพ่อื ดูการกระจายตัวของข้อมูลผู้กระทาผิดซ้า จากน้ันกระทรวงยุติธรรมได้ทาการรวบรวมข้อมูล จากเครอ่ื งมอื ท่ีใช้ในการปฏิบตั ิงานเพ่มิ เตมิ เพ่ิอเสริมกับขอ้ มลู จากฐานข้อมลู หลกั ตวั อย่างเชน่  แบบสอบถามเพ่อื รวบรวมข้อเท็จจรงิ จัดทาประวัติ เพอ่ื จาแนกระดับความเส่ียงต่อการกระทาผิด ซ้า โดยแบบสอบถามนี้ถูกใช้เก็บข้อมูลในขั้นตอนการสืบเสาะ/พินิจ การจาแนก/วิเคราะห์เพ่ือ พฒั นาพฤตนิ ิสัย และ การกลบั เขา้ ส่สู ังคม  แบบสารวจสภาวะจติ ใจ ร่างกาย และพฤตกิ รรม ซึ่งถูกใชใ้ นขึ้นตอนการสบื เสาะ/พนิ ิจ  แบบสัมภาษณ์เพ่ือติดตามการพัฒนาสภาวะ ซ่ึงถูกใช้เก็บข้อมูลด้านการพัฒนาสภาวะในขั้นตอน การจาแนก/วเิ คราะหเ์ พอื่ พัฒนาพฤตนิ สิ ยั เป็นระยะหลังการพจิ ารณาคดี  แบบสอบถามข้อมูลของผู้กระทาความผิด เช่น ประวัติการกระทาผิด ประวัติการใช้สารเสพติด และการบาบัดรักษา ภูมิหลังทางครอบครัว ประวัติการศึกษาและอาชีพ ประวัติการใช้ความ รุนแรง สภาวะทางจิตและพฤติกรรม ชุมชนและสภาพแวดล้อม การคบเพื่อน ฯลฯ โดยข้อมูลใน ส่วนนี้สามารถใช้งานร่วมกันระหว่างหน่วยงานที่เก่ียวข้องได้เพื่อระบุกรณีท่ีผู้กระทาผิดย้อนกลับ เขา้ มาในระบบหลังการปล่อยตัว หน่วยงานในกลมุ่ พฤตินิสยั ของกระทรวงยุติธรรมได้วางแผนที่จะนาข้อมูลทั้งหมดท่ีได้จัดเตรียมไว้เพื่อ จดั ทาโมเดลพยากรณ์ 2 ส่วนดว้ ยกัน คือ สว่ นท่ี 1 เครอื่ งมือประเมนิ ความเสย่ี งในการชว่ ยคดั กรองกล่มุ ผูม้ ีโอกาสยอ้ นกลับไปกระทาผิด เป็นการสร้างโมเดลสาหรับการวิเคราะห์เชิงทานาย เพื่อใช้ในการคัดกรองผู้กระทาผิดที่มีโอกาส กระทาผิดซ้า หนีการคุมประพฤติ หรือฝุาฝืนกฏการภาคทัณฑ์ โดยในเบ้ืองต้นใช้ทฤษฎีทางด้านสถิติ ประยุกต์ใช้เพื่อสร้างโมเดลพื้นฐานท่ีสามารถคัดกรองแบ่งกลุ่มผู้กระทาผิด ออกเป็น 3 กลุ่มคือ กลุ่มความ เส่ียงต่า ความเสี่ยงปานกลาง และความเสี่ยงสูง (ในลักษณะเดียวกับการทา Credit Scoring ของธนาคาร) ซึ่งการแบ่งกลุ่มในลักษณะนี้จะสามารถช่วยในการออกแบบวิธีการคุมประพฤติท่ีแตกต่างกันสาหรับนักโทษ แต่ละกล่มุ เสยี่ ง รวมถึงเปน็ การเพิม่ ประสทิ ธิภาพการดแู ล คมุ ประพฤติ และฟ้ืนฟู ผู้กระทาผดิ ได้ โดยต้ังแต่ปี ค.ศ. 1970 เป็นต้นมานักสังคมศาสตร์ได้เร่ิมศึกษาและสร้างเครื่องมือวิจัยเพื่อประเมิน ความเส่ียงการกระทาผิดซ้า เครื่องมือเหล่านั้นได้ถูกนามาประยุกต์ใช้อย่างเป็นรูปธรรมในประเทศ แคนาดาดังนาเสนอในบทความเรื่อง “Risk-Need-Responsivity Model for Offender Assessment and Rehabilitation” โดย Andrew and Bonta ซึ่งจุดหลักท่ีเพ่ิมประสิทธิผลในการทานายคือการดึงเอา Dynamic Risk Factor เข้ามาใชป้ ระกอบการสรา้ งโมเดล ข้อมูลทีใ่ ชใ้ นการสร้างโมเดลเชิงคณติ ศาสตรจ์ ะแบง่ ออกไดเ้ ปน็ 3 กลมุ่ คอื  Static Factors เชน่ ประเภทการกระทาผิด อายุปัจจุบัน อายุเม่ือถูกจับครั้งแรก ประวัติการ มงี านทา ประวัติการกระทาผิด ฯลฯ  Dynamic Factors เช่น เจตคติ (Attitude) กลุ่มเพอื่ นท่ีคบ สารเสพตดิ ทใี่ ช้ บุคลกิ ในมิติด้าน การตอ่ ตา้ นสังคม ฯลฯ ซึ่งเป็นข้อมลู ทต่ี อ้ งเกบ็ เพ่ิมเติมและประเมินคะแนนโดยผู้เชย่ี วชาญ 44

 Real-time Data เชน่ พฤตกิ รรม และสถานท่มี ั่วสมุ ในเวลาปจั จบุ นั ในปัจจบุ นั กลุ่มงานดา้ นพฤตินสิ ยั มขี อ้ มูลบางส่วนใน 2 หมวดแรกแล้ว โดยมีความน่าจะเป็นที่สามารถ ทดสอบการสร้างโมเดลคณติ ศาสตร์เพื่อนาร่องได้ จากนั้นค่อยเร่มิ ประสานงานกับหน่วยงานอื่นในกระบวนการ ยุตธิ รรมเพอื่ รวบรวมขอ้ มูลในหมวดท่ี 3 ส่วนที่ 2 การใช้ระบบ Recommender เพ่ือแนะนาโครงการฟ้ืนฟูพฤติกรรมท่ีเหมาะสมสาหรับผู้กระทาผิด สว่ นบุคคล สร้างโมเดลสาหรับการวิเคราะห์เชิงทานายเพื่อใช้ในการคัดเลือกวิธีการท่ีเหมาะสมเพ่ือแทรกแซง (Intervention) แนวโนม้ การกระทาผิดซา้ โดยพิจารณาลักษณะและความต้องการของแตล่ ะบุคคล ในเบื้องต้น ทฤษฎีทางด้านสถิติและความน่าจะเป็น จะถูกประยุกต์ใช้เพ่ือสร้างระบบ Recommender ในลักษณะ เดียวกับระบบท่ีใช้กันอย่างแพร่หลายในภาคธุรกิจ ระบบ Recommender จะถูกสร้างและฝึก (Build and Train) จากพฤติกรรมหลงั จากร่วมโครงการฟื้นฟูของผู้กระทาผิดในอดีต โดยจัดกลุ่มตามลักษณะนิสัยและเจต คติ จากนั้นเม่ือมีผู้กระทาผิดรายใหม่เข้ามาในระบบ โมเดล Recommender จะสามารถเลือกโครงการฟ้ืนฟู ที่เหมาะสมจากข้อมูล รูปแบบ (Pattern) ที่มีอยู่โดยดูจากความคล้ายคลึงได้ ข้อมูลท่ีใช้ในการสร้างระบบ recommender จะรวมถงึ ประวตั ิการกระทาผดิ สภาวะแวดล้อมท่ีอยู่อาศัย การเข้าร่วมหรือความเก่ียวเน่ือง กับกลุ่มมิจฉาชีพ กล่มุ เพ่อื น และ ข้อมูลความเส่ียงในการกระทาความผิดซ้า (Credit Score) ฯลฯ 6.4 โครงการวิเคราะหข์ ้อมูลคา่ เบกิ จ่ายสิทธิการรักษาพยาบาลจากรฐั บาล กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมได้ร่วมเจรจากับสานักงานกลางสารสนเทศบริการสุขภาพ (สกส.) ในการวิเคราะห์ข้อมูลค่าเบิกจ่ายสิทธิการรักษาพยาบาลจากรัฐบาล เพ่ือให้กระทรวงสาธารณสุข สามารถนาผลการวิเคราะห์ที่ได้ไปช่วยในการวางแผนงานและดาเนินการในส่วนท่ีเก่ี ยวข้องได้อย่างมี ประสทิ ธภิ าพ โดยการวเิ คราะห์เปน็ การนาศาสตร์ทางด้าน AI มาใช้เพอื่ หาโมเดลที่เหมาะสมเพ่ือให้หน่วยงานที่ เก่ียวข้องกับระบบประกันสุขภาพ เช่น สกส. สานักงานหลักประกันสุขภาพแห่งชาติ (สปสช.) กรมบัญชีกลาง และสานักงานประกันสังคม สามารถนาโมเดลดังกล่าวไปใช้พัฒนางานในมิติต่างๆ ได้ เช่น ใช้ในการประเมิน งบประมาณกองทุนและการเบิกจ่ายตามพื้นท่ี ใช้เพ่ือทานายหรือพยากรณ์โรคที่อาจจะเกิดข้ึนของผู้ปุวยเดิม ใช้เพื่อการจัดสรรทรัพยากรบุคคล สถานที่ และรถพยาบาลได้อย่างเหมาะสมมีประสิทธิภาพ เป็นต้น โดยปัจจุบันกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมอยู่ระหว่างการดาเนินการวิเคราะห์สร้างมโนภาพข้อมูล เพ่ือจัดกลุ่มข้อมูลค้นหาลักษณะความสัมพันธ์ของข้อมูลท่ีแอบแฝงอยู่และพัฒนาให้เป็นแบบจาลองข้อมูลเพื่อ การพยากรณ์ โดยโมเดลที่ได้จะสามารถผลักดนั ใหร้ ะบบประกนั สุขภาพของประเทศไทยมีประสิทธิภาพมากข้ึน และสามารถไปถึงหรอื เหนอื กวา่ ระบบประกนั สขุ ภาพในมาตรฐานสากล ปจั จุบันคนไทยไดร้ บั การค้มุ ครองสิทธิการรักษาพยาบาลจากรัฐบาล โดยสิทธกิ ารรักษาพยาบาลที่มีอยู่ 3 ระบบ คือ 1) สิทธิสวัสดิการการรักษาพยาบาลของข้าราชการ 2) สิทธิประกันสังคม และ 3) สิทธิ หลักประกันสุขภาพ 30 บาท โดยองค์กรท่ีกากับดูแลแต่ละระบบมีหน้าท่ีดูแลจัดเก็บข้อมูลการเบิกจ่ายค่า รกั ษาการพยาบาล ได้แก่ 1) กรมบัญชีกลางและกระทรวงการคลังดแู ลค่าเบิกจา่ ยสิทธิสวัสดิการรักษาพยาบาล 45

ของข้าราชการ 2) สานักงานประกันสังคมดูแลการเบิกจจ่ายสิทธิประกันสังคม และ 3) สปสช. ดูแลสิทธิ ประกันสุขภาพ โดยการจัดเก็บข้อมูลผู้ใช้สิทธิทั้ง 3 สิทธิ ซึ่งสานักงานกลางสารสนเทศบริการสุขภาพเป็น หน่วยงานกลางท่ีรวบรวมข้อมูลผู้ใช้สิทธิทั้ง 3 ประเภท แต่ในปัจจุบัน สกส. มีความร่วมมือกับกรมบัญชีกลาง และสานักงานประกันสงั คมในการพัฒนาระบบจัดเก็บข้อมูลและประมวลผลทางอิเล็กทรอนิกส์ ซึ่งในโครงการ จะใช้ข้อมูลที่ได้จาก สกส. (กรมบัญชีกลาง และสานักงานประกันสังคม) มาใช้ในการวิเคราะห์เป็นหลัก นอกจากน้ันจะขอความร่วมมือขอใช้ข้อมูลจาก สปสช. เพื่อเพ่ิมเติมข้อมูลบางส่วนมาร่วมในการวิเคราะห์ใน ครั้งน้ีด้วย โดยข้อมูลที่นามาใช้คือ ข้อมูลการเบิกจ่ายค่ารักษาพยาบาลของข้าราชการ ข้อมูลแจ้งค่า รักษาพยาบาลของประกันสังคม ข้อมูลรายละเอียดธุรกรรมค่ารักษาพยาบาล ข้อมูลตรวจรักษา ข้อมูลการทา หัตถการ ข้อมลู การวนิ จิ ฉยั เป็นต้น 6.5 การศึกษาปัจจยั เพ่ือทานายระดับความสามารถของบดิ ามารดาในการดูแลบตุ รวยั 0-3 ขวบ กรณีศึกษาท่ีเกิดจากความร่วมมือของกระทรวงต่างๆ ท้ังหมด 5 กระทรวง คือ กระทรวงสาธารณสุข กระทรวงการพัฒนาสังคมและความม่ันคงของมนุษย์ กระทรวงศึกษาธิการ กระทรวงการคลัง และกระทรวง ดิจิทัลเพ่ือเศรษฐกิจและสังคม เพ่ือตอบโจทย์การทานายระดับความสามารถของบิดามารดาในการดูแลบุตรวัย 0-3 ปี โดยการบูรณาการขอ้ มลู โดยนาข้อมูลของเด็กจากกระทรวงสาธารณสุข เช่น การได้รับวิตามิน การได้รับการตรวจไทรอยด์ การเข้ารับการตรวจครรภ์ ความถี่ในการพบแพทย์ ระดับพัฒนาการ ฯลฯ เป็นต้น มาทาการวิเคราะห์ด้วย เทคนิค Cluster Analysis เพอื่ จัดกล่มุ เด็กตามคณุ ภาพการเล้ยี งดู โดยจัดกลุ่มได้เป็น 3 กลุ่ม คือ กลุ่มที่ได้รับ การเล้ียงดูในระดับดี กลุ่มท่ีได้รับการเลี้ยงดูระดับปานกลาง และกลุ่มท่ีได้รับการเลี้ยงดูระดับท่ีควรได้รับ คาแนะนา จากนั้นนาข้อมูลของเด็กจับคู่กับข้อมูลของบิดามารดา โดยใช้ข้อมูลที่ได้จากการบูรณากา รของ 5 กระทรวง เช่น ข้อมูลสุขภาพพ่อและแม่ ข้อมูลด้านสถานะทางเศรษฐกิจ การรับเงินกู้ ระดับการศึกษา เป็นต้น เพื่อทาการวิเคราะห์หาสาเหตุรากเหง้า (Root Cause Analysis) โดยใช้เทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence: AI) สรา้ งสูตรสาหรับคัดกรองพ่อและแม่ที่มีโอกาสเส่ียงที่จะไม่สามารถเล้ียงดูบุตรให้ มีคุณภาพที่ดีได้ ซ่ึงประโยชน์ท่ีได้รับคือสามารถทานายปัญหาการเลี้ยงดูของพ่อและแม่รายใหม่ได้ตั้งแต่ วันคลอด เพื่อให้หน่วยงานภาครัฐท่ีเก่ียวข้องสามารถวางแผนเตรียมความพร้อมในการให้ความช่วยเหลือกับ พ่อและแม่ เพื่อใหส้ ามารถเล้ียงดเู ด็กได้อย่างมีคุณภาพ และพรอ้ มสาหรับก้าวเขา้ สเู่ ยาวชนท่ีดีในอนาคตได้ 6.6 การวเิ คราะหเ์ สียงสะทอ้ นจากนักทอ่ งเท่ยี ว กรณีศึกษาโดยการรวบรวมข้อมูลจากสื่อสังคมออนไลน์ เพื่อใช้นามาใช้วิเคราะห์ความคิดเห็นของ นักท่องเที่ยว ในกรณีศึกษานี้ใช้ข้อมูลท่ีรวบรวมจาก TripAdvisor.com ซึ่งเป็นเว็บไซต์ด้านการท่องเท่ียว อันดบั 1 ของโลก โดยเน้นความคดิ เหน็ ของนักท่องเท่ียวท่ีมีต่อการท่องเท่ียวในจังหวัดเชียงราย ซึ่งเป็นจังหวัด ที่มีผู้ให้ความคิดเห็นใน TripAdvisor.com มากที่สุด โดยมีการนาข้อมูล ความคิดเห็นนักท่องเท่ียวมาทาการ วิเคราะหด์ ้วยเทคนิค Descriptive Statistics, Spatial Analytics และ Sentiment Analytics 46

ประโยชน์ท่ีได้รับจากการวิเคราะห์ คือ ทาให้ทราบแหล่งท่องเที่ยวที่นักท่องเที่ยวสนใจ สามารถ นาไปใช้ในการวางแผนจัดการการท่องเที่ยว การบริหารจัดการสถานท่ีท่องเท่ียวได้อย่างเหมาะสมทั้งสถานท่ี ทอ่ งเที่ยวใหม่ทีก่ าลงั ไดร้ ับความนยิ ม หรือสถานที่ทอ่ งเที่ยวเดมิ ทม่ี ปี ริมาณนกั ท่องเที่ยวหนาแน่น 6.7 การเพิ่มศักยภาพด้านการจัดเก็บภาษี เป็นการดาเนินการร่วมกับกรมสรรพากรในการจัดลาดับกรณีการตรวจสอบการจ่ายภาษี ซึ่งโจทย์ ดังกล่าวเป็นการวิเคราะห์ข้อมูลโดยใช้เทคโนโลยีด้านการเรียนรู้ของเครื่อง (Machine learning) เพื่อสร้าง แบบจาลองในการพยากรณร์ ายรับของธรุ กจิ ในอุตสาหกรรมท่องเท่ียว และพัฒนาระดับการจ่ายภาษีมาตรฐาน (benchmarks) ตามประเภทธุรกิจ จากน้ันแบบจาลองทางคณิตศาสตร์ท่ีได้จากการเรียนรู้ของเครื่องจะถูกใช้ ในการทานายรายรับเพ่ือนามาเปรยี บเทยี บกบั รายรับท่ีธุรกิจได้รายงานแก่กรมสรรพากร หากธุรกิจใดมีโอกาส สงู ทีจ่ ะมรี ายงานรายรบั ต่ากว่าความเปน็ จริงมาก โดยพิจารณาจากธุรกิจที่เป็นค่าผิดปกติ (Outlier) จากระดับ มาตรฐานข้างต้น ระบบจะสามารถแจ้งเตือนเจ้าหน้าที่สรรพากรได้ ข้อมูลท่ีสามารถนามาใช้ในการวิเคราะห์ เช่น ข้อมูลภาษีเงินได้ ภาษีการขาย ข้อมูลรายได้ รายจ่าย กาไรสุทธิของธุรกิจในอุตสาหกรรมท่องเท่ียว ข้อมูล โรงแรม ทพ่ี กั รา้ นอาหาร ขอ้ มูลท่วั ไปเกี่ยวกบั การดาเนินการของธรุ กิจในอตุ สาหกรรมทอ่ งเทยี่ ว เป็นตน้ 6.8 การวิเคราะหร์ ปู แบบภูมิอากาศเพือ่ การวางแผนของท่าอากาศยาน กรมอุตุนิยมวิทยาภายใต้กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม จัดทากรณีศึกษาการบูรณาการ ขอ้ มลู ท่เี กี่ยวข้องกับสภาพอากาศที่มอี ยู่ ได้แก่ 1) ข้อมลู อณุ หภมู ิ/ความชน้ื สัมพัทธ์/ทิศทางลม/ความกดอากาศ 2) ข้อมูลสภาพทัศนวิสัย 3) ข้อมูลปริมาณเมฆ 4) ข้อมูลลักษณะอากาศปัจจุบัน 5) มาทาการวิเคราะห์ด้วย เทคนิค Cluster Analysis อุตุนิยมวิทยา ในพ้ืนท่ีนาร่อง จ.สุโขทัย เพื่อหารูปแบบการจัดกลุ่มของภูมิอากาศ ซ่ึงทาให้พบกับการเปล่ียนแปลงของสภาพภูมิอากาศ ซึ่งประโยชน์ท่ีได้รับคือ สามารถใช้ในการวางแผนด้าน การบริหารความเสี่ยงเร่ืองการบิน และใช้ในการจัดทาแผนส่งเสริมการท่องเที่ยวให้เหมาะสมกับสภาพอากาศ ทเี่ ปลี่ยนไปได้ 6.9 การจัดทาแพลตฟอร์มการรวบรวมข้อมูลเพ่ือการวิเคราะห์ “Digital Transformation ตาม มาตรฐาน” OECD (Digital Economy Outlook) เนื่องจากประเทศไทยมีความร่วมมือกับองค์การเพ่ือความร่วมมือทางเศรษฐกิจและการพัฒนา (Organization for Economic Co-operation and Development: OECD) ในประเด็นการขับเคล่ือนการ พัฒนาและปฏิรูปประเทศอย่างมีประสิทธิภาพและยั่งยืน เพื่อสอดรับกับเปูาหมายการพัฒนาของประเทศ โดยเฉพาะอย่างย่ิงด้านการพัฒนาเศรษฐกิจดิจิทัล ในการดาเนินการตามกรอบความร่วมมือดังกล่าวประเทศ ไทยโดยสานักงานคณะกรรมการดิจิทัลเพื่อเศรษฐกิจและสังคมแห่งชาติ จะดาเนินกิจกรรมความร่วมมือเพื่อ ศึกษาบริบทการพัฒนาเศรษฐกิจดิจิทัลของประเทศ (Thailand Digital Economy Outlook) ใน 6 มิติหลัก คือ การเข้าถึง การใช้นวัตกรรม การทางาน สังคม ความเช่ือม่ัน และการเปิดตลาด โดยผลการวิเคราะ ห์ สามารถนามาใช้เป็นข้อมูลสนับสนุนการวางแผนการพัฒนาดิจิทัลเพ่ือเศรษฐกิจและสังคมในระดับมหภาค 47

ต่อไปได้ ซึ่งในการดาเนินการดังกล่าวจะต้องทาการรวบรวมข้อมูลจากแหล่งต่างๆ รวมทั้งการวิเคราะห์และ นาเสนอขอ้ มลู ปรากฏการณ์ Digital Transformation ให้ครอบคลุมท้ัง 6 มิติ การรวบรวมข้อมูลจากหลายแหล่งเพ่ือให้ครอบคลุมทุกมิตินั้น อาจมีความหลากหลายของแหล่งที่มา และความหลากหลายของรูปแบบการจัดเก็บข้อมูล ดังน้ันในการศึกษาน้ีจึงเป็นการสร้างแพลตฟอร์มในการ รวบรวมข้อมูลจากแหล่งต่างๆ การจัดเก็บข้อมูล การวิเคราะห์ รวมไปถึงการนาเสนอข้อมูลในรู ปแบบ Dashboard ซึ่งการทาแพลตฟอร์มดังกล่าว มีแนวโน้มที่จะพัฒนาต้นแบบให้กับจังหวัดราชบุรี และหาก กรณีศึกษาประสบผลสาเร็จกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมจะสามารถนา แพลตฟอร์มดังกล่าวนี้ไป ประยุกต์ใช้ในพ้ืนที่อ่ืนต่อไปได้ เพื่อให้วิธีการรวบรวมข้อมูลปรากฏการณ์ Digital Transformation ที่เป็นไป ในทศิ ทางเดยี วกนั ทั้งประเทศ 48

เอกสารแนบ 49

เอกสารแนบ ก1 สรุปรายช่ือหน่วยงานระดับกรมหรือเทียบเท่า ท่ีมี Agency Data Center / Cloud กระทรวงกลาโหม กระทรวงการคลัง  กองทพั ไทย13  กรมบญั ชีกลาง  กองทัพบก1  กรมศลุ กากร  กองทัพเรือ1  กรมสรรพสามติ  กองทพั อากาศ1  กรมสรรพากร กระทรวงการท่องเท่ียวและกีฬา  สานักงานเศรษฐกิจการคลัง กระทรวงการพัฒนาสังคมและความมนั่ คงของมนษุ ย์  กรมท่องเทีย่ ว  กรมกจิ การเดก็ และเยาวชน  สถาบันการพละศึกษา  กรมกิจการผู้สงู อายุ  กรมสง่ เสรมิ และพัฒนาคณุ ภาพชวี ิตคนพิการ  การเคหะแหง่ ชาติ กระทรวงเกษตรและสหกรณ์  สานักงานธนานุเคราะห์ กระทรวงคมนาคม  องคก์ ารสะพานปลา  กรมการขนส่งทางบก  กรมทางหลวง  กรมทางหลวงชนบท  กรมทา่ อากาศยาน  การทางพิเศษแห่งประเทศไทย  การทา่ เรอื แห่งประเทศไทย  การรถไฟแห่งประเทศไทย  บรษิ ัท ขนส่ง จากัด  บริษัท ท่าอากาศยานไทย จากดั (มหาชน)  บรษิ ัท ไทยสมายล์แอรเ์ วย์ จากดั  บรษิ ัท วิทยกุ ารบินแหง่ ประเทศไทย จากัด  สถาบนั การบนิ พลเรอื น 13กองทัพบก กองทพั เรือ และกองทัพอากาศ เปน็ หนว่ ยงานทข่ี ึน้ ตรงต่อกองทพั ไทย (ซง่ึ เป็นหน่วยงานระดับกรม) ที่วางแผนจะจดั ทา data center ของหนว่ ยงานเอง 50

กระทรวงดจิ ทิ ลั เพ่อื เศรษฐกจิ และสังคม กระทรวงทรัพยากรธรรมชาตแิ ละสิ่งแวดลอ้ ม  กรมอุตนุ ยิ มวทิ ยา  กรมควบคมุ มลพิษ  บรษิ ทั ไปรษณีย์ไทย จากัด  กรมทรพั ยากรนา้  สานกั งานพัฒนาธรุ กรรมทางอิเล็กทรอนกิ ส์ (องค์การมหาชน)  สานักงานส่งเสรมิ เศรษฐกจิ ดจิ ิทลั  สานักงานสถิติแหง่ ชาติ กระทรวงพลงั งาน กระทรวงพาณิชย์  กรมธุรกจิ พลงั งาน  กรมการคา้ ต่างประเทศ  กรมพัฒนาพลงั งานทดแทนและอนรุ กั ษพ์ ลังงาน  กรมการคา้ ภายใน  การไฟฟาู ฝาุ ยผลิตแหง่ ประเทศไทย  กรมส่งเสรมิ การคา้ ระหวา่ งประเทศ  บรษิ ัท ปตท. จากัด (มหาชน)  สานกั งานคณะกรรมการกากบั กจิ การพลงั งาน กระทรวงยุตธิ รรม  กรมสอบสวนคดพี ิเศษ กระทรวงมหาดไทย  สานกั งานคณะกรรมการปอู งกนั และปราบปราม  กรมท่ีดนิ ยาเสพตดิ  การประปานครหลวง  การประปาส่วนภมู ิภาค กระทรวงวทิ ยาศาสตรแ์ ละเทคโนโลยี  การไฟฟูานครหลวง  ศนู ย์ความเป็นเลศิ ดา้ นชีววทิ ยาศาสตร์  การไฟฟูาสว่ นภมู ภิ าค  สถาบนั วจิ ยั วทิ ยาศาสตรแ์ ละเทคโนโลยแี ห่ง  สานักบรหิ ารการทะเบียน กรมการปกครอง ประเทศไทย  สถาบนั วิจัยแสงซินโครตรอน (องคก์ ารมหาชน) กระทรวงแรงงาน  สถาบันสารสนเทศทรัพยากรนา้ และการเกษตร  กรมการจดั หางาน (องคก์ ารมหาชน)  สานกั งานพฒั นาเทคโนโลยอี วกาศและภมู ิ สารสนเทศ (องค์การมหาชน)  สานกั งานพฒั นาวทิ ยาศาสตรแ์ ละเทคโนโลยี แหง่ ชาติ 51

กระทรวงสาธารณสุข กระทรวงอตุ สาหกรรม  กรมควบคมุ โรค  กรมโรงงานอตุ สาหกรรม  กรมสนับสนนุ บรกิ ารสุขภาพ  กรมส่งเสรมิ อุตสาหกรรม  กรมอนามัย  สานักงานคณะกรรมการอาหารและยา หนว่ ยงาน/องค์กรอสิ ระ และอน่ื ๆ  ธนาคารแหง่ ประเทศไทย สานกั นายกรฐั มนตรี  สานักงานการตรวจเงินแผ่นดนิ  บริษทั อสมท. จากดั (มหาชน)  สานักงานคณะกรรมการปอู งกนั และปราบปราม  สานักงบประมาณ การทุจริตแหง่ ชาติ  สานักงานคณะกรรมการพัฒนาการเศรษฐกจิ และ  สานักงานคณะกรรมการปอู งกันและปราบปราม สังคมแหง่ ชาติ การฟอกเงิน  สานักงานพัฒนารฐั บาลดจิ ทิ ัล (องคก์ ารมหาชน)  สานกั งานตารวจแหง่ ชาติ  สานกั งานศาลยุตธิ รรม 52

เอกสารแนบ ก2 สรุปจานวนหนว่ ยงานทีจ่ ะร่วมใช้คลาวด์ระดบั กระทรวง (Ministry Cloud) สังกัดหนว่ ยงาน จานวน จานวน เปอร์เซนต์ของ หนว่ ยงานท่ีจะ หนว่ ยงานใน หน่วยงานที่จะรว่ มใช้ รว่ มใช้คลาวด์ สงั กดั คลาวด์ระดบั กระทรวง กระทรวงกลาโหม2 ระดับกระทรวง 8 50% กระทรวงการคลงั 3 4 19 74% กระทรวงการต่างประเทศ4 14 13 100% 13 กระทรวงการท่องเท่ียวและกีฬา 57 71% กระทรวงการพัฒนาสังคมและความมั่นคงของมนุษย์ 4 9 44% กระทรวงเกษตรและสหกรณ์ 21 22 95% กระทรวงคมนาคม 10 22 45% กระทรวงดิจิทลั เพื่อเศรษฐกจิ และสังคม 49 44% กระทรวงทรัพยากรธรรมชาติและสง่ิ แวดลอ้ ม 14 16 88% กระทรวงพลังงาน 49 44% กระทรวงพาณิชย์ 10 13 77% กระทรวงมหาดไทย 6 12 50% กระทรวงยุติธรรม 14 16 88% กระทรวงแรงงาน 56 83% กระทรวงวัฒนธรรม5 9 9 100% กระทรวงวทิ ยาศาสตร์และเทคโนโลยี 9 15 60% กระทรวงศกึ ษาธิการ6 12 12 100% กระทรวงสาธารณสขุ 7 11 64% กระทรวงอตุ สาหกรรม 17 19 89% สานกั นายกรฐั มนตรี7 85% 3 26 75% รวม 1851 2731 ขอ้ สังเกต: 1. สถานะปจั จุบนั ไดม้ กี ารสารวจและวิเคราะห์ขอ้ มูลหนว่ ยงานแลว้ 159 หน่วยงานจากหน่วยงานภาครัฐต่างๆ (รวม หน่วยงานอิสระ) ซ่ึงได้รวมถึงสานักงานปลัดจากทุกกระทรวง ผู้เชี่ยวชาญในคณะอนุกรรมการออกแบบ สถาปัตยกรรมระบบบูรณาการข้อมูลภาครัฐ ได้อนุมานหน่วยงานบางส่วนว่าจะร่วมใช้คลาวด์ระดับกระทรวง 53

ซึ่งหน่วยงานเหล่าน้ีสามารถให้ข้อมูลยืนยันในภายหลัง สาหรับจานวนหน่วยงานทั้งหมดใน 20 สังกัด ได้มีการ รวบรวมจากเว็บไซต์ของแต่ละสงั กัดโดยตรงเพอ่ื ความครบถว้ นและทนั สมยั 2. จานวนหนว่ ยงานในสังกัดกระทรวงกลาโหม นับกองทัพบก กองทัพเรือ และกองทัพอากาศ เสมือนเป็นกรม เพื่อจุดประสงค์ในการนับจานวน Agency Data center / Cloud เน่ืองจากเหล่าทัพมีข้อมูลชั้นความลับสูง จงึ ประสงคจ์ ะดแู ลดาต้าเซนเตอร์เอง 3. จานวนหนว่ ยงานในสงั กดั กระทรวงการคลงั ไมร่ วมการพจิ ารณาธนาคารต่างๆ ในสังกัดกระทรวง 4. กระทรวงต่างประเทศ มีแผนจะใช้ระบบคลาวด์ผสม มีดาต้าเซนเตอร์และระบบคลาวด์ โดยสานักงานปลัด จะใหบ้ ริการทุกหน่วยงานในสังกดั 5. กระทรวงวฒั นธรรม มแี ผนจะใช้ระบบคลาวดก์ ลางภาครฐั 6. กระทรวงศึกษาธิการ มีแผนจะสร้างระบบคลาวด์ผสม มีดาต้าเซนเตอร์และระบบคลาวด์ส่วนตัวและมี บางส่วนเชอ่ื มต่อไปยงั คลาวดส์ าธารณะ โดยส่วนกลางจะให้บรกิ ารทกุ หน่วยงานในสังกดั 7. สานักนายกรัฐมนตรี วางแผนจะจัดทาคลาวด์ระดับกระทรวงสาหรับส่วนราชการท่ีข้ึนตรงต่อปลัดสานัก นายกรัฐมนตรีเท่าน้ัน ประกอบด้วย 3 หน่วยงาน คือ สานักงานปลัดสานักนายกรัฐมนตรี กรมประชาสัมพันธ์ และ สานกั งานคณะกรรมการคุ้มครองผบู้ รโิ ภค 54

เอกสารแนบ ข แนวทางปฏิบัติทางเทคโนโลยสี าหรับการแปลงข้อมูลใหอ้ ยใู่ นรปู แบบ พรอ้ มใชง้ าน เอกสารแนบฉบับน้ีอธิบายแนวทางปฏิบัติในการแปลงข้อมูลในรูปแบบ CSV (ย่อมาจาก Comma- Separated Values) ให้อยใู่ นรปู แบบ XML (ยอ่ มาจาก Extensible Markup Language) และ JSON (ย่อมา จาก JavaScript Object Notation) ท่ีพร้อมสาหรับการนาไปพัฒนาต่อยอดเป็นรูปธรรม เช่น พัฒนาเป็น โปรแกรมพร้อมใช้งานผ่าน Web/Mobile Applications หรือการวิเคราะห์ข้อมูล Data Analytics โดยเอกสารฉบับนี้มีท่ีมาจากผลการสารวจท่ีพบว่าข้อมูลในหน่วยงานภาครัฐส่วนใหญ่ยังถูกเก็บอยู่ในรูปแบบ ท่ีหลากหลาย แต่สามารถแปลงออกมา (Export) ให้ในรูปแบบ CSV ได้เป็นอย่างต่า ดังนั้นแนวทางปฏิบัติ จึงตั้งต้นด้วยการที่ข้อมูลในรูปแบบ CSV ถูกแปลงให้อยู่ในรูปแบบที่มีมาตรฐานพร้อมนาไปใช้งานมากขึ้น ได้แก่ XML หรือ JSON ซึ่งมีการใช้งานอย่างแพร่หลายท้ังในและต่างประเทศ สามารถใช้งานได้สะดวก และ ทีส่ าคญั คอื มขี ้นั ตอนการแปลงขอ้ มูลที่ชัดเจนพร้อมสาหรบั การนาไปปฏิบัตใิ ช้และเช่ือถือได้ วิธกี ารแปลงข้อมูลเปน็ JSON และ XML ในเอกสารฉบบั น้ี แบ่งออกเป็น 2 วธิ ี ได้แก่ 1. การแปลงด้วยเคร่ืองมือออนไลน์ : เหมาะสาหรับข้อมูลท่ีไม่ต้องการความปลอดภัยสูง และจานวน ไม่มากนกั สามารถแปลงขอ้ มลู ไดอ้ ยา่ งรวดเรว็ ทั้งยังไม่ต้องตดิ ต้งั โปรแกรมในเครื่อง 2. การแปลงด้วยเคร่ืองมือท่ีติดต้ังบนเครื่อง : เหมาะสาหรับข้อมูลท่ีต้องการความปลอดภัยสูง มีขั้นตอนที่เยอะกว่าการใช้เครื่องมือออนไลน์ เคร่ืองมือท่ีเอกสารฉบับน้ีแนะนาคือ Openrefine ซึ่งเป็นโปรแกรม Open Source ที่ได้รับการยอมรับจาก European Open Data Portal https://www.europeandataportal.eu ผู้ใช้สามารถดาวน์โหลดซอฟทแ์ วร์ Openrefine สาหรับ ระบบปฏิบัติการต่างๆได้จาก http://openrefine.org/download.html จากน้ันทาการติดตั้ง ตามขั้นตอนทรี่ ะบุในเว็บไซตด์ งั กล่าว ข.1. วธิ กี ารแปลงขอ้ มลู จาก CSV เป็น JSON ข.1.1 การแปลงข้อมูลเครื่องมอื ออนไลน์ สามารถเลือกได้ 2 วิธดี ังน้ี  กรณีข้อมูลถกู เก็บอย่ใู นเคร่ืองอยา่ งเดียว สามารถแปลงข้อมูลผา่ น URL: https://www.csvjson.com/ csv2json โดยผู้ใชง้ านตอ้ งอบั โหลดไฟล์ CSV โดยคลิก “Select a file..” จากน้ันคลิกปุม “Convert” ระบบจะแปลงข้อมูลในรปู แบบ CSV ไปยัง JSON โดยอัตโนมตั ิ จากนัน้ คลิก “Download” เพ่ือ เก็บข้อมลู ในรปู แบบ JSON ไปใชใ้ นขนั้ ตอนต่อไป  กรณมี ีข้อมลู ท่ถี ูกเกบ็ อยู่บนคลาวด์ สามารถแปลงข้อมลู ผา่ น URL: https://codebeautify.org/csv- to-json-converter โดยผ้ใู ชง้ านตอ้ งอับโหลดไฟล์ CSV โดยคลกิ “Browse” หรอื คลิก “Load Url” 55

ในกรณีท่ีไฟล์อยบู่ นคลาวด์ จากนน้ั คลิกปมุ “CSV to JSON” ระบบจะแปลงไฟลใ์ นรูปแบบ CSV ไปยงั JSON โดยอตั โนมัติจากน้ันผใู้ ช้งานคลกิ “Download” เพื่อเก็บไฟล์ JSON ไปใชใ้ นขนั้ ตอนต่อไป ข.1.2 การแปลงข้อมูลด้วยเครอื่ งมือที่ติดตั้งบนเคร่ือง สามารถใช้ Openrefine 3.0 ตามข้ันตอนดงั น้ี  ดบั เบล้ิ คลกิ เพอ่ื เปดิ Openrefine  เลือกไฟล์ CSV ที่ตอ้ งการแปลง  คลิก Create project 56

 คลกิ Templating  การเปล่ียน Template จาก CSV ไปเป็น JSON นั้น ผู้ใช้ต้องทาการแก้ไข Prefix และ Suffix โดย Prefix จะอยู่ในรูปแบบ “ [ ” และSuffix จะอยู่ในรูปแบบ “ ] ” ทั้งน้ีผู้ใช้สามารถใช้ Row template เป็นคา่ default ได้ 57

 เม่อื แกไ้ ขเสร็จคลกิ “Export”เพ่อื ดาวนโ์ หลดไฟล์ ข.2 วิธกี ารแปลงขอ้ มลู จาก CSV เป็น XML ข.2.1 การแปลงข้อมูลเคร่ืองมือออนไลน์ สามารถเลือกได้ 2 วิธดี ังน้ี  แปลงข้อมูลผ่าน URL: http://convertcsv.com/csv-to-xml.htm ผู้ใช้งานต้องอัปโหลดไฟล์ CSV โดยคลิก “Choose File” หรือคลิก “Enter URL” ในกรณีท่ีไฟล์อยู่บนคลาวด์ จากน้ันคลิกปุม “Convert CSV to XML” ระบบจะแปลงไฟล์ในรูปแบบ CSV ไปยัง XML โดยอัตโนมัติจากน้ัน ผ้ใู ชง้ านคลกิ “Download” เพ่ือเกบ็ ข้อมลู ในรปู แบบ XML ไปใชใ้ นข้นั ตอนตอ่ ไป  แปลงข้อมูลผ่าน URL: https://codebeautify.org/csv-to-xml-converter ผู้ใช้งานต้องอัปโหลด ไฟล์ CSV โดยคลิก “Browse” หรือคลิก “Load Url” ในกรณีที่ไฟล์อยู่บนคลาวด์ จากน้ันคลิกปุม “CSV to XML” ระบบจะแปลงไฟล์ในรูปแบบ CSV ไปยัง XML โดยอัตโนมัติจากนั้นผู้ใช้งานคลิก “Download” เพือ่ เกบ็ ข้อมูลในรูปแบบ XML ไปใชใ้ นขั้นตอนตอ่ ไป ข.2.2 การแปลงข้อมูลด้วยเคร่ืองมอื ท่ีตดิ ตั้งบนเครื่อง สามารถใช้ Openrefine 3.0 ตามข้นั ตอนดงั นี้  ดบั เบล้ิ คลกิ เพอ่ื เปดิ Openrefine  เลอื กไฟล์ CSV ที่ต้องการแปลง  คลกิ Create project ตามด้วย Export  คลิก Templating  เพิ่ม Prefix, Row Template และ Suffix ดงั ตวั อย่างต่อไปนี้ 58

ขอ้ มูลที่ถกู เกบ็ เป็น XML โดยปกตจิ ะมรี ปู แบบดงั นี้ <row> <ชือ่ Attribute1> ค่าของ Attribute1 </ชอื่ Attribute1> <ชอื่ Attribute2> คา่ ของ Attribute2 </ช่อื Attribute 2> <ชอ่ื Attribute3> ค่าของ Attribute3 </ช่อื Attribute3> </row> ตวั อยา่ งเช่น <food> <name> Belgian Waffles </name> <price> $5.95 </price> <description> Two of our famous Belgian Waffles with plenty of real maple syrup </description> <calories> 650 </calories> </food> โดยความหมายของตวั อยา่ งนี้คอื ข้อมูลอาหาร (food) ถกู เก็บในรูปแบบของ XML และมี Attribute สีช่ นิดคือ name มีค่า Belgian Waffles price มคี า่ $5.95 description มีคา่ Two of our famous Belgian Waffles with plenty of real maple syrup calories มคี ่า 650 ในกรณีท่ีผู้ใช้งานต้องการแปลงข้อมูล CSV เป็น XML โดยใช้ Openrefine ซ่ึงโปรแกรมจะอ่านค่า {{cells [\"ช่ือ Attribute1\"].value }} เป็นค่าของ Attribute น้ันๆ ในข้ันตอนการเขียน row template ดงั นน้ั จากตัวอย่างผู้ใช้งานสามารถเขยี น row template ไดด้ งั น้ี <food> <name> {{cells[\"name\"].value}} </name> <price> {{cells[\"price\"].value}} </price> <description> {{cells[\"description\"].value}} </description> <calories> {{cells[\"calories\"].value}} </calories> </food>  จากนน้ั คลิก Export เพอื่ ดาวน์โหลดไฟล์ 59

ข.3 ขนั้ ตอนหลังจากการแปลงไฟลเ์ ป็น JSON และ XML เพื่อนาไปสกู่ ารตอ่ ยอดใช้งาน AB 3 Web/Mobile App Analytics 2 Customize, RDF/ Prioritize Linked RDF 1 XML/JSON Data (CSV) แผนภาพแสดงขั้นตอนหลังจากแปลงไฟล์เป็น JSON และ XML เพื่อนาไปสู่การต่อยอดใช้งาน ใน Web/Mobile App หรือการวิเคราะห์ข้อมูล (Analytics) โดยสามารถเลือกใช้งานจากข้อมูลในรูปแบบ XML/JSON ไดโ้ ดยตรงหรือแปลงเปน็ รปู แบบของ RDF / Linked RDF กอ่ น 60

(ราง) กรอบการวิเคราะหขอมูลขนาดใหญภาครัฐ (Government Big Data Analytics Framework) ฉบับพิมพคร้ังท่ี 1 ขอเสนอแนะเพิ่มเตมิ ควรปรับปรงุ ในเรอ่ื ง ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ขอแกไขเนอื้ หา ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ควรเพมิ่ เตมิ เนอ้ื หา ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... ..................................................................................................................................................................................... (กรณีท่ีกรอกขอมลู ไมเพยี งพอใหเขียนเพม่ิ เติมในกระดาษเปลาแนบมาพรอมเอกสารน้ีหรือสงความเหน็ มาท่ี [email protected]) จาก (นาย/นาง/นางสาว) .................................................................................................................................................................. หนวยงาน/บรษิ ัท............................................................................................................................................................................... โทรศพั ท.: ......................................................โทรสาร.....................................................อเี มล............................................................ (คณะกรรมการออกแบบสถาปต< ยกรรม (Architecture Design) ระบบบรู ณาการขอมูลภาครัฐ ภายใตคณะกรรมการการขบั เคลอื่ นการดําเนนิ นโยบายเพื่อใชประโยชนข: อมูลขนาดใหญฯ ขอขอบพระคณุ ลวงหนามา ณ ท่นี ี้ )

ชําระคาสงเปนI รายเดอื น ใบอนญุ าตที่ พเิ ศษ 65/2559 ปณท.ศนู ยร: าชการเฉลิมพระเกียรติ สงถงึ กองโครงสรางพื้นฐานเทคโนโลยีดิจิทัล สํานักงานคณะกรรมการดิจิทลั เพ่อื เศรษฐกิจและสังคมแหงชาติ เลขท่ี 120 หมู 3 ชั้น 6-9 อาคารรัฐประศาสนภักดี ศนู ยราชการเฉลมิ พระเกยี รติ 80 พรรษาฯ ถนนแจงวัฒนะ กรงุ เทพมหานคร 10210

กระทรวงดจิ ทิ ลั เพื่อเศรษฐกิจและสังคม 120 หมู$ท่ี 3 อาคารรฐั ประศาสนภกั ดี ศนู ย+ราชการเฉลิมพระเกียรติ 80 พรรษา 5 ธันวาคม 2550 ถนนแจง2 วัฒนะ แขวงท$ุงสองห2อง เขตหลักสี่ กรุงเทพมหานคร 10210 www.mdes.go.th สงวนลิขสิทธิ์ © 2019 กระทรวงดจิ ิทลั เพอ่ื เศรษฐกจิ และสงั คม


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook