Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

Published by 3Hmoob Start Up, 2022-04-18 02:32:41

Description: กรอบการวิเคราะหาข้อมูลขนาดให่ญภาครัฐ

Keywords: กรอบการวิเคราะ,หาข้อมูลขนาดให่ญภาครัฐ

Search

Read the Text Version

(ราง) กรอบการวิเคราะหขอมูลขนาดใหญภาครัฐ (Government Big Data Analytics Framework) Version 1 จัดทาํ โดย คณะอนุกรรมการออกแบบสถาปต@ ยกรรม (Architecture Design) ระบบบรู ณาการขอมลู ภาครัฐ ภายใตคณะกรรมการขบั เคลื่อนการดําเนนิ นโยบายเพ่อื ใชประโยชนขอมลู ขนาดใหญ (Big Data) ศนู ยขอมูล (Data Center) และคลาวดคอมพวิ ตงิ้ (Cloud Computing)

Data exchange (ราง) Data Catalog Peoplewareกรอบการวเิ คราะหขอมลู ขนาดใหญภาครัฐ (Government Big Data Analytics Framework) Data Committees & Operating Use casesteinamgovernment Infrastructure โดย คณะอนกุ รรมการออกแบบสถาปตยกรรม (Architecture Design) ระบบบูรณาการข$อมูลภาครัฐ ภายใตคณะกรรมการขับเคล่ือนการดําเนนิ นโยบายเพอื่ ใชประโยชนขอมลู ขนาดใหญ (Big Data) ศูนยขอมูล (Data Center) และคลาวดคอมพวิ ติ้ง (Cloud Computing) Version 1.0













สารบญั บทนา.............................................................................................................................................................. 1 บทที่ 1 โครงสรา้ งพน้ื ฐานเพ่ือการประมวลผลภาครฐั ...................................................................................... 3 1.1 กรอบมาตรฐานดาต้าเซนเตอร/์ คลาวด์ภาครฐั ...................................................................................... 4 1.2 โครงสร้างพ้นื ฐานเพื่อการประมวลผลของหนว่ ยงานภาครฐั .................................................................. 6 1.3 ระบบคลาวดก์ ลางภาครฐั (Government Data Center and Cloud services : GDCC).................. 9 บทที่ 2 รายการข้อมลู ภาครฐั (Government Data Catalog) ..................................................................... 13 2.1 บริการรายการขอ้ มูลภาครัฐ (Government Data Catalog Service).............................................. 13 2.2 การทางานรว่ มกับหนว่ ยงานภาครัฐเรือ่ งการกากับดูแลข้อมลู ............................................................ 18 บทที่ 3 การให้บรกิ ารด้านการแลกเปล่ยี นขอ้ มูล ........................................................................................... 21 3.1 มาตรฐานข้อมูล.................................................................................................................................. 21 3.2 การปรับปรงุ ข้อมลู เพ่อื เตรียมความพร้อม........................................................................................... 22 3.3 ระบบบรกิ ารและแลกเปลย่ี นขอ้ มูลกลาง............................................................................................ 23 บทที่ 4 การกลัน่ กรองคาร้องขอข้อมลู ขา้ มหน่วยงาน .................................................................................... 26 บทที่ 5 การพฒั นาบุคลากรภาครฐั ดา้ นการวิเคราะหข์ ้อมูล........................................................................... 28 5.1 กรอบการพัฒนาบุคลากร ................................................................................................................... 28 5.2 เครือข่ายมหาวิทยาลัยด้านวิทยาศาสตร์ข้อมลู .................................................................................... 32 บทที่ 6 กรณตี ัวอย่างการใชป้ ระโยชน์ขอ้ มูล.................................................................................................. 39 6.1 การเพ่ิมศักยภาพด้านการท่องเทย่ี วเมอื งรอง...................................................................................... 39 6.2 การวเิ คราะห์สื่อสังคมออนไลนแ์ ละพัฒนาเครื่องมือเพ่ือรวบรวมข้อมลู สารวจความคิดเห็นของภาครฐั : กรณศี ึกษาเนต็ ประชารฐั ........................................................................................................................... 41 6.3 การจัดทาเครื่องมอื ประเมินช่วยคัดกรองผู้กระทาผดิ ที่มโี อกาสย้อนกลับไปกระทาผิดซา้ .................... 43 6.4 โครงการวิเคราะห์ข้อมูลค่าเบกิ จา่ ยสิทธกิ ารรักษาพยาบาลจากรฐั บาล ............................................... 45 6.5 การศกึ ษาปจั จัยเพ่อื ทานายระดบั ความสามารถของบิดามารดาในการดแู ลบุตรวยั 0-3 ขวบ.............. 46 6.6 การวเิ คราะห์เสยี งสะท้อนจากนักท่องเทยี่ ว ........................................................................................ 46 ก

6.7 การเพมิ่ ศักยภาพดา้ นการจดั เก็บภาษี................................................................................................. 47 6.8 การวเิ คราะหร์ ูปแบบภมู ิอากาศเพื่อการวางแผนของท่าอากาศยาน .................................................... 47 6.9 การจดั ทาแพลตฟอรม์ การรวบรวมข้อมูลเพื่อการวิเคราะห์ “Digital Transformation ตามมาตรฐาน” OECD (Digital Economy Outlook)...................................................................................................... 47 เอกสารแนบ ก1 สรปุ รายชือ่ หนว่ ยงานระดับกรมหรือเทียบเท่า ที่มี Agency Data Center / Cloud................. 50 เอกสารแนบ ก2 สรปุ จานวนหนว่ ยงานทีจ่ ะร่วมใชค้ ลาวดร์ ะดับกระทรวง (Ministry Cloud).................................. 53 เอกสารแนบ ข แนวทางปฏิบัตทิ างเทคโนโลยีสาหรับการแปลงข้อมลู ให้อยูใ่ นรปู แบบพร้อมใชง้ าน............... 55 ข.1. วิธีการแปลงข้อมูลจาก CSV เป็น JSON............................................................................................ 55 ข.1.1 การแปลงข้อมูลเคร่ืองมอื ออนไลน์ .............................................................................................. 55 ข.1.2 การแปลงข้อมูลดว้ ยเคร่ืองมือทีต่ ดิ ต้ังบนเครื่อง........................................................................... 56 ข.2 วิธีการแปลงขอ้ มูลจาก CSV เปน็ XML.............................................................................................. 58 ข.2.1 การแปลงข้อมลู เคร่ืองมือออนไลน์ .............................................................................................. 58 ข.2.2 การแปลงข้อมูลดว้ ยเครื่องมือทตี่ ิดตั้งบนเคร่ือง........................................................................... 58 ข.3 ขนั้ ตอนหลังจากการแปลงไฟลเ์ ปน็ JSON และ XML เพอ่ื นาไปส่กู ารต่อยอดใช้งาน........................... 60 ข

บทนา ในปัจจุบันประเทศไทยมีความตื่นตัวเร่ืองบ๊ิกดาต้าอย่างกว้างขวางตามกระแสโลก องค์กรท้ังภาครัฐ และภาคเอกชนเริ่มปรับตัวและเตรียมพร้อมเข้าสู่ยุคของการวิเคราะห์และใช้ประโยชน์ข้อมูลขนาดใหญ่ เพ่ือประกอบการตัดสินใจ (Data Driven Decision) และการดาเนินงาน (Insight to Operation) ดังน้ัน เพื่อให้เกิดประโยชน์อย่างเป็นรูปธรรม องค์กรภาครัฐซึ่งเป็นเจ้าของข้อมูลสาคัญท่ีมีผลต่อการพัฒนาประเทศ จึงควรต้องคานึงถึงการบูรณาการและการให้บริการข้อมูลข้ามหน่วยงานภาครัฐ ตลอดไปจนถึงการให้บริการ ข้อมูลที่ไม่มีชั้นความลับแก่ภาคเอกชน คณะทางานภายใต้คณะกรรมการขับเคล่ือนการดาเนินนโยบาย เพ่ือใช้ประโยชน์ข้อมูลขนาดใหญ่ (Big Data) ศูนย์ข้อมูล (Data Center) และคลาวด์คอมพิวติ้ง (Cloud Computing) จึงได้มีมติให้จัดตั้งหน่วยงานใหม่ที่ใช้ช่ือว่า สถาบันส่งเสริมการวิเคราะห์และบริหารข้อมูล ภาครัฐ ซึง่ เป็นหน่วยงานในรูปแบบ Service Delivery Unit หรือ SDU โดยหน่วยงานดังกล่าวมีวัตถุประสงค์ หลักในการส่งเสริมให้เกิดโครงการและสนับสนุนการดาเนินงานด้านบ๊ิกดาต้าสาหรับหน่วยงานภาครัฐ นอกจากน้ี SDU ดังกล่าวจะดาเนินงานวางกรอบการพัฒนาการใช้ประโยชน์ข้อมูลภาครัฐให้เป็นไปในทิศทาง เดียวกัน สามารถบูรณาการและให้บริการข้อมูลข้ามหน่วยงานได้อย่างเป็นระบบ รวดเร็ว ปลอดภัย และ ควบคุมได้ ซึ่งจะนาไปสู่การวิเคราะห์และใช้ประโยชน์ข้อมูลอย่างเป็นรูปธรรมในอนาคต ดังอธิบายในเอกสาร ฉบับนี้ การออกแบบแนวคิดของการให้บริการข้อมูลภาครัฐ (Government Data Service Framework) แสดงในภาพที่ 1 ภาพที่ 1 แนวคิดของการให้บรกิ ารขอ้ มลู ภาครฐั (Government Data Service Framework) กรอบการให้บริการข้อมูลภาครัฐประกอบด้วย 6 ส่วนงานหลักที่จะสร้างให้เกิดระบบนิเวศข้อมูล ท่ีสามารถถกู ใชป้ ระโยชน์ร่วมกนั ได้อย่างเปน็ ระบบ โดยทกุ สว่ นงานควรเริ่มดาเนนิ การไปพรอ้ มๆกนั ดงั นี้ 1

1. พัฒนาโครงสร้างพ้ืนฐานการประมวลผลภาครัฐท่ีเหมาะสม มีประสิทธิผลในการใช้งานท้ังในมิติ ด้านความต่อเน่ืองของบริการ การรักษาความปลอดภัย และการแลกเปลี่ยนเชื่อมโยงข้อมูลอย่างเป็นระบบ ซึ่งสถาปัตยกรรมโครงสร้างพื้นฐานควรเป็นแบบแบ่งปัน ท่ีผู้รับบริการมองเสมือนว่าเป็นโครงสร้างเดียวท่ีใช้ ร่วมกัน ในขณะที่ทางกายภาพโครงสร้างพ้ืนฐานเป็นแบบกระจาย ที่มีการเช่าใช้คลาวด์ผสมกับการสร้าง ดาต้าเซนเตอร์ หน่วยงานภาครัฐสามารถวางแผนการปรับโครงสร้างพ้ืนฐานการประมวลผลท่ีเหมาะสม ให้กับหน่วยงานได้ โดยทาการวิเคราะห์ช่องว่าง (Gap Analysis) ตามกรอบแนวทางท่ีกระทรวงดิจิทัล เพอื่ เศรษฐกจิ และสงั คมกาหนดข้ึน (ผลสรปุ การออกแบบโครงสร้างพ้ืนฐานภาครฐั แสดงในบทที่ 1) 2. พัฒนาระบบรายการข้อมูลภาครัฐ (Government Data Catalog) โดยรวบรวมเมทาดาต้าของ ข้อมูลสาคัญจากหน่วยงานภาครัฐท้ังหมดเพ่ือจัดสร้างเป็นคาตาล็อก (โดยแบ่งทาเป็นระยะ เริ่มจาก กลุ่มหน่วยงานนาร่องก่อน) จากนั้นพัฒนากลไกการสืบค้นในมิติต่างๆและหน้าจอสืบค้นท่ีใช้งานง่ายสาหรับ ให้บุคลากรภาครัฐค้นหาแหล่งข้อมูลเพื่อใช้ประกอบการวิเคราะห์ หรือ ให้บริการได้อย่างสะดวก รวมไปถึง การออกแบบเคร่ืองมือต่างๆ ที่หน่วยงานภาครัฐต้องใช้ในการกากับดูแลและให้บริการข้อมูลของหน่วยงานได้ อย่างเปน็ ระบบ (รายละเอยี ดแสดงในบทท่ี 2) 3. พฒั นาระบบสารสนเทศเพอ่ื บริหารจดั การการเชื่อมโยงและแลกเปล่ียนข้อมูล สาหรับการวิเคราะห์ ข้อมูลขนาดใหญ่ (Big Data Analytics) ของหน่วยงานภาครัฐโดยมีบริการพ้ืนฐาน เช่น การยืนยันตัวตน การจากัดสิทธิในการเข้าถึงข้อมูล บริการส่งข้อมูลข้ามหน่วยงานผ่านระบบสารสนเทศ บันทึกทรานแซกชัน การเขา้ ถึงขอ้ มูลเพอ่ื เป็นหลกั ฐาน และการบริการข้อมลู ประเภทอ่นื (การออกแบบแสดงในบทที่ 3) 4. ต้ังคณะกรรมการกลน่ั กรองคาขอข้อมูลและคณะทางาน เพ่ือให้นโยบายการใช้ข้อมูลของหน่วยงาน ภาครัฐและกากับการให้บริการข้อมูลในมิติต่างๆ ของหน่วยงานภาครัฐ (กรอบหน้าที่ของคณะกรรมการ นาเสนอในบทท่ี 4) 5. วางแผนและดาเนินงานด้านการพัฒนาบุคลากรภาครัฐ เพื่อเตรียมความพร้อมสาหรับ การประยุกต์ใช้ข้อมูลในการวิเคราะห์เพื่อวางแผนยุทธศาสตร์ การปฏิบัติงานของเจ้าหน้าที่ และ การบริหารงานของหน่วยงานภาครัฐ โดยเน้นการอบรมเพื่อพัฒนานักวิทยาศาสตร์ข้อมูล นักวิเคราะห์ข้อมูล และวิศวกรขอ้ มลู (รายละเอยี ดและกระบวนการสรา้ งบุคลากรในบทที่ 5) 6. พัฒนาระบบนาร่องการวิเคราะห์ข้อมูลขนาดใหญ่ ในหลากหลายสาขา เช่น การแพทย์และ การสาธารณสุข การบริหารงานการจราจร การพัฒนาการศึกษา การส่งเสริมการท่องเท่ียว ฯลฯ เพ่ือให้ บคุ ลากรภาครฐั เหน็ ถึงประโยชนข์ องการใช้ข้อมูลประกอบการสร้างนโยบายและแผนงาน (ตัวอย่างกรณีศึกษา นาเสนอในบทที่ 6) 2

บทที่ 1 โครงสร้างพน้ื ฐานเพอื่ การประมวลผลภาครัฐ การว างแผ นภ าพรว มของโครงสร้ างพื้น ฐานดาต้าเซน เตอร์ แล ะคลาวด์มีความส าคัญในการ เพ่ิม ประสิทธิผลของระบบงานภาครัฐโดยรวม ทั้งในด้านการให้บริการระบบงานท่ีต่อเน่ืองและการรักษา ความปลอดภัยทางไซเบอร์ให้ได้ตามมาตรฐานสากล การจัดการทรัพยากรประมวลผลที่คุ้มค่า การวางแผน งบประมาณที่มีประสิทธิภาพ และการแลกเปลี่ยนข้อมูลข้ามหน่วยงานอย่างเป็นระบบ ซ่ึงรูปแบบแนวคิด (Conceptual Design) สาหรับโครงสร้างพื้นฐานการประมวลผลภาครัฐจะเป็นแบบกระจาย โดยมีการเช่าใช้ คลาวด์ผสมกบั การสรา้ งดาตา้ เซนเตอรเ์ พือ่ เพม่ิ ความยืดหยุน่ ในการพัฒนาโครงสร้างพ้ืนฐาน หน่วยงานที่เช่าใช้ ระบบคลาวด์จะไม่จาเป็นต้องจัดซื้อครุภัณฑ์ หรือสร้างอาคารดาต้าเซนเตอร์เพื่อรองรับการขยายตัวของ ระบบงานทง้ั หมด และบุคลากรสารสนเทศสามารถมุ่งเน้นการกากับดูแลระบบงานและข้อมูลแทนการใช้เวลา ในการดแู ลเครื่องประมวลผลและอุปกรณ์พื้นฐานได้ ซึ่งจากข้อมูลในต่างประเทศการใช้คลาวด์น้ันจะประหยัด งบประมาณได้ถึง 30-70% ขึ้นกับลักษณะการใช้งานโดยการใช้แบบ Software-as-a-service หรือ SaaS จะประหยัดได้สูงที่สุด [ref: “Cloud vs. On-Premises cost” by www.fusionalliance.com, “Comparing Costs of Managed Hosting vs. On-Prem DIY” by Rackspace, “SaaS VS On-Premise HR Systems” by www.peoplehr.com] ทั้งน้ี เนื่องจากหน่วยงานภาครัฐแต่ละหน่วยงานมีลักษณะการใช้ทรัพยากรประมวลผลท่ีแตกต่างกัน ไปตามพนั ธกจิ และช้ันความลับของข้อมูล อีกท้ังยังมีความพร้อมด้านสารสนเทศท่ีไม่เท่ากัน โครงสร้างพ้ืนฐาน ด้านการประมวลผลจึงจะมีความแตกต่างกันออกไป ดังน้ันเพ่ือให้การออกแบบโครงสร้างพ้ืนฐานมีความ เหมาะสมกับการใช้งานของแต่ละหน่วยงาน คณะกรรมการขับเคลื่อนการดาเนินนโยบายเพ่ือใช้ประโยชน์ ข้อมูลขนาดใหญ่ (Big Data) ศูนย์ข้อมูล (Data Center) และคลาวด์คอมพิวต้ิง (Cloud Computing) จึงได้ ขอให้หน่วยงานภาครัฐต่างๆ ทาการสารวจโครงสร้างพ้ืนฐานที่มีอยู่เทียบกับมาตรฐานสากล และนาข้อมูล ดังกลา่ วเขา้ ร่วมประเมินวิเคราะห์หาช่องว่าง (Gap Analysis) ร่วมกับผู้เชี่ยวชาญในคณะอนุกรรมการออกแบบ สถาปัตยกรรม (Architecture Design) ระบบบูรณาการข้อมูลภาครัฐ ซึ่งผลจากการวิเคราะห์ได้ถูกนามาใช้ วางแผนเพ่ือปรับปรุงโครงสร้างพื้นฐานสาหรับแต่ละหน่วยงาน รวมไปถึงการวางแผนการโอนย้ายระบบงานเก่า (Legacy System) เขา้ สู่เทคโนโลยใี หม่ และการวางแผนการพฒั นาบุคลากรสารสนเทศอกี ดว้ ย การดาเนินงานออกแบบโครงสร้างการประมวลผลพ้ืนฐานในครั้งน้ี มีหน่วยงานภาครัฐเข้าร่วมให้ ขอ้ มลู เพือ่ ประเมินวเิ คราะห์หาช่องว่างจานวน 159 หน่วยงาน ข้อมูลจากการสารวจและสัมภาษณ์ได้ถูกนามา ออกแบบกรอบโครงสร้างสารสนเทศและการประมวลผลข้อมูลพื้นฐาน กรอบดังกล่าวถูกออกแบบโดย มวี ัตถุประสงคห์ ลักดงั น้ี  เพื่อให้หน่วยงานภาครัฐสามารถเข้าถึงทรัพยากรคอมพิวเตอร์ได้อย่างรวดเร็วและท่ัวถึง ทันต่อ ความตอ้ งการในการเปลี่ยนแปลงเข้าสู่รัฐบาลดจิ ทิ ัล 3

 เพอ่ื เพิม่ ความตอ่ เน่ืองในการใหบ้ ริการระบบงานภาครัฐ (Availability) ให้ถึงมาตรฐานสากลคือ 99.9%  เพอ่ื ใหก้ ารดูแลรกั ษาความปลอดภัยระบบงาน และขอ้ มลู ทีม่ ชี ั้นความลบั เป็นไปตามมาตรฐานสากล  เพื่อให้เกิดการแลกเปลี่ยนข้อมูลข้ามหน่วยงานได้อย่างมีมาตรฐานและเป็นระบบ (Repeatable process) รองรบั การใชง้ านการวเิ คราะหแ์ ละใช้ประโยชน์ขอ้ มลู ขนาดใหญ่ (Big Data)  เพ่ือประหยดั งบประมาณด้านโครงสร้างพน้ื ฐานการประมวลผล 1.1 กรอบมาตรฐานดาต้าเซนเตอร์/คลาวดภ์ าครฐั กรณีที่ระบบงานของหน่วยงานภาครัฐไม่มีช้ันความลับข้อมูล หน่วยงานสามารถจัดหาหรือเช่าซื้อ ทรัพยากรประมวลผลได้อย่างอิสระ ผู้ให้บริการจะเป็นองค์กรใดก็ได้ อย่างไรก็ดีในกรณีที่ระบบงานมี ชัน้ ความลับขอ้ มูลระดับ ข้อมลู ความลับราชการ หรือ ข้อมูลส่วนบุคคล ผู้ให้บริการการประมวลผลจะต้องเป็น องค์กรที่รัฐบาลสามารถกากับดูแลได้ ส่วนในกรณีที่ระบบงานมีชั้นความลับระดับ ข้อมูลความม่ันคง ผู้ใหบ้ ริการการประมวลผลจะตอ้ งเป็นองค์กรที่รัฐบาลสามารถกากับดูแลได้ทมี่ ีมาตรฐานเร่ืองความปลอดภัยสูง มากทั้งความปลอดภัยพ้นื ท่ีและความปลอดภัยเครือข่าย ร ะ บ บ ง า น แ ล ะ ฐ า น ข้ อ มู ล ท่ี มี ชั้ น ค ว า ม ลั บ ข อ ง ภ า ค รั ฐ จ ะ ต้ อ ง ถู ก ติ ด ตั้ ง อ ยู่ ใ น ด า ต้ า เ ซ น เ ต อ ร์ ที่ได้มาตรฐานสากลทั้งในด้านพื้นที่ แหล่งจ่ายไฟ การรักษาความปลอดภัยข้อมูล (Data Protection) และ ความปลอดภัยไซเบอร์ (Cyber Security) รวมทั้งมีการับประกันบริการ (Service Level Agreement - SLA) ที่เหมาะสม สามารถบริหารจัดการเคร่ืองประมวลผลและที่จัดเก็บข้อมูลให้ได้ตามช้ันความลับของระบบงาน และฐานขอ้ มลู โดยหน่วยงานภาครฐั ในระดับต่างๆสามารถเลอื กใช้บรกิ ารดาตา้ เซนเตอร์/คลาวด์ได้ ดงั น้ี  ดาต้าเซนเตอร์ที่ได้มาตรฐาน tier 4 (หรือใกล้เคียงโดยยกเว้นเรื่องการจ่ายไปจาก 2 แหล่ง) ที่หน่วยงานจะสร้างข้ึนหรือมีอยู่แล้ว ซึ่งหน่วยงานจะกากับดูแลพื้นท่ี ระบบประมวล ระบบเครือข่าย และระบบรกั ษาความปลอดภยั ดว้ ยตวั เอง  Outsource บริการดาต้าเซนเตอร์/คลาวด์ ไปยังผู้ให้บริการคลาวด์สาธารณะ โดยระบบงานและ ฐานข้อมูลท่ีมีช้ันความลับต้องใช้บริการจากองค์กรท่ีรัฐบาลสามารถกากับดูแลได้ ในขณะที่ ระบบงานและฐานข้อมูลท่ีไม่มีชั้นความลับ (ข้อมูลสาธารณะ) สามารถถูกนาไปติดตั้งในพื้นท่ีของ ผู้ใหบ้ ริการจากภาคเอกชนหรอื จากตา่ งประเทศได้อย่างอิสระ ทัง้ นห้ี น่วยงานภาครัฐสามารถที่จะเลือก ผู้ให้บริการดาต้าเซนเตอร์/คลาวด์สาหรับระบบงานต่างๆได้เอง อาจจะใช้ผู้ให้บริการหลายเจ้าได้ แตใ่ หเ้ ป็นไปตามเกณฑ์เรือ่ งชน้ั ความลบั ขอ้ มลู ที่กลา่ วในข้างตน้  สร้างระบบคลาวด์ผสมเอง โดยมีท้ังดาต้าเซนเตอร์และระบบคลาวด์ส่วนตัว จากนั้นมีบางส่วน เช่ือมต่อไปยังคลาวด์สาธารณะเป็นแบบคลาวด์ผสม โดยมีการบริหารจัดการเรื่องชั้นความลับของ ระบบงานและฐานข้อมูลให้เป็นไปตามเกณฑ์เร่ืองชั้นความลับข้อมูลท่ีกล่าวในข้างต้น รูปแบบ สถาปัตยกรรมแสดงในรปู ที่ 1.1 4

รูปท่ี 1.1 คลาวดแ์ บบผสม (Hybrid Cloud)  Outsource บริการดาต้าเซนเตอร์/คลาวด์ ไปยังระบบคลาวด์กลางภาครัฐ (Government Cloud) ซง่ึ ในกรณนี ี้กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจะกากับดูแลผู้ให้บริการคลาวด์ภาครัฐอีกต่อหนึ่ง โดยผู้ให้บริการคลาวด์ภาครัฐสามารถบริหารจัดการเช่าทรัพยากรต่อจากภาคเอกชนเพื่อสร้างเป็น Multi-cloud สาหรับให้บริการระบบงานและฐานข้อมูลที่ไม่มีช้ันความลับได้ โดยประเด็นเร่ือง ชัน้ ความลบั ข้อมลู จะถกู จัดการโดยอัตโนมตั ิ หนว่ ยงานภาครฐั ไมจ่ าเปน็ ต้องบริหารผู้ให้บริการคลาวดเ์ อง ในกรณีที่หน่วยงานเลือกที่จะบริหารจัดการการเช่าซ้ือระบบคลาวด์เอง ขอให้อ้างอิงราคากลาง ทก่ี าหนดโดยกระทรวงดจิ ิทลั ฯในการจัดซอ้ื ดังนี้ บรกิ ารเคร่ืองเสมือน (VM) โดยใช้ไฮเปอร์ไวเซอร์แบบลิขสิทธ์ิจากต่างประเทศ ค่าเช่าเฉพาะเครื่องเสมือน ขนาดมาตรฐานราคาไม่เกิน 12,250 บาท/เดือน/เคร่ือง โดยสาหรับเครื่องเสมือนท่ีมีรายละเอียดสเปค แตกต่างออกไปให้คานวณโดยปรบั จากคา่ กลาง รายละเอียดการใหบ้ ริการมาตรฐานอธิบายไดด้ งั ตอ่ ไปน้ี  เครอื่ งเสมือนขนาด 4 vCPU, RAM 8 GB, HDD 1 TB  Core Network ของผู้ให้บริการข้ึนต่า 100 Gbps Domestic Bandwidth (NIX) และ 30 Gbps International Bandwidth (IIG)  มาตรฐานศนู ย์ข้อมลู ISO 27001:2013 Data Center Edition เปน็ อยา่ งน้อย  ระบบปฏบิ ตั ิการ (Operating System) และ ฐานข้อมูล (Database) แบบ Opensource  บรกิ ารเสริมดา้ นลิขสทิ ธ์ิซอฟท์แวร์จากต่างประเทศ o Windows Server 2016 ราคา 800 บาทต่อเดอื น o Redhat Server ราคา 800 บาทตอ่ เดอื น o Microsoft SQL STD edition ราคา 12,000 บาทตอ่ เดือน o Microsoft SQL ENT edition ราคา 50,000 บาทตอ่ เดือน บริการเครื่องเสมือน (VM) โดยใช้ไฮเปอร์ไวเซอร์แบบลิขสิทธิ์ของบริษัทไทยท่ีคนไทยพัฒนา ต่อยอดจากไฮเปอร์ไวเซอร์โอเพ่นซอร์สตัวอย่างเช่น Openstack ค่าเช่าเฉพาะเคร่ืองเสมือนขนาดมาตรฐาน ไม่เกิน 8,000 บาท/เดือน/เคร่ือง โดยสาหรับเคร่ืองเสมือนท่ีมีรายละเอียดสเปคแตกต่างออกไปให้คานวณ โดยปรบั จากค่ากลาง รายละเอยี ดการใหบ้ รกิ ารมาตรฐานอธบิ ายได้ดงั ต่อไปนี้ 5

 เครอื่ งเสมอื นขนาด 4 vCPU, RAM 8 GB, HDD 1 TB  Core Network ของผู้ให้บริการข้ึนต่า 100 Gbps Domestic Bandwidth (NIX) และ 30 Gbps International Bandwidth (IIG)  มาตรฐานศูนย์ข้อมลู ISO 27001:2013 Data Center Edition เปน็ อยา่ งนอ้ ย  ระบบปฏิบตั ิการ (Operating System) และ ฐานข้อมลู (Database) แบบ Opensource  เป็นระบบคลาวด์แบบ Multi-region แบบเดียวกับ Microsoft Azure, Google Cloud, Amazon AWS, และ GDCC ของกระทรวงดจิ ิทลั ฯ  บรกิ ารเสริมดา้ นลิขสทิ ธ์ซิ อฟท์แวร์จากตา่ งประเทศ o Windows Server 2016 ราคา 800 บาทต่อเดอื น o Redhat Server ราคา 800 บาทตอ่ เดือน o Microsoft SQL STD edition ราคา 12,000 บาทตอ่ เดือน o Microsoft SQL ENT edition ราคา 50,000 บาทต่อเดือน หมายเหตุ share ratio Physical: vCPU = 1: 2-4 1.2 โครงสรา้ งพน้ื ฐานเพ่ือการประมวลผลของหนว่ ยงานภาครัฐ จากข้อมูลท่ีได้จากการสารวจและสัมภาษณ์หน่วยงานเกือบ 160 แห่ง กรอบโครงสร้างสารสนเทศ และการประมวลผลข้อมลู พน้ื ฐานภาครฐั ไดถ้ กู ออกแบบ ดงั แสดงในรปู ที่ 1.2 รูปที่ 1.2 สถาปตั ยกรรมโครงสร้างพ้ืนฐานเพ่ือการประมวลผลของหนว่ ยงานภาครัฐ 6

จากรูปดาต้าเซนเตอร์ และระบบคลาวด์จะถูกแบ่งออกเป็น 4 แบบ คือ 1.ดาต้าเซนเตอร์/คลาวด์ ระดับกรมหรือหน่วยงานเทียบเท่า (Agency Cloud) 2.ดาต้าเซนเตอร์/คลาวด์ระดับกระทรวง (Ministry Cloud) 3.ดาต้าเซนเตอร์กลางเพื่อให้บริการข้อมูลภาครัฐ (Data Linkage and Exchange) 4.ระบบ คลาวด์กลางภาครัฐ (Government Data Center and Cloud services: GDCC) และ โดยมีรายละเอียด ดังต่อไปนี้ 1. ดาตา้ เซนเตอร์/คลาวด์ระดับกรมหรือหน่วยงานเทียบเท่า (Agency Cloud) ข้อมูลจากการสารวจ ประเมนิ ทรพั ยากรและบุคลากรของหน่วยงานจากผเู้ ชี่ยวชาญในคณะอนุกรรมการออกแบบสถาปัตยกรรมระบบ บูรณาการข้อมูลภาครัฐ พบว่าภาครัฐมีหน่วยงานระดับกรมหรือเทียบเท่าจานวน 90 (±5) แห่ง (ร่างรายชื่อ ในเอกสารแนบ ก1) ท่ีมีดาต้าเซนเตอร์หรือใช้บริการระบบคลาวด์อยู่แล้วโดยมีการใช้งานหน่วยประมวลผล รวมอยู่ท่ีประมาณ 35,000 คอร์ในปัจจุบัน ซึ่งหน่วยงานเหล่านี้มีความประสงค์จะดูแลดาต้าเซนเตอร์ และ/ หรอื คลาวดเ์ พอื่ ใหบ้ รกิ ารระบบงานของหน่วยงานเอง โดยแบ่งได้เปน็ 2 รูปแบบดังนี้ 1. มีดาต้าเซนเตอร์อยู่แล้วและวางแผนที่จะพัฒนาต่อยอดให้ดาต้าเซนเตอร์ได้มาตรฐาน ท่ใี กล้เคียง tier 4 และขยายกาลงั การประมวลผลดว้ ยการขยายดาตา้ เซนเตอร์ โดยหน่วยงานกลุ่มน้ีมีประมาณ 75 (±5) แหง่ และมคี วามต้องการปริมาณหนว่ ยประมวลผลเพม่ิ เตมิ รวมสาหรบั ปีงบประมาณ 2563 ประมาณ 7,000 ซีพียูคอร์ และเพ่ิมอีกปีละ 3,500 ซีพียูคอร์ ในปีงบประมาณ 2564 และ 2565 (หน่วยประมวลผล ทม่ี ีอยู่เดิมจะตอ้ งมีการปรับเปลยี่ นทกุ 5 ป)ี หมายเหตุ ตัวเลขรวมเฉพาะหนว่ ยงานที่ใหข้ ้อมลู เรอื่ งทรพั ยากรการประมวลผลแบบละเอียด และไมร่ วม supercomputer ของกระทรวงวทิ ยาศาสตร์และเทคโนโลยี 2. มีดาต้าเซนเตอร์อยู่แล้วและวางแผนที่จะขยายกาลังการประมวลผลไปยังระบบคลาวด์ ดังแสดงในรูปที่ 1.1 หรือวางแผนย้ายไประบบคลาวด์ทั้งหมดผ่านการเช่าใช้คลาวด์จากผู้ให้บริการคลาวด์ สาธารณะที่รัฐบาลกากับดูแลได้หรือระบบคลาวด์กลางภาครัฐ ซึ่งหน่วยงานในกลุ่มน้ีมีอีกประมาณ 10 (±5) แห่ง และมีปริมาณความต้องการปริมาณหน่วยประมวลผลในปีที่ 1 (งบประมาณ 2563) คือ 6,000 VM และ เพิม่ เป็น 9,000 VM และ 12,000 VM ในปีงบประมาณ 2564 และ 2565 ตามลาดบั หมายเหตุ ตวั เลขรวมเฉพาะหน่วยงานทใี่ หข้ อ้ มูลเรอ่ื งทรพั ยากรการประมวลผลแบบละเอยี ด 2. ดาต้าเซนเตอร์/คลาวด์ระดับกระทรวง (Ministry Cloud) จะมีแผนสร้างทั้งสิ้น 20 แห่ง ซ่ึงมี จุดประสงค์ในการให้บริการกรมและหน่วยงานภายใต้กระทรวงที่ไม่ประสงค์จะสร้างและดูแลดาต้าเซนเตอร์/ คลาวด์เอง (จานวนหนว่ ยงานเสนอในเอกสารแนบ ก2) โดยคลาวด์กระทรวงส่วนมากจะถูกสร้างข้ึนโดยการเช่า ใช้บริการพ้ืนที่และทรัพยากรการประมวลผล และจัดเก็บข้อมูลจากผู้ให้บริการคลาวด์สาธารณะ (Public Cloud) ที่รัฐบาลสามารถกากับดูแลได้ หรือระบบคลาวด์กลางภาครัฐ (GDCC) และนาทรัพยากรที่เช่าใช้ เหล่านัน้ มาใหบ้ ริการต่อหนว่ ยงานภายใต้กระทรวง สาหรับบางกระทรวงท่ีมีดาต้าเซนเตอร์อยู่แล้ว จะสามารถ 7

ให้บริการหน่วยงานภายใต้กระทรวงได้ในลักษณะคลาวด์ส่วนตัว (Private Cloud) และยังสามารถขยาย โดยการตอ่ เชอ่ื มไปยงั คลาวดส์ าธารณะ แสดงในรปู ที่ 1.1 ไดอ้ ีกดว้ ย รปู แบบบริการ คือ a. Co-location : หน่วยงานภายใต้กระทรวงนาทรัพยากรประมวลผลที่มีอยู่แล้ว ไปติดตั้ง ในสถานที่ของผู้ให้บริการคลาวด์ระดับกระทรวง เพ่ือเพ่ิมมาตรฐานด้านความปลอดภัยและความต่อเน่ือง บริการของระบบงาน และลดภาระเรอื่ งการดูแลทรัพยากรพน้ื ฐาน b. Infrastructure-as-a-Service (IaaS) : ผู้ดูแลระบบคลาวด์กระทรวงจัดสรรเครื่องประมวลผล เสมือน (Virtual Machine) ท่ีเก็บข้อมูล และเครือข่ายเช่ือมต่อ ให้กับระบบงาน ตามท่ีหน่วยงานภายใต้ กระทรวงรอ้ งขอ c. Software-as-a-service (SaaS) : ผู้ดูแลคลาวด์กระทรวงจัดหาหรือพัฒนาระบบซอฟท์แวร์ กลางเพื่อติดตั้งในระบบคลาวด์ และจัดสรรรหัสผู้ใช้สาหรับให้หน่วยงานภายใต้กระทรวงเข้าใช้งาน ระบบซอฟท์แวร์กลางร่วมกนั ปริมาณหน่วยประมวลผลที่ผู้ให้บริการภาครัฐต้องเตรียมพร้อมให้สาหรับกระทรวงต่างๆ ในปีท่ี 1 (งบประมาณ 2563) คือ 11,000 VM และเพิ่มเป็น 16,500 VM และ 22,000 VM ในปีงบประมาณ 2564 และ 2565 ตามลาดบั หมายเหตุ ตัวเลขรวมเฉพาะหน่วยงานที่ให้ขอ้ มูลเร่ืองทรพั ยากรการประมวลผลแบบละเอยี ด 3. ดาต้าเซนเตอร์กลางภาครัฐเพื่อให้บริการข้อมูล (Data Linkage and Exchange Services) : เพอ่ื ให้การใชป้ ระโยชนข์ ้อมูลภาครฐั ในอนาคตเกิดไดอ้ ยา่ งเปน็ ระบบ สะดวกรวดเร็ว และเป็นไปตามข้อบังคับ/ ข้อกฎหมายของหน่วยงานเจ้าของข้อมูล ภาครัฐจึงควรสร้างดาต้าเซนเตอร์กลางสาหรับให้บริการเป็นจุดเชื่อม โยงและแลกเปลี่ยนข้อมูล ซึ่งจากการสารวจศึกษาและสัมภาษณ์โดยคณะทางานในคณะอนุกรรมการออกแบบ สถาปัตยกรรมระบบบูรณาการขอ้ มลู ภาครัฐ พบว่าในปัจจุบันหน่วยงานที่มีดาต้าเซนเตอร์ท่ีให้บริการเช่ือมโยง ข้อมูลน้ันมีอยู่ท้ังส้ิน 2 หน่วยงานคือ 1) ระบบ Data linkage ของกรมการปกครอง (ข้อมูลบุคคล) และ 2) ระบบ National Single Window ของกรมศุลกาการ (ข้อมูลนาเข้า/ส่งออก) ดังน้ันการลงทุนขยายบริการ ท่ีมีอยเู่ พอื่ ให้สามารถรองรับการแลกเปลย่ี นข้อมูลสาหรับการวิเคราะห์ข้อมูลขนาดใหญ่ (Big Data Analytics) และการให้บรกิ ารประชาชนแบบ One Stop Services จึงเป็นการลงทุนท่ีคุ้มค่า โดยเสนอให้ท้ัง 2 หน่วยงาน พิจารณาขยายบริการในปีงบประมาณ 2563 และ 2564 เพ่ือให้ครอบคลุม สาหรับข้อมูลส่วนอื่น เช่นข้อมูล นิติบุคคลในดา้ นอื่นนอกเหนือจากการนาเขา้ /ส่งออก ขอ้ มลู ด้านพลังงาน ฯลฯ ขอให้หน่วยงานที่เกี่ยวข้องหรือ ได้รับมอบหมาย ให้สร้างดาต้าเซนเตอร์เพื่อให้บริการเชื่อมโยงข้อมูลเพ่ิมเติมให้ครบสมบูรณ์ในอนาคต นอกจากน้ี ในปีงบประมาณ 2563 ภาครัฐควรสร้างบริการคาตาล็อกข้อมูลกลาง (National Data Catalog) และบริการสืบค้นข้อมูล (Directory Service) เพ่ิมเติมเพ่ือให้การใช้ประโยชน์ข้อมูลเกิดข้ึนได้อย่างเป็นระบบ โดยมกี ระทรวงดิจิทัลเพ่อื เศรษฐกจิ และสงั คมเปน็ ผู้ใหบ้ ริการ 8

4. คลาวด์กลางภาครัฐ (Government Cloud) ซ่ึงจะถูกสร้างขึ้นโดย บริษัท กสท โทรคมนาคม จากดั (มหาชน) ภายใตก้ ารกากับดูแลของกระทรวงดจิ ทิ ลั เพือ่ เศรษฐกิจและสังคม เพ่ือให้ประเทศมีระบบกลาง ในการให้บริการคลาวด์แก่หน่วยงานภาครัฐท่ีมีมาตรฐานและปลอดภัย หน่วยงานภาครัฐจะสามารถเข้าถึง ทรัพยากรคอมพิวเตอร์ได้อย่างรวดเร็วทันต่อความต้องการในการเปล่ียนแปลงเข้าสู่รัฐบาลดิจิทัล บริการของ คลาวด์กลางภาครัฐจะมี 2 ระดับ คือ การให้บริการเต็มรูปแบบ (Managed Service) และการให้บริการผ่าน Self Service Portal ผู้ใช้จะสามารถเข้าถงึ และปรบั บริการได้เอง โดยรายละเอยี ดจะนาเสนอในหัวขอ้ ต่อไป 1.3 ระบบคลาวดก์ ลางภาครัฐ (Government Data Center and Cloud services : GDCC) ระบบคลาวดก์ ลางภาครัฐจะถูกออกแบบและพฒั นาขึ้นโดย บริษัท กสท โทรคมนาคม จากัด (มหาชน) ภายใต้การกากับดูแลของกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม ซึ่งจะเป็นระบบกลางในการให้บริการ คลาวด์สาหรับหน่วยงานภาครัฐที่มีมาตรฐานและปลอดภัย หน่วยงานภาครัฐสามารถเข้าถึง ทรัพยากรคอมพิวเตอร์ได้อย่างรวดเร็ว ทั่วถึง และทันต่อความต้องการในการเปล่ียนแปลงเข้าสู่รัฐบาลดิจิทัล รวมทง้ั เปน็ การรองรบั การใช้งานการวเิ คราะห์และใชป้ ระโยชน์ข้อมูลขนาดใหญ่อีกด้วย โดยระบบคลาวด์กลาง ภาครัฐที่สร้างข้ึนจะสามารถให้บริการผ่านเครือข่ายได้หลายประเภท รวมถึงเครือข่ายกลางภาครัฐ (GIN) เครือข่ายสาธารณะ (Public) และเครือข่ายส่วนตัว (Private/VPN) และมีการออกแบบให้การบริการ มีความต่อเน่ืองสูงให้ถึง 99.9% โดยดาต้าเซนเตอร์อย่างน้อย 2 แห่งจะถูกใช้ในการให้บริการระบบ คลาวด์กลางร่วมกัน เม่ือดาต้าเซนเตอร์หนึ่งเกิดปัญหาขึ้นระบบงานและฐานข้อมูลจะถูกปรับให้ทางาน บนอีกดาต้าเซนเตอร์หนึ่งได้อย่างรวดเร็ว นอกจากนี้ ระบบคลาวด์กลางภาครัฐจะมีข้อตกลงเร่ืองการบริการ (Service Level Agreement - SLA) ที่เหมาะสม มีผู้ดูแลระบบแบบ 24x7 มีการบันทึกข้อมูล (Log) และ ให้บริการหน้าจอแสดงผลข้อมูลการใช้งาน (Dashboard) ของทุกระบบงานและฐานข้อมูลเพื่อให้หน่วยงาน ต่างๆสามารถทารายงานสรุปการใช้ประโยชน์ทรัพยากรประกอบการพิจารณาปรับปริมาณทรัพยากรหรือ เพิม่ ประสิทธภิ าพการใชง้ านและงบประมาณโดยรวมอีกดว้ ย สถาปตั ยกรรมระบบแสดงในรปู ที่ 1.3 9

SLA 99.9 % Daily 8.6s Weekly 1 min and 0.5s Monthly 4 mins and 23s Yearly 52 mins and 35.7s รปู ที่ 1.3 สถาปัตยกรรมระบบคลาวด์กลางภาครัฐ จากการอ้างอิงข้อมูลการสารวจประเมินทรัพยากรของหน่วยงานโดยผู้เช่ียวชาญในคณะอนุกรรมการ ออกแบบสถาปัตยกรรมระบบบูรณาการข้อมูลภาครัฐนั้น คลาวด์กลางภาครัฐหรือ GDCC จะถูกวางแผน จะให้บริการแก่หน่วยงานภาครัฐดังน้ี 1. ให้บริการ คลาวด์ระดับกระทรวง อย่างน้อย 10 แห่งในเบื้องต้น 2. ให้บริการหน่วยงานภาครัฐบางส่วนที่ประสบปัญหาล่าช้าในการจัดซื้อเพื่อขยายดาต้าเซนเตอร์ หรือ เช่าคลาวด์เพ่ือขยายระบบงาน (จัดสรรเตรียมให้ 25 % ของปริมาณหน่วยประมวลผลรวม) 3. จัดสรร เพ่ือเตรียมรองรับหน่วยงานภาครัฐท่ีระบุว่าต้องการใช้บริการคลาวด์กลางภาครัฐ โดยปริมาณหน่วย ประมวลผลทคี่ ลาวดก์ ลางภาครัฐจะตอ้ งเตรยี มพรอ้ มเรม่ิ ตน้ จากขนาด 4,000 VM ในปีงบประมาณ 2562 และ ขยับข้ึนเป็น 8,000 12,000 และ 20,000 VM ในปีงบประมาณ 2563 2564 และ 2565 ตามลาดับ (การประมาณการโดย Extrapolation) ส่วนในปีงบประมาณถัดไปควรพิจารณาดูการใช้งานในช่วงแรกก่อน วางแผนขยาย โดยบริษทั กสท โทรคมนาคม จากัด (มหาชน) จะให้บริการตามราคาและสเปคผู้ให้บริการกลาง ดงั ที่ระบใุ นหวั ข้อที่ 1.1 ทั้งนี้เพ่ือให้การใช้ประโยชน์ระบบคลาวด์กลางภาครัฐเกิดขึ้นได้อย่างเป็นรูปธรรมกระทรวงดิจิทัล เพ่ือเศรษฐกิจและสังคมจะให้บริการการฝึกอบรมเจ้าหน้าท่ีสารสนเทศภาครัฐในเรื่องการใช้งานระบบคลาวด์ โดยแบ่งออกเป็น 3 กลุ่มดังแสดงในรูปท่ี 1.4 จากรูปการฝึกอบรมจะมีการออกใบเกียรติบัตร 3 ระดับคือ 1) ระดับพ้ืนฐานที่สามารถใช้งานระบบคลาวด์ได้ จานวน 2,000 คน ในระยะเวลา 3 ปี 2) ระดับกลางท่ี สามารถใชง้ านระบบและดแู ลระบบคลาวด์ข้นั พนื้ ฐานได้ จานวน 500 คนในระยะเวลา 3 ปี และ 3) ระดับสูงท่ี สามารถใช้งานระบบ ดูแลระบบคลาวด์ข้ันสูงและสามารถสอนคนอ่ืนต่อไปได้ เป็นจานวน 100 คนในช่วง ปงี บประมาณ 2563 10

รูปที่ 1.4 คลาสฝกึ อบรมการใชค้ ลาวดก์ ลางภาครฐั ใน 3 ระดบั สาหรับหน่วยงานท่ีไม่มีเจ้าหน้าท่ีสารสนเทศ ทางสานักงานคณะกรรมการดิจิทัลเพื่อเศรษฐกิจและ สังคมแห่งชาติ พร้อมจะทาเรื่องเพื่อสนับสนุนการขยายอัตรากาลังไปยังสานักงานคณะกรรมการข้าราชการ พลเรอื นให้กับหน่วยงานภาครฐั นอกจากน้ีกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจะร่วมกับบริษัท กสท โทรคมนาคม จากัด ในการให้บริการโอนย้ายระบบงานข้ึนสู่ระบบคลาวด์กลางภาครัฐ โดยหน่วยงานภาครัฐท่ีจะนาระบบงาน ขน้ึ สคู่ ลาวด์ ควรจะต้องจัดเตรียมงบประมาณในการโอนย้ายระบบ ซ่ึงค่าใช้จ่ายจะข้ึนอยู่กับความซับซ้อนของ ระบบงาน การโอนย้ายระบบแบง่ ออกได้เป็น 3 ประเภท ดงั น้ี 1. Re-Deploy เป็นการย้ายระบบซอฟท์แวร์ท่ีใช้อยู่ในปัจจุบันไปประมวลผลบนระบบคลาวด์โดย ไม่มีการออกแบบใหม่หรือพัฒนาเพ่ิมเติม ซ่ึงการโอนย้ายลักษณะนี้ หากเป็นการโอนย้ายจาก VM ในดาต้าเซนเตอร์ ไปยัง VM บนคลาวด์ โดยใช้ VM เวอร์ชันเดิมของบริษัทเดียวกัน จะมีราคา ค่าใช้จ่ายกลางอยู่ท่ี 4,000 บาท/คร้ัง หากในกรณีการโอนย้ายจากเครื่องแม่ข่าย (Physical Server) ไปสู่ VM หรือ VM ข้ามเวอร์ชันและบริษัท ซึ่งมีความยุ่งยากสูงกว่าจะมีราคาค่าใช้จ่ายกลางอยู่ที่ 4,000 – 10,000 บาท/ครัง้ ข้ึนอยู่กบั ความยากง่ายและจานวน VM 2. Re-Architect ในกรณีที่ระบบงานอยู่บนเทคโนโลยีเก่า (Legacy System) การโอนย้ายระบบงาน มักจะต้องออกแบบสถาปัตยกรรมระบบซอฟท์แวร์ใหม่ ซึ่งส่งผลให้บางโมดูลต้องถูกพัฒนาใหม่ บางส่วนหรือทั้งหมดก่อนท่ีจะสามารถวางระบบซอฟท์แวร์ลงบนคลาวด์ได้ การโอนย้ายจึงมี ความยุ่งยากสูง และค่าใช้จ่ายสูงขึ้นอยู่กับเทคโนโลยี หน่วยงานจึงควรประเมินราคาและ ตง้ั งบประมาณล่วงหน้า 11

3. Replace คือการใช้บริการซอฟท์แวร์ที่จัดให้โดยผู้ให้บริการบนระบบคลาวด์ ทดแทนการใช้ ซอฟท์แวร์เดิมขององค์กร การทดแทนระบบซอฟท์แวร์ในลักษณะน้ี ผู้ดูแลระบบจะมีภาระในการ โอนยา้ ย ฐานข้อมูลเข้าสู่ระบบใหม่ หน่วยงานควรประเมินราคาและต้ังงบประมาณล่วงหน้าในกรณีที่ ข้อมลู มีความซบั ซอ้ นสงู 12

บทที่ 2 รายการขอ้ มูลภาครัฐ (Government Data Catalog) จากความต้องการใช้ประโยชน์ข้อมูลภาครัฐเพ่ิมมากขึ้นในปัจจุบัน และผู้ใช้ข้อมูลท่ีมีอยู่หลากหลาย ทั้งกลุ่มเจ้าหน้าท่ีภาครัฐ นักวิจัยจากมหาวิทยาลัย นักวิชาการ/นักวิเคราะห์ข้อมูลทั้งภาคเอกชนและ ภาคประชาสังคม รวมถงึ ประชาชนท่ัวไป อยา่ งไรกด็ ี ปริมาณข้อมลู ที่ถกู ผลติ ขึ้นอย่างต่อเนื่องทาให้การเลือกใช้ ข้อมลู และการสบื คน้ หาแหล่งขอ้ มูลท่เี หมาะสมสาหรับการวเิ คราะห์หรอื ให้บรกิ ารมคี วามซับซ้อนและยุ่งยากสูง ดงั นั้นเพอื่ ให้การใชป้ ระโยชนข์ อ้ มลู ภาครัฐเกิดขึ้นไดอ้ ยา่ งเป็นรูปธรรม กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม จึงวางแผนที่จะพัฒนารายการข้อมูลภาครัฐ (Government Data Catalog) และระบบสารสนเทศเพื่อการสืบค้น ดงั จะนาเสนอตอ่ ไป 2.1 บรกิ ารรายการข้อมูลภาครฐั (Government Data Catalog Service) ในกระบวนการการวิเคราะห์ข้อมูลขนาดใหญ่น้ัน นักวิทยาศาสตร์ข้อมูลจาเป็นต้องสารวจ หาแหล่งข้อมูลสาคัญตามหัวข้อการวิเคราะห์และทาความเข้าใจการใช้ข้อมูลในมิติต่างๆ รายการข้อมูลภาครัฐ และเคร่ืองมือสารสนเทศข้อมูลจึงเป็นส่ิงจาเป็นเพ่ือช่วยให้ผู้ใช้ประโยชน์ข้อมูลสามารถสืบค้น ร้องขอ เข้าถึง ทราบแหล่งท่ีมา ทราบถึงช้ันความลับ ประเภท รูปแบบ และสามารถใช้ประโยชน์ของข้อมูลภาครัฐทั้งหมดได้ รายการข้อมูลดังกล่าวจะเป็นเสมือนสมุดหน้าเหลือง (Yellow pages) ของข้อมูลภาครัฐท่ีสาคัญทั้งหมดของ ประเทศไทย ซ่ึงเป็นจุดเร่ิมต้นที่จาเป็นอย่างย่ิงในการพัฒนาการใช้ประโยชน์ข้อมูลภาครัฐให้มีประสิทธิผลและ เป็นไปในทศิ ทางเดยี วกนั สามารถบรู ณาการ ให้บริการ และใชป้ ระโยชนข์ ้อมลู ข้ามหนว่ ยงานได้อย่างเป็นระบบ การจัดทารายการข้อมูลภาครัฐ ดังแสดงในรูปท่ี 2.1 เป็นการรวบรวมคาอธิบายรายการข้อมูลหรือ เมทาดาต้า (Metadata) ของข้อมูลสาคัญจากหน่วยงานภาครัฐท้ังหมดมาสร้างเป็นคาตาล็อกเพ่ือประโยชน์ ในการสืบค้นผ่านระบบสารสนเทศบริการนามานุกรมข้อมูลภาครัฐ (Directory Services) โดยเมทาดาต้า ที่รวบรวมจากทุกหน่วยงานควรมีรูปแบบเดียวกัน ซึ่งกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมจะทาหน้าที่ ใ น ก า ร อ อ ก แ บ บ ก ร ะ บ ว น ก า ร แ ล ะ เ ค รื่ อ ง มื อ เ พื่ อ จั ด ท า ม า ต ร ฐ า น เ ม ท า ด า ต้ า แ ล ะ ร ว บ ร ว ม เ ม ท า ด า ต้ า รายการข้อมูลท่ีสาคัญจากหน่วยงานรัฐทั้งหมด โดยศึกษา ค้นคว้า เปรียบเทียบและวิเคราะห์ กรณีศึกษา ด้านการจัดทามาตรฐานเมทาดาต้าของประเทศอ่ืน เพ่ือปรับให้เหมาะสมและเอ้ือต่อการแลกเปลี่ยนข้อมูล ในประเทศไทย หน่วยงานภาครัฐต่างๆ จะสามารถนามาตรฐานดังกล่าวไปใช้งานและจัดทาเมทาดาต้าของ หน่วยงานได้อย่างสอดคลอ้ งกัน นอกจากน้ีกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจะทาการออกแบบกลไกด้านข้อมูลที่หน่วยงาน ภาครัฐสามารถนาไปประยุกต์ใช้ในเรื่องการกากับดูแลข้อมูล การให้บริการข้อมูล และการใช้ประโยชน์ข้อมูล อกี ด้วย 13

รปู ที่ 2.1 การให้บริการรายการข้อมูลภาครัฐ จากรูป 2.1 กระทรวงดจิ ิทัลเพ่ือเศรษฐกิจและสงั คมจะดาเนนิ การสร้างระบบการใหบ้ ริการรายการข้อมูล ภาครฐั ดังน้ี 1) ออกแบบกระบวนการจัดทามาตรฐานเมทาดาต้าและรูปแบบท่ีเป็นมาตรฐาน (Template) รวมทั้งแนะแนวให้หน่วยงานภาครัฐจัดทาเมทาดาต้าของข้อมูลสาคัญตามแบบท่ีกาหนด ซ่ึงควรมีรูปแบบ เดยี วกนั เพอ่ื ความสะดวกในการสบื คน้ และแลกเปล่ียนข้อมูล โดยเมทาดาต้าที่จะจัดทาขึ้นควรมีการระบุข้อมูล ต่างๆ ดังน้ี มาตรฐานของรูปแบบเมทาดาต้า (Metadata model) คาอธิบายรายการข้อมูล (Data Description) แหล่งที่มาของข้อมูล (Data Source) หน่วยงานเจ้าของข้อมูล (Data Owner) วิธีการ/กระบวนการเก็บ รวบรวมข้อมูล (Collection Method) จุดประสงค์การเก็บข้อมูลของหน่วยงานท่ีเป็นเจ้าของ (Purposes of Data Collection) ประเภทข้อมูล (Type) และรูปแบบการจัดเก็บข้อมูล (Format) คากากับ (Tags) โดเมน ทางธุรกิจ (Business domain) และคาสาคัญ (Keywords) (รายการในเมทาดาต้าอาจจะมีการปรับเพ่ิม/ลด ได้ตามความเหมาะสม) หลังจากหน่วยงานมีการจัดทาเมทาดาต้าแล้ว ส่วนกลางจะรวบรวมเมทาดาต้ามาจากหน่วยงานต่างๆ รวมถึงเมทาดาต้าของข้อมูลภาครัฐจากศูนย์ข้อมูล เช่น ศูนย์ข้อมูลน้า ศูนย์ข้อมูลประชาชน ฯลฯ มาเก็บไว้ เพ่ือประโยชน์ในการสืบคน้ ข้อมูลภาครฐั โดย a. ข้อมูลที่ไม่มีช้ันความลับ สามารถเผยแพร่ได้ (Open data) การจัดเก็บจะรวบรวมทั้ง เมทาดาต้าและข้อมูล ทั้งน้ีเพ่ือให้ความสะดวกแก่ผู้ใช้บริการ กล่าวคือหากข้อมูลที่ต้องการ ใช้ประโยชน์เป็นข้อมูลเปิด ผู้ร้องขอข้อมูลจะสามารถดาวน์โหลดข้อมูลไปใช้ได้เลย ผ่านชอ่ งทางการให้บรกิ ารข้อมลู (Data portal) เดียวกัน b. ข้อมูลทม่ี ชี น้ั ความลับ การจดั เก็บจะรวบรวมเฉพาะเมทาดาตา้ เทา่ น้ัน ไมจ่ ดั เกบ็ ตัวข้อมูลจรงิ 14

2) จดั ทาเกณฑ์สาหรับการระบชุ ัน้ ความลับของขอ้ มลู เพ่ือให้หน่วยงานภาครัฐสามารถใช้เป็นเครื่องมือ ในการระบุจัดแบ่งประเภทข้อมูลตามช้ันความลับได้อย่างสอดคล้องกัน โดยเกณฑ์อาจจะอยู่ในรูปแบบของ ตน้ ไมป้ ระกอบการตัดสนิ ใจดังแสดงในรปู ที่ 2.2 จากรูปชน้ั ความลับขอ้ มูลจะจาแนกได้เป็น 4 ระดับตามกรอบ การกากับดูแลข้อมูลคือ ข้อมูลสาธารณะ (Public data) ข้อมูลท่ีสามารถระบุถึงตัวบุคคลได้ (Personally Identifiable Information: PII) ข้อมลู ความลบั ราชการ (Confidential Government) และข้อมลู ที่เกี่ยวข้อง กับความมัน่ คงของประเทศ (National Security) รูปที่ 2.2 ต้นไมป้ ระกอบการตัดสินใจจาแนกชั้นความลับของข้อมูล 3) จัดทาดัชนีข้อมูล (data index) ซ่ึงเป็นส่วนสาคัญที่จะเพิ่มความสะดวกรวดเร็วแก่บริการค้นหา รายการข้อมลู โดยผู้ใช้บรกิ ารจะสามารถค้นหาแบบหลายมติ ิ (Multi-dimensional search) ได้ ตวั อยา่ งเช่น  การสืบค้นตามหัวข้อเรื่อง เช่น การวิเคราะห์ข้อมูลด้านสุขภาพและการสาธารณสุข การเงินและ การธนาคาร ทรัพยากรธรรมชาติ การศึกษา การท่องเที่ยว กระบวนการยุติธรรม คมนาคม และ บริการสงั คม เป็นต้น  การสืบค้นตามรายชื่อกระทรวงและหน่วยงานระดับกรมหรือเทียบเท่า เช่น การวิเคราะห์ข้อมูล จากกรมการขนส่งทางบก การบนิ ไทย กระทรวงคมนาคม เปน็ ต้น  การสืบคน้ ตามประเภทข้อมูล (Data type) หรอื รูปแบบข้อมลู (Data format)  การสืบค้นตามชั้นความลับของข้อมลู และสทิ ธกิ ารเขา้ ถึงข้อมูล เชน่ - กลุม่ ข้อมูลเปดิ (Open data) ทท่ี กุ คนมีสทิ ธใิ นการเขา้ ถึงและนาไปใช้ได้อย่างเสรี กลุ่มข้อมูล นี้จะเป็นประโยชน์ต่อภาครฐั ภาคเอกชน และประชาชน 15

- กล่มุ ข้อมูลส่วนบุคคล (Personally Identifiable Information) ที่อาจต้องมีการนารายละเอียด ส่วนที่ระบุตัวตนได้ออกก่อนท่ีจะนาไปวิเคราะห์ และหน่วยงานเจ้าของข้อมูลสามารถระบุ ข้อจากัดการใชป้ ระโยชนข์ อ้ มลู ได้ - กลุ่มข้อมูลความลับราชการ (Government data) ที่ให้สิทธิเฉพาะเจ้าหน้าที่ท่ีมีหน้าที่ รับผิดชอบเกี่ยวข้อง - กลุ่มข้อมูลความมั่นคงของรัฐ (Secured Government data) ท่ีให้สิทธิเฉพาะเจ้าหน้าที่ ทมี่ หี นา้ ที่รับผดิ ชอบเกี่ยวข้อง 4) พจิ ารณาเลอื กรูปแบบ (สกลุ ไฟล)์ การจัดเกบ็ เมทาดาตา้ โดยทรี่ ูปแบบดงั กล่าวจะต้องให้มนุษย์และ เคร่ืองคอมพิวเตอร์สามารถอ่านเข้าใจได้อย่างสะดวก เพื่อให้การสืบค้นข้อมูลทาได้ง่ายและการแลกเปล่ียน ข้อมูลทาได้แบบอัตโนมัติ หรือก่ึงอัตโนมัติ โดยรูปแบบสากลของเมทาดาต้าจะมีอยู่หลายประเภทได้แก่ Common European Research Information Format (CERIF), Comprehensive Knowledge Archive Network (CKAN) ทั้งน้ีรูปแบบท่ีได้รับความนิยม คือ Data Catalog Vocabulary (DCAT) ซ่ึงจะเป็นรูปแบบ การเก็บเมทาดาต้าแบบ RDF จากนั้นทาการออกแบบกลไกและส่วนติดต่อผู้ใช้ (User Interface) ท่ีสะดวก สาหรับให้หนว่ ยงานใชใ้ นการจดั ทา (publish) เมทาดาตา้ ออนไลน์ 5) ออกแบบเกณฑก์ ลางและกระบวนการตวั อย่างในการประเมินคุณภาพข้อมูลหน่วยงาน ซ่ึงตัวอย่าง เกณฑ์ด้านคุณภาพข้อมูลตามมาตฐานสากล ได้แก่ ความถูกต้องแม่นยา ( Accuracy), ความตรงกัน (Consistency), ความสามารถในการเข้าถึงข้อมูลท่ีเป็นปัจจุบัน (Availability), ความสมบูรณ์ของข้อมูล (Completeness), ความสอดคล้องกับรูปแบบมาตรฐานของข้อมูล (Conformance), ความน่าเชื่อถือได้ของ ข้อมูล (Credibility), ความเข้าประเด็น (Relevance), ความทันสมัยของข้อมูล (Timeliness) และบริบท ขอ้ มลู (Context) ดงั รูปท่ี 2.3 อธิบายความหมายของเกณฑ์ตัวอย่าง รูปท่ี 2.3 เกณฑก์ ารประเมนิ คณุ ภาพขอ้ มูล 16

6) จัดทากรอบนโยบายต้นแบบด้านการกากับดูและวงจรชีวิตและบริหารจัดการข้อมูลดิจิทัลของ หน่วยงานภาครัฐ เพ่ือให้เอื้อต่อการใช้ประโยชน์ภายในหน่วยงานและแลกเปล่ียนข้อมูลข้ามหน่วยงาน หน่วยงานภาครัฐสามารถนาไปดาเนินงานให้เป็นไปในทิศทางเดียวกันได้ โดยกรอบนโยบายจะต้องกาหนด กระบวนการเชิงปฏิบัติแยกกันสาหรับข้อมูลที่ชั้นความลับต่างกัน : กลุ่มข้อมูลเปิด กลุ่มข้อมูลส่วนบุคคล กลมุ่ ขอ้ มลู ความลบั ราชการ กลมุ่ ขอ้ มลู ความมั่นคงของรัฐ โดยกรอบดงั กล่าวประกอบดว้ ยประเดน็ ดังน้ี a. การกาหนดกระบวนการจัดทาและสุม่ ตรวจข้อมูล (Procedure) ท่ีทาให้มั่นใจว่าปริมาณและ คุณภาพของขอ้ มูลตรงตามมาตรฐาน b. การกาหนดกระบวนการทท่ี าให้ม่นั ใจว่าข้อมลู มีความทนั สมยั ตลอดเวลา c. กาหนดกระบวนการในการใชข้ ้อมลู และการใชข้ ้อมลู ร่วมกนั 1 (Sharing of data) i. ข้อตกลงและเง่ือนไข2 (Terms and Conditions) ในการเผยแพร่ข้อมูล (Data Release) ii. เกณฑ์วิธี (Protocol) สาหรับการถ่ายโอนข้อมูล และวิธีการจัดการกับข้อมูล (Data handling method) เช่น เอพีไอ (API: Application Programming Interface) เอฟทพี ี (FTP: File Transfer Protocol) หน่วยความจาแบบพกพา อีเมล์ ฯลฯ iii. นโยบายควบคุมการเข้าถึง (Access control policy) การกาหนดว่าบุคคลใด สามารถเข้าถึงข้อมูลใดได้บ้าง โดยอาจกาหนดตามหน้าที่ความรับผิดชอบของบุคคล น้นั iv. การกาหนดกลุ่มของฟิลเตอร์ (Filter) ที่ทาให้ข้อมูลไม่สามารถระบุตัวตนได้ (anonymize) หรือ ลดระดับ (de-classify) ของชุดข้อมูล (Dataset) ท่ีเป็น ความลบั (confidential) แต่เปน็ ชุดขอ้ มูลท่ีมีประโยชนม์ าก โดยตวั อยา่ งการลดระดับช้ัน ความลับของข้อมูล ได้แก่ กรณีที่ชุดข้อมูลมีข้อมูลที่สามารถระบุถึงตัวบุคคลได้ (PII) การดาเนนิ การนาชือ่ ของบคุ คลออกจากชุดข้อมูลน้ันจะทาให้ชุดข้อมูลดังกล่าวถูกลด ระดับชั้นความลับจากระดับข้อมูลท่ีสามารถระบุถึงตัวบุคคลได้ (PII) เป็นระดับ ข้อมูลความลับ (Confidential) d. การกาหนดแบบฟอร์ม (Template) นโยบายการปูองกันข้อมลู (Data protection policy) 1 http://www.stou.ac.th/Schools/Sst/main/eLearning/Oa/html/charpter3.html 2 https://www.etda.or.th/file_storage/uploaded/Etda_Website/file/article_law_4.pdf 17

7) ออกแบบและจัดทาระบบบริการนามานุกรมข้อมูลภาครัฐ (Directory services) และระบบ บริหารจัดการเมทาดาต้า (Metadata Management System) โดยระบบจะมีกลไกในการค้นหาข้อมูล ผ่านการสืบค้นในมิติต่างๆ กลไกการร้องขอข้อมูล (กรณีข้ามหน่วยงาน) และกลไกการอนุมัติใช้ข้อมูลสาหรับ คาขอประเภทต่างๆ ท้ังน้ีการขอข้อมูลท่ีไม่มีช้ันความลับ (ข้อมูลเปิด) จะไม่ต้องขออนุมัติ นอกจากน้ีระบบ นามานุกรมจะทาหน้าท่ียืนยั นตัวตน (Authentication) และตรวจสอบสิทธิในการเข้าถึงข้อมูล (Authorization) ของผ้ใู ช้ตามกฎเกณฑ์ท่ีหน่วยงานเจ้าของข้อมูลระบุ รวมทั้งบันทึกรายการการสืบค้นและคา ขอข้อมูลทั้งหมด (Search and Request Log) เพื่อให้หน่วยงานเจ้าของข้อมูลสามารถตรวจสอบได้ ระบบ นามานุกรมน้ี จะเช่ือมต่อกับศูนย์เช่ือมโยงและแลกเปล่ียนข้อมูล (Data Linkage and Exchange Centers) เพ่ืออานวยความสะดวกให้การเข้าถึง (Data Access) และถ่ายโอนข้อมูล (Data Transfer) สามารถทาได้ ผา่ นระบบทง้ั หมดในอนาคต 8) จัดระบบเพื่อบันทึกธุรกรรมการล็อกอิน การร้องขอ การอนุมัติ ข้อมูลทั้งหมดที่เกิดข้ึนผ่านระบบ นามานกุ รมภาครัฐ เพ่ือประโยชน์ในการตดิ ตามสถานะและรายงานธรุ กรรมการแลกเปลี่ยนข้อมลู ท้ังหมด 2.2 การทางานร่วมกบั หน่วยงานภาครัฐเร่อื งการกากับดูแลข้อมูล ความสาเร็จของการจัดทารายการข้อมูลภาครัฐอย่างเป็นรูปธรรมนั้น จะต้องเกิดจากความเข้าใจและ เห็นถึงประโยชน์รว่ มกนั ของหนว่ ยงานภาครัฐ นอกจากนี้การแลกเปล่ียนข้อมูลข้ามหน่วยงานจะเกิดประโยชน์ ได้น้ัน หน่วยงานภาครัฐก็ต้องสามารถดูแลข้อมูลของตนได้อย่างเป็นระบบ กระทรวงดิจิทัลเพ่ือเศรษฐกิจและ สังคมจึงสนับสนุนให้หน่วยงานภาครัฐจัดตั้งคณะทางานด้านข้อมูล (Data Stewardship team) เพ่ือดาเนินงานด้านนโยบายข้อมูลของหน่วยงานเอง โดยกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมสามารถ ให้การสนับสนุนทางด้านวิชาการเพ่ือให้ได้นโยบายข้อมูลท่ีเหมาะสมกับหน่วยงานและสอดคล้องกันในภาครัฐ ได้ ตัวอย่างเช่น การวางนโยบายเพื่อกากับดูแลให้ข้อมูลแต่ละประเภทมีวงจรชีวิต (Data life Cycle) ที่เหมาะสม บริหารจัดการได้อย่างเป็นรูปธรรม และตอบโจทย์ด้านการรายงานและการวิเคราะห์ เพอื่ ประกอบการตัดสินใจ ในเบื้องต้น กระบวนการสร้างความเข้าใจและจัดเตรียมมาตรฐานด้านข้อมูลของกระทรวงดิจิทัล เพอื่ เศรษฐกิจและสงั คม จาเปน็ ตอ้ งได้รับความร่วมมือจากหน่วยงานภาครัฐอย่างเข้มแขง็ ในเร่อื ง ดงั ตอ่ ไปน้ี 1. จัดต้ังคณะทางานด้านข้อมูล (Data Stewardship team) เพ่ือประสานกับทีมงานจากกระทรวง ดจิ ทิ ัลเพื่อเศรษฐกจิ และสงั คมทร่ี ับผดิ ชอบเรือ่ งการจัดทารายการข้อมูลภาครัฐ 2. ระบุชุดข้อมูลสาคัญ (Critical dataset) ของหน่วยงาน โดยมีเกณฑ์ท่ีชัดเจนในการกาหนด ระดบั ความสาคญั ของชุดข้อมลู 3. จาแนกชุดข้อมูลสาคัญตามชัน้ ความลับและจัดทาดัชนขี ้อมลู ในมติ ิตา่ งๆเพ่ือความสะดวกในการสืบค้น 18

4. สร้างกฎเกณฑ์ว่าด้วยสิทธิการเข้าถึงข้อมูล (Access Right) โดยระบุประเภทบุคคล ที่จะมีสิทธิ์เข้าดู ขอ้ มลู ในแต่ละชน้ั ความลบั และสิทธใิ นการขอรบั ขอ้ มลู ไปใช้ประโยชนผ์ า่ นกลไกการถ่ายโอนขอ้ มูล 5. จดั ทาเมทาดาต้าร่วมกับกระทรวงดจิ ิทลั เพ่อื เศรษฐกจิ และสงั คม เพ่ือให้หนว่ ยงานภาครัฐมีเมทาดาต้า ในรปู แบบเดียวกนั สามารถรองรับการสืบคน้ เช่ือมโยง และแลกเปลยี่ นขอ้ มลู ภาครฐั ได้ในอนาคต 6. พิจารณาสร้างพ้ืนท่ีสาหรับแลกเปลี่ยนข้อมูลแยกต่างหากจากฐานข้อมูลหลัก และแปลงรูปแบบ การจัดเก็บข้อมูลสาคัญในพื้นท่ีดังกล่าวให้อยู่ในสกุลไฟล์ท่ีให้ทั้งมนุษย์และเคร่ืองคอมพิวเตอร์ สามารถอา่ นได้อย่างสะดวกเพือ่ ให้การแลกเปลี่ยนขอ้ มูลเกดิ ข้ึนไดแ้ บบอัตโนมตั ิ 7. ออกแบบกระบวนการประเมินคุณภาพและปริมาณของชุดข้อมูลสาคัญที่เหมาะสมกับหน่วยงาน โดยระบุเกณฑ์ท่ีใช้ในการประเมินคุณภาพอย่างชัดเจนและเป็นไปตามมาตรฐานสากล (สามารถ อ้างอิงจากเกณฑ์กลางและกระบวนการตัวอย่างของกระทร วงดิจิทัลเพ่ือเศรษฐกิจและสังคม ได้) จากนน้ั ทาการประเมินช่องว่างที่เกิดข้ึน (Gap) ระหว่างสถานะข้อมูลปัจจุบันกับสถานะที่ควรจะเป็น ตามเกณฑ์ท่ีกาหนด เพื่อวางแผนดาเนินการ (Roadmap) การพัฒนาชุดข้อมูลสาคัญให้มีคุณภาพ ภายในระยะเวลา 3-5 ปี 8. วางนโยบายเพ่อื กากบั ดแู ลวงจรชวี ติ และบรหิ ารจัดการข้อมูลดิจิทัล และสามารถใช้ได้กับทุกประเภท ข้อมลู (4 ประเภท) โดยเฉพาะประเด็นเรือ่ งกระบวนการจัดทาและสุ่มตรวจข้อมูล และกระบวนการใช้ และแลกเปลยี่ นข้อมลู แผนการดาเนินงานเรื่องการให้บริการรายการข้อมูลภาครัฐของกระทรวงดิจิทัล เพื่อเศรษฐกิจและ สังคม จะแบ่งเป็น 3 ช่วง โดยเร่ิมต้นช่วงท่ี 1 ในปีงบประมาณ 2562 ช่วงที่ 2 ในปีงบประมาณ 2563 และ ช่วงที่ 3 ในปงี บประมาณ 2564 และ 2565 ในช่วงท่ี 1 กจิ กรรมรวมถึงการศึกษาและจัดทาชุดเครื่องมือที่ประกอบด้วย กรอบมาตรฐาน กรอบนโยบาย กลไกการจัดการ และแบบฟอร์มด้านข้อมูลต่างๆ สาหรับให้หน่วยงานภาครัฐใช้เป็นจุดเริ่มต้นในการจัดทา มาตรฐานเมทาดาต้าและกากับดูแลข้อมูล เช่น มาตรฐานและตัวอย่างเมทาดาต้า วิธีการประเมินคุณภาพและ ปริมาณข้อมลู เกณฑส์ าหรับการระบชุ ้ันความลับของข้อมูล กรอบนโยบายด้านการบริหารจัดการข้อมูลดิจิทัล ฯลฯ โดยศึกษาจากรปู แบบทต่ี า่ งประเทศใช้ และรปู แบบของเมทาดาตา้ ท่มี กี ารดาเนินการแล้วของหน่วยงานภาครัฐ ในขั้นตอนนี้คณะทางานอาจจะร้องขอเมทาดาต้าจากหน่วยงานภาครัฐเท่าที่มีเพ่ือมากลั่นกรองและจัดทา รายการข้อมูลเบื้องต้นได้อีกด้วย หลังจากน้ัน ทีมงานจากกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม จะนา ชุดเคร่ืองมือท่ีจัดทาขึ้นไปใช้เพ่ือร่วมจัดทาเมทาดาต้าข้อมูลและวางแผนการจัดกา รนโยบายด้านข้อมูลกับ หน่วยงานนาร่อง 1-2 หน่วยงาน รวมท้ังจัดฝึกอบรมบุคลากรของกระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม เพอื่ เตรยี มความพร้อมในการให้คาแนะนาให้กบั หน่วยงานภาครฐั อ่นื ในการดาเนินงานระยะถัดไป 19

ในช่วงที่ 2 กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจะนาชุดเคร่ืองมือที่ผ่านกระบวนการทดสอบกับ หน่วยงานนาร่องแล้วไปใช้ร่วมกับงานใน 1-2 รายสาขาของงานภาครัฐ (จากท้ังสิ้น 21 สาขา) รวมท้ังพัฒนา ระบบบริการนามานกุ รมข้อมูลภาครัฐ และระบบบรหิ ารจดั การเมทาดาต้า เพือ่ เริม่ ต้นให้บรกิ าร ในช่วงท่ี 3 กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจะทาการขยายผลให้ครอบคลุมท้ัง 21 สาขา งานภาครัฐ ใหร้ ะบบบรกิ ารนามานกุ รมข้อมูลภาครัฐ สามารถให้บรกิ ารได้อย่างสมบรู ณ์ 20

บทที่ 3 การให้บรกิ ารด้านการแลกเปลยี่ นขอ้ มลู การใช้ประโยชน์ข้อมูลข้ามหน่วยงานต้องอาศัยระบบบริการนามานุกรมข้อมูลภาครัฐเพ่ือการค้นหาและ ระบุข้อมูลท่ีต้องการสาหรับแต่ละโจทย์ปัญหา และต้องมีกลไกสารสนเทศเพ่ือเอ้ือให้เกิดการถ่ายโอนข้อมูลข้าม หน่วยงานได้อย่างสะดวก ดังนั้นจึงต้องมีการพัฒนาระบบสารสนเทศเพ่ือบริหารจัดการการเช่ือมโยงและ แลกเปลี่ยนข้อมูลสาหรับการวิเคราะห์ข้อมูลขนาดใหญ่ (Big Data Analytics) ของหน่วยงานภาครัฐ ซึ่งตัวอย่าง บริการพื้นฐานของระบบดังกล่าวรวมถึง การยืนยันตัวตน การจากัดสิทธิในการเข้าถึงข้อมูลบริการส่งข้อมูล ข้ามหน่วยงานผ่านระบบสารสนเทศ การบันทึกทรานแซกชันการเข้าถึงข้อมูลเพ่ือเป็นหลักฐาน และการบริการ ข้อมูลประเภทอน่ื เน้อื หาในบทนี้จะนาเสนอรายละเอียดสาหรับการใหบ้ ริการดา้ นการแลกเปล่ียนข้อมูล 3.1 มาตรฐานข้อมูล เพื่อให้การแลกเปล่ียนข้อมูลเกิดข้ึนได้อย่างมีประสิทธิผล หน่วยงานภาครัฐควรจะสร้าง พน้ื ทีแ่ ลกเปลย่ี นขอ้ มูล (Data Exchange Zone) แยกตา่ งหากจากฐานข้อมูลหลัก และพิจารณาแปลงรูปแบบ ข้อมูลดิบที่จะนามาใส่ในพ้ืนท่ีแลกเปลี่ยนน้ีให้เอ้ือต่อการแลกเปลี่ยนข้อมูล โดยกระทรวงดิจิทัลเพื่อเศรษฐกิจ และสังคมไดก้ าหนดมาตรฐานรูปแบบขอ้ มลู เปน็ 4 ระดับ ดังแสดงในตารางท่ี 3.1  ระดับ 4 ดาว : ตัวอย่างเช่น เจซัน (JSON: JavaScript Object Notation) เอ็กเอ็มแอล (XML: Extensible Markup Language) และ อาร์ดีเอฟ (RDF: Resource Description Framework) ฯลฯ ซึ่งเป็นไฟล์ท่ีข้อมูลถูกเก็บในลักษณะข้อความ (plain text) ที่ทั้งมนุษย์และระบบคอมพิวเตอร์สามารถ อ่านเข้าใจได้ รวมทั้งระบบคอมพิวเตอร์สามารถประมวลผลข้อมูลได้โดยอัตโนมัติ ซ่ึงเป็นรูปแบบท่ีดีท่ีสุด สาหรบั การแลกเปล่ียนขอ้ มูล  ระดับ 3 ดาว : ซีเอสวี (CSV: Comma-Separated Value) เอ็กแอลเอส (XLS) หรือ เอ็กแอลเอสเอ็ก (XLSX) ซ่ึงเป็นไฟล์ที่ข้อมูลถูกจัดเป็นคอลัม (column) ระบบคอมพิวเตอร์และมนุษย์สามารถอ่านเข้าใจ ได้ถ้ามคี าอธบิ ายคอลมั (column) จากผ้ใู ห้บริการข้อมูล ท้ังน้ีสกุลไฟล์ CSV สามารถถูกแปลงเป็น JSON, XML และ RDF ได้อัตโนมัติโดยใช้โปรแกรมสาเร็จรูป (ตัวอย่างวิธีการแสดงในเอกสารแนบ ข) ขณะทไ่ี ฟล์เอก็ เซลจะมีข้อด้อยกว่าเมื่อเทียบกับ CSV เนื่องจากต้องใช้ซอฟต์แวร์ลิขสิทธ์ิจึงจะสามารถเปิด และแปลงไฟล์ได้ อยา่ งไรกด็ กี ารแลกเปลยี่ นขอ้ มูลยังสามารถทาได้อยา่ งเปน็ ระบบแม้มีข้อจากดั อยู่บ้าง  ระดับ 2 ดาว : ด็อก (DOC) หรือ ด็อกเอ็ก (DOCX) เฮชทีเอ็มแอล (HTML) และไฟล์เท็กซ์ (TXT) ซ่ึงเป็น ไฟล์ข้อมูลท่ีใช้ประโยชน์โดยระบบคอมพิวเตอร์ต้องมีการแปลงไฟล์หรือกระบวนการประมวลผล ภาษาธรรมชาติ (Natural language Processing) เพิ่มเติม ซึ่งไม่สะดวกสาหรับการแลกเปลี่ยนข้อมูล มากนกั  ระดับ 1 ดาว : รูปแบบข้อมูลท่ีไม่เหมาะสมกับการแลกเปล่ียนข้อมูลเพ่ือการใช้ประโยชน์คือ ไฟล์ PDF ภาพกราฟ และ ข้อมลู ท่ียังไมอ่ ยู่ในรปู แบบดิจิทัล 21

สกุลไฟลท์ ่ีเคร่อื ง สกลุ ไฟลเ์ ชิงแผนที่ท่ี สกลุ ไฟล์ท่ีสามารถ สกลุ ไฟล์ท่ี สกลุ ไฟลท์ ่ีใช้ คอมพวิ เตอร์สามารถ เครอื่ งคอมพิวเตอร์ ถกู ใช้งานไดอ้ ย่างมี ไม่แนะนา ประโยชน์ได้ยาก อา่ นไดส้ ะดวก สามารถอา่ นได้ ขอ้ จากดั JSON Shapefile CSV HTML Images (PNG, JPG) XML GeoJSON Excel Word Charts RDF GML TXT PDF ODF KML เอกสารกระดาษ TSV WKT ตารางท่ี 3.1 สกลุ ไฟล์สาหรับการแลกเปล่ียนข้อมูล นอกจากนี้ ข้อมูลดิบที่หน่วยงานภาครัฐจัดเก็บอาจจะมีความไม่สอดคล้อง ตัวอย่างเช่นข้อมูล ‘วันท่ี’ หน่วยงานท่ี 1 เก็บในรูปแบบ dd/MM/YYYY หน่วยงานท่ี 2 เก็บในรูปแบบ MM/dd/YYYY และปีท่ีเก็บ จะมโี อกาสเปน็ ได้ท้ังปีคริสต์ศักราช (ค.ศ.) และปีพุทธศักราช (พ.ศ.) การใช้ประโยชน์ข้อมูลจึงต้องมีการแปลง รูปแบบเข้าหากันซ่ึงเพ่ิมค่าใช้จ่ายและไม่สะดวกต่อการทางาน ดังน้ันกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม จะทาหน้าที่สร้างและรวบรวมมาตรฐานกลางสาหรับข้อมูลประเภทต่างๆ และจัดทาคลังมาตรฐานข้อมูล ที่สืบค้นอ้างอิงได้ โดยมีการตรวจสอบผู้เป็นเจ้าของข้อมูลหลัก (Master Data) ตัวอย่างเช่น ชื่อคนและท่ีอยู่ จะมีกระทรวงมหาดไทยเป็นเจ้าของข้อมูลหลัก รูปแบบการจัดเก็บจึงควรยึดตามกระทรวงมหาดไทย การนาข้อมูลไปใช้ต่อจึงจะสามารถอ้างอิงได้อย่างถูกต้องโดยไม่ต้องแปลงรูปแบบ กรณีข้อมูลท่ัวไป ท่ีไม่มีเจ้าของตามพระราชบัญญัติ เช่น ‘วันที่’ กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมจะสร้างมาตรฐาน รปู แบบข้อมลู เพื่อการจดั เก็บข้นึ ตามมาตรฐานสากล 3.2 การปรบั ปรงุ ข้อมูลเพื่อเตรียมความพรอ้ ม สาหรับหน่วยงานเจ้าของข้อมูลที่เตรียมจะเข้าร่วมในกลไกการแลกเปล่ียนข้อมูลภาครัฐ หน่วยงาน ควรที่จะปรับปรุงข้อมูลสาคัญเพื่อเตรียมพร้อมสาหรับการให้บริการข้อมูล โดยเริ่มจาก 2 เกณฑ์ประเมิน คุณภาพท่ีทาไดง้ า่ ยกอ่ น คอื ความสอดคล้องกบั รูปแบบมาตรฐานของข้อมูล (Conformance) และความถูกต้อง แมน่ ยา (Accuracy) โดยเรม่ิ จากการตรวจสอบระดับพนื้ ฐานกอ่ น ดงั น้ี ความสอดคล้องกบั รูปแบบมาตรฐานของข้อมูลพนื้ ฐาน  ตรวจสอบให้ชุดข้อมูลมีแถว Header สาหรับอธิบายรายละเอียดของคอลัม (column) เพอ่ื การนาไปใช้ประโยชนข์ องหน่วยงานทีข่ อข้อมูล 22

 ตรวจสอบใหช้ ุดข้อมูลมรี หัสทแี่ สดงเวอรช์ ัน เพอ่ื ใหผ้ ู้ขอข้อมลู สามารถติดตามการเปลี่ยนแปลง ของชุดข้อมูลได้ โดยเวอร์ชันสามารถใช้ตรวจสอบข้อมูลพ้ืนฐาน เช่น วันท่ีเก็บข้อมูล วันท่ี ปรับปรุงข้อมลู วธิ จี ดั เกบ็ ขอ้ มลู และหนว่ ยงานเจ้าของข้อมูล ทั้งนี้เพื่อให้ผู้ใช้ประโยชน์ข้อมูล สามารถตรวจสอบความใหม่ของขอ้ มูลได้ ความถูกต้องแม่นยา  ตรวจสอบหาค่าที่ผิดปกติจากกลุ่มท่ัวไปในชุดข้อมูล หากพบข้อมูลท่ีมีช่วงของค่าที่เป็นไป ไม่ได้ เช่น ข้อมูลอายมุ คี า่ หลกั พัน ควรปรบั แก้ เป็นต้น  ตรวจสอบหาข้อมูลที่ซ้ากัน ข้อมูลท่ีขาดหายไปในบางส่วน (Missing Data) และความผิดปกติ ท่ัวไปจากกฎที่ต้ังไว้ เช่น การเก็บตัวอักษรในคอลัมตัวเลข หากมีควรปรับค่ารวมท้ังระบุ กระบวนการการจดั การแกไ้ ข  ตรวจสอบว่าชุดข้อมูลมีคอลัมข้อมูลท่ีถูกสร้างข้ึนมาเพียงเพ่ือการทดสอบระบบงานหรือไม่ หากมีควรลบทิ้ง โดยการตรวจสอบคุณภาพแบบพ้ืนฐานนี้ สามารถทาแบบออฟไลน์ได้ เพ่ือไม่ขัดจังหวะการใช้งาน ระบบฐานข้อมูล รวมท้ังเจ้าหน้าท่ีสารสนเทศหน่วยงานสามารถพัฒนาโปรแกรมย่อยเพื่อใช้ตรวจสอบข้อมูล แบบกึ่งอตั โนมัตไิ ดอ้ กี ด้วย 3.3 ระบบบรกิ ารและแลกเปล่ยี นขอ้ มูลกลาง เพื่อการกากับดูแลช้ันความลับข้อมูล กลไกและระบบสารสนเทศเพื่อการให้บริการและแลกเปลี่ยน ข้อมูลกลาง จาเป็นจะต้องเชื่อมต่อกับระบบนามานุกรมข้อมูลภาครัฐ เพ่ือทาการยืนยันตัวตนผู้ใช้ (Authentication) และตรวจสอบสิทธิในการเข้าถึงข้อมูล (Authorization) ให้เป็นไปตามกฎเกณฑ์ ที่หน่วยงานเจ้าของข้อมูลระบุ ระบบบริการและแลกเปลี่ยนข้อมูลจะต้องบันทึกรายการการเข้าถึงข้อมูลและ ถ่ายโอนข้อมลู ท้งั หมด (Access Log) เพือ่ ใหห้ น่วยงานเจ้าของข้อมูลสามารถตรวจสอบได้ และเพื่อให้สามารถ ทาผลสรปุ เชงิ สถิตเิ ร่ืองการร้องขอใช้ข้อมูลของทงั้ ภายในและภายนอกหน่วยงาน อกี ด้วย นอกจากน้กี ลไกการบริการและแลกเปลี่ยนข้อมูลกลางยังต้องมีกระบวนการบนระบบสารสนเทศที่ให้ ผู้ใชง้ านสามารถจดั การข้อมูลทีม่ คี วามผดิ ปกติไดต้ ามขนั้ ตอนดังต่อไปนี้ 1. Confirm: ตรวจสอบและทาการยนื ยนั วา่ ชดุ ข้อมลู มปี ญั หา 2. Notify: แจง้ เตอื นใหก้ ับผู้ทด่ี ูแลหรอื หน่วยงานเจา้ ของขอ้ มลู นี้เกย่ี วกบั ปัญหาในชุดข้อมลู 3. Log: ทาการเกบ็ log ปัญหาท่ีเกดิ ขึ้นไวเ้ พอ่ื ติดตามและสรุปผล 4. Diagnose: วเิ คราะห์ปญั หาของขอ้ มูลพืน้ ฐานได้ 5. Evaluate Option: ประเมนิ ตน้ ตอของปัญหา เชน่ การเก็บขอ้ มลู อลั กอริทมึ ในการคานวณข้อมูล 6. Correct: แกไ้ ขขอ้ มูลท่ผี ดิ ปกติท่พี บใหถ้ กู ต้อง 23

ในชว่ งแรกของการให้บริการแลกเปลี่ยนข้อมูล กระบวนการจัดการข้อมูลจะช่วยให้เกิดการแจ้งเตือน ระหว่างหน่วยงานเพอ่ื ใหเ้ กดิ การพัฒนาคณุ ภาพขอ้ มูลโดยรวม และทาให้หน่วยงานสามารถให้บริการข้อมูลที่มี ระดบั คณุ ภาพทีย่ อมรบั (Data Quality Service Level Agreement) ได้ในอนาคต กลไกการบริการและการแลกเปลี่ยนข้อมูลเพื่อการวิเคราะห์ข้อมูลขนาดใหญ่น้ัน ควรถูกออกแบบ ในลักษณะที่หน่วยงานเจ้าของข้อมูลไม่จาเป็นจะต้องส่งข้อมูลดิบเข้ามาจัดเก็บที่ศูนย์บริการข้อมูลกลาง เพียงแต่จัดทา (publish) เมทาดาต้าขึ้นระบบนามานุกรมข้อมูลภาครัฐเท่าน้ัน ขั้นตอนการแลกเปลี่ยนข้อมูล ระหวา่ งหน่วยงาน อธบิ ายไดต้ ามรปู ที่ 3.1 รูปที่ 3.1 กลไกการบริการและการแลกเปลี่ยนข้อมูล จากรปู การบริการและแลกเปลีย่ นขอ้ มลู จะมี 4 ขัน้ ตอน ดงั ต่อไปน้ี 1. หนว่ ยงานภาครัฐจัดทา (publish) เมทาดาต้าเขา้ มาทร่ี ะบบนามานุกรมข้อมลู ภาครัฐ 2. ผู้ใช้งานท่ีต้องการร้องขอข้อมูลจะทาการสืบค้น ระบุข้อมูลที่ต้องการ และย่ืนคาร้องขอข้อมูล ผา่ นระบบนามานุกรมขอ้ มูลภาครัฐ (Directory Service) ซึ่งระบบดังกล่าวจะยืนยันตัวตน ตรวจสิทธิ์ของ ผู้ร้องขอ และตรวจสอบว่าคาขอข้อมูลมีความเหมาะสมตามกฎเกณฑ์ท่ีระบุโดยหน่วยงานเจ้าของข้อมูล หรือไม่ ตัวอยา่ งเชน่ ขอ้ มูลท่ีขอมีช้ันความลับระดับใด ผู้ขอมีสิทธิ์หรือไม่ คาขอต้องการปริมาณข้อมูลมาก เพียงใด หากคาขออยู่ในเกณฑ์ปกติการอนุมัติจะสามารถทาได้โดยระบบอัตโนมัติ มิเช่นนั้นจะต้องมี การส่งผ่านคาขอไปยัง คณะอนุกรรมการกลั่นกรองคาขอข้อมูลอีกต่อหน่ึง นอกจากนี้คาร้องขอข้อมูล ทัง้ หมดจะถกู บนั ทึกเพ่อื ประโยชน์ในการตรวจสอบในภายหลงั 3. หากคาร้องขอข้อมูลได้รับการอนุมัติ จะมีการแจ้งไปยังผู้ขอ และคาร้องพร้อมรายละเอียดจะถูกส่งผ่านไป ยงั ระบบบริการและแลกเปลย่ี นข้อมูลกลาง (Data Exchange Service) 4. ระบบบริการและแลกเปล่ียนข้อมูลกลาง จะมีการต่อเชื่อมกับหน่วยงานเจ้าของข้อมูลและหน่วยงาน ผ้ขู อรับบรกิ ารทั้งหมด รวมทงั้ เกบ็ ขอ้ มูลดา้ นเครอื ขา่ ย เช่น IP Address และเกณฑใ์ นการส่ง-รับข้อมูลของ 24

หน่วยงานเจ้าของข้อมูล เพื่อจุดประสงค์ในการถ่ายโอนข้อมูล ซ่ึงการถ่ายโอนข้อมูลจากต้นทางไปยัง ปลายทางสามารถทาได้ท้ังแบบผ่านและไม่ผ่านระบบกลาง การที่ข้อมูลไม่จาเป็นต้องวิ่งผ่านระบบบริการ ขอ้ มูลกลางจะสามารถลดปัญหาคอขวดที่อาจเกดิ ขึ้นในกรณีที่มีรายการคาขอจานวนมาก ท้ังนี้ช่องทางการ ส่งขอ้ มูลจะขึ้นอยู่กบั เกณฑท์ ห่ี นว่ ยงานเจา้ ของข้อมลู ระบไุ ว้ ตวั อยา่ งเช่น  Application Programming Interface หรือ API คือการโอนย้ายข้อมูลโดยอัตโนมัติ ผ่านการเรียกใช้งานส่วนโปรแกรมท่ีหน่วยงานเจ้าของข้อมูลจัดเตรียมไว้ให้ โดยระบบงานของ ผู้ขอข้อมูลจะสามารถดึงข้อมูลตรงจากระบบฐานข้อมูลของหน่วยงานเจ้าของข้อมูลได้โดยตรง การส่งลักษณะนเ้ี หมาะกับขอ้ มูลท่ีมีโครงสร้าง  Secured File Transfer Protocol (SFTP) ทาได้ 2 วิธี คือ 1) เจ้าของข้อมูลทาการอัปโหลด ไฟล์ข้อมูลเข้าไปที่พ้ืนที่จัดเก็บช่ัวคราวของระบบบริการข้อมูลกลาง เพ่ือให้ผู้ร้องขอข้อมูลเข้ามา ดึงข้อมูลไปใช้ในภายหลัง 2) หน่วยงานเจ้าของข้อมูลถ่ายโอนข้อมูลไปยังผู้รับโดยตรงผ่านระบบ อัตโนมัติด้วยโปรโตคอล SFTP การส่งข้อมูลลักษณะน้ีต้องมีรหัสผู้ใช้และรหัสผ่านสาหรับ การเข้าสูร่ ะบบท่ชี ัดเจน การส่งลักษณะนี้เหมาะกบั ข้อมูลขนาดใหญ่และขอ้ มลู ที่ไม่มโี ครงสรา้ ง  Removable storage หรือ Email คือการทาสาเนาไฟล์ข้อมูลโดยใส่รหัสปูองกันการเปิดไฟล์ และนาไฟล์ดังกล่าวใส่ลงใน Removable Storage เพื่อจัดส่ง หรือ ส่งทาง Email การส่ง ลักษณะนี้เหมาะกบั หนว่ ยงานที่มขี อ้ จากัดทางดา้ นระบบเครอื ข่ายคอมพิวเตอร์ หมายเหตุ ระบบนามานุกรมข้อมูลภาครัฐ และระบบบริการข้อมูลกลาง ไม่จาเป็นต้องติดตั้งในดาต้าเซนเตอร์ เดียวกนั ระบบท้งั 2 สามารถทางานร่วมกันได้ผ่านกลไก Web Service 25

บทท่ี 4 การกลั่นกรองคารอ้ งขอข้อมลู ข้ามหน่วยงาน เม่ือระบบบริการและแลกเปลี่ยนข้อมูลเริ่มถูกใช้งานอย่างเป็นรูปธรรม คาร้องขอข้อมูลจะมี หลากหลายประเภทและต่างวัตถุประสงค์ ภาครัฐจึงจาเป็นต้องวางแผนอย่างเป็นระบบเพ่ือรองรับคาร้องขอ พิเศษรูปแบบต่างๆ เช่น คาขอขอ้ มูลจานวนมากกว่าปกติ คาขอข้อมูลจากหลายหน่วยงานในคราวเดียว คาขอ ข้อมูลที่มีชั้นความลับสูงจากกระทรวงอื่น เป็นต้น ซึ่งการสร้างมาตรฐานและกระบวนการในการอนุมัติคาร้อง ขอและการใหบ้ รกิ ารข้อมลู ที่เป็นระบบ ทาซ้าได้ และสะดวกสาหรับผู้ใชง้ านจึงเป็นส่ิงจาเป็น คาขอข้อมูลจากหน่วยงานภายใต้กระทรวงเดียวกันสามารถพิจารณาตัดสินได้ใ นระดับกระทรวงโดย คณะทางานด้านข้อมูลของกระทรวง อย่างไรก็ดีในกรณีการขอข้อมูลข้ามกระทรวงนั้น การพิจารณาอนุมัติ จะเป็นเรื่องยาก รัฐบาลจึงควรแต่งตั้งหัวหน้าเจ้าหน้าที่ข้อมูลภาครัฐ (Government Chief Data Officer) และจัดตั้งคณะกรรมการเพื่อการกล่ันกรองคาร้องขอข้อมูล เพ่ือร่วมพิจารณาคาร้องขอข้อมูลแบบพิเศษ อยา่ งเปน็ ระบบดังแสดงในรูปท่ี 4.1 รูปท่ี 4.1 พิจารณาคาร้องขอขอ้ มูล คณะกรรมการดังกล่าวควรมีตัวแทนจากคณะทางานด้านข้อมูล (Data Stewardship team) ของ ทุกกระทรวง และมีคณะทางานจากสานักงานพัฒนารัฐบาลดิจิทัล และ/หรือ กระทรวงดิจิทัลเพื่อเศรษฐกิจ และสังคมเพื่อช่วยประสานให้เกิดการปฏิบัติตามมติจากคณะกรรมการฯ โดยคณะทางานดังกล่าวจะทาหน้าท่ี ในการออกแบบและกากับการทางานบนระบบสารสนเทศเพื่ออานวยความสะดวกในกระบวนการพิจารณา และอนุมตั ิคาร้องขอขอ้ มูล อีกดว้ ย การมีบุคลากรในระดับต่างๆ ร่วมกากับดูแลการให้บริการข้อมูลของหน่วยงานภาครัฐ จะส่งผลให้ การแลกเปล่ียนและใช้ประโยชน์ข้อมูลเกิดขึ้นได้อย่างมีประสิทธิผล หัวหน้าเจ้าหน้าที่ข้อมูลภาครัฐและ คณะกรรมการฯ ดงั กล่าวจะมีหน้าทีห่ ลัก ดงั น้ี 26

 พิจารณาประเด็นทเ่ี กย่ี วขอ้ งกบั การสร้างศูนย์ข้อมลู  พิจารณาคาร้องขอข้อมูลพิเศษ และให้นโยบายแก่หน่วยงานเจ้าของข้อมูลเร่ือง การอนุมัติ/ไม่อนุมัติ คาร้องขอ  บริหารจัดการให้การใชข้ อ้ มูลภาครัฐเกิดประโยชน์สูงสุดและสนับสนุนให้การใช้ข้อมูลเพื่อการวิเคราะห์ เกดิ ข้ึนในวงกว้าง โดยไมข่ ัดตอ่ พระราชบญั ญตั ิด้านข้อมูล กฎกระทรวง และเกณฑ์ด้านข้อมูลอืน่ ๆ  บริหารจัดการการแลกเปลี่ยนข้อมูลข้ามกระทรวง โดยออกนโยบาย วิธีการ และข้อตกลงการใช้ ประโยชน์ข้อมูลข้ามหน่วยงานท่ีเหมาะสม โดยมีตัวอย่างเอกสาร เช่น ข้อตกลงการแลกเปลี่ยนข้อมูล (Data Exchange Agreement) ข้อตกลงการให้บริการข้อมูล (Data Supply Agreement) และ กฎเกณฑ์/เงื่อนไข ในการปล่อยข้อมูลจากหน่วยงาน (Terms and Conditions of Data Release) ให้ หนว่ ยงานอ่นื ของภาครัฐนาไปใชป้ ระโยชน์  ส่งเสริม สนับสนุน และประสานให้เกิดการปฏิบัติการอย่างเป็นรูปธรรมในเร่ืองการบริการข้อมูล ภาครัฐในมิติต่างๆ คือ การทารายการข้อมูลของหน่วยงาน (Data Inventory) กระบวนการ กากับดูแลข้อมูล (Data Governance) การผลิตข้อมูล (Data Production) การสนับสนุนให้เกิด การใชป้ ระโยชนข์ ้อมูล (Data Usage)  นาเสนอกลยุทธ์ด้านข้อมลู ใหแ้ กค่ ณะรฐั มนตรี 27

บทท่ี 5 การพฒั นาบคุ ลากรภาครัฐดา้ นการวเิ คราะหข์ อ้ มลู ในการปรับตัวและเตรียมความพร้อมเข้าสู่ยุคของการวิเคราะห์และใช้ประโยชน์ข้อมูลขนาดใหญ่ เพื่อวางแผนยุทธศาสตร์ ปฏิบัติงาน และบริหารงานของภาครัฐนั้น หน่วยงานภาครัฐจาเป็นต้องวางแผนและ ดาเนินงานด้านการพัฒนาบุคลากรล่วงหน้า โดยเน้นการอบรมเพื่อสร้างนักวิทยาศาสตร์ข้อมูล วิศวกรข้อมูล และนกั วิเคราะหข์ อ้ มูล เนื่องจากบุคลากรในสาขาดงั กล่าวเปน็ ทต่ี ้องการสูงมาก การจัดจ้างอัตราใหม่ในจานวน ท่ีเพียงพอจึงเป็นเร่ืองท่ีท้าทาย สานักงานคณะกรรมการข้าราชการพลเรือนร่วมกับกระทรวงดิจิทัลเพ่ือ เศรษฐกจิ และสังคมจงึ ไดเ้ สนอกลไกการพัฒนาบุคลากรเพ่ือการใชป้ ระโยชน์ข้อมลู ขนาดใหญ่ดังนี้ 5.1 กรอบการพัฒนาบคุ ลากร ข้อเสนอการพัฒนาบุคลากรเพื่อการใช้ประโยชน์ข้อมูลขนาดใหญ่ ได้กาหนดเปูาหมายว่า ภายในปี 2565 บุคลากรภาครัฐของไทยจะตระหนักถึงคุณค่าของข้อมูลและสามารถนาข้อมูลขนาดใหญ่มาสร้าง มูลค่าเพิ่ม และมีการพัฒนาเครือข่ายการทางานอย่างเป็นพันธมิตรกับทุกภาคส่วน ( Public-Private Partnership: PPP) รวมท้ังมีการกาหนดนโยบาย ยุทธศาสตร์ และการบริหารจัดการท่ีต้ังอยู่บนข้อมูลและ หลักฐานเชงิ ประจักษ์ กลมุ่ เปาู หมายของการพฒั นาประกอบดว้ ย 3 กลุ่ม ดังแสดงในรูปที่ 5.1 รูปท่ี 5.1 กลมุ่ เปูาหมายการพัฒนาบุคลากรด้านการใชป้ ระโยชน์ข้อมูล รูปที่ 5.1 แสดงกลุ่มงานและทักษะหลักที่ต้องการเพ่ือทาโครงการบ๊ิกดาต้าภาครัฐให้ได้ประสิทธิผล โดยแบ่งเป็น 3 เร่ืองคือ งานด้านการสร้างและดูแลระบบสารสนเทศบิ๊กดาต้า งานด้านการวิเคราะห์และ แสดงผลข้อมูล และงานด้านการนาเอาข้อมูลไปใช้ประโยขน์ประกอบการตัดสินใจ ดังน้ันกลุ่มเปูาหมายของ การพัฒนาบคุ ลากรจึงมี 3 กลมุ่ เพ่ือใหส้ อดคล้องกบั งาน ดงั น้ี 28

1) กลุ่มผู้ใช้ข้อมูล (Business Domain) ได้แก่ ผู้บริหารระดับสูง ผู้อานวยการกอง ผู้ทางานด้าน นโยบายและวิชาการ ผู้ทางานด้านบริการ มีหน้าท่ีกาหนดโจทย์หรือประเด็นท่ีต้องการวิเคราะห์ข้อมูล และนา สารสนเทศท่เี ป็นผลจากการวเิ คราะห์และนาเสนอข้อมูลมาใช้ประกอบการดาเนินงาน 2) กลุ่มผู้สร้างและพัฒนาระบบ ได้แก่ Data Engineer, Data Architecture, Business Analyst, Project Manager, Corporate Security, IT Operator มีหน้าท่ีในการออกแบบและพัฒนา โครงสร้างพื้นฐานด้านข้อมูล รวมท้ังดูแลและบริหารจัดการข้อมูลให้อยู่ในสภาพท่ีพร้อมใช้งาน อย่างต่อเนื่อง และปลอดภัย 3) กลุ่มผู้วิเคราะห์ ประมวลและแสดงผลข้อมูล ได้แก่ Data Scientist, Data Analyst, Data Visualizer มีหน้าที่ในการนาข้อมูลมาจัดกลุ่ม วิเคราะห์ และประมวลผล พร้อมท้ังพัฒนารูปแบบการแสดงผล รวมถงึ Dashboard สาหรับการนาเสนอขอ้ มูล นอกจากนี้ กรอบแนวทางการดาเนินงานการพัฒนาบุคลากรในการใช้ประโยชน์ข้อมูลขนาดใหญ่ จะถูกแบง่ ออกเป็นระยะต้น ระยะกลาง และระยะยาว เพ่ือให้การดาเนินการบรรลุเปูาหมายอย่างเป็นขั้นตอน ดังแสดงในรปู ท่ี 5.2 รปู ท่ี 5.2 กรอบการดาเนินงาน 3 ระยะ ระยะสั้น การพัฒนาแพลทฟอร์มเสริมสร้างทักษะที่เรียกว่า Sandbox สาหรับการพัฒนาบุคลากรใน ระยะส้ัน โดยเริ่มตั้งแต่การกาหนดโจทย์ การพัฒนาโครงสร้างและระบบข้อมูล การวิเคราะห์และประมวลผล ขอ้ มลู การแสดงผลข้อมูลเชิงประจกั ษ์ ตลอดไปจนถึงการนาสารสนเทศและองค์ความรู้ท่ีได้จากการวิเคราะห์ และประมวลผลมาใช้ประกอบการตัดสินใจและการดาเนินงานในรูปแบบต่างๆ แพลทฟอร์มดังกล่าวเน้นการ พัฒนาบคุ ลากรผา่ นหลักสูตรที่นารูปแบบการพัฒนาแบบ Project based Learning มาปรับใช้ เพ่ือให้ผู้เข้ารับ การฝึกอบรมสามารถ “ทาได้ ทาเปน็ ” มากกวา่ เรยี นรู้จากทฤษฎี ดงั น้ี 29

ข้ันตอนที่ ๑ ขน้ั ตอนท่ี ๒ ขั้นตอนที่ ๓ ขั้นตอนที่ ๔ กาหนดโจทย/์ สรรหา/คัดเลอื กบุคลากร พัฒนาบคุ ลากร แบบ นาขอ้ มูลมาใชป้ ระโยชน์ ประเด็นเชงิ นโยบาย เข้ารว่ มโครงการ Project based Learning กลไกการดาเนนิ งาน การดาเนินการรว่ มกบั การสรรหา/คัดเลอื กจาก การจัดการพัฒนาทักษะ การให้ผูเ้ ข้ารับการฝกึ อบรม หลกั สตู ร ป.ย.ป.๑ ๑) ผเู้ ข้ารบั การอบรม/ บุคลากรผ่านการเรียนรู้ กลุ่มผู้ใช้ขอ้ มูล นาการ (ปลดั กระทรวง) โดยจัด เจา้ ของโจทย์คัดเลอื ก โดยการทางานจริง แสดงผลข้อมูลที่พัฒนาขนึ้ ให้มีการให้ความรู้ บคุ ลากรที่มีคณุ สมบัตทิ ี่ ในขัน้ ตอนท่ี ๓ มาจดั ทา เก่ียวกับการนาข้อมูล กาหนดเขา้ รบั การพฒั นา ขอ้ เสนอนโยบายแห่งรัฐ ขนาดใหญ่มาใชป้ ระโยชน์ ทักษะบนแพลทฟอร์ม Sandbox ๒) การนาบคุ ลากรจาก โครงการ Policy Work and Study Team ของ ก.พ. มาสนับสนนุ หน่วยงานทเี่ กี่ยวข้อง สกพ. สกพ. ดศ. สกพ. นากลไกการฝึกอบรม ประสานและคัดเลอื ก จดั ดาเนนิ การพัฒนา จดั ใหก้ ารพฒั นา หลกั สตู ร ป.ย.ป. มา ผู้มีคณุ สมบตั ิทีก่ าหนด บุคลากรผ่านเครอื ข่าย ความสามารถในการนา สนับสนนุ การดาเนินงาน เขา้ ร่วมโครงการ มหาวทิ ยาลยั ขอ้ มลู มาใช้ประโยชน์เปน็ ดศ. ดศ. สถาบนั คุณวฒุ วิ ิชาชพี ส่วนหนง่ึ ของการฝึกอบรม ใหก้ ารสนับสนนุ เชงิ กาหนดคณุ สมบตั ิบุคคล จดั การประเมินสมรรถนะ หลกั สูตรการพฒั นาผ้นู า เทคนิคและวิธกี ารในการ ผ้เู ขา้ ร่วมโครงการ และ ผเู้ รยี น ตา่ งๆ เชน่ นบส. ป.ย.ป. กาหนดโจทย์/ประเด็น รว่ มคดั เลอื กบุคลากร สดช. เปน็ ต้น ให้กบั กล่มุ ผู้เข้ารับการ จัดประเมินผ้สู อน ดศ. ฝกึ อบรมหลักสูตร ป.ย.ป. สพร. จัดดาเนินการพฒั นา ในการนาข้อมลู ขนาด พฒั นา ระบบ e-Learning บคุ ลากรใหส้ ามารถนา ใหญ่มาใชป้ ระโยชน์ สกพ. ข้อมลู มาใชป้ ระโยชน์ ออกแบบการสรา้ งแรงจงู ใจ ให้บุคลากรมคี วามสนใจเข้า รับการฝกึ อบรม เช่น การ Top-Up เงนิ เดือน การให้ รางวลั หรอื ทุนการศึกษา 30

ระยะกลาง วางแผนการบรหิ ารจัดการกาลงั คนเพือ่ การใชป้ ระโยชนข์ ้อมูลขนาดใหญ่ท่มี ีความคล่องตัว สามารถ สนบั สนุนการพัฒนานโยบาย การตัดสินใจ การบริหารจัดการ การให้บริการ และการพัฒนานวัตกรรมภาครัฐ โดยมกี รอบการดาเนินงานดังน้ี  การวางระบบการบริหารจัดการกาลังคนโดยแบ่งเป็น ๓ กลุ่มหลัก ดังน้ี (๑) กลุ่มหน่วยงานท่ีมีความ พร้อมดา้ นบุคลากร สามารถดูแลบริหารจัดการระบบข้อมูล และมีบุคลากรท่ีมีความสามารถด้านการ วิเคราะห์ ประมวลและแสดงผลข้อมูล แต่ยังคงมีความต้องการการสนับสนุนเทคนิคห รือการ ดาเนินการในบางประการ (๒) กลุ่มหน่วยงานที่อยู่ระหว่างการพัฒนา โดยมีบุคลากรท่ีมีความเข้าใจ และสามารถให้ข้อมูลความต้องการได้ชัดเจนระดับหน่ึง ต้องการการสนับสนุนเชิงเทคนิคในการสร้าง และพัฒนาระบบ และการวิเคราะห์ ประมวลและแสดงผลข้อมูล (๓) กลุ่มหน่วยงานที่ขาดแคลน บุคลากรด้านข้อมูล แต่มีความจาเป็นต้องนาข้อมูลมาใช้ประโยชน์เพ่ือการตัดสินใจ การกาหนด นโยบาย หรอื การบริหารจัดการตา่ งๆ  นาบุคลากรที่มีทักษะและความเช่ียวชาญเฉพาะทางจากหน่วยงานต่างๆ มารวมไว้ในหน่วยงานเดียว เช่น กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคม และพัฒนารูปแบบการทางานในลักษณะเป็น “ทีมท่ี ปรึกษา” (Agile Team) สาหรับให้บริการหน่วยงานภาครัฐ โดยอาจนาที่ปรึกษาภายนอกหรือ หนว่ ยงานเอกชนมารว่ มดาเนนิ งานในรปู แบบตา่ ง ๆ ดว้ ย ในการนี้ ใหม้ ีพฒั นารูปแบบการจ้างงานใหม่ นอกเหนือจาก “ข้าราชการ/พนักงานราชการ” เพ่ือดึงดูดจูงใจ และอาจมีการเพิ่ม “สายงานเฉพาะ ทาง” สาหรับผู้ปฎิบัติงานท่ีต้องใช้องค์ความรู้เกี่ยวกับการวิเคราะห์ข้อมูล มีการดูแลทางก้าวหน้าใน อาชีพ การสรา้ งโอกาสการพฒั นาที่ต่อเนื่องการให้ได้รับค่าตอบแทนที่เหมาะสม การพัฒนาระบบการ แต่งตงั้ ใหส้ อดคลอ้ งกบั ลกั ษณะงานท่มี ีความซับซ้อนและความต้องการบุคลากรที่มีสมรรถนะสูงและมี ความเป็นมืออาชีพ ท้ังนี้ อาจมีการนาวุฒิบัตรหรือประกาศนียบัตรรับรองมาตรฐานหรือสมรรถนะ ดา้ นการวิเคราะหข์ อ้ มลู มาใชใ้ นการบรหิ ารจัดการกาลังคนดว้ ย  พฒั นาขีดความสามารถของผู้ใช้ข้อมูลกลุ่มต่าง ๆ ได้แก่ ผู้บริหารระดับสูง ผู้อานวยการกอง ผู้ทางาน ด้านนโยบายและวิชาการ และผู้ทางานด้านบริการให้สามารถกาหนดโจทย์หรือประเด็นท่ีต้องการ วิเคราะห์ข้อมูล และนาสารสนเทศท่ีเป็นผลจากการวิเคราะห์และนาเสนอข้อมูลมาใช้ประกอบการ ดาเนินงาน ได้อย่างเหมาะสม รวมท้ังยกระดับศักยภาพผู้ปฏิบัติงานด้านเทคโนโลยีสารสนเทศของ หน่วยงาน โดยอย่างน้อยให้มีความสามารถในการกากับควบคุมงานจ้างที่ปรึกษา ( Project management) และในการบริหารจัดการข้อมูลอย่างปลอดภัยและมีธรรมาภิบาล ( Data Management)  นากลไกการให้ทุนรัฐบาลมาใช้สนับสนุนการสร้างและพัฒนากาลังคนด้านการวิเคราะห์และใช้ ประโยชนข์ อ้ มูลขนาดใหญท่ ง้ั ในระยะส้นั และระยะยาว  วางระบบการบริหารองค์ความรู้และเก็บรวบรวมข้อมูลการดาเนินงานเพ่ือสร้างความต่อเน่ืองในการ ดาเนินงานดว้ ย 31

ระยะยาว การต่อยอดขยายผลโดยมีเปูาหมายเพ่ือให้เกิดการแบ่งปันและสร้างประโยชน์ในทรัพยากร ข้อมูลของทุกภาคสว่ น เพ่ือการพัฒนาต่อยอดการสร้างมูลค่าเพ่ิมให้กับระบบเศรษฐกิจ สร้างความม่ันคงให้กับ สังคม และสร้างการพัฒนาท่ียั่งยืน โดยเน้นส่งเสริมสนับสนุนการพัฒนาความร่วมมือกับหุ้นส่วนภาคี (PPP) ท้ังภายในและระหว่างประเทศภายใต้เจตจานงค์ร่วมกัน โดยร่วมสร้าง Open Government Data Platform for Business and Citizen ให้ความรู้และสร้างภูมิคุ้มกันเพ่ือให้ประชาชนมีความเข้าใจที่ถูกต้องเกี่ยวกับการ ดูแลความปลอดภัยของข้อมูลส่วนบุคคล และการนาข้อมูลเปิดภาครัฐมาใช้เพื่อพัฒนาต่อยอดและการสร้าง มูลค่าเพมิ่ 5.2 เครอื ขา่ ยมหาวิทยาลยั ด้านวิทยาศาสตร์ข้อมลู ท้ังนี้เพื่อเป็นการสนับสนุนการดาเนินการตามข้อเสนอการพัฒนาบุคลากรเพ่ือการใช้ประโยชน์ข้อมูล ขนาดใหญท่ ส่ี านักงานคณะกรรมการข้าราชการพลเรอื นเสนอนน้ั กระทรวงดิจิทัลเพ่ือเศรษฐกิจและสังคมจึงได้ สรา้ งความรว่ มมือกับเครือข่ายมหาวิทยาลัยช้ันนาในประเทศไทยเพื่อวางแผนในการสร้างให้บุคลากรภาครัฐมี ทักษะในด้านการวิเคราะห์ข้อมูลและสามารถปฏิบัติงานได้อย่างเป็นรูปธรรม โดย การสร้างเครือข่าย มหาวิทยาลัยดา้ นวทิ ยาศาสตร์ขอ้ มูล (Data Science) เพอ่ื การพัฒนาบุคลากรภาครฐั ในการวเิ คราะห์และ จดั การข้อมลู ขนาดใหญ่ เครือขา่ ยมหาวิทยาลัยดังกล่าว มีวัตถุประสงค์เพื่อระดมผู้เช่ียวชาญและผู้สอนในมหาวิทยาลัยมาร่วม ออกแบบโครงสร้างกรอบหลักสูตรกลางและจัดการเรียนการสอนแบบนอกห้องเรียนให้กับเจ้าหน้าท่ีของ หน่วยงานภาครัฐ ซ่ึงกรอบหลักสูตรกลางรวมถึงเนื้อหาท่ีจาเป็น (Materials) วิธีการเรียนการสอนท่ีเหมาะสม (Pedagogy) ทักษะ/องค์ความรู้ท่ีจะได้ (Learning Outcome) และการวัดผล/ประเมินทักษะ (Asessment) โดยกรอบหลกั สตู รจะสรา้ งทกั ษะด้านวิทยาศาสตร์ข้อมูลทั้งการวิเคราะห์และจัดการข้อมูลขนาดใหญ่ โดยเน้น พัฒนาให้คนทาเป็นมากกว่ารู้เพียงแค่เรียนเร่ืองอะไรเท่านั้น ซึ่งคณะผู้สอนจากแต่ละมหาวิทยาลัยจะสามารถ ปรับเน้ือหาจากกรอบหลักสูตรกลางให้เข้ากับโจทย์ปัญหาของหน่วยงานภาครัฐแต่ละแห่งได้ตามความ เหมาะสม การเรยี นการสอนจะเปน็ เชิงปฏบิ ตั ิ (Bootcamp) โดยมีแนวทางการดาเนนิ การ ดังน้ี 1) ให้มหาวิทยาลัยเสนอกลไกการเรียนการสอนในรูปแบบปฏบิ ัติ (Bootcamp) ท่ีเหมาะสม เช่น a. Lecture โดยใช้การจัดการเรียนรู้แบบใช้ปัญหาเป็นฐาน (Problem-Based Learning) โดยจัด เนอ้ื หาให้อยู่ในบรบิ ทของงานทเ่ี กีย่ วข้องโดยตรงกบั ผู้เรียน b. การประชมุ เชงิ ปฏิบตั ิการโดยเน้นการร่วมกนั ลงมือปฏิบตั ิ (Hands-on Workshop) c. การจัดการเรียนรู้แบบใช้โครงงานเป็นฐาน (Project-Based Learning) โดยมอบหมายโครงงาน ทีอ่ ย่ใู นบรบิ ทของงานทีเ่ ก่ียวข้องโดยตรงกับผเู้ รยี น d. การอภิปรายและการสมั มนาถกปัญหาในหอ้ งเรยี น e. การนาเสนอผลงาน (Showcases) ตอนจบหลกั สตู รอยา่ งเปน็ ทางการ 32

2) แต่ละ bootcamp ดาเนินงานเป็นอิสระต่อกัน โดยอยู่ภายในกรอบของโครงสร้างหลักสูตรกลางที่ เครือขา่ ยมหาวิทยาลัยเห็นชอบ โดยแต่ละค่ายมีการออกแบบชุดองค์ความรู้และทักษะ ท่ีรวมเรียกว่า Learning Outcome ท่ีหมาะสม 3) มีการให้หนังสือรับรอง (Certificate) สาหรับแต่ละ bootcamp สาหรับผู้ที่ผ่านการทดสอบความรู้ ความเขา้ ใจและการลงมอื ปฏบิ ตั ิ 4) ผู้เรยี นสามารถสะสมผลการเรียนรู้ (Satisfied learning outcome) ในรูปแบบของ Micro-credential สาหรับใช้เป็นส่วนหนง่ึ ของการไดห้ นงั สอื รบั รองหรอื ประกาศนยี บัตร และ/หรือเพื่อใช้เป็นส่วนหนึ่งของ ปริญญาระดบั มหาบณั ฑติ ในภายหลัง ซึ่งการใช้กลไกในลักษณะนี้ เครือข่ายมหาวิทยาลัยฯ ต้องร่วมกัน แตกเน้อื หาในแต่ละหลักออกเป็นทักษะ/องค์ความรู้ย่อย (Micro-credential) ดังตัวอย่างในรูปท่ี 5.3 และออกแบบวิธีการประเมินทักษะ/องคค์ วามร้ยู ่อยให้ได้ประสิทธผิ ล สาหรับผู้สอนใช้เป็นเครื่องมือใน การประเมนิ ผล รปู ที่ 5.3 ตัวอย่างทักษะ/องค์ความร้ยู อ่ ย (Micro-credential) ท้ังนี้ การออกแบบกรอบหลักสูตรควรท่ีจะสอดคล้องกับกระบวนการการดาเนินโครงการบ๊ิกดาต้าท่ี เหมาะสม โดยขั้นตอนแรกของกระบวนการดาเนินงานดังกล่าว นักวิทยาศาสตร์ข้อมูล ผู้บริหาร และ คณะทางานด้านบิ๊กดาต้าของแต่ละกลุ่มงานจะร่วมกาหนดโจทย์ที่เหมาะสมสาหรับการนาร่อง (Project Inception) และสารวจขอ้ มลู ท่มี ีอยใู่ นปจั จุบันตามโจทยน์ ารอ่ งทก่ี าหนดเพื่อประเมินความเป็นไปได้และแปลง จากความต้องการในเชิงปัญหาให้เป็นข้อกาหนดในเชิงข้อมูลและระบบ (Problem Analysis) จากนั้น นักวิทยาศาสตร์ข้อมูลทาการศึกษาการกระจายตัวของข้อมูลและหาความสัมพันธ์ระหว่างตัวแปรโดยใช้ ตัวอย่างต้องการตัวอย่างข้อมูลจริงเพื่อระบุข้อมูลที่ต้องการเพ่ิมเติม (Exploratory Data Analysis) และ เตรีย มข้อมูลมาใช้ในการสร้ างแบบจาลองหรือโมเ ดลทางคณิต ศาสตร์เ พ่ือการทานายโดย ใช้เ ทคนิ คแล ะ อัลกอริทึมต่างๆ รวมทั้งทดสอบความแม่นยาของโมเดลคณิตศาสตร์ที่สร้างขึ้น (Predictive Analytics) และ ออกแบบวิธีการแสดงผลโดยเลือกมิติของข้อมูลที่เหมาะสมเพ่ือให้คณะทางานทดลองใ ช้และสื่อสารกับทีม ผู้บริหารและผู้ปฏิบัติ ให้สามารถนาเอาความเข้าใจดังกล่าวไปแปลงเป็นแผนการพัฒนาต่อยอด (Visualization Dashboard) จากนั้นนักพัฒนาระบบสารสนเทศจะสามารถพัฒนาโปรแกรมตามรูปแบบของ โมเดลคณิตศาสตร์ท่ีวางไว้ ตั้งค่าให้โปรแกรมให้ประมวลผลโมเดลแบบอัตโนมัติตามความถี่ที่วางแผนไว้ และ 33

ติดต้ังระบบซอฟท์แวร์เพ่ือการใช้งานจริง (Implementation and Deployment) ซ่ึงข้ันตอนต่างๆ ดังกล่าว จะตอ้ งการบคุ ลากร 3 กลุ่มอย่างชัดเจนดงั แสดงในรปู ท่ี 5.4 รูปท่ี 5.4 ขนั้ ตอนการทาโครงการบ๊กิ ดาต้า ดงั น้ัน กรอบหลกั สตู รจงึ ตอ้ งถกู ออกแบบสาหรับท้ัง 3 กลุ่มเปูาหมาย โดยตัวอย่างหลักสูตรของกลุ่มท่ี 1 ผู้ใช้ข้อมูลแสดงในรูป 5.5 ตัวอย่างกรอบหลักสูตรดังกล่าวเป็นหลักสูตร 2 วัน กระบวนการการเรียนการ สอนจะถูกแบ่งเป็นช่วงบรรยายและช่วงปฏิบัติ โดยช่วงบรรยายเน้นการสร้างความเข้าใจเรื่องบิ๊กดาต้าผ่าน กรณีศกึ ษาในบรบิ ทท่เี ก่ียวข้องกับองคก์ ร และช่วงปฏบิ ัติจะเน้นใหผ้ ู้เรียนเข้าใจและสามารถเลือกโจทย์ปัญหาท่ี เหมาะสมกับองค์กร เป็นไปตามวิสัยทัศน์ผู้บริหาร และเป็นโจทย์ท่ีสามารถดาเนินการได้อย่างเป็นรูปธรรม โดยคานึงถึงข้อมลู ทีม่ ีอยู่ ข้อมูลทีห่ าเพ่มิ เตมิ ได้ และกระบวนการทางานในปจั จุบนั รูปท่ี 5.5 ตัวอย่างกรอบหลักสูตรของกลมุ่ ผใู้ ชข้ ้อมลู (Problem Selection Workshop and Basic BI) 34

ส่วนกรอบหลักสูตรของกลุ่มท่ี 2 ผู้วิเคราะห์ข้อมูล จะมี 2 ส่วนดังแสดงในรูปที่ 5.6 และ 5.7 ซึ่งรายละเอียดและลักษณะกลไกการฝึกอบรมของตัวอย่างหลักสูตร Data Science Basic ในรูปท่ี 5.6 นั้น การฝึกอบรมเริ่มตน้ ดว้ ยการทดสอบก่อนการอบรม (Admission test) เพ่ือคัดเลือกบุคลากรที่เหมาะสมที่จะเข้า รับการอบรม การทดสอบระหว่างการอบรม (Comprehensive Test) เพ่ือทดสอบความรู้ความเข้าใจในเน้ือหา ของผรู้ ับการอบรม โดยอาจจะเป็นช่วงกลางของระยะเวลาอบรมทั้งหมด รวมท้ังการทดสอบหลังการอบรมเสร็จ สิ้นโดยผู้รับการอบรมจะได้รับการทดสอบโดยวิธีนาเสนอโครงการให้กับอาจารย์และผู้บริหารจากหน่วยงานต้น สังกัดเพื่อเป็นการประเมินด้านเทคนิคและมุมมองจากบริบทของงานที่เก่ียวข้องกับผู้รับการอบรม ซึ่งจะคล้าย กับการสอบวิทยานิพนธ์ของนักศึกษาระดับมหาบัณฑิต หลักสูตรใช้เวลาเรียน 20-30 วันทาการ ในช่วงระยะ 5-6 เดือน เนื้อหาหลักของหลกั สตู รนีจ้ ะเนน้ การปูพ้นื ฐานดา้ นการวเิ คราะหข์ อ้ มูลเชิงสถิติ การทดสอบสมมติฐาน การวเิ คราะห์ปจั จัยและเทรนด์ ผเู้ ขา้ อบรมจะไดท้ าการวิเคราะห์ข้อมูลจริงโดยใช้หลักการทางสถิติเพื่อให้ได้ผล ลัพธท์ ี่เปน็ รูปธรรม รวมทง้ั มีการอบรมเชงิ ปฏิบตั ิการโดยการทางานกบั ข้อมลู และเน้นการเข้าไปวิเคราะห์ข้อมูล จริง โดยผู้สอนจะให้คาแนะนาในการวิเคราะห์ข้อมูลในแต่ละขั้น ต้ังแต่การวิเคราะห์ปัญหา การสารวจข้อมูล การเลือกใช้วิธกี ารในการวเิ คราะห์ การสร้างแบบจาลองและการประเมินผล รวมถึงแนะนาในการนาเอาผลไป ต่อยอด ตัวอย่างเน้ือหาคือ 1) Introduction to Data Science and data analytic mindset 2) Business and data analytical thinking 3) Problem analysis (Problem statement and decomposition, Best practices and solution) 4) Exploratory data analysis (Assumption checking, Feature selection, Data visualization and Preparation) - Statistical thinking and descriptive statistics (Introduction to statistics, data sampling, biases, terms, mean, median, mode, frequency, percentile and quartile, IQR, Histogram, Boxplot) - Probability theory (Probability distribution function, cumulative distribution function) - Hypothesis testing (Null and alternative hypotheses, z-test and t-test, paired t-test, chi-square test, ANOVA, correlation) 35

Learning Outcome Examples: Being able to capture, clean, and manipulate data Being able to analyze data using basic techniques through programming interface Understand statistics for data science Understand data integration and gain basic Explore data distribution using R or Python hands-on experience (Tabular, Analyze data with data mining techniques file/documents, streaming) Being able to make decision using insights Acquire skill to program in R/Python Understand consumer behaviors Understand business analytics and data- driven decisions รูปที่ 5.1 ตัวอยา่ งกรอบหลักสูตรกลุ่มผวู้ ิเคราะหข์ ้อมูล (Data Science Basic) 5) Model building, training, validation, and evaluation (Defining test data, Evaluation strategies, Result analysis) - Linear regression (Generalized linear model, Linear regression, Poisson regression, Survival analysis) - Classification (Decision three, support vector machine, random forest) - Clustering (kNN, Hierarchical clustering, k-mean clustering) - Co-occurrence analysis (Content-based filtering, Collaborative filtering) - Performance evaluation and cost-benefit (Accuracy, ROC, RMSE, Cost- benefit) ผู้เรยี นจะสามารถตงั้ คาถามจากข้อมูล วิเคราะห์คาถาม เตรียมข้อมูล สร้างแบบจาลอง และวิเคราะห์ ผลจากแบบจาลองได้ ตัวอย่างกรอบหลักสูตรด้าน Business Intelligence แสดงในรูปท่ี 5.7 จะใช้เวลาเรียน 5-8 วันทา การ ในช่วงระยะเวลา 1-2 เดือน และตัวอย่างกรอบตัวอย่างหลักสูตรสาหรับกลุ่มผู้สร้างและพัฒนาระบบ แสดงในรูปที่ 5.8 ซึ่งต้องการเวลาเรียน 15-20 วันทาการในช่วงระยะเวลา 4-5 เดือน ท้ังน้ีการออกแบบกรอบ 36

หลกั สตู รทั้งหมดจะเป็นหนา้ ทข่ี องคณะทางานในเครือขา่ ยมหาวิทยาลัยด้านวิทยาศาสตร์ข้อมูลต่อไป ซึ่งขณะนี้ ยงั อยู่ในกระบวนการทางาน ดงั น้ันรปู ที่ 5.5-5.8 จงึ เป็นการแสดงตวั อย่างกรอบหลักสูตรเทา่ นน้ั รปู ท่ี 5.7 ตัวอยา่ งกรอบหลักสตู รกลมุ่ ผู้วเิ คราะหข์ ้อมูล (Business Intelligence Analytics) รปู ที่ 5.8 ตัวอยา่ งกรอบหลักสตู รกลมุ่ ผูส้ ร้างและพฒั นาระบบ (Data Engineering) นอกจากน้ีกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมยังมีแผนท่ีจะสร้างความร่วมมือกับสถาบันพัฒนา บุคลากรดิจิทัลภาครัฐ สานักงานพัฒนารัฐบาลดิจิทัล เพื่อเตรียมความพร้อมสาหรับระบบ E-Learning ด้าน การวิเคราะห์ข้อมูลขนาดใหญ่ในอนาคต และขณะน้ีทางกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมได้เตรียมการ 37

ดา้ นการทาบันทึกข้อตกลงร่วมกับเครือข่ายมหาวิทยาลัยในปี 2562 จานวน 14 มหาวิทยาลัย และคาดหวังว่า จะมีการขยายเครือข่ายในปีต่อๆ ไปอย่างต่อเนื่อง โดยมหาวิทยาลัยท่ีร่วมโครงการจะเสนอรายชื่อผู้สอนที่มี ความเชี่ยวชาญและมีประสบการณ์ในการทางานด้านการวิเคราะห์ข้อมูลขนาดใหญ่ เพื่อเข้าร่วมในการ ออกแบบโครงสร้างหลักสูตรกลางพร้อมจัดทาสื่อการสอนพ้ืนฐาน รวมท้ังวิธีการประเมิน ทักษะ/องค์ความรู้ ยอ่ ยตา่ งๆ โดยกระทรวงดจิ ิทลั เพือ่ เศรษฐกจิ และสงั คมจะเป็นเจ้าภาพในการบริหารจดั การ และจัดสัมมนาเร่ือง วิธีการสอนบุคลากรภาครัฐให้กับผู้สอนจากมหาวิทยาลัยในเครือข่าย รวมท้ังออกแบบวิธีการประเมินผู้สอนที่ เหมาะสม ท้ังน้ีเปูาหมายของเครือข่ายความร่วมมือดังกล่าวคือ การพัฒนาบุคลากรภาครัฐทางด้าน วิทยาศาสตร์ข้อมูล (Data Sciences) อย่างน้อย 250 คน ด้านวิศวกรข้อมูล (Data Engineering) อย่างน้อย 250 คน และด้านวิเคราะห์ธุรกรรมข้อมูล (Business Analytics) อีกอย่างน้อย 800 คน โดยวางเปูาหมายให้ สามารถเรม่ิ ดาเนินการไดใ้ นเดอื นมิถนุ ายน 2562 น้ี 38

บทท่ี 6 กรณตี วั อยา่ งการใชป้ ระโยชน์ข้อมลู หลังจากท่ีกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมได้ริเริ่มโครงการดังท่ีกล่าวในข้างต้นของเอกสาร ฉบับน้ีเพ่ือสนับสนุนให้เกิดการใช้ประโยชน์ข้อมูลในภาครัฐแล้ว ทางกระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม ยังได้วางแผนที่จะร่วมมือกับหน่วยงานภาครัฐจานวนหน่ึงในการพัฒนาระบบนาร่องการวิเคราะห์ข้อมูล ขนาดใหญใ่ นหลากหลายสาขา เช่น การส่งเสริมการทอ่ งเทยี่ ว การแพทย์และการสาธารณสุข การใช้ข้อมูลจาก ส่ือสงั คมออนไลนก์ ับการสารวจความคิดเห็น การบริหารงานจราจร การพฒั นาการศึกษา ฯลฯ เพื่อให้บุคลากร ภาครัฐได้เห็นถึงประโยชน์ของการใช้ข้อมูลประกอบการสร้างนโยบายและแผนงานในอนาคต รวมถึงการเพิ่ม ประสิทธิภาพและพฒั นาการดาเนินงานในปจั จบุ นั โดยตัวอยา่ งของกรณศี ึกษาตา่ งๆ สรุปได้ดังต่อไปนี้ 6.1 การเพิม่ ศกั ยภาพด้านการท่องเทีย่ วเมืองรอง กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคมดาเนินงานร่วมกับการท่องเที่ยวแห่งประเทศไทยและ กระทรวงการท่องเท่ียวและกีฬาในการวิเคราะห์และนาเสนอสถานท่ีท่องเที่ยวที่เหมาะสมกับนักท่องเท่ียวแต่ ละกลุ่ม ด้วยระบบการแนะนาสถานที่ท่องเที่ยวอัตโนมัติ โดยมีจุดมุ่งหมายในการเพ่ิมความพึงพอใจและ กระตุ้นการใช้จ่ายของนักท่องเที่ยว รวมถึงช่วยกระจายนักท่องเที่ยวสู่เมืองรอง (Emerging Destinations) ระบบนจี้ ะใช้ข้อมูลลักษณะและพฤตกิ รรมของนักทอ่ งเท่ยี วในภาพรวม (Demand Side) ร่วมกับข้อมูลสถานท่ี ทอ่ งเที่ยว กิจกรรมการท่องเท่ียว ฯลฯ (Supply Side) เพ่ือนามาทาการวิเคราะห์สร้างโมเดลทางคณิตศาสตร์ ท่ีสามารถให้คาแนะนาสถานท่ีท่องเท่ียวอัตโนมัติได้ และสามารถนามาสนับสนุนการท่องเที่ยวในมิติต่างๆ ได้ ด้วย เช่น การจัดทาแคมเปญโฆษณาแหล่งท่องเท่ียวในเมืองรองท่ีมีประสิทธิผล การนาเสนอแหล่งท่องเท่ียว เมืองรองใหแ้ กน่ ักทอ่ งเทย่ี ว เปน็ ต้น โดยเปาู หมายหลกั ของโจทย์นี้ คอื นักท่องเท่ียวชาวตา่ งชาติ ในภาพรวม ระบบการแนะนาสถานที่ท่องเที่ยวอัตโนมัติ ประกอบด้วยข้ันตอนหลัก 3 ขั้นตอน คือ 1) นักท่องเท่ียวคนใหม่เข้ามาใช้งานระบบ (เพื่อให้การกล่าวถึงนักท่องเที่ยวรายใหม่นี้มีความกระชับและ เข้าใจง่าย เราจะเรียกนักท่องเท่ียวคนนี้ว่า นาย ก.) ตอบคาถามสั้นๆ เพื่อให้ระบบทาความรู้จักกับนาย ก., 2) ระบบ AI คานวณหาสถานที่ท่องเที่ยวที่เหมาะสมกับลักษณะเชิงพฤติกรรมของนาย ก. และ 3) ระบบ นาเสนอสถานทที่ ่องเทยี่ วตา่ งๆ กลบั มาให้นักท่องเทย่ี ว ดงั แสดงในรปู ที่ 6.1 ระบบ AI ดังที่กล่าวไว้ข้างต้นน้ัน ประกอบด้วยองค์ประกอบหลักซ่ึงมีการสร้างจากโมเดลทาง คณติ ศาสตร์ อยู่ 3 องค์ประกอบดว้ ยกัน ดงั แสดงในรูปที่ 6.2 องค์ประกอบแรก คือ โมเดลการจัดกลุ่มนักท่องเที่ยว (Market Segmentation) ซ่ึงไม่จาเป็นจะต้อง เป็นมิติเดียวกัน เช่น กลุ่มหนึ่งชอบเท่ียวจังหวัดใกล้ๆ กัน กลุ่มหนึ่งชอบเท่ียวเน้นความโอ่อ่าหรูหรา อีกกลุ่ม หนึ่งชอบกิจกรรมผจญภัยแต่เน้นประหยัด เป็นต้น ซ่ึงวิเคราะห์ข้อมูลการจัดกลุ่มจากข้อมูลการสารวจ นักทอ่ งเที่ยว โดยการท่องเท่ยี วแหง่ ประเทศไทย ซ่ึงมกี ารสารวจนักท่องเที่ยวต่างชาติมากกว่า 120,000 คนใน เวลา 4 ปีที่ผ่านมามีการเก็บข้อมูลทั้งหมด 4 มุมมองเพ่ือใช้ในการแบ่งกลุ่มนักท่องเท่ียว คือ เชิงลักษณะ ประชากร (Demographic) เชิงภูมิศาสตร์ (Geographic) เชิงลักษณะจิตวิทยา ( Psychographic) 39

และเชงิ พฤติกรรม (Behavioral) ซง่ึ สามารถจัดกลุ่มนักท่องเท่ียวจากข้อมูลเหล่าน้ีด้วยเทคนิควิธีการวิเคราะห์ จดั กลมุ่ (Clustering Analysis) รปู ท่ี 6.1 ภาพรวมของระบบการแนะนาสถานท่ีท่องเท่ยี วอัตโนมตั ิในมุมมองของผใู้ ช้งาน รูปท่ี 6.2 องค์ประกอบในการสร้างระบบการแนะนาสถานที่ท่องเที่ยวอัตโนมตั ิ องคป์ ระกอบท่ีสอง คอื โมเดลคานวณค้นหาสถานทท่ี อ่ งเทีย่ ว (Recommender System) จากกลุ่มท่ี เราคานวณด้วยข้อมูลนักท่องเที่ยวในอดีตจากองค์ประกอบท่ีหน่ึง ระบบสามารถหากลุ่มท่ีใกล้เคียงกับนาย ก. มากทส่ี ุด และใชก้ ลุ่มนกั ท่องเทยี่ วนี้ เพือ่ ค้นหาสถานทที่ ่องเทยี่ วทเ่ี หมาะสม โดยจะมีการอ้างอิงกับข้อมูลขนาด ใหญ่อีกแหล่งหนึ่ง คือ TripAdvisor ซ่ึงเป็นแหล่งร่วมข้อมูลการให้คะแนนสถานที่ท่องเท่ียวเขียนโดย นักท่องเที่ยวจานวนหลายล้านคนจากทั่วโลก ข้อมูลคะแนนดังกล่าวจะช่วยให้ระบบ AI นาเสนอสถานท่ี ท่องเท่ียวที่มีแนวโน้มจะสร้างความพึงพอใจให้กับนักท่องเท่ียวรายใหม่ (นาย ก.) มากท่ีสุด โดยอ้างอิงกับ ลักษณะกลมุ่ นักทอ่ งเท่ียวทนี่ าย ก. ได้รบั การจาแนกจากองคป์ ระกอบแรก 40


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook