วชิ าเทคโนโลยดี จิ ทิ อล เพื่อ การจดั การอาชีพ 30001-2003 รหัส DIGITAL TECHNOLOGY FOR WORKS ความรพู ื้นฐาน การจัดการขอ มูลขนาดใหญ
ความหมายของ Big Data หมายถึง การนาํ ขอมูลจํานวนมหาศาลทไี่ ดจ ากการใหบริการมาวเิ คราะห เพื่อหาโอกาส ทางธุรกจิ ใชป ระกอบการตัดสนิ ใจในเรื่องสําคญั ๆ ท้ังการพฒั นาดานการขายและการตลาด การปรบั ปรุงสินคา บรกิ ารใหต รงกับความตอ งการผบู ริโภคยคุ ใหม
องคประกอบทส่ี าํ คัญของขอมูล - Device/Data Source ( แหล่งทมี่ าของข้อมูล) เป็นแหล่งกาํ เนิดของขอ้ มูลอาจจะเป็นระบบ โปรแกรม หรือ จะเป็นมนุษยท์ ่ีทาํ ใหเ้ กิดขอ้ มูล ข้ึนมา มกั จะมาจากแหล่งขอ้ มูลท่ีหลากหลาย ซ่ึงมี ความยากลาํ บากในการจดั การโครงสร้างหรือจดั เตรียมใหข้ อ้ มูลที่นาํ มารวมกนั น้นั มี ความพร้อมใชต้ ่อไป - Gateway (ช่องทางการเชื่อมโยงข้อมูล) การออกแบบช่องทางการเชื่อมโยงขอ้ มูลไดอ้ ยา่ งสมบูรณ์ แบบจาํ เป็นตอ้ งทราบก่อนวา่ จะนาํ ขอ้ มูลใดไปทาํ อะไรต่อบา้ ง มิเช่นน้นั การสร้างช่อง ทางการเช่ือมที่ไม่มีเป้าหมายกอ็ าจจะเป็นการเสียเวลาโดยเปล่าประโยชน์
- Storage (แหล่งเกบ็ ข้อมูล) แหล่งเกบ็ ขอ้ มูลน้ีไม่ใช่การเกบ็ ขอ้ มูลจากแหล่งขอ้ มูลเพียงอยา่ ง เดียวแต่เป็นการเกบ็ ขอ้ มูลจากแหล่งขอ้ มูลหลายๆแหล่ง เอามาไวเ้ พ่ือรอการใชง้ าน - Analytics (การวิเคราะห์ขอ้ มูล) เป็นหนา้ ที่หลกั ของ Data Scientist แบ่งงานออกเป็น 2 ลกั ษณะ คือ การวเิ คราะห์เบ้ืองตน้ ใชว้ ธิ ีทางสถิติ หรือจะเป็นการวิเคราะห์เชิง ลึกโดยการสร้าง model แบบต่างๆ การเรียนรู้ของเคร่ืองจกั ร เพื่อใหไ้ ดผ้ ลลพั ธ์ เฉพาะเจาะจงในแต่ละปัญหาและแต่ละชุดขอ้ มูล - Report/Action (การใชผ้ ลการวิเคราะห์ขอ้ มูล) ผลลพั ธ์ที่ไดจ้ าการวิเคราะห์สามารถนาํ ไปใช้ งานได้ 2 รูปแบบ คือ ออกเป็นรายงาน เพือ่ ให้ Data Analyst นาํ ผลลพั ธท์ ี่ได้ ไปใชง้ านกบั ทางธุรกิจต่อไปเป็นการนาํ ไปกระทาํ เลยโดยที่ไม่ตอ้ งมี มนุษย์ คอยตรวจสอบ
The Six Vs of Big Data Big Data ที่มีคุณภาพสูงควรมีลกั ษณะพ้นื ฐาน 6 ประการ ดงั น้ี ปริมาณ ความเร็ว ความถกู ตอ ง คุณคา Volume Velocity Veracity Value ความหลากหลาย ความแปรผนั ได Variety Variability
ววิ ฒั นาการของ Big Data ตน้ กาํ เนิดของชุดขอ้ มูลขนาดใหญ่ไดม้ ีการริเริ่มสร้างมาต้งั แต่ยคุ 60 และในยคุ 70 โลกของขอ้ มูลกไ็ ดเ้ ร่ิมตน้ และไดพ้ ฒั นาศูนยข์ อ้ มูลแห่งแรกข้ึน และมีการพฒั นาฐานขอ้ มูลเชิงสมั พนั ธ์ข้ึนมา ปี ค.ศ 2005 เริ่มมีการนึกถึงขอ้ มูลปริมาณมากท่ีผคู้ นไดส้ ร้างข้ึนมาผา่ นส่ือออนไลน์ เช่น เฟซบุ๊ก (facebook) ยทู ูบ(Youtube) และส่ือสงั คมออนไลนแ์ บบอ่ืนๆ โดยมีโปรแกรม Hadoop ท่ีเป็นโอเพนซอร์ สเฟรมเวริ ์กท่ีถูกสร้างข้ึนมาในช่วงเวลาเดียวกนั ใหเ้ ป็นที่เกบ็ และวเิ คราะห์ขอ้ มูลขนาดใหญ่ พฒั นาการของ IoT (Internet of Things) เป็นเครื่องมืออุปกรณ์ท่ีเชื่อมต่อกบั อินเทอร์เน็ตไดเ้ กบ็ และ รวบรวมขอ้ มูลซ่ึงอาจเป็นเร่ืองที่เก่ียวกบั พฤติกรรมการใชง้ านของลูกคา้ ประสิทธิภาพของสินคา้ หรือการเรียนรู้ของ เครื่องจกั ร สิ่งเหลา่ น้ีลว้ นทาํ ใหม้ ีขอ้ มูลขนาดใหญ่ แมว้ า่ ยคุ ของขอ้ มูลขนาดใหญ่ Big Data มาถึงและไดเ้ ริ่มตน้ แลว้ แตก่ ย็ งั เป็นเพียงช่วงแรกๆ และระบบ คลาวดค์ อมพวิ ติง กไ็ ดข้ ยายความเป็นไปไดม้ ากข้ึน คลาวดม์ ีความสามารถในการใชง้ านไดอ้ ยา่ งยดื หยนุ่
รูปแบบของขอ มลู Big Data - ขอมลู เชงิ พฤตกิ รรม เชน เซิรฟ เวอรล็อก การคลิกเขา มาดขู อ มลู ทางเวบ็ ไซต - ขอ มูลภาพและเสยี ง เชน วิดิโอ รูปภาพ เสยี งทถี่ ูกบันทกึ ไว - ขอมูลขอ ความ เชน การสง ขอ มลู ทางขอความ - ขอ มลู ทีถ่ กู บนั ทึกไว เชน ขอมูลทางการแพทย ขอ มลู ท่ไี ดจ ากการสาํ รวจ - ขอ มลู เซนเซอร เชน ขอมลู ทางภมู ิศาสตร ขอ มูลอุณหภูมิตา งๆ
การจัดการขอ มูลขนาดใหญ (Big Data) กาํ หนดกลยุทธเก่ียวกับขอมูลขนาดใหญ กลยทุ ธข อมูลขนาดใหญอ อกแบบมาเพื่อชว ยในการกาํ กับดูแลและปรบั ปรุงวิธที ีไ่ ดร ับ จดั เกบ็ จดั การ แบงปน และใชข อมลู ภายในและภายนอกองคก รเดยี วกัน รูแหลงท่ีมาของขอมูลขนาดใหญ กระแสขอ มูลมาจาก Internet of Things และอุปกรณทเ่ี ช่ือมตอ อ่นื ๆ ทีไ่ หลเขา สรู ะบบไอทีจากอุปกรณสวมใส อปุ กรณท างการแพทย อุปกรณอ ุตสาหกรรม และอน่ื ๆ
การเขาถึง จัดการ และจัดเก็บขอมูลขนาดใหญ ระบบคอมพิวเตอรสมัยใหมมีความเร็ว จาํ เปนในการเขาถึงขอมูลจํานวนมาก ประเภทของขอมูลขนาดใหญไดอยางรวดเร็ว นอกเหนือจากการเขาถึงที่เชื่อถือไดแลว ยังตองมีวิธีการรวมขอมูล รับประกันคุณภาพ จัดระเบียบขอมูลและการจัดเก็บ การวิเคราะหขอมูลขนาดใหญ เทคโนโลยีท่ีมีประสิทธิภาพสูง การวิเคราะห สามารถเลือกท่ีจะใชขอมูลขนาดใหญท้ังหมดนํามาวิเคราะหไดแตไมวาจะใชวิธีใด การวิเคราะห ไดรับมูลคา ขอมูลเชิงลึกจากขอมูลปจจุบันซึ่งเปนขอมูลขนาดใหญ ตัดสินใจอยางชาญฉลาดและใชขอมูลชวย ขอมูลที่ไดรับการจัดการ มีความนาเชื่อถือนาํ ไปสูการวิเคราะหท่ีนาเช่ือถือ การตัดสินใจที่นาเช่ือถือ เพ่ือใหสามารถแขงขันได จาํ เปนตองรับประโยชนสูงสุดและดาํ เนินงานบนพื้นฐานขอมูล และตองมีการขับเคลื่อนดวยขอมูลที่มีประโยชนชัดเจน
การนาํ Big Data ไปใชประโยชนในดานตางๆ ในปจจุบันน้ี มีการนํา Big Data มาใชในภาครัฐ เพ่ือแกไขปญหาความเดือนรอนและลดความเลื่อมลา้ํ ผานกระบวนการวิเคราะหเชื่อมโยงเพ่ือตอบโจทยการใหบริการของภาครัฐ นอกจากนั้น ภาคเอกชนไดนําขอมูล Big Data มาใชประโยชน เพื่อกระดับธุรกิจ ดวยการพัฒนา เทคโนโลยีแช็ตบอตท่ีสามารถรับมือกับความตองการขอมูลของลูกคาท่ีติดตอเขามาจาํ นวนมาก ไดอยางมี ประสิทธิภาพ รวดเร็ว ฉับไว พรอมใหบริการตลอด 24 ช่ัวโมง
Search
Read the Text Version
- 1 - 10
Pages: