Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore งานเจวคอมpdf

งานเจวคอมpdf

Published by cirwrrn033, 2020-12-14 18:01:57

Description: งานเจวคอมpdf

Search

Read the Text Version

แผนผงั ความคิด (Mind Mapping) ความรู้พ้ืนฐานการจดั การขอ้ มูลขนาดใหญ่ (Big Data) ความหมายของ Big Data กำรนำ Big Data ไปใช้ประโยชน์ในด้ำนต่ำงๆ องค์ประกอบทส่ี ำคญั ของข้อมูล กระบวนกำรจำก Big Data สู่ควำมสัมพนั ธ์ของข้อมูล กำรจดั ทำ Big Data ลกั ษณะทสี่ ำคญั ของ Big Data ตวั อย่ำงกำรนำ Big Data ววิ ฒั นำกำรของ Big Data ตวั อย่ำงแบรนด์ต่ำงๆ ทใี่ ช้ Big Data ในกำรวเิ ครำะห์ข้อมูล รูปแบบของข้อมูล Big Data กำรจดั กำรข้อมูลขนำดใหญ่ (Big Data)



1. ควำมหมำยของ Big Dada การนาขอ้ มูลจานวนมหาศาลจากการใหบ้ ริการมาวเิ คราะห์ เพื่อหาโอกาสทางธุรกิจใชป้ ระกอบการ ตดั สินใจในเรื่องสาคญั ๆ ท้งั การพฒั นาดา้ นการขายและการตลาด การปรับปรุงสินคา้ บริการใหต้ รวกบั ความ ตอ้ งการของผบู้ ริโภคยคุ ใหม่ท่ีเปลี่ยนแปลงอยา่ งรวดเร็ว รวมถึงภาคการผลิตที่นาขอ้ มูล Big Data มาใชใ้ นการ วเิ คราะห์เพือ่ เพ่ิมผลิตภาพหรือค่าเฉลี่ยของประสิทธิภาพการผลิต (productivity) ในกระบวนการผลลิตและการ ดาเนินงาน Big Data เป็นขอ้ มูลท่ีมีโครงสร้างชดั เจน เช่น ขอ้ มูลที่เกบ็ อยใู่ นตารางขอ้ มูลและฐานขอ้ มูลต่างๆ ปกติ โดยทวั่ ไป หรืออาจเป็นขอ้ มูลก่ึงโครงสร้าง เช่น ลอ็ กไฟล์ หรือแมก้ ระทงั่ ขอ้ มูลท่ีไม่มีโครงสร้าง เช่น ขอ้ มูลการ โตต้ อบไลน์ หรือไฟลจ์ าพวกมีเดีย และขอ้ มูลท่ีใชใ้ นการเซนเซอร์ เช่น การตรวจจบั ความเร็ว แตท่ ้งั หมดน้ีกย็ งั คง เป็นขอ้ มูลดิบที่รอการนามาประมวลและวเิ คราะห์ เพ่อื นาผลท่ีไดม้ าสร้างขอ้ มูลธุรกิจ ขอ้ มูลเหลา้ น้ีอาจไม่ดอ้ ยใู่ น รูปแบบที่องคก์ รสามารถนาไปใชไ้ ดท้ นั ที แต่อาจมีขอ้ มูลที่เป็นประโยชน์ต่อองคก์ รบางอยา่ งแฝงอยู่

2.องคป์ ระกอบท่ีสำคญั ของ ขอ้ มลู 2.1 Device/Data source (แหลง่ ที่มาของขอ้ มูล) ซ่ึงถือไดว้ า่ เป็นตน้ น้าเป็นแหล่งกาเนิดขอ้ มูลอาจเป็น ระบบ โปรแกรม หรือจะเป็นมนุษยท์ ่ีทาใหเ้ กิดขอ้ มูลข้ึนมา ท้งั น้ี เมื่อไดช้ ื่อวา่ เป็นBig Dataแลว้ ขอ้ มูล ตา่ งๆ มกั จะมาจากแหล่งขอ้ มูลที่หลากหลาย ซ่ึงมีความความยากลาบากในการจดั การโครงสร้างหรือจดั เตรีมขอ้ มูลท่ีนามารวมกนั น้นั มีความพร้อมใชต้ ่อไป 2.2 Gateway (ช่องทางการเช่ือมโยงขอ้ มุล) การเชื่อมโยงขอ้ มูล เป็นส่วนที่สาคญั มาก และเป็นปัญหาใหญ่ในการทา Big Data project ตอ้ งอาศยั ทกั ษะของData Engineer ท้งั การเขียน โปรแกรมเองและใชเ้ ครื่องมือที่มีอยมู่ ากมาย ท้งั น้ี การจะ ออกแบบช่องทางการเช่ือมโยงขอ้ มูลไดอ้ ยา่ งสมบูรณ์แบบ จาเป็นตอ้ งทราบก่อนวา่ จะนาขอ้ มูลไปทาอะไรต่อบา้ ง

2.3 storage (แหล่งเกบ็ ขอ้ มูล) แหล่วเกบ็ ขอ้ มูลน้ีไม่ใช่การเกบ็ ขอ้ มุลจากแหล่งขอ้ มุลเพียงอยา่ งเดียวแต่เป้น การเกบ็ ขอ้ มุลจากแหล่งขอ้ มูลหลายๆแหล่ง เอามาไวเ้ พื่อรอการใชง้ าน ซ่ึงอาจจะเป็นท่ีพกั ขอ้ มูลใหพ้ ร้อมใช้ หรือจะเป็นแหล่งเกบ็ ขอ้ มุลในอดีตกเ็ ป็นได้ 2.4 Analytics (การวเิ คราะห์ขอ้ มูล) ส่วนที่เป็นหนา้ ท่ีหลกั ของ Data scientistซ่ึงแบ่งงานออกเป็น2ลกั ษณะ คือการวิเคราะห์เบ้ืองตน้ โดยการใชว้ ิธีทางสถิติ หรือจะเป็ นการวิเคราะห์เชิงลึกโดยการสร้างmodelแบบ ตา่ งๆรวมไปถึงการใช้ Machine learning การเรียนรู้ของเครื่องจกั ร 2.5 Report/Action (การใชผ้ ลการวเิ คราะห์ขอ้ มูล) ผลลพั ธืท่ีไดจ้ ากการวเิ คราะห์สามารถนาไปใชง้ านได2้ รูปแบบ คือ ออกแบบรายงาน เพ่ือให้นาผลลพั ธ์ท่ีไดไ้ ปใชก้ บั งานทางธุรกิจต่อไป หรือจะเป็ นการนาไป กระทาเลยโดยท่ีไม่ตอ้ งมี มนุษย์ คอยตรวจสอบ ซ่ึงจาเป็ นตอ้ งมีการเขียนโปรแกรมเพ่ิมเพื่อให้มีการระทา ออกไป

3.ลกั ษณะท่ีสำคญั ของ Big Data Big Data มีคุณลกั ษณะสาคญั 6 อยา่ ง คือ 3.1 ปริมาณ (volume) หมายถึง ขอ้ มูลตอ้ งมีขนาดใหญ่มาก ซ่ึงไม่สามารถประมวลผลผลิตปริมาณของขอ้ มูล ดว้ ยระบบฐานขอ้ มูลได้ จาเป็ นตอ้ งใชค้ ลงั ขอ้ มูล และชิฟต์แวร์ฮาดูป ทางานประสานกนั ในการบริหารขอ้ มูล ปริมาณขอ้ มุล ปริมาณขอ้ มูลท่ีมากจึงเป็นปัจจยั ท่ีมีความสาคญั ในปริมาณขอ้ มูลมากมายมหาศาล 3.2 ความหลากหลาย (VARIETY) หมายถึง ความหลากหลายของชนิดขอ้ มูล อาจเป็นขอ้ มูลที่มีโครงสร้าง และ ก่ึงมีโครงสร้างต้งั แต่ขอ้ มุลแบบด้งั เดิมไปจนเอกสาร ขอ้ ความ อีเมล รูปภาพ เท่าน้นั ขอ้ มูลในสมยั ก่อนมจั ะเป็น ขอ้ มุลที่เป็ นโครงสร้างและความพอดีกบั ฐานขอ้ มูลเชิงปัจจุบนั ขอ้ มูลมีขนาดใหญ่ข้ึนและเป็ นขอ้ มุลแบบไม่มี โครงสร้างหรือก่ึงโครงสร้าง เช่น ขอ้ มุลแบบตวั อกั ษร ขอ้ มูลภาพ ขอ้ มูลเสียง ซ่ึงตอ้ งการประมวลผลเพ่ิมเติม เพ่อื ที่จะแปลความหมาย หารายละเอียดอธิบายของขอ้ มูล

3.3 ความเร็ว (velocity) หมายถึง ขอ้ มูลดงั กล่าวตอ้ งมีอตั ราการเพ่ิมข้ึนอยา่ งรวดเร็ว เช่น ขอ้ มลู จากภาพถ่าย โทรศพั ท์ท่ีถูกอปั โหลดข้ึน ขอ้ มุลการพิมพส์ นทนา ขอ้ มุลวิดีโอ รวมไปถึงขอ้ มูลการส่ังซ้ือสินคา้ โดยขอ้ มุล ท้งั หมดลว้ นเป็นขอ้ มุลท้งั หมดลว้ นเป็นขอ้ มูลท่ีมีการเพิม่ ข้ึนตลอดเวลาไม่สิ้นสุด 3.4 ความถูกตอ้ ง (veracity) เป็นขอ้ มูลท่ีมีความคลุมเครือ มีความไม่แน่นอน เน่ืองจากขอ้ มูลมีความหลากหลาย และมาจากแหล่งต่างๆ เช่น เฟซบุ๊ก (facebook) ทวิตเตอร์ (twitter) และยูทูบ (youtube) ซ่ึงเป็ นสิ่งที่สามารถ ควบคุมคุณภาพของขอ้ มูลไดย้ าก 3.5 คุณภาพ (value) หมายถึง ขอ้ มูลมีประโยชน์และมีความสัมพนั ธ์ในเชิงธุรกิจ ซ่ึงอาจจะไม่ใช่ทุกขอ้ มูลที่จะมี ประโยชน์ในการเก็บและวิเคราะห์ ขอ้ มูลที่มีประโยชน์จะตอ้ งเก่ียวขอ้ งกบั วตั ถุประสงค์ทางธรุ กิจ ขอ้ มูลที่มี ประโยชน์ท่ีสุดน่าจะเป็นขอ้ มูลผลิตภณั ฑข์ องคูแ่ ข่ง 3.6 ความแปรผนั ได้ (variability) หมายถึง เป็นเร่ืองความไม่เขา้ กนั ของขอ้ มูลท่ีสามารถเกิดข้ึนไดต้ ลอดเวลา ซ่ึง อาจจะก่อใหเ้ กิดปัญหาได้ ดงั น้นั จาเป็นตอ้ งมีกระบรวนการเพื่อนดกั จบั และแกไ้ ขใหท้ นั ทว่ งที



4.ววิ ฒั นำกำรของ Big Data ถึงแมว้ า่ แนวคิดเร่ืองขอ้ มูลขนาดใหญ่หรือBig Data จะเป็นเร่ืองใหม่และเร่ิมทากนั ในไม่กี่ปี มาน้ีแต่ตน้ กาเนิดของชุดขอ้ มูลขนาดใหญ่ไดม้ ีการริเริ่มสร้างมาต้งั แตย่ คุ 60 และยคุ 70 โลกของขอ้ มุลกไ็ ดเ้ ริ่มตน้ ไดพ้ ฒั นา ศูนยขื อ้ มูลแห่งแรกข้ึน และมีการพฒั นาฐานขอ้ มูลเชิงสมั พนั ธ์ข้ึนมา ประมาณปี ค.ศ 2005 เริ่มมีการตระหนกั ถึงขอ้ มูลปริมาณมากท่ีผคุ้ นไดส้ ร้างข้ึนมาผา่ นส่ือออนไลน์เช่น เฟซบุค้ facebook ยทู ูบ youtube และส่ือออนไลนืแบบอ่ืนๆ โดยมีโปรแกรม Hadoop ท่ีเป็นโอเพนซอร์สเฟรม เวริ ์กที่ถูกสร้างข้ึนมาในช่วงเวลาเดียวกนั ใหเ้ ป็นที่เกบ็ และวเิ คราะห์ขอ้ มุลขนาดใหญ่ และในช่วงเวลาเดียวกนั NoSQLเร่ิมข้ึนและไดร้ ับความนิยมมากข้ึน การพฒั นาโอเพนซอร์สเฟรมเวิร์ก เช่น Hadoop มีความสาคญั ต่อการเติมโตของขอ้ มูลขนาดใหญ่ เนื่องจากทาใหข้ อ้ มุลขนาดใหญ่ ทางานไดง้ ่ายและประหยดั กวา่ ในช่วงหลายปี ที่ผา่ นมาปริมาณขอ้ มูลขนาดใหญ่ ไดเ้ พม่ิ ข้ึนอยา่ งรวดเร็ว ผคู้ นยงั คงสร้างขอ้ มูลจานวนมาก ซ่ึงไม่ใช่แค่มนุษยท์ ี่สร้างข้ึนมา



ข้อมุลเชงิ พฤตกิ รรม ข้อมูลภาพและเสยี ง รูปแบบของข้อมุล Big Data ข้อมูลข้อความ ข้อมลู เซนเซอร์ ข้อมูลทถี่ กู บนั ทกึ ไว้

• 6. กำรจดั กำรข้อมูลขนำดใหญ่ • 6.1 กาหนดกลยทุ ธ์ิเกี่ยวกบั ขอ้ มูล ขนาดใหญ่ • ในระดบั สูง กลยทุ ธข์ อ้ มูลขนาดใหญ่เป็นแผนที่ ออกแบบมาช่วยในการกากบั ดูแลและปรับปรุงวิธีที่ ไดร้ ับ จดั เกบ็ จดั การ แบ่งปัน และใชข้ อ้ มูลภายใน และภายนอกองคก์ รเดียวกนั กลยทุ ธข์ อ้ มูลขนาดใหญ่ ช่วยสร้างหนทางไปสู่ความสาเร็จทางธุรกิจ ขอ้ มุลที่มี ปริมาณจานวนมาก เม่ือพฒั นากลยทุ ธ์ ส่ิงสาคญั คือ ตอ้ งพิจารณาเป้าหมายทางธุรกิจ • 6.2 รู้แหล่งที่มาขอ้ มูลขนาดใหญ่ • กระแสขอ้ มูลมาจากinternet of things และอุปกรณ์ที่เชื่อมตอ่ อ่ืนๆ ท่ีไหลเขา้ สู่ระบบไอทีจาก อุปกรณ์ท่ีสวมใส่ รถยนตอ์ จั ฉริยะ อุปกรณ์ทาง การแพทย์ อุปกรณ์อุตสาหกรรม และอ่ืนๆ ซ่ึง สามารถวิเคราะห์ขอ้ มูลขนาดใหญ่น้ีได้ รวมถึง ตดั สินใจเลือกขอ้ มูลที่จะเกบ็ หรือไม่เกบ็ และขอ้ มูลใด ท่ีตอ้ งมีการวเิ คราะห์เพ่ิมเติม

6.3 กำรเข้ำถึง กำรจัดกำร และจัดเกบ็ ข้อมูลขนำดใหญ่ ระบบคอมพวิ เตอร์สมยั ใหม่มีความรวดเร็วและความ ยดื หยนุ่ ท่ีจาเป็นในการเขา้ ถึงขอ้ มูลจานวนมากและประเภทของ ขอ้ มูลขนาดใหญ่ไดอ้ ยา่ งรวดเร็วนอกเหนือจากการเขา้ ถึงท่ีเช่ือถือได้ แลว้ ยงั ตอ้ งมีวธิ ีในการรวบรวมขอ้ มูล รับประกนั คุณภาพของขอ้ มูล การจดั ระเบียบขอ้ มูลและการจดั เกบ็ 6.4 กำรวเิ ครำะห์ข้อมูลขนำดใหญ่ 6.5 ตัดสินใจอย่ำงชำญฉลำดและใช้ข้อมูลช่วย ดว้ ยเทคโนโลยที ี่มีประสิทธิภาพสูง การวเิ คราะห์ ขอ้ มูลที่ไดร้ ับการจดั การและมีความน่าเชอ่ื ถือ ในหน่วยความจา องคก์ รต่างๆจึงสามารถเลือกที่จะใชข้ อ้ มูล นาไปสู่การวเิ คราะห์ที่น่าเช่ือถือและการตดั สินใจท่ีน่าเช่ืถือ ขนาดใหญท่ ้งั หมดแลว้ นามาวเิ คราะห์ไดแ้ ต่ไม่วา่ จะใชว้ ธิ ีใด เพื่อใหส้ ามารถแข่งขนั ได้ ธุรกิจต่างๆ จาเป็นตอ้ งไดร้ ับ การวเิ คราะห์ขอ้ มุลเป็นวธิ ีที่บริษทั ต่างๆ ไดร้ ับมูลค่าและขอ้ ประโยชน์สูงสุดจากขอ้ มูลขนาดใหญ่ และดาเนินงานบน มุลเชิงลึกจากขอ้ มุลปัจจุบนั ซ่ึงเป็นขอ้ มูลขนาดใหญ่ พ้นื ฐานขอ้ มุล ตดั สินใจบนพ้ืนฐานหลกั ฐานท่ีนาเสนอโดย ขอ้ มูลขนาดใหญ่

7.กำรนำBig Data ไปใช้ประโยชน์ในด้ำนต่ำงๆ ในปัจจุบนั นม้ ีการนามาใชใ้ นภาครัฐ เพื่อแกไ้ ขปัญหาความเดือดร้อนและลดความเหล่ือมล้าโดยนา ขอ้ มูลในระบบราชการจากหลายหน่วยงาน เช่น ขอ้ มูลสาธารณสุข ทะเบียนราษฎร์ ที่ต้งั ของธุรกิจ โรงพยาบาล สถานบาบดั สถานการณ์จา้ งแรงงาน มาวเิ คราะห์ปละโจทยเ์ ชื่อมโยงกนั เกิดเป็นขอ้ มูลขนาด ใหญ่ของภาครัฐ ผา่ นกระบวนการวเิ คราะห์เชื่อมโยงเพ่ือตอบโจทยก์ ารใหบ้ ริการของภาครัฐ การฝึกอาชีพเพ่ือเพมิ่ รายไดใ้ หก้ บั ผมู้ ีรายไดน้ อ้ ย พร้อมท้งั จบั คู่กบั แหล่งงานท่ีอยใู่ กลเ้ คียงกบั ที่พหั อาศยั อีกท้งั ยงี ติดตามและเสนอโอกาสฝึกอาชีพใหม่ๆ เพมิ่ เติม เพือ่ ใหม้ ีรายไดท้ ่ีสูงข้ึนและพฒั นาคุณภาพ ชีวิตใหด้ ีข้ึน ซ่ึงถา้ วิเคาะห์ดูจะเห็นวา่ ขอ้ มูลจานวนมากเกิดการบูรณาการและวเิ คาะห์ เพอื่ ใชส้ าหรับการตดั สินใจในการใหบ้ ริการของภาครัฐไดต้ รงกลุ่มเป้าหมาย โดยในปัจจุบนั น้ีจะ เห็นไดจ้ ากการใชบ้ ตั รประชาชนเพยี งบตั รเดียวกส็ ามารถเขา้ ถึงบริการภาครัฐไดม้ ากข้ึน



8.กระบวนกำรจำก Big Data สู่ควำมสัมพนั ธ์ของข้อมูล Storage กำรรวบรวมข้อมูลมำจัดเกบ็ การรวบรวมขอ้ มูลจากแหล่งต่างๆ ท้งั ขอ้ มูลที่มีคุณภาพ ขอ้ มูลท่ีคาดวา่ จะมี ประโยชน/์ ไม่ครบถว้ นขอ้ มูลรูปภาพ วดิ ีโอ Processing กำรประมวลผล เม่ือขอ้ มูลต่างๆ ถูกนามารวมกนั ไวใ้ นท่ีเดียวแลว้ จะถูกนาไปจกั หมวดหมู่ ขอ้ มูลท่ีมีความเกี่ยวขอ้ งสมั พนั ธ์กนั ใหผ้ ลคลา้ ยคลึงกนั Analyst กำรวเิ ครำะห์และนำเสนอ จากน้นั ขอ้ มูลมากมายท้งั หมดท่ีถูกจดั เรียงและในหลลายมิติจะถูกนามา วเิ คราะห์หารูปแบบของขอ้ มูลท่ีมองไม่เห็นดว้ ยตาปล่า

9.วธิ ีกำรจัดทำ Big Data -ต้งั เป้าหมายถึงสิ่งเลก็ ไวก้ ่อน ในช่วงเริ่มตน้ ไม่จาเป็นตอ้ งต้งั เป้าหมายใหญท่ ่ีสุด แต่ต้งั เป้าหมายเลก็ ๆไวก้ ่อนเพ่ือที่จะไดด้ ูวา่ ตนเองตอ้ งการท่ีจะรู้เร่ืองอะไร เพ่อื แกป้ ัญหาสิ่งใด -วางแผนรวบรวมขอ้ มูลจากแหล่งท่ีมีอยุ่ ขอ้ มูลที่ไดจ้ ากกิจกรรมท่ีเกิดข้ึนทางหนา้ ร้าน หลงั ร้านมีอะไรบา้ ง ใหว้ างแผนการรวบรวมขอ้ มูลนอกจากน้นั การรู้จกั หา ขอ้ มูลจากแหล่งอื่นบนสื่อสงั สมออนไลน์ -จบั ตาความเคล่ือนไหวและเขา้ ใจแหล่งที่มาของขอ้ มูล ใชส้ ื่อสงั คมออนไลน์ที่มีอยใู่ หเ้ กิดประโยชน์ เรียนรู้สิ่งที่เกิดข้ึนรอบตวั ท้งั ลูกคา้ คู่แข่งขนั หรือประเดน็ ที่คนส่วนใหญ่กาลงั พดู ถึงส่ิงเหล่าน้ีวา่ เป็นอยา่ งไร เกี่ยวขอ้ งหรือไม่อยา่ งไหร่กบั ธุรกิจของตน -ฝึกหาความสมั พนั ืของขอ้ มูล นาขอ้ มูลทางตรงและทางออ้ มมาลองหาความสมั พนั ธ์ท่ีอาจจะเกิดข้ึนกบั ธุรกิจ ยง่ิ เริ่มเร็วไดเ้ ท่าไหร่ยงิ่ ดี -จาลองขอ้ มูลข้ึนมา เพือ่ ใหเ้ ขา้ ใจขอ้ มูลไดม้ ากยงิ่ ข้ึน และเห็นขอ้ มูลวา่ จะนาขอ้ มูลไปใชใ้ นแนวทางใด ระหวา่ งน้นั กค็ ่อยๆ พฒั นาไปเร่ือยๆ

10.กำรเรียนรู้ของเครื่องจกั ร (Machine Learning) การเรียนรู้ของ เคร่ืองจกั ร กาลงั เป็นท่ีนิยมอยู่ ในขณะน้ี ขอ้ มูลโดยเฉพาะ อยา่ งยงิ่ ขอ้ มูลขนาดใหญ่เป็น เหตุผลท่ีมนุษยส์ ามารถสอน เคร่ืองจกั รได้ การมรขอ้ มูล ขนาดใหญท่ าใหง้ ่ายในการ เตรียมขอ้ มูลในนการสอน เคร่ืองจกั ร ใหส้ ามารถเรียนรู้ ได้

10.ตัวอย่างแบรนดต์ า่ งๆทใี่ ช้ Big Data ในการวเิ คราะหข์ ้อมูล McDonald’s Netflix ร้านอาหารจานด่วนท่ีเป็นท่ีนิยมระดบั โลก ใช้ แบรนดใ์ หญ่ท่ีใชB้ ig Data ในการวเิ คราะห์ เทคโนโลยที ่ีทนั สมยั หลายๆอยา่ ง ดา้ นการ กลุม่ เป้าหมายในการนาส่งโฆษณา ดว้ ยสมาชิก ประกอบธุรกิจ มากกวา่ 100ลา้ นราย


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook