Important Announcement
PubHTML5 Scheduled Server Maintenance on (GMT) Sunday, June 26th, 2:00 am - 8:00 am.
PubHTML5 site will be inoperative during the times indicated!

Home Explore big data1

big data1

Published by Xnichakringklab, 2020-12-14 17:11:16

Description: big data1

Search

Read the Text Version

ความหมายของ Big Data Big Data Big Data หมายถึง การนาข้อมูลจานวนมหาศาลที่ ได้จากการ ให้บริการมาวิเคราะห์ เพื่อหาโอกาสทางธุรกิจ ใช้ประกอบการ ตัดสินใจในเรื่องสาคัญ ๆ ท้ังการพัฒนา ด้านการขายและ การตลาด การปรับปรุงสินค้าบริการให้ ตรงกับความต้องการของ ผ้บู รโิ ภคยุคใหม่ทเ่ี ปลี่ยนแปลง อย่างรวดเรว็ รวมถึงภาคการผลิตท่ี นาข้อมูล Big Data ไปใช้ในการวิเคราะห์เพ่ือเพิ่มผลิตภาพหรือ ค่าเฉลี่ย ของประสิทธิภาพการผลิต (Productivity) ใน กระบวนการ ผลติ และการดาเนนิ งาน

Big Data เป็นข้อมูลท่ีมีโครงสร้างชัดเจน (Structured Data) เช่น ข้อมูลที่เก็บอยู่ในตารางข้อมูล และ ฐานข้อมูลต่าง ๆ ปกติโดยไป หรืออาจเป็นข้อมูลกึ่งมีโครงสร้าง (Semi-Structured Data) เซน่ ล็อกไฟล์ (Log Files) หรือแม้กระท่ังข้อมูลท่ีไม่มีโครงสร้าง (Unstructured Data) เช่น ข้อมูลการโต้ตอบ ปฏิสัมพันธ์ผ่านสังคมเครือข่าย (Social Network) เช่น เฟซบุ๊ก (Facebook) ทวิตเตอร์ (Twitter) ไลน์ (Line) หรือไฟล์จาพวกมีเดีย (Media) และข้อมูลท่ีใช้การเซนเซอร์ เซน่ การตรวจจับความเร็ว ฯลฯ ซ่ึง อาจเป็นข้อมูลภายในองค์กรและภายนอกท่ีมาจากการคิดต่อระหว่างองค์กร หรือจากทุกช่องทางการ ติดต่อ กับลูกค้า แต่ทั้งหมดนี้ก็ยังคงเป็นเพียงข้อมูลดิบท่ีรอการนามาประมวลและวิเคราะหเ์ พื่อนาผลที่ได้ มาสรา้ งมลู คา่ ทางธุรกจิ ขอ้ มูลหลน่ ้ีอาจไม่ไดอ้ ยู่ในรูปแบบท่ีองค์กรสามารถนาไปใช้ได้ทันที แต่อาจมีข้อมูล ทเ่ี ป็นประโยชน์ต่อองค์กรบางอยา่ งแฝงอยู่

องคป์ ระกอบทส่ี าคัญของข้อมูล องคป์ ระกอบของ Big Data จะประกอบด้วยส่วนสาคัญตา่ ง ๆ ดังน้ี 2.1 Device/Data source (แหล่งท่ีมาของข้อมูล) ซ่งึ ถือได้ว่าเป็นต้นน้า เป็นแหล่งกาเนิดของข้อมูลอาจเป็น ระบบ โปรแกรม หรือจะเป็นมนุษย์ที่ทาให้เกิดข้อมูลข้ึนมา ท้ังนี้ เมื่อได้ชื่อว่าเป็น Big Data แล้วข้อมูลต่าง ๆ มักจะมาจากแหล่งข้อมูลที่หลากหลาย ซึ่งมีความยากลาบากในการจัดการโครงสร้างหรือ จัดเตรียมให้ข้อมูลท่ี นามารวมกันนั้นมีความพรอ้ มใช้ต่อไป 2.2 Gateway (ช่องทางการเชื่อมโยงข้อมูล) การเชื่อมโยงข้อมูลเป็น ส่วนท่ีสาคัญมาก และเป็นปัญหาใหญ่ในการทา Big Data Project ต้อง อาศัยทักษะของ Data Engineer ท้ังการเขียนโปรแกรมเอง และใช้ เคร่ืองมือที่มีอย่มู ากมาย ท้ังน้ี การจะออกแบบช่องทาง การเช่ือมโยงข้อมูล ได้อย่างสมบูรณ์แบบจาเป็นต้องทราบ ก่อนว่าจะนาข้อมูลใดไปทาอะไรต่อ บ้าง มเิ ชน่ นน้ั การสรา้ งช่องทางการเชอ่ื มท่ไี มม่ เี ปา้ หมายก็อาจเปน็ การ องค์ประกอบของ Big Data เสยี เวลาโดยเปลา่ ประโยชน์

2.3 Storage (แหล่งเก็บข้อมูล) แหล่งเก็บข้อมูลน้ีไม่ใช่การเก็บข้อมูลจากแหล่งข้อมูลเพียงอยา่ งเดียว แต่ เป็นการก็บข้อมูลจากแหลง่ ขอ้ มูลหลาย ๆ แหล่ง เอามาไวเ้ พือ่ รอการใชง้ าน ซ่ึงอาจจะเป็นท่ีพักข้อมูล ให้พร้อม ใช้ หรือจะเปน็ แหล่งกบ็ ข้อมลู ในอดีดก็เปน็ ได้ 2.4 Analytics (การวิเคราะห์ข้อมูล) ส่วนน้ีเป็นหน้าที่หลักของ Data Scientist ซ่งึ แบ่งงานออกเป็น 2 ลกั ษณะ คือ การวิเคราะหเ์ บือ้ งตน้ โดยการใช้วธิ ีทางสถิติ หรือจะเปน็ การวเิ คราะห์เชิงลึกโดยการสร้าง Model แบบต่างๆ รวมไปถึงการใช้ Machine Learning การเรียนรู้ของเคร่ืองจักร โดยเครื่องจักรในที่นี้ หมายถึง Program Computer เพือ่ ใหไ้ ด้ผลลพั ธ์เฉพาะเจาะจงในแต่ละปญั หาและแต่ละชดุ ข้อมลู 2.5 Repot/Action (การใช้ผลการวิเคราะหข์ ้อมูล) ผลลัพธ์ท่ีใดจากการวิเคราะหส์ ามารถนาไปใช้งาน ได้ 2 รปู แบบ คอื ออกเปน็ รายงาน เพื่อให้ Data Analyst นาผลลัพธ์ที่ได้ไปใช้กับงานทางธุรกิจต่อไป หรือจะเป็น การนาไปกระทาเลยโดยที่ไม่ต้องมี “มนุษย์” คอยตรวจสอบ ซึ่งจาเป็นต้องมีการเขียนโปรแกรมเพิ่ม เพ่ือให้มี การกระทาออกไป ที่เรยี กว่า Artificial Intelligence : AI (ปญั ญาประดิษฐ)์

ลักษณะท่สี าคญั ของ Big Data Big Data มคี ณุ ลกั ษณะสาคญั อยู่ 6 อย่าง คือ 3.1 ปริมาณ (Volume) หมายถึง ข้อมูลนั้นต้องมีขนาดใหญ่มาก ซึ่งไม่สามารถประมวลผลปริมาณของ ขอ้ มูลดว้ ยระบบฐานขอ้ มลู ได้ จาเป็นต้องใช้คลังข้อมูล (Data Warehouse) และซอฟต์แวร์ฮาดูป (Hadoop) ทางานประสานกันในการบริหารจัดการข้อมูล ปริมาณข้อมูลที่มากจึงเป็นปัจจัยที่มีความสาคัญ ในปริมาณ ข้อมูลมากมายมหาศาล ส่วนท่ีจะต้องประมวลผลเป็นข้อมูลท่ีไม่มีโครงสร้าง มีความหนาแน่น ของข้อมูลต่า และข้อมูลพวกนี้อาจเป็นข้อมูลท่ีไม่ทราบค่า เช่น ฟีดข้อมูลของเฟซบุ๊ก (Facebook) ทวิตเตอร์ (Twitter) ไลน์ (Line) การคลิกบนเว็บไซต์หรืออุปกรณ์แอปพลิเคชันต่าง ๆ หรืออุปกรณ์ท่ีมี เชนซอร์ บางองค์กรอาจมี ข้อมูลให้ประมวลผลเป็นสิบ ๆ เทระไบต์ (Terabyte : TB) หรือบางองค์กร อาจมีเป็นหลายร้อยเพตะไบต์ (Petabyte : PB)

The Six Vs of Big Data 3.2 ความหลากหลาย (Variety) หมายถึง ความ หลากหลายของชนิดข้อมูล อาจเป็นข้อมูลที่มี โครงสร้าง ไม่มีโครงสร้าง และก่ึงมีโครงร้าง ตั้งแต่ของข้อมูลแบบ ดั้งเดิมไปจนถึงเอกสาร ข้อความ อีเมล วิดีโอ เสียง ข้อมูล หุ้น และธุรกรรมทางการเงิน ซ่ึงไม่ได้จากัดเพียงข้อความ อีเมล รูปภาพ ฯลฯ เท่านั้น ข้อมูลในสมัยก่อนมักจะเป็น ข้อมูลท่ีเป็นโครงสร้างและมีความพอดีกับฐานข้อมูลเชิง สัมพันธ์ ปัจจุบันข้อมูลมีขนาดใหญ่ขึ้นและเป็นข้อมูลแบบ ไม่มีโครงสร้างหรือกึ่งโครงสร้าง เช่น ข้อมูลแบบตัวอักษร ข้อมูลภาพ ข้อมูลเสียง ซึ่งต้องการการประมวลผลเพ่ิมเติม เพ่ือทจ่ี ะแปลความหมาย และหารายละเอียดคาอธิบายของ ขอ้ มลู (Meta Data)

3.3 ความเร็ว (Velocity) หมายถึง ข้อมูลดังกล่าวต้องมีอัตราการเพิ่มขึ้นอย่างรวดเร็ว เช่น ข้อมูล จาก ภาพถ่ายโทรศัพท์ที่ถูกอัปโหลดขึ้น ข้อมูลการพิมพ์สนทนา ข้อมูลวิดีโอ รวมไปถึงข้อมูลการส่ังซื้อสินค้า โดย ขอ้ มูลท้ังหมดล้วนเป็นข้อมูลที่มีการเพ่ิมขึ้นตลอดเวลาแบบไม่ส้ินสุด เรียกว่า เป็นการประมวลผแบบเรียลไทม์ (Real-Time) โดยการเติบโตของ Internet of Things ขอ้ มลู จะถกู ส่งไปยังธุรกจิ ต่าง ๆ 3.4 ความถูกต้อง (Veraciy) เป็นข้อมูลที่มีความคลุมเครือ มีความไม่แน่นอน เนื่องจากข้อมูลมีความ หลากหลายและมาจากแหล่งต่าง ๆ เช่น เฟซบุ๊ก (Facebook) ทวิตเตอร์ (Twitter) และยูทูบ (Youtube) ซึง่ เป็นส่ิงทส่ี ามารถควบคุมคุณภพของข้อมูลได้ยาก ข้อมูลท่ีมีคุณภาพน้ันจะต้องถูกต้องแม่นยาและเชื่อถือได้ ถ้า ขอ้ มลู ไร้คุณภาพก็จะสง่ ผลตอ่ การวิเคราะห์ต่อไป 3.5 คณุ ค่า (Value) หมายถงึ ข้อมลู มีประโยชนแ์ ละมีความสัมพนั ธใ์ นเชิงธุรกิจ ซ่ึงอาจจะไม่ใช่ ทุกข้อมูลท่ี จะมปี ระโยชน์ในการเก็บและวคิ ราะห์ ข้อมูลทม่ี ีประโยชนจ์ ะต้องเก่ยี วขอ้ งกบั วัตถปุ ระสงคท์ างธรุ กิจ 3.6 ความแปรผันได้ (Variability) หมายถึง เป็นเรื่องความไม่เข้ากันของข้อมูลที่สามารถเกิดข้ึนได้ ตลอดเวลา ซง่ึ อาจจะก่อให้เกิดปัญหาได้ ดังนนั้ จาเป็นตอ้ งมกี ระบวนการเพื่อดักจบั และแก้ไขใหท้ ันทว่ งที

วิวัฒนาการของ Big Data ถึงแม้ว่าแนวคิดเรื่องข้อมูลขนาดใหญ่หรือ Big Data จะเป็นเร่ืองใหม่และเร่ิมทากันในไม่กี่ปีมาน้ี แต่ต้น กาเนิดของชุดข้อมูลขนาดใหญ่ได้มีการริเริ่มสร้างมาต้ังแต่ยุค 60 และในยุค 70 โลกของข้อมูลก็ได้ เริ่มต้นและ ได้พฒั นาศนู ย์ขอ้ มลู แห่งแรกข้ึน และมีการพฒั นาฐานข้อมูลเชงิ สัมพันธ์ขน้ึ มา ประมาณ ค.ศ. 2005 เร่ิมมีการตระหนักถึงข้อมูลปริมาณมากท่ีผู้คนได้สร้างข้ึนมาผ่านส่ือออนไลน์ เช่น เฟ ซบุ๊ก (Facebook) ยทู ูบ (Youtube) และ สื่อสังคมออนไลน์แบบอื่น ๆ โดยมีโปรแกรม Hadoop ที่เป็นโอเพน เซอร์สเฟรมเวิร์กท่ีถูกสร้างข้ึนมาในช่วงเวลาเดียวกัน ให้เป็นที่เก็บและวิเคราะห์ข้อมูลขนาดใหญ่ และในช่วง เวลาเดยี วกัน NoSQL เริ่มข้ึนและไดร้ บั ความนยิ มมากขึ้น การพัฒนาโอเพนซอร์สเฟรมเวิร์ก เช่น Hadoop (และเมื่อเร็ว ๆ นี้ก็มี Spark) มีความสาคัญต่อการเติบโต ของข้อมูลขนาดใหญ่ เน่ืองจากทาให้ข้อมูลขนาดใหญ่ ทางานได้ง่ายและประหยัดกว่า ในช่วงหลายปีท่ีผ่านมา ปรมิ าณขอ้ มูลขนาดใหญไ่ ดเ้ พมิ่ ขน้ึ อยา่ งรวดเร็ว ผู้คนยงั คงสรา้ งข้อมลู จานวนมาก ซงึ่ ไม่ใชแ่ คม่ นุษย์ทส่ี ร้างขึ้นมา

รปู แบบของข้อมลู Big Data Big Data มีรูปแบบของข้อมูล ดังน้ี 5.1 ข้อมูลเชงิ พฤติกรรม เชน่ เซิรฟ์ เวอรล์ ็อก การคลิกเขา้ มาดูขอ้ มลู ทางเวบ็ ไซต์ การเขา้ มาใช้ บัตร ATM ในการกดเงนิ 5.2 ขอ้ มูลภาพและเสยี ง เช่น วดิ ีโอ รูปภาพ เสียงทถ่ี กู บนั ทึกไว้ 5.3 ขอ้ มูลข้อความ เช่น การส่งข้อมูลทางขอ้ ความ 5.4 ขอ้ มูลทีถ่ กู บันทึกไว้ เชน่ ขอ้ มูลทางการแพทย์ ข้อมลู ทไี่ ด้จากการสารวจ ข้อมูลทางภาษี 5.5 ขอ้ มลู เซนเซอร์ เชน่ ข้อมูลทางภมู ิตาสตร์ ข้อมูลอณุ หภมู ิตา่ ง ๆ ข้อมลู การตรวจจับความเรว็

การจัดการข้อมูลขนาดใหญ่ (Big Data) กอ่ นท่ีธรุ กิจจะสามารถนา Big Data มาใชง้ านได้ ควรพจิ ารณาว่าข้อมูลจะไหลเวียนไปยังสถานท่ี แหล่งที่มา ระบบ เจ้าของ และผู้ใช้จานวนมากได้อย่างไร มีข้ันตอนสาคัญในการจัดการ \"โครงสร้างข้อมูล\" ขนาดใหญ่นี้ ซึ่งรวมถงึ ข้อมูลแบบต้ังเดิม ขอ้ มลู ทม่ี โี ครงสร้าง และข้อมลู ทไี่ มม่ โี ครงสรา้ งและกง่ึ มโี ครงสรา้ ง ดงั น้ี 6.1 กาหนดกลยุทธ์เก่ียวกับข้อมูลขนาดใหญ่ กลยุทธ์ข้อมูลขนาดใหญ่ ช่วยสร้างหนทางไปสู่ตวามสาเร็จทางธุรกิจ ข้อมูลที่มีปริมาณจานวนมาก เม่ือพัฒนากลยุทธ์ สิ่งสาคัญ คือ ต้องพิจารณาเป้าหมายทางธรุกิจและ เทคโนโลยีในปัจจุบันและอนาคต และโครงการริเริ่มการปฏิบัติกับ ข้อมูล ขนาดใหญ่มีความจาเปน็ 6.2 รู้แหล่งที่มาของข้อมูลขนาดใหญ่ กระแสข้อมูลมาจาก Internet of Things (IoT) และอุปกรณ์ท่ีเชื่อมต่ออื่น ๆ ที่ไหลเข้าสู่ระบบไอที่จาก Internet of things (IoT) อุปกรณ์สวมใส่ รถยนต์อัจฉริยะ อุปกรณ์ทางการแพทย์ อุปกรณ์ อุตสาหกรรม และอ่นื ๆ

6.3 การเข้าถึง จัดการ และจัดเก็บข้อมูลขนาดใหญ่ ระบบคอมพิวเตอร์สมัยใหม่มีความเร็วและความ ยืดหยุ่นท่จี าเป็นในการเขา้ ถงึ ข้อมลู จานวนมาก และประเภทของข้อมูลขนาดใหญ่ได้อยา่ งรวดเร็ว นอกเหนือจาก การเข้าถึงท่ีเชื่อถือได้แล้ว บริษัทต่าง ๆ ยังต้องมีวิธีในการรวมข้อมูล รับประกันคุณภาพของข้อมูล การจัด ระเบียบข้อมูลและการจัดเก็บ และการเตรียมข้อมูลสาหรับการวิเคราะห์ ข้อมูลบางอย่างอาจถูกจัดเก็บใน สถานที่ในคลงั ข้อมลู แบบดัง้ เดิม 6.4 การวิเคราะห์ข้อมูลขนาดใหญ่ ด้วยเทคโนโลยีที่มี ประสิทธิภาพสูง เช่น Grid Computing (การประมวลผล แบบกริด) หรือ การวิเคราะห์ในหน่วยความจา องค์กรต่าง ๆ จึงสามารถเลอื กที่จะใช้ขอ้ มลู ขนาดใหญ่ท้ังหมด 6.5 ตัดสินใจอย่างชาญฉลาดและใช้ข้อมูลช่วย ข้อมูลท่ีรับ การจัดการและมีความน่าเช่ือถือนาไปสู่การวิเคราะห์ท่ี น่าเชือ่ ถอื และการตดั สนิ ใจที่นา่ เชื่อถือ เพ่ือให้สามารถแขง่ ขนั ได้ Hadoop

การนา Big Data ไปใชป้ ระโยชนใ์ นดา้ นตา่ ง ๆ ในปัจจบุ นั นี้ มกี ารนา Big Data มาใชใ้ นภาครัฐ เพ่ือแกป้ ัญหาความเดือดร้อนและลดความเหลื่อมล้า โดยนา ข้อมูลในระบบราชการจากหลายหนว่ ยงาน เช่น ข้อมูลสาธารณสุข ทะเบียนราษฎร์ ท่ีตั้งของธุรกิจ โรพยาบาล สถานบาบดั สถานการณจ์ ้างแรงงาน มาวิเคราะหแ์ ละโจทยเ์ ชื่อมโยงกนั เกดิ เปน็ ข้อมูลขนาดใหญ่ Big Data ของภาครัฐ ผ่านกระบวนการวิเคราะห์เช่ือมโยงเพ่ือตอบ โจทย์การให้บริการของภาครฐั ตัวอย่างเช่น รัฐบาลต้องการ ช่วยเหลือผู้มีรายได้น้อย แต่แทนที่จะช่วยเหลือโดยให้เงิน อุดหนุนท่ีเท่า ๆ กันแบบปูพรม ก็นา Big Data ซึ่งเป็น ข้อมูลจากแหล่งต่าง ๆ มาใช้ช้ีจาเพาะว่าบุคคลใดท่ีถือว่ามี รายได้น้อยพร้อมท้ังกาหนดระดับและลักษณะความ ชว่ ยเหลอื ท่ีแตกตา่ งกัน ข้อมลู ผ้ทู ่ีมอี ายุระหวา่ ง 15 ปี ถึง 60 ปี ระหวา่ งปี ค.ศ. 2010-2040

การฝึกอาชีพเพื่อเพิ่มรายได้ให้กับผู้มีรายได้น้อย พร้อมทั้งจับคู่กับแหล่งงานท่ีอยู่ใกล้เคียงกับท่ีพักอาศัย อกี ทงั้ ยังติดตามและเสนอโอกาสฝกึ อาชีพใหม่ ๆ เพ่ิมเติม เพื่อให้มีรายได้ที่สูงข้ึนและพัฒนาคุณภาพชีวิตให้ ตีขึ้น ซึ่งถ้าวิเคราะห์ดูจะเห็นว่า ข้อมูลจานวนมากเกิดการบูรณาการและวิเคราะห์ เพ่ือใช้สาหรับการ ตัดสนิ ใจในการให้บริกรของภาครฐั ไดต้ รงกลุม่ เป้าหมาย Big Data สาหรับภาคเอกชนท่ีนามาใช้ประโยชน์ เช่น เว็บไซต์อี-คอมเมิร์ซ ท่ีจัดเก็บข้อมูลพฤติกรรม การซื้อสินคา้ ของลูกคา้ อย่างตอ่ เนอื่ ง และมีระบบท่ีทาหน้าที่คัดเลือกสินค้าอ่ืน ๆ ท่ีคาดว่าลูกค้าจะต้องการ เพม่ิ เติม แล้วนาเสนอขึ้นมาให้โดยอัตโนมัติบนหน้าเว็บไซต์อี-ตอมเมิร์ซของลูกค้ารายนั้น ๆ ทั้งน้ี ลูกค้า แต่ ละคนไม่จาเป็นต้องนาเสนอสินค้าเดียวกัน จากการสังเกตพฤติกรรมการซื้อสินค้าพบว่าภาคเอกชนจะมี การเก็บข้อมูล ช่ือ ที่อยู่ เพศ เช้ือชาติ อายุ ประวัติการซื้อสินค้า ชนิดสินค้า เวลาที่ซื้อ มูลค่าสินค้า นามา วิเคราะห์จับคู่กับสินค้าอื่นที่ศักยภาพ ท้ังน้ี เง่ือนไขหรือสูตรการจับคู่อาจแตกต่างกันไปตามกลุ่มลูกค้าหรือ ประชากรในแตล่ ะประเทศ หรอื ตามกลมุ่ สังคมหรอื วัฒนธรรม

นอกจากนั้น ภาคเอกชนได้นาข้อมูล Big Data มาใช้ปะโยชน์ เพ่ือยกระดับธุรกิจ ด้วยการพัฒนา เทคโนโลยีแช็ตบอต (Chatbot) ที่สมารถรับมือกับความต้องการข้อมูลของลูกค้าท่ีติดต่อเข้ามาจานวน มาก ผ่าน Messaging Application ได้อยา่ งมีประสิทธิภาพ รวดเร็ว ฉับไว พร้อมใหบ้ ริการตลอด 24 ชว่ั โมง และนี่คอื จุดเปลีย่ นสาคญั ของการใหบ้ รกิ ารทจี่ ะเขา้ มาใช้งานแทนคน (Agent) แม้วา่ เรือ่ งราวของ Big Data จะมีความซบั ซ้อนหรือมีอุปสรรคต่าง ๆ ไม่ว่าจะเป็นอุปสรรคในระหว่าง การนาไปประยุกต์งาน ไปจนถึงการปรับกระบวนการทางานใหม่ เพ่ือให้เอื้อต่อการจัดเก็บข้อมูล จึง จาเปน็ ทีจ่ ะต้องปรบั นโยบายรัฐหรือเอกชนใหส้ อดคล้องกบั การทา Big Data ด้วยเปน็ อย่างมาก

กระบวนการจาก Big Data ส่คู วามสัมพันธ์ของขอ้ มลู กระบวนการจาก Big Data สูค่ วามสัมพันธข์ องขอ้ มูล มดี ังนี้ 8.1 Storage : การรวบรวมข้อมูลมาจัดเก็บ การรวบรวมข้อมูลจากแหล่งต่าง ๆ ทั้งข้อมูลที่มีคุณภาพ ขอ้ มูลท่ีคาดว่าจะมีประโยชน์ไมค่ รบถ้วน ขอ้ มลู รปู ภาพ วดิ โี อ ไฟลเ์ สยี งท้งั หลาย ถกู สง่ มาจัดเกบ็ ท่ีถังขอ้ มูล 8.2 Processing : การประมวลผล เม่ือข้อมูลต่าง ๆ ถูกนามารวมกันไว้ในที่เดียวแล้ว จะถูกนาไปจัด หมวดหม่ขู ้อมูลที่มีความเก่ียวขอ้ งสมั พันธ์กัน ใหผ้ ลคลา้ ยคลงึ กัน แลว้ นามาเปล่ยี นเปน็ รูปแบบข้อมูลเพ่ือนาเข้า ระบบคลังข้อมูลท่ผี า่ น การประมวลผลแลว้ 8.3 Analyst : การวิเคราะห์และนาเสนอ จากนั้นข้อมูลมากมายทั้งหมดที่ถูกจัดเรียงแล้วในหลายมิติจะถูก นามาวิเคราะห์หารูปแบบ ของข้อมูลท่ีมองไม่เห็นด้วยตาเปล่า เช่น หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หา แนวโน้มการตลาด แนวโน้มความชอบของลูกค้า และข้อมูลอ่ืน ๆ ที่เป็นประโยชน์ทางธุรกิจ และถูกนาเสนอ ออกมาในรปู แบบที่เข้าใจง่าย ผา่ นทางสถติ ิ กราฟ หรือรูปภาพ

วธิ กี ารจดั ทา Big Data 9.1 ต้ังเป้าหมายถึงสิ่งเล็กไว้ก่อน ช่วงเริ่มต้นไม่จาเป็นต้องตั้งเป้าหมายใหญ่ที่สุด แต่การต้ังเป้าหมายเล็ก ๆ ไว้กอ่ นเพ่ือทจ่ี ะได้ดูว่าตนเองต้องการที่จะรูเ้ รื่องอะไร เพอื่ แกป้ ัญหาส่งิ ใด 9.2 วางแผนรวบรวมขอ้ มูลจากแหลง่ ทม่ี ีอยู่ ขอ้ มูลที่ได้จากกิกรรมทเี่ กิดข้นึ ท้ังหนา้ ร้าน หลังร้านมีอะไรบ้าง ให้วางแผนการรวบรวมข้อมูลนอกจากน้ัน การจักหาข้อมูลจากแหล่งอ่ืนบนส่ือสังคมออนไลน์ เช่น แนวโน้ม ความนิยมจาก Google Trends หรือการใช้ keyword ท่ีเกี่ยวข้องกับธุรกิจของตนเพื่อดูว่าคนพูดถึงสิ่งที่ ตอ้ งการด้วยคาวา่ อะไรบา้ ง 9.3 จับตาความเคลื่อนไหวและเข้าใจแหล่งท่ีมาของข้อมูล ใช้ส่ือสังคมออนไลน์ท่ีมีอยู่ให้เกิดประโยชน์ เรียนสิ่งท่ีเกิดขึ้นรอบตัว ท้ังลูกค้า คู่แข่งขัน หรือ ประเด็นที่คนส่วนใหญ่กาลังพูดถึงสิ่งเหล่าน้ันว่าเป็นอย่างไร เกยี่ วขอ้ งหรือไม่อย่างไรกับธุรกจิ ของตน

9.4 ฝึกหาความสัมพันธ์ของข้อมูล นาข้อมูลทางตรงและทางอ้อมมาลองหาความสัมพันธ์ท่ีอาจเกิด ข้ึนกับธุรกิจ ยิ่งเร่ิมเร็วได้เท่าไรย่ิงดี ในแต่ละขั้นตอนของการดาเนินงาน มีส่วนใดท่ีหากปรับการทางาน แล้วจะได้ข้อมูลท่ีคิดว่าตอ้ งการอย่างแทจ้ รงิ 9.5 จาลองข้อมูลขึน้ มา เพ่ือให้เขา้ ใจขอ้ มลู ทีม่ อี ยู่ให้มากยิ่งขน้ึ และเหน็ ภาพรวมว่าจะนาข้อมูลไปใช้ใน แนวทางใด ระหว่างน้ันก็คอ่ ย ๆ พฒั นาไปเร่อื ย ๆ 9.6 แยกผลลัพธ์และข้อมูลรบกวนออกจากข้อมูลขนาดใหญ่ เม่ือได้ผลลัพธ์แล้วให้ลองแยกข้อมูล ส่วนเกินออกจากข้อมูลส่วนใหญ่ แล้วสนใจเพียงแค่ข้อมูลเชิงลึกท่ีนาไปใช้ต่อได้จริง ทดลองนาข้อมูลเชิง ลึกท่ีได้เข้าไปใช้งานในกระบวนการทาธุรกิจ ถ้าไม่มีผลลัพธ์อะไรเกิดขึ้นให้เลิกสนไข้อมูลส่วนนี้ แล้ว ตั้งเป้าหมายและวางใหมอ่ ีกคร้ัง

ตัวอย่างการนา Big Data ไปใช้ NETFLIX 10.1 การพัฒนาผลิตภัณฑ์ บริษัท Netflix และ บริษัท Procter & Gamble ได้ใช้ข้อมูล Big Data ช่วยในการ คาดการณ์ ความต้องการของลูกค้า โดยการสร้างโมเดลเชิง คาดการณ์สาหรับผลิตภัณฑ์และบริการใหม่ ๆ โดยการจาแนก คุณลักษณะที่สาคัญของผลิตภัณฑ์หรือบริการในอดีต และ ปัจจุบัน แล้วสร้างแบบจาลองความสัมพันธ์ระหว่าง คุณลักษณะ เหล่านี้กับความสาเร็จในเชิงพาณิชย์ของ ข้อเสนอ นอกจากนี้ บริษัท P&G ยังใช้ข้อมูลของ สื่อสังคมออนไลน์ในการวิเคราะห์ การทดสอบตลาด และเปิดตัวสินค้าในช่วงต้น เพ่ือวางแผนการ ผลิตและ เปิดตัวสินค้าใหม่

10.2 การคาดการณ์เพ่ือการบารุงรักษาเคร่ืองจักร ปัจจัยท่ีใช้ทานายการชารุดของเคร่ืองจักรน้ี มาจาก ข้อมูลทั้งท่ีเป็นแบบมีโครงสร้าง เช่น วัน เดือน ปี ท่ีผลิต รุ่นและข้อมูลที่ไม่มีโครงสร้าง เช่น ข้อมูลจาก เซนเซอรต์ า่ ง ๆ 10.3 สร้างประสบการณ์ที่ดีให้กับลูกค้า ในสภาวะการแข่งขันทางการค้าในปัจจุบัน การเสนอ ประสบการณ์และข้อเสนอท่ีดีที่สุดและตรงใจต่อลูกค้าท่ีสุดก็จะเป็นผู้ได้เปรียบในการแข่งขัน ข้อมูลขนาดใหญ่ หรอื Big Data ช่วยให้ธุรกิจรวบรวมขอ้ มูลจาก สือ่ สงั คมออนไลน์ ขอ้ มลู การสนทนา ผา่ นส่ือต่าง ๆ เพ่ือช่วยให้ ปรับปรุงการสอ่ื สารกับลูกค้า และเพิม่ มลู คา่ ให้ได้มากทสี่ ุดด้วยการส่งขอ้ เสนอ สุดพเิ ศษให้ตรงใจกบั ลกู 10.4 การตรวจสอบการโกงและการปฏิบัติดามกฎระเบียบ การโกงในระบบเครือข่ายอินเทอร์เน็ตไม่ได้มี เฉพาะจากแฮ็กเกอร์เท่านั้น แต่จะต้องเผชิญกับ ผู้เชี่ยวชญในหลาย ๆ รูปแบบ ในระบบการรักษาความ ปลอดภยั สมยั ไหมนีไ้ ด้มีการพฒั นาอย่างไมห่ ยุดน่งิ การใชข้ ้อมลู ขนาดใหญ่สามารถทาให้ระบุรูปแบบของข้อมูล ที่เข้ามาในรูปทมี่ ชิ อบและไม่ถูกตอ้ งตามขอ้ กาหนดเองได้

10.5 การเรียนรู้ของเครื่องจักร (Machine Learning) การ เรียนรู้ของเครื่องจักร หรือ Machine Learning กาลังเป็นที่นิยมอยู่ ในขณะนี้ ข้อมูลโดยเฉพาะอย่างยิ่งข้อมูลขนาดใหญ่เป็นเหตุผลท่ี มนษุ ย์ สามารถสอนเคร่อื งจักรได้ 10.6 ประสิทธิภาพในการปฏิบัติงาน โดยปกติประสิทธิภาพใน ก า ร ป ฏิ บั ติ ง า น จ ะ ไ ม่ ส า ม า ร ถ ท ร า บ ว่ า ก า ร ด า เ นิ น ง า น นั้ น มี Machine Learning ประสทิ ธิภาพเพยี งใด แต่ในพน้ื ท่ที ีม่ ีขอ้ มูลขนาดใหญ่ ด้วยขอ้ มลู ขนาดใหญน่ ีท้ าให้สามารถวเิ คราะหแ์ ละเขา้ ถึงการผลติ หรือการปฏบิ ตั ิงานได้ 10.7 การขับเคลื่อนในการสร้างสรรค์ส่ิงใหม่ ๆ ข้อมูลขนาดใหญ่สามารถช่วยในการสร้างสรรค์สิ่งใหม่ ๆ ได้ โดยการศกึ ษาความสัมพนั ธ์ระหวา่ งบุคคล สถาบนั หน่วยงาน องค์กรและกระบวนการ

ตวั อยา่ งแบรนดต์ า่ ง ๆ ท่ใี ช้ Big Data ในการวเิ คราะห์ข้อมลู 11.1 การใช้ข้อมูลในการดึงดูดแลรักษลูกค้า ลูกค้า คือ ทรัพย์สินที่สาคัญที่สุดท่ีต้องใส่ใจ ไม่มี ธุรกิจใดที่ สามารถประสบความสาเร็จได้โดยปราศจากการสร้างฐานลูกค้าที่แข็งแรง อย่างไรก็ตาม ต่อให้มีฐานลูกค้าที่ แขง็ แรง แตห่ ากละเลยทจ่ี ะศึกษาวา่ จริง ๆ แลว้ ลกู ค้าตอ้ งการสง่ิ ใด นาเสนอแต่สิ่งที่ \"ลกู ค้า ไม่ตอ้ งการ\" ในทสี่ ดุ ก็ จะทาใหส้ ูญเสยี ลูกค้าไป และส่ิงน้จี ะเป็นอุปสรรคตอ่ เสน้ ทางสคู่ วามสาเร็จ Mc Donald's ตัวอย่างธุรกิจที่ใช้ข้อมูลในการดูแลและดึงดูดลูกค้า Mc Donal's ร้านอาหารจานด่วนที่เป็น ท่ีนิยมระดับโลก ใช้ เทคโนโลยีที่ทันสมัยในหลาย ๆ ด้านของการประกอบธุรกิจ รวมถึงการใช้ข้อมูล ในการดูแลลูกค้าผ่านแอปพลิเคชัน โทรศัพท์คลื่อนที่ ท่ีช่วยให้ลูกค้าสามารถสั่งซื้อและชาระเงิน เกือบทกุ ขั้นตอนผ่านอปุ กรณ์โทรศัพทค์ ลื่อนที่

11.2 การใช้ข้อมูลเพื่อแก้ไขปัญหาผู้โฆษณาและเสนอข้อมูลเชิงลึกทางการตลาด การวิเคราะห์ BigData สามารถช่วยจับคู่ระหว่างความคาดหวังของลูกค้ากับธุรกิจได้ ซึ่งรวมถึงการเปล่ียนสายผลิตภัณฑ์ ของธุรกิจให้ ตอบโจทย์ความต้องการลูกค้ามากข้ึน และม่ันใจได้ว่าการทาแคมเปญการตลาดและ การโฆษณานั้นมี ประสิทธิภาพมากขึ้น ซึง่ ในความเป็นจริงน้นั หลายธรุ กจิ ได้สูญเสียเงินไปจานวนมาก Netflix ตัวอยา่ งแบรนด์ท่ีใช้ข้อมูลสาหรับกาหนดเป้าหมายในการทา โฆษณา Netflix เป็นตัวอย่างท่ดี ขี องแบรนด์ใหญ่ที่ใช้ Big Data ในการวิเคราะห์ กลุ่มเป้าหมายในการนาส่งโฆษณา ด้วยสมาชิก มากกว่า 100 ล้านราย บริษัทได้รวบรวมข้อมูลจานวนมาก ซ่ึง เปน็ กุญแจสาคญั ที่ทาให้ Netflix ประสบความสาเร็จ

11.3 การวิเคราะห์ข้อมลู สาหรับการจดั การความเสี่ยง แผนการจัดการความเสี่ยงเป็นการลงทุนที่สาคัญ สาหรับหลาย ๆ ธุรกิจ เพราะปัจจุบันหลาย ๆ อย่างต่างเคล่ือนไหวหรือเปลี่ยนแปลงอยู่ตลอดเวลา ซ่ึง ความสามารถในการมองเหน็ ถงึ ความเส่ยี งทอี่ าจเกดิ ขึ้นและสามารถลดความเส่ียงกอ่ นที่จะเกิดขน้ึ นัน้ เป็นส่ิง สาคญั อยา่ งมากสาหรับกาทาธรุ กจิ Starbucks ตัวอย่างแบรนด์ท่ีใช้การวิเคราะห์ข้อมูลในการบริหารจัดการความเสี่ยง Starbucks ในฐานะบริษัทกาแฟช้ันนา ของโลก Starbucks สามารถเปิด สาขาใหม่ในบริเวณ ใกล้เคียงกับร้านค้าอื่น ๆ และยังรับประกันถึงอัตรา การประสบความสาเร็จท่สี ูง เพราะโดยปกติแล้วการตัดสินใจเปิดสาขาใหม่ ขึ้นมานั้นเป็นความเสี่ยงโดยไม่จาเป็น แต่ Starbucks ได้ใช้ฐานข้อมูลใน การวิเคราะห์ คานวณถึงอัตราความสาเร็จของทุกตาแหน่งที่ต้ังใหม่ ก่อน จะลงมือปฏบิ ตั ิด้วยขอ้ มูลตามพนื้ ทีน่ ั้น ๆ

1.4 การใช้ข้อมูลในการจัดการห่วงโซ่อุปทาน Supply Chain Management (SCM) หรือการจัดการ หว่ งโซ่อุปทาน คือ กระบวนการดาเนินงานของวัสดุ สินค้า ตลอดจนการผลิต ข้อมูล และธุรกรรมต่าง ๆ ผ่าน องคก์ รที่เปน็ ผสู้ ่งมอบ ผผู้ ลิต ผจู้ ดั จาหน่ายไปจนถงึ ลูกค้าหรือผบู้ รโิ ภค Supply Chain PepsiCo ตัวอย่างแบรนด์ท่ีใช้ข้อมูลเพื่อเพิ่มประสิทธิภาพของ Supply Chain PepsiCo เป็นบริษัทบรรจุสินค้าอุปโภคบริโภคที่ต้องใช้ ข้อมูลจานวนมากเพ่ือ การจัดการห่วงโซ่อุปทานท่ีมี ประสิทธิภาพ บริษัทมุ่งมั่น ท่ีจะสร้างความม่ันใจว่าสามารถเติม เต็มช้ันวางของ ร้านค้าปลึกด้วยปริมาณและประเภทของ ผลติ ภณั ฑ์ท่ี เหมาะสม

จบการนาเสนอคะ่


Like this book? You can publish your book online for free in a few minutes!
Create your own flipbook