ให นร. ดูรปู ภาพ แลวลองพูด เกี่ยว กับรูปภาพท่ีเหน็ 1
2
Data & Information ขอ มูลและสารสนเทศ
Data & Information ◼ ขอมูล คือ ขอ เทจ็ จรงิ ทีม่ ีการรวบรวมไวแ ละมคี วามหมาย อาจเกี่ยวขอ งกับคน สง่ิ ของหรอื เหตุการณอื่นๆ เปนสวนพ้นื ฐานสาํ หรับการ ประมวลผลของงานเพื่อใหไดสารสนเทศสําหรับ ชวยตดั สนิ ใจและนําเอาไปใชป ระโยชนอ ื่นๆตาม ตอ งการ ขอ มูล ความหมายตาม 4
การจดั การขอ มลู 5
แหลงขอ มูล ◼ สามารถแบง ประเภทตามแหลงที่มาได 2 ประเภท คอื - แหลงขอมลู ภายใน - แหลงขอมูลภายนอก 6
แหลง ขอ มูลภายใน ◼ แหลงกําเนิดขอมูลอยูภายในองคกรทว่ั ไป - เชน ยอดขายประจาํ ป, ขอมูลผถู ือหนุ , รายงานกาํ ไรขาดทุน, รายชือ่ พนักงาน ฯลฯ อาจเปน ขอ มูลท่เี ปด เผยไดห รอื ขอ มูลทีเ่ ปน ความลบั เชน ขอ มลู ผลติ ภณั ฑใหม ขอ มลู การทดลอง เปน ตน 7
แหลง ขอ มลู ภายนอก ◼ แหลงกําเนดิ อยภู ายนอกองคก ร เชน ขอ มูลลูกคา เจาหนี้ อัตราดอกเบ้ยี สถาบันการเงนิ กฎหมายและอัตราภาษีของ รัฐบาล หรอื ขอ มูลบริษทั คูแขง 8
แหลง ขอ มูลภายนอก ◼ ไมใ ชข อ มูลทม่ี อี ยูภายในบรษิ ทั หรอื องคกร ◼ อาจหาไดจากบรษิ ทั ผใู หบ ริการ ขอมูลหรือจากหนงั สอื พมิ พ วทิ ยุ โทรทัศนหรอื สื่ออ่นื ๆ 9
คณุ สมบตั ขิ องขอมูลที่ดี 10 คณุ สมบัติพนื้ ฐานทคี่ วรมีดงั นี้ 1. ความถกู ตอ ง (Accuracy) 2. มีความเปนปจ จุบนั (Update) 3. ตรงตามความตอ งการ (Relevance) 4. ความสมบูรณ (Complete) 5. สามารถตรวจสอบได (Verifiable)
ความถกู ตอง (Accuracy) ◼ ขอมลู ทีไ่ มเ ปน จริงอาจกอ ใหเ กดิ ความเสียหายได ◼ ตองคัดเลือกขอ มลู ทถี่ กู ตอ ง ◼ คอมพวิ เตอรประมวลผลตามขอมลู ที่ไดร ับ เม่อื ปอ นขอมูลผิดผลลัพธก ย็ อมผดิ ตามไปดว ย (Garbage In Garbage Out) 11
ความเปน ปจจบุ นั (Update) - ตอ งมกี ารปรับปรงุ แกไขใหม ีความ เปนปจจบุ ันอยูเสมอ - เหตุการณต า งๆมกั เกดิ ขน้ึ ใหมอ ยู ตลอด เชน จาํ นวนผมู ีสิทธิเลือกตัง้ ในสมยั กอ นกบั ปจ จุบนั ยอ มไมเทา กนั - ขอ มลู ที่ลา สมัยหากนําไปใช 12 ภาพโดย Gerd
ตรงตามความตอ งการ (Relevance) ◼ ขอ มูลท่จี ะนาํ มาใชต องสอดคลอ งตรงกบั ความ ตอ งการมากท่สี ุด ◼ อาจไดจ ากการสํารวจหรือออกแบบสอบถาม ◼ หากไมสอดคลอ งกับความตอ งการก็ไมส ามารถนาํ ไปใชประโยชนไดอยางเตม็ ที่ ภาพโดย mohamed 13 Hassan จาก Pixabay
ความสมบรู ณ (Complete) ◼ บางครั้งอาจเก็บรวบรวมขอมลู มากกวาหนง่ึ ครง้ั เพอ่ื ใหไ ดข อมลู ทีส่ มบรู ณ เชน การเกบ็ ขอมลู เชิงสถิติ หรอื วดั คาเฉล่ยี อาจ ตอ งเกบ็ ทัง้ ขอมูล ปฐมภมู ิ (primary data) และขอมลู ทุติยภูมิ (secondary data) 14
ความสมบรู ณ (Complete) ◼ ขอมลู ทีส่ มบรู ณอ าจตองคํานึงถงึ ความครบถว น ของขอ มลู ดวย เชน อายุ เพศ การศึกษา ศาสนา เชื้อชาติ ของบคุ ลากรในบรษิ ัท เปน ตน 15
สามารถตรวจสอบได 16 (Verifiable) ◼ ขอมลู ท่ไี ดจ ากหลายแหลง อาจมที ้งั เชื่อถือได และเชอ่ื ถือไมไ ด ◼ จําเปน ตอ งตรวจสอบแหลง ทมี่ าหรือหลักฐาน อา งองิ กอน ◼ ปองกันขอมลู ทไี่ มเกดิ ประโยชนแ ละอาจทําให เสยี หายได ภาพ
การแบง ลาํ ดับชั้นของการจัดการขอมลู (Hierarchy of Data) 17
การแบง ลําดับชน้ั ของการจดั การขอ มูล (Hierarchy of Data) ◼ บิต (Bit - Binary Digit) ◼ ไบต (Byte) ◼ ฟลดห รือเขตของขอ มูล (Field) ◼ เรคอรด (Record) ◼ ไฟลหรือแฟมตารางขอมลู (File) ◼ ฐานขอมลู (Database) ภาพโดย Gerd ภาพโดย William 18
การแบง ลาํ ดับชั้นของการจัดการขอมลู (Hierarchy of Data) 19
บิต (Bit - Binary Digit) ◼ ลําดบั ชนั้ ของหนวยขอมูลทีเ่ ลก็ ทสี่ ดุ ◼ ขอมูลที่จะทาํ งานรวมกับคอมพิวเตอรไ ด ตอ งแปลง ใหอยูในรูปของเลขฐานสองเสยี กอ น ◼ เม่อื แปลงแลว จะไดตวั เลขแทนสถานะเปดและปด ของสญั ญาณไฟฟา ท่เี รยี กวาบติ คือ บิต 0 และบติ 1 20
Byte (อักขระ) ◼ เมือ่ นาํ บิตมารวมกันหลายๆบิต จะไดห นว ยขอ มูล กลุม ใหมท ี่เรยี กวา ไบต (byte) ◼ จํานวนของบิตที่ไดใ นแตล ะกลมุ อาจมมี ากบา งหรือ นอยตามแตช นดิ ของรหสั ทีใ่ ชเ ก็บ ◼ สาํ หรับรหสั แอสกี 1 ตวั อกั ษรหรอื 1 ไบต = 8 บติ 21
ฟล ดหรอื เขตของขอ มลู (Field) ◼ ประกอบดวยกลมุ ของตวั อักษรหรอื ไบตต ง้ั แต 1 ตัว ข้ึนไปมาประกอบกันเปนหนว ยขอมลู ท่ีใหญขึ้นเพอื่ แสดงลักษณะหรอื ความหมายอยางใดอยา งหน่ึง ◼ ยกตัวอยางเขตขอ มูลเกย่ี วกบั พนกั งาน เชน รหสั พนักงาน ชอ่ื นามสกุล เงินเดือน ตําแหนง เปนตน 22
เรคอรด (Record) ◼ กลุม ของเขตขอ มูลหรอื ฟลดท่ีมีความสัมพนั ธ กัน และนาํ มาจดั เก็บรวมกันเปน หนวยใหมท ี่ ใหญข ้ึนเพยี งหนว ยเดยี ว ◼ ขอมูลที่จดั เก็บอาจมหี ลายเรคอรดได 23
ไฟลหรอื แฟมตารางขอ มลู (File) ◼ เปนการนําเอาขอ มลู ทัง้ หมดหลายๆ เรคอรดที่ ตอ งการจัดเก็บมาเรียงอยูใ นรปู แบบของแฟม ตารางขอมลู เดยี วกนั เชน แฟมตารางขอมูลเกี่ยว กับคะแนนนกั ศกึ ษาวิชาคอมพิวเตอร อาจ ประกอบดวย เรคอรดของนกั ศกึ ษาหลายๆคนท่ี เก็บขอมูล เก่ียวกับ รหสั นักศึกษา ชือ่ นามสกุล และคะแนนทไ่ี ด เปน ตน 24
แฟมตารางขอมูลคะแนนนกั ศึกษา วิชาคอมพวิ เตอร 25
◼ การรวมเอาแฟม ตารางขอ มูลหลายๆแฟมทม่ี ีค วามสัมพันธกันมาเก็บรวมไวทเ่ี ดียว ◼ มกี ารเก็บคาํ อธบิ ายโครงสรางฐานขอมูลหรอื เรียก วา พจนานกุ รมขอมลู (data dictionary) ไว เพอ่ื ชวยในการประมวลผล 26
โครงสรา งของฐานขอมลู 27
ตัวอยา งฐาน ◼ ฐานขอมลู ขทะเอบยี มนราูลษฎร ◼ ฐานขอมูลทะเบยี นนักศึกษา ◼ ฐานขอมลู บคุ ลากร ◼ ฐานขอ มูลสินคา คงคลงั ◼ ฯลฯ 28
◼ โครงสรา งของแฟม ขอมูล ▪วิธีการกาํ หนดโครงสรา งเพอ่ื จัดเกบ็ ขอมลู ไวใ นแฟม บนสอ่ื บนั ทกึ ขอมูลสาํ รอง (secondary storage) ▪ เพ่ือใหการจดั เก็บและเขา ถึงขอมูลมคี วามรวดเรว็ ถูก ตอง และเหมาะสมกบั ความตองการ 29
◼อาจแบงไดเ ปน 3 ลกั ษณะคือ 1. โครงสรางของแฟมขอ มูลแบบเรยี งลาํ ดับ (Sequential File Structure) 2. โครงสรางของแฟม ขอมลู แบบสมุ (Direct/Random File Structure) 3. โครงสรา งของแฟม ขอมูลแบบลําดบั เชิงดรรชนี (Index Sequential File Structure) 30
▪โครงสรางของแฟมขอ มูลชนดิ พ้ืนฐานที่สามารถใช งานไดงา ยทสี่ ดุ ▪ จดั เก็บขอมลู แบบเรยี งลําดบั เรคอรดตอ เน่ืองกันไป ▪ การอานหรือคนคนื ขอมลู จะขามลาํ ดบั ไปอา นโดย ตรงไมได 31
▪เหมาะสมกับงานท่มี กี ารอานขอ มลู ตอ เนื่องกนั ไปตามลําดบั และในปริมาณมาก ▪จดั เกบ็ อยใู นอุปกรณประเภทเทปแมเหล็ก (magnetic tape) 32
33
◼ โครงสรา งแฟม ขอมลู ทเ่ี ขาถงึ ไดโดยตรง ◼ สามารถเลอื กหรืออานคาไดโ ดยไมจ ําเปน ตองผา น เรคอรดแรกๆ ◼ การเขา ถึงขอ มลู ทาํ ไดเรว็ ◼ จัดเกบ็ ในส่อื ทม่ี ีการเขา ถึงไดโ ดยตรงประเภทจาน แมเ หล็ก เชน ดิสเกต็ ต, ฮารด ดสิ กห รอื CD-ROM 34
อาจแบง ตามลักษณะการทํางานออกไดเปน 2 ประเภทคอื 2.1 แบบแฮชไฟล (Hash File) 2.2 แบบดรรชนี (Indexed File) 35
▪ อาศัยอลั กอรทิ มึ ที่เรียกวา แฮชชิ่ง (hashing) ใน การคาํ นวณหาคา คยี ฟล ด ▪ถา ขอมูลมาก การแปลงคา ตําแหนงอาจเกดิ การชน กัน (collision) ได 36
▪ ใชแฟม ดรรชนี (index) ทาํ การคนหาหรือเขา ถงึ ขอมลู โดยตรง ▪แฟมดรรชนีประกอบดวยคยี 2 ตัวคือ คยี ของ ขอมลู และคียข อง ตาํ แหนง ทีเ่ ก็บขอ มลู ▪คลา ยกับแผนผงั บอกตาํ แหนงงานนิทรรศการ 37
◼ อาศัยกระบวนการ ISAM (index sequential access method) ◼ รวมเอาความสามารถในการเขา ถึงขอมูลแบบสมุ และ แบบเรียงตามลําดับเขา ไวดว ยกนั 38
◼ ขอ มูลถูกเก็บเรยี งกันตามลําดบั ไวบนส่อื แบบ สุม และเขา ถึงขอ มลู ผา นแฟมขอ มลู ลาํ ดบั เชงิ ดรรชนี (indexed sequential file) ◼ ทํางานไดย ืดหยุนกวา วิธีอื่นโดยเฉพาะกรณที ่มี ี ขอ มลู มากๆ 39
40
เปรยี บเทยี บโครงสรา งแฟม ขอ มลู แตละประเภท 41
ขอดีขอ เสยี ของแตล ะแบบ แบบเรียงลาํ ดับ (sequential file) 42
ขอ ดีขอเสยี ของแตล ะแบบ ◼ แบบสมุ (random file) 43
ขอดีขอเสยี ของแตละแบบ ◼ แบบลาํ ดับเชิงดรรชนี (indexed sequential file) 44
สามารถแบงออกไดเ ปน 2 ประเภทคือ ▪ แฟมหลัก (Master file) ▪แฟมรายการเปลยี่ นแปลง (Transaction file) 45
◼ แฟม ขอ มูลทม่ี ีความถขี่ องการเปลีย่ นแปลงขอ มูลไม บอ ยมากนัก ◼ อาศยั ขอมูลจากแฟมขอมูลรายการเปลย่ี นแปลงเขา มาทาํ ใหมคี วามทนั สมยั (up to date) ได ◼ ตัวอยา งของแฟมหลัก เชน แฟมหลักลูกคา ธนาคารซึ่งจะเกบ็ ขอมูลของลูกคา เชน ชื่อ ทอ่ี ยู หมายเลขบญั ชี ยอดเงินคงเหลอื ในบญั ชี เปน ตน 46
◼ แฟมขอมูลท่ีมีการเปล่ยี นหรือแกไขของรายการขอมลู ภายใน คอนขา งบอยและทําแบบประจาํ ตอ เน่อื งหรือ เกิดข้นึ ทุกวัน มักจะนาํ ไปใชส าํ หรับการปรบั ปรุงแฟม หลัก ◼ ตวั อยางเชน แฟมรายการเปลย่ี นแปลงเวลาเขา - ออกงานของพนักงาน (transaction file) ซึ่งจะมี รายการบนั ทกึ หรอื ลงเวลาเกิดขึ้นอยเู ปน ประจําทกุ วนั 47
48
◼การประมวลผลแบบแฟม ขอมูล (File Processing) ▪ตางแผนกตางแยกจัดเกบ็ ▪ขอ มลู เกิดการซา้ํ ซอน (data redundancy ) 49
ระบบฐานขอมลู (Database Systems) ◼ แกป ญหาความซํา้ ซอนกนั ของขอมูลจากเหตุผลขา ง ตน 50
Search