ltluy@- 1c-tu.edu.vn GIÁO TRÌNHCÔNG NGHỆ VÀ CÁC HỆ THỐNG THÔNG TIN HỌC PHẦN: TV104 SỐ TÍN CHỈ:
-2- CHƯƠNG 1: Tiến trình phát triển hệ thống TT thư viện 1. Nhập môn hệ thống TT-TV 1.1. Hệ thống: Một hệ thống thông tin là một tập hợp các phần cứng, phần mềm, dữ liệu, con người và quy trình được thiết kế để tạo ra các thông tin hỗ trợ các hoạt động giao dịch hàng ngày , tầm ngắn, tầm xa của người sử dụng trong một tổ chức. Hệ thống thông tin thường được phân thành năm loại: hệ thống thông tin văn phòng, hệ thống xử lý giao dịch(OLTP), hệ thống thông tin quản lý, hệ thống hỗ trợ quyết định, và các hệ thống chuyên gia. Chúng ta rất quen thuộc với hệ thống xử lý giao dịch thông tin. 1.2. Hệ thống quản lý 1.3. Hệ thống truy cập thông tin thư viện Hệ thống thông tin ở đây là hệ thống thông tin thư viện bao gồm cơ sở hạ tầng công nghệ thông tin, con người và tập các quy trình quản lý. ở chương 1, chúng ta đã được giới thiệu khái lược về các hệ thống tổ cức truy cập, hệ thống TT cũng là hệ thống TC nhưng bao hàm rộng hơn. Trong một thư viện thông thường bao gồm rất nhiều hệ thống: phần cứng, phần mềm QLTV, cơ sở dữ liệu, các website tra cứu, các bộ sưu tập… và một hệ thống tổ chức truy cập thông tin quan trọng bật nhất trong TV là Hệ thống quản lý TV 2. Sự phát triển sử phát triển hệ thống tin học trong thư viện Từ lâu các thư viện đã ứng dụng nhiều công nghệ khác nhau để xác định, bổ sung, xử lý, lưu trữ, và cung cấp thông tin. Tuy nhiên việc ứng dụng công nghệ có nhiều đặc điểm khác nhau giữa các thư viện tùy thuộc vào những yếu tố như: + Loại hình thư viện: thư viện quốc gia, học thuật, công cộng, trường học, chuyên biệt, v.v.); + Mục đích và quy mô của thư viện, qui mô vốn tài liệu, các tài liệu chuyên sâu; + Số lượng và trình độ của bạn đọc; + Số lượng, trình độ nghiệp vụ và trình độ công nghệ thông tin của đội ngũ cán bộ thư viện; + Các loại hình và mức độ chuyên nghiệp của các dịch vụ; + Nguồn ngân sách để phát triển và quản lý cơ sở hạ tầng công nghệ thông tin. Một số tiền đề cho việc ứng dụng rộng rãi công nghệ thông tin trong các thư viện:
-3- + Sự ra đời của máy tính cá nhân vào đầu thập niên 80 của thế kỷ XX. + Sự ra đời của rất nhiều giải pháp tự động hoá thư viện. + Sự xuất hiện và phổ biến của môi trường mạng – Mạng Cục Bộ (LAN) và Mạng diện rộng (WAN). + Sự ra đời của Internet vào đầu thập niên 90. + Nguồn nhân lực thư viện có khả năng phát triển và sử dụng hiệu quả các ứng dụng và giải pháp công nghệ thông tin. + Sự gia tăng mạnh mẽ của các loại hình tài liệu số (văn bản, số, hình ảnh, âm thanh, đa phương tiện). + Người sử dụng có hiểu biết về công nghệ thông tin với những nhu cầu cao hơn, mong muốn truy cập một khối lượng lớn thông tin với tốc độ nhanh hơn qua máy tính cá nhân. + Sự hiểu biết ngày càng sâu về các vấn đề liên quan đến sự tương tác giữa người và máy tính (HCI: Human-Computer Interaction). + Phương châm định hướng người dùng trong việc phát triển các ứng dụng công nghệ thông tin với giao diện thân thiện. + Sự ra đời của các thư viện số. Kochtanek và Matthews (2002) phân chia quá trình phát triển công nghệ trong thư viện thành 4 giai đoạn có phần trùng lắp như sau: 2.1. Giai đoạn tập trung phát triển Hệ Thống: Giai đoạn này kéo dài đến giữa thập niên 70 của thế kỷ XX và dẫn tới sự phát triển của các phần mềm ứng dụng có khả năng thay thế các qui trình thủ công đang áp dụng trong các thư viện. Trọng tâm của các ứng dụng này là phục vụ công tác lưu hành tài liệu- công tác vốn được xem là khó nhất, mang tính chất lặp đi lặp lại và tốn nhiều lao động. 2.2. Giai đoạn tập trung triển khai các Chức năng: Bắt đầu từ thập niên 70, giai đoạn này có nhiều tính năng được bổ sung thêm cho các hệ thống hiện có. Cũng trong giai đoạn này, những nhà cung cấp phần mềm theo phương thức chìa khóa trao tay (turnkey vendor) cũng bắt đầu gia cố thêm nhiều tính năng. Các nhà cung cấp này là những công ty chuyên cung cấp những phần cứng và phần mềm cần thiết trong một gói sản phẩm. Vào thời điểm này, họ chủ yếu cung cấp các hệ thống quản lí công tác lưu hành, và tùy vào những nhu cầu cụ thể và ngân sách mà các thư viện có thể quyết định nên triển khai thêm module nào (biên mục, bổ sung, quản lí ấn phẩm định kì, và những chức năng khác). Một vài năm sau, có nhiều thư viện cũng đã bắt đầu triển khai một module OPAC rất đơn giản phục vụ bạn đọc.
-4- OPAC lúc bấy giờ chỉ đơn thuần là một phiên bản điện tử của các tủ thẻ mục lục truyền thống. Nhìn chung, trọng tâm ứng dụng công nghệ trong giai đoạn này là tự động hóa các quy trình thủ công hơn là sáng tạo ra những quy trình mới cho môi trường điện tử. 2.3. Giai đoạn hướng đến Người sử dụng: Trong giai đoạn này (hiện nay chúng ta vẫn đang trong giai đoạn này), người sử dụng được chú trọng hơn công nghệ và các hệ thống. Phần lớn các hệ thống được phát triển dựa trên nhu cầu, kĩ năng và nguyện vọng của người sử dụng. Những hệ thống này giúp người dùng tiếp cận các tài liệu được lưu trữ cả dưới dạng in ấn và số hoá của một thư viện hay các thư viện láng giềng, trên khắp thế giới hay thư viện ảo trên Internet. Vì tiêu điểm của những hệ thống này là người sử dụng, các ngành học nghiên cứu về tương tác giữa người và máy tính (HCI- human- computer interaction) trở nên rất phù hợp và quan trọng. 2.4. Giai đoạn toàn cầu hoá các Nguồn tài nguyên thông tin: sự ra đời của các hệ thống mạng toàn cầu vận hành theo giao thức Transmission Control Protocol/ Internet Protocol (TCP/IP) hay các giao thức khác đã giúp các thư viện tạo điều kiện cho bạn đọc của họ tiếp cận các nguồn tài nguyên số hoá từ khắp nơi trên thế giới. Công nghệ thông tin đã phát triển như vũ bão, vượt qua giới hạn của sự nghiên cứu; như chúng ta đã thấy các hệ thống mới ngày nay không chỉ phát triển trên hệ thống mạng Ethernet, mà còn phát triển trên các thiết bị viễn thông khác như Wifi,các hệ thống định vị toàn cầu (GPRS)… Internet và Web thật sự đã mang lại sức mạnh về thông tin cho người dùng với khả năng kết nối người dùng với các nguồn tài nguyên thông tin số không kể thời gian và khoảng cách. Công nghệ Web đã đưa mô hình hoạt động của thư viện sang một bước ngoặt mới với vốn tài liệu nội bộ được tích hợp với tài nguyên của các thư viện khác, các cơ sở dữ liệu trực tuyến, các thư viện số. Chính việc sử dụng rộng rãi giao thức TCP/IP và mô hình client-server đã góp phần hiện thực hóa khả năng kết nối không hạn chế đó.
-5- Chương 2 Internet Căn Bản Mục tiêu 1. Xác định các loại tiện ích thông tin có sẵn trên Internet. 2. Xác định giao thức Internet sử dụng. 3. Mô tả hoạt động của thư điện tử bằng thuật ngữ đơn giản. 4. Mô tả hoạt động của nhóm thảo luận thư điện tử bằng thuật ngữ đơn giản. 5. Truyền tập tin dùng giao thức truyền FTP. 6. Tìm đường dẫn Internet (URL), dán vào trình duyệt và kết nối với 1 trang từ xa trên trên Web. Giới thiệu Thế giới như chúng ta biết do một số đông lực lượng hình thành nên. Mạng Internet rõ ràng là một động lực xã hội và kinh tế khổng lồ trong nền kinh tế và xã hội hiện nay. Các doanh nghiệp, bộ ngành chính phủ, trường học… tất cả đều sử dụng Internet trong cuộc sống hàng ngày. Mọi người tìm thông tin trên Internet và sử dụng Internet để liên lạc với nhau, bất kể với bên trong hay bên ngoài tổ chức. Công nghệ này đã ảnh hưởng đến phương thức hoạt động và cung cấp dịch vụ cho khách hàng của văn phòng lưu trữ tập tin, thư viện và những nhà cung cấp thông tin khác. Internet là một mạng máy tính, hay chính xác hơn là một mạng của những mạng máy tính. Các mạng máy tính không phải là công nghệ mới, đã có từ thời có máy tính. Chương này không thể nghiên cứu từng loại mạng máy tính hay giải thích chi tiết bất cứ công nghệ nào. Mục đích của chương là nhằm cung cấp kiến thức sơ lược cho người sử dụng. Mạng Internet Chúng ta sẽ xem xét loại thông tin có sẵn trên Internet, và phương pháp định vị và truy cập thông tin. Tốc độ nhu cầu sử dụng Internet ở Việt Nam ngày càng tăng lên nhanh chóng. Bộ Bưu Chính Viễn Thông dự đoán đến năm 2010 sẽ có khoảng 20 triệu người sử dụng Internet. Những người sử dụng cuối cùng Internet này sẽ tìm thông tin trên mạng và liên lạc với nhau thông qua Internet.
-6- Có vẻ kỳ lạ khi bắt đầu khóa học bằng những ứng dụng Công nghệ thông tin như thế này, nhưng Internet đã có ảnh hưởng mạnh đến phương thức làm việc của nhiều cán bộ thư viện và các chuyên gia công nghệ thông tin, và nó cũng rất quan trọng khi bạn nhận thức được vai trò thiết yếu của nó trong các thư viện và trung tâm học liệu hiện nay. Tất cả nhân viên thư viện và các nhà quản lý thông tin khác đều sử dụng Internet trong suốt quá trình làm việc và đa số là sử dụng hàng ngày, do đó tầm quan trọng của Internet càng được khẳng định. Công nghệ Internet cũng ảnh hưởng đến cơ quan lưu trữ tập tin và viện bảo tàng, ảnh hưởng đến cách các tổ chức lưu trữ tập tin nội bộ cho nhân viên. Bây giờ đọc Ferguson và Hebels, Chương 1. Trong chương này, không đọc các phần có đầu đề là ‘công cụ tìm kiếm’, ‘thư mục chuyên ngành’, ‘tính năng tìm kiếm cơ bản’, và ‘chức năng công cụ tìm kiếm’. Ferguson và Hebels giới thiệu rõ ràng những khái niệm và tiện ích Internet phổ biến nhất. Một điểm quan trọng mà các bạn cần nắm là Internet là một mạng của các mạng máy tính. Gắn kết các mạng máy tính khác nhau lại với nhau là một giao thức kỹ thuật gọi là TCP/IP. Tất cả các mạng máy tính nối với Internet đều tương thích với giao thức này, có nghĩa là dữ liệu có thể di chuyển giữa các mạng mà không có hàng rào kỹ thuật. Các mạng nối kết thông qua một dụng cụ gọi là bộ định tuyến, do đó nếu tất cả các bộ định tuyến đều “nói” chung một ngôn ngữ thì chúng có thể trao đổi dữ liệu. Đây là điều giáo trình muốn nói đến khi cho rằng Internet thật sự là một tập hợp hay các bộ định tuyến. Để kết nối Internet, mạng máy tính cần một máy chủ Internet. Máy tính bạn đang sử dụng có thể không kết nối trực tiếp vào Internet vì (cũng giống như máy tính tôi đang sử dụng để đánh máy bài này) nó cần kết nối vào một máy chủ Internet trước khi liên lạc với phần còn lại của Internet. Việc này cũng có thể thực hiện thông qua một tổ chức như trường đại học, vì bản thân trường đại học đã là một trạm Internet, hay thông qua một nhà cung cấp dịch vụ Internet (ISP). Đây là danh sách các nhà cung ứng dịch vụ Internet hiện nay ở Việt Nam, danh sách này có thể không hoàn chỉnh: http://www.thelist.com/countrycode/84/ Mạng Internet được tạo ra trong suốt thời kỳ Chiến tranh Lạnh, vì vậy một trong những tính năng chính của nó sự thừa thải có kế hoạch. Dù mất đi một phần nào đó trong mạng lưới (do vụ tấn công tên lửa) cũng không phá hủy được toàn
-7- bộ mạng lưới. Đặc tính dư thừa vẫn luôn tồn tại như một phần của Internet. Nó có thể là mớ hỗn độn do không không có một tổ chức nào có thể đứng ra “kiểm soát” Internet, nhưng tính chất mở đã chứng minh được tính linh hoạt của nó - hiện tượng Internet là một bằng chứng rõ ràng cho điều đó. Một cơ quan gần gũi nhất với bộ phận vận hành mạng Internet là tổ chức Quản lý tên miền quốc tế (ICANN: Internet Corporation for Assigned Names and Numbers) có quyền phân phối địa chỉ giao thức Internet, nhưng nó không “điều chỉnh” Internet. Để biết hơn về ICANN, truy cập vào trang web: http://www.icann.org/ Thư điện tử Thư điện tử (thường gọi tắt là email) có lẽ là phần được sử dụng phổ biết nhất của Internet, mặc dù email không nhất thiết liên quan đến Internet. Một email chủ yếu là một thông điệp dạng văn bản, mặc dù các phần đính kèm theo có thể khiến email khác đi. Cần ghi nhớ rằng email có thể hoạt động tốt khi đi kèm nó là các thư dạng văn bản ngắn. Để nhận email, bạn phải có một email client (máy khách) trên máy tính. Microsoft Outlook hiện nay là chương trình phổ biến, mặc dù Eudora và Pegasus đã từng rất quen thuộc. Nếu bạn sử dụng Hotmail hay Yahoo! thì email client được đưa vào dịch vụ và hiện ra cho bạn sử dụng như một trang Web. Tất cả thư điện tử đều thực hiện các chức năng cơ bản sau: Hiển thị danh sách thư nhận được, mặc dù ở dạng viết tắt như chỉ là hàng chủ đề. Cho phép người sử dụng chọn và đọc toàn bộ thư. Người sử dụng có thể viết và gởi thư mới bằng cách đánh vào địa chỉ email của người nhận. Cho phép thêm phần đính kèm. Trên mạng máy tính phải có một email server (máy chủ) cho phép gởi và nhận email. Nó có thể là một máy tính trong tổ chức hay một máy tính do nhà cung cấp dịch vụ Internet (ISP) vận hành. Máy chủ sẽ có một danh sách các tài khoản email trong dịch vụ, có cả tài khoản của bạn. Khi bạn sử dụng email client của bạn để gởi thư, client sẽ tìm tài khoản đó từ máy chủ và chuyển giao thư. Máy chủ sẽ giữ thư ở đó cho đến khi bạn mở tài khoản để xem thư mới.
-8- Cũng như bất cứ công nghệ nào, thư điện tử có nhiều giao thức liên quan. Để xử lý thư gởi đi, máy chủ email của bạn có thể sử dụng SMTP (Simple Mail Transfer Protocol - Giao thức chuyển thư điện tử đơn giản). Để xử lý thư nhận được, có thể sử dụng POP3 hoặc IMAP. POP là Post Office Protocol và IMAP là Internet Mail Access Protocol - Giao thức truy cập thư tín Internet. POP là một giao thức rất đơn giản nhưng lại hạn chế (vẫn có thể được nếu chỉ sử dụng một máy tính). Nếu bắt đầu truy cập vào tài khoản email từ máy tính bàn và máy tính xách tay riêng biệt thì IMAP sẽ trở thành một giao thức thích hợp hơn để sử dụng – căn bản là vì POP gởi thư nhận được đến máy tính dùng để mở email và do đó máy tính khác không thể đọc thư này. IMAP sẽ giữ thư trong bộ lưu trữ riêng của nó. Khi gởi thư, máy chủ SMTP của bạn sẽ “hỏi” Dịch vụ tên miền (DNS – Domain Name Server) có thể tìm địa chỉ ở đâu. Nếu thấy được tên miền cần tìm, nó sẽ chuyển thư này đến những máy chủ POP3 hay IMAP có liên quan. Hugo Haas đã đưa ra những ý kiến của ông về cách sử dụng email một cách hiệu quả trong trang web http://larve.net/people/hugo/2000/03/email. Mặc dù danh sách của Hugo đôi khi cũng khá khác thường nhưng đó là những ý tưởng rất hay. Gởi những bản đính kèm lớn có thể gây khó khăn cho người nhận do dung lượng hộp thư của họ có giới hạn và bạn cũng sẽ không cần biết rằng người nhận đã không nhận được thư bạn gửi. Đồng thời, nếu bạn không chắc rằng người nhận có sử dụng phần mềm nào đó hay không thì bạn đừng gởi những đính kèm trong chương trình Word, thay vào đó hãy sử dụng RTF (Rich Text Format) hay một tùy chọn trung tính tương tự. Cũng như Haas, tôi rất không thích những “chữ ký” dài lê thê theo sau email. Những hướng dẫn sử dụng email khác gồm có trang web này của Gadwall Group: http://www.gadwall.com/topics/email.htm Email thiếu đồng bộ, do đó người nhận không phải lúc nào cũng đọc ngay thư hay nhanh chóng hồi âm. Nếu có việc thật sự gấp và cần thiết thì mọi người thường gọi điện thoại hơn. Nhưng email thì nhanh mà lại rẻ, do đó đa số mọi người cũng thường dùng email để liên lạc. Thật không may khi có một số vấn đề thật sự khi sử dụng email thông thường.
Số thư spam trong email dường như đan-g9t-ăng dần. Có thể lọc bỏ thư spam bằng phần mềm tốt và điều này thật sự có lợi - mặc dù không phải 100% thư sau khi lọc đều là các thư phù hợp với người. Virus được gởi kèm theo email, do đó tốt nhất là bạn nên KHÔNG BAO GIỜ mở đính kèm từ địa chỉ mà bạn không biết. Nếu nghi ngờ, hãy để đính kèm đó trong vài ngày rồi cho chạy phần mềm kiểm tra virus. (Vài ngày này sẽ tạo cơ hội cho những nhà viết phần mềm chống virus phát hiện thêm vài con sâu khác) ? Nếu là người sử dụng email có kinh nghiệm thì bạn hãy ôn lại các bài thực hành được khuyến nghị và xem bạn có đồng ý với các thực hành đó không. Ghi chú lại những điểm bạn không đồng ý và nêu lên trong lớp học. Danh sách thảo luận và nhóm thông tin Ferguson và Hebels mô tả danh sách thảo luận điện tử dựa trên phần mềm phản xạ thư điện tử. Những danh sách này đôi khi được gọi là listservs, đặt theo tên của một chương trình quản lý danh sách thảo luận phổ biến. Có nhiều danh sách thảo luận theo tất cả các loại chủ đề, và một số danh sách rất phổ biến. Mỗi danh sách thảo luận có một máy tính chủ vận hành danh sách đó. Thông thường có hai địa chỉ kết nối với một nhóm thảo luận: một địa chỉ dùng cho công việc hành chính như tham gia (hay đăng ký), và một địa chỉ dùng để gởi các thư đến danh sách. Người sử dụng mới hay không thường xuyên thường nhầm lẫn giữa hai địa chỉ đó và gởi yêu cầu đăng ký (hay phổ biến hơn là yêu cầu không đăng ký) đến địa chỉ danh sách chứ không gởi đến địa chỉ hành chính. Điều này có nghĩa là yêu cầu không đăng ký của họ được gởi đến tất cả người đăng ký, chứ không đến địa chỉ hành chính. ? Tìm một nhóm người Việt thảo luận về thư viện hay quản lý thông tin. Bạn phải sử dụng địa chỉ email để đăng ký vào danh sách? Một trong những vấn đề khi tham gia một danh sách thảo luận bận rộn là bạn nhận ra rằng bạn nhận quá nhiều thư đến nỗi không thể đọc hết trong một ngày, nhưng hầu hết mọi người vẫn tiếp tục đăng ký vào những danh sách mà họ cho rằng có giá trị đặc biệt.
- 10 - Nhóm thông tin (thường được gọi là Usenet News) cũng tương tự như danh sách thảo luận, trừ khi bạn sử dụng một phần mềm đặc biệt gọi người đọc thư truy cập vào thư trên máy chủ, chứ không nhận bản sao mỗi thư của riêng bạn. Nhóm thông tin được sắp theo bảng phân loại lớn, bao gồm rec (giải trí), comp (tin học), và misc (linh tinh). Có hàng nghìn nhóm thông tin với nhiều mảng chủ đề phong phú, gồm những thứ như rec.juggling (giải trí.xiếc), rec.food.recipes (giải trí.thức ăn.công thức nấu ăn), comp.sys.mac.databases (tin học.hệ thống.mac.cơ sở dữ liệu), và alt.fashion (alt.thời trang). Để đọc một nhóm thông tin, bạn cần phải truy cập vào máy chủ thông qua một nhà cung cấp dịch vụ truy cập Internet. Do có quá nhiều nhóm thông tin, nên hầu hết các nhà cung cấp dịch vụ truy cập chỉ có một số nhóm. Một số nhà cung cấp dịch vụ truy cập Internet đưa ra các trang web thông tin công cộng có sẵn cho bất kỳ ai có địa chỉ. Cũng có thể truy cập nhóm thông tin thông qua công cụ tìm kiếm, ví dụ như thông qua tùy chọn “Groups” (Các Nhóm) trong cộng cụ tìm kiếm Google. FTP FTP (Giao thức truyền tập tin) là phần mềm cho phép người sử dụng Internet truyền tập tin (như văn bản, phần mềm, hình ảnh…) từ máy này sang máy khác. Tập tin là bộ dữ liệu thuật ngữ máy tính riêng biệt được đặt tên, tất cả thông tin lưu dưới dạng số tổ chức thành các tập tin. Một số trang web vẫn lưu trữ các bộ sưu tập của phần mềm miền công cộng và tài liệu điện tử. Để truy cập vào trang web FTP, bạn cần phải biết tên trang web, tên thư mục các tập tin có sẵn, và tên tập tin bạn muốn. Các tập tin có sẵn thông qua FTP ở một số dạng khác nhau, thể hiện qua sự khác nhau ở các phần mở rộng cùa chúng. Ví dụ, phần mở rộng .txt là một tập tin văn bản, nhưng .bin là tập tin nhị phân. FTP cũng dùng để truyền tập tin từ máy tính cá nhân đến máy chủ để làm cho các tập tin có sẵn cho mọi người sử dụng thông qua mạng toàn cầu web (WWW). Ngày nay, nhiều người truy cập trang FTP thông qua mạng Web chứ không truy cập trực tiếp. World Wide Web
- 11 - Ferguson và Hebels đưa ra mô tả cơ bản về phương thức hoạt động của World Wide Web. Để biết thêm chi tiết, xem trang web: http://www.howstuffworks.com/web-server.htm Muốn xem xét Web, cần phải biết rõ một số diễn biến trước đó của nó. Đến khoảng năm 1991, thư điện tử, truy cập từ xa sử dụng Telnet (một ứng dụng khách giúp máy tính hoạt động như một thiết bị cuối trên máy tính lớn từ xa), và FTP là những dịch vụ chính có sẵn thông qua Internet. Nhờ vào những điều đã biết về các tiện ích này, bạn có thể nhận ra rằng, để sử dụng hiệu quả, vấn đề chính của những tiện ích này là thì cần phải biết một địa chỉ - địa chỉ người nhận hay địa chỉ máy tính muốn kết nối, hoặc vị trí và tên tập tin cần muốn sao chép. Để truy cập Web, cần thiết phải có một trình duyệt Web cài đặt vào máy tính. Máy tính có hệ điều hành Windows vận hành hệ thống thường có Internet explorer (trình duyệt Internet), nhưng nó không là trình duyệt duy nhất. Mozilla Firefox là một trình duyệt hiệu quả, có thể tải về rất dễ dàng. Chương trình này có một số tính năng vượt trội hơn so với Explorer và hiện nay nó dùng rất tốt cho RSF feeds và blogs (website cá nhân). http://www.mozilla.org/download.html Đánh URL dưới đây vào trình duyệt, rồi bạn sẽ thấy trang web Đại học Cần Thơ xuất hiện trên màn hình. http://www.ctu.edu.vn/colleges/tech/sinhvien/sinhvien.htm Để làm được điều này, máy tính thực hiện các quá trình sau: Chia URL (URL) thành 3 phần: Giao thức – trong trường hợp này HTTP (the Hypertext Transfer Protocol) là tài nguyên sử dụng Web. Tên máy chủ trang web: www.ctu.edu.vn Thư mục con: colleges, tech, sinhvien, và tên trang sinhvien.htm Trình duyệt liên lạc với máy chủ định danh (name server) để chuyển tên máy chủ mà bạn hiểu (www.ctu.edu.vn) sang tên máy chủ theo cách Internet hiểu – đó là địa chỉ giao thức Internet (IP) gồm 4 số ngăn cách bằng một dấu chấm. (172.18.45.254
- 12 - Sau đó trình duyệt tạo nên kết nối với địa chỉ IP trên port 80. Trình duyệt gởi lệnh GET đến máy chủ từ xa yêu cầu tập tin trong URL. Máy chủ từ xa tìm thư mục con và trong thư mục con 'sinhvien' máy chủ tìm thấy tập tin yêu cầu và gởi đến trình duyệt của bạn. Trình duyệt này đọc HTML (HyperText Markup Language - Ngôn ngữ đánh dấu siêu văn bản) trong trang được gởi đi, giải mã và định dạng trang trên màn hình. Máy chủ từ xa hiện nay đã ngừng liên lạc với máy tính của bạn mặc dù máy tính này vẫn tiếp tục hiển thị thông tin nhận được. Trong kịch bản này, máy tính của bạn là client (máy khách) và máy tính từ xa là server (máy chủ). Mạng Internet phát triển Chúng ta vừa thấy rằng Internet không ngừng thay đổi và phát triển. Các đặc tính như Gopher (một bậc tiền bối của World Wide Web như Ferguson và Hebels đã đề cập) được xem như cuộc cách mạng khi mới được giới thiệu, nhưng ngày nay lại quá lỗi thời mặc dù vẫn hỗ trợ trình duyệt hiện nay. ? Tương lai của Internet ra sao? Những yếu tố nào ảnh hưởngđến sự phát triển của Internet? Thật khó trả lời những câu hỏi này, nhưng hãy cố gắng tìm một bài báo bàn về sự phát triển mới đây liên quan đến Internet, và hãy tham dự các buổi học hàng tuần để thảo luận về các phát hiện của bạn và nơi bạn tìm thông tin ấy. Nếu có thể thì hãy cố gắng liên hệ các nhận xét của bạn về vòng đời của công nghệ và sự đáp ứng thị trường của vòng tròn Moore (đã thảo luận trong Chương 1). Các vấn đề Trên trang 25–26, Ferguson và Hebels nhận ra một mảng vấn đề của Internet và ứng dụng của nó nảy sinh trong thư viện và các ngành thông tin. Thảo luận chi tiết tất cả các vấn đề này là vượt quá giới hạn của LIM 212, và bạn sẽ thấy rằng một số vấn đề liên quan đến các khoá học khác. Tuy nhiên, để kết luận chương này, hãy nghĩ về các vấn đề này và những hàm ý chung cho ngành thông tin thư viện.
- 13 - Các tổ chức có thể muốn đề ra một chính sách về sử dụng Internet. Một chính sách có thể dành cho nhân viên và một chính sách dành cho khách hàng. Dưới đây là Chính sách sử dụng thư viện của Trung tâm phát triển thông tin Việt Nam bao gồm các quy tắc về sử dụng Internet: http://www.vdic.org.vn/index.php?language=vietnamese ? Internet và ứng dụng Internet có hàm ý gì đối với nhà quản lý LIM? Cán bộ LIM? Và khách hàng LIM? Bạn có thể nhận ra một số vấn đề hay câu hỏi có thể nảy sinh từ những ẩn ý này? Nếu được đề ra chính sách về sử dụng Internet cho thư viện của bạn, bạn sẽ đề ra điều gì? Bài tập đề nghị Sử dụng email Đăng ký vào một danh sách thảo luận email Truyền tập tin sử dụng FTP Tìm một URL (URL), dán vào trình duyệt Web và kết nối với một trang web từ xa trên World Wide Web. Câu hỏi ôn tập Hoàn thành tất cả các bài tập và câu hỏi ôn tập sau đây để kiểm tra mức độ hiểu bài, chuẩn bị để thảo luận trong lớp. 1. Nếu là người sử dụng email có kinh nghiệm thì bạn hãy ôn lại những phần thực hành được đề nghị và xem bạn có đồng ý với những phần thực hành đó không. Ghi chú lại những điểm bạn không đồng ý và nêu lên trong lớp học… 2. Tìm một nhóm người Việt thảo luận về thư viện hay quản lý thông tin. Bạn phải sử dụng địa chỉ email nào để đăng ký vào danh sách? 3. Tương lai của Internet ra sao? Những yếu tố nào ảnh hưởng đến sự phát triển của Internet? 4. Internet và ứng dụng Internet có hàm ý gì đối với nhà quản lý LIM? Cán bộ LIM? Và khách hàng LIM? Bạn có thể nhận ra một số vấn đề hay câu
- 14 - hỏi có thể nảy sinh từ những ẩn ý này? Nếu được đề ra chính sách về sử dụng Internet cho thư viện của bạn, bạn sẽ đề ra điều gì ?
- 15 - Chương 3 Tìm tin trên Internet – Tìm kiếm thông tin Mục tiêu bài học. Sau bài học này, học viên có thể: Giải thích chức năng của 3 bộ phận của một bộ máy tìm kiếm (search engine) gồm: spider, index (chỉ mục), phần mềm giao diện (interface software). Trình bày và giải thích những phương pháp chủ yếu một bộ máy tìm kiếm dùng để sắp xếp thứ tự các kết quả tìm kiếm của một yêu cầu tìm tin. Giải thích lý do tại sao đối với cùng một yêu cầu tìm tin nếu sử dụng 2 bộ máy tìm kiếm khác nhau sẽ cho danh sách các kết quả tìm kiếm khác nhau. Mô tả được những điểm khác biệt chủ yếu giữa một bộ máy tìm kiếm và một danh bạ Web. Cho biết khi nào thích hợp sử dụng một trong hai công cụ tìm tin. ! Tài liệu cần đọc: Chapter 1 (Chương 1), tác giả Ferguson và Hebels Đến Chương cuối, bạn sẽ phải cần đọc lại chương này nhiều, nhưng bây giờ bạn chỉ cần đọc những phần có các tiêu đề sau trong Chapter 1: “search engines” (máy tìm kiếm), “subject directory” (thư mục chủ đề), “basic search features” (đặc điểm tìm kiếm cơ bản) và “search engine functionalities” (chức năng của máy tìm kiếm). Phần Giới Thiệu Như trong sách giáo khoa đã đề cập, ngày nay có hàng triệu các website, điều này có thể gây khó khăn cho chúng ta trong việc tìm tin, hay tìm những thông tin thích hợp phục vụ yêu cầu tìm tin của bạn đọc trong các thư viện. Một trong những cách tìm tin là tìm một trang Web có chứa những thông tin có liên quan đến đề tài bạn cần tìm, sau đó click chuột vào các siêu liên kết trong trang web đó. Nếu bạn tìm thấy một trang khác hay hơn, bạn có thể click vào các liên kết trong trang Web đó và cứ tiếp tục như thế cho đến khi tìm đủ thông tin về đề tài cần tìm. Tìm tin theo cách như trên gọi là “lướt Web”. Đôi khi, “lướt Web” để tìm tin sẽ giúp bạn tìm được những thông tin có liên quan, tuy nhiên vấn đề là chúng ta thường không biết trang web nào thích hợp. Một vấn đề khác nữa là sau khi đã lướt qua một số trang web và tìm được thông tin nhưng bạn vẫn không thể chắc rằng những trang web bạn vừa xem có phải là trang web hay nhất hay không, hay có trường hợp bạn tìm được một nhóm site phù hợp nhưng chúng lại
- 16 - cung cấp những thông tin quan trọng không giống nhau. Điều này cho thấy chúng ta cần phải biết cách tìm tin một cách hiệu quả hơn, vừa tìm được nhiều trang web có liên quan lại vừa tiết kiệm được thời gian. Trong Chương này, các bạn sẽ tìm hiểu 2 công cụ tìm tin trên Web khác nhau: máy tìm kiếm và danh bạ các trang Web. Có lẽ bạn đã từng sử dụng bộ máy tìm kiếm nhiều hơn là danh bạ Web. Các chuyên viên thông tin cần phải biết một số bộ máy tìm kiếm cũng như là một số danh bạ Web khác nhau và phải sử dụng chúng một cách thành thạo. Các máy tìm kiếm Chắc hẳn là những người sử dụng Web đã quá quen thuộc với các bộ máy tìm kiếm. Có thể nói chính nhờ có những bộ máy tìm kiếm này đã giúp đưa Internet trở thành một “hiện tượng” như ngày nay. Máy tìm kiếm phổ biến đến nỗi tên của một bộ máy tìm kiếm đã được đưa vào từ vựng Anh ngữ và được sử dụng như một động từ. Ở các nước nói tiếng Anh, khi người ta tìm thông tin trên Internet, họ thường nói “I am going to google it”. Các bộ phận của một máy tìm kiếm Các bộ máy tìm kiếm cài đặt một chương trình được đặt cho những tên gọi khác nhau như “crawler”, “spider”, hay “robot” (bạn cũng có thể đặt những tên khác cho chương trình này). Tất cả những tên gọi này đều cũng chỉ một chương trình. Những bộ máy tìm kiếm cài đặt spider gồm có 3 phần tử chính. Đầu tiên là spider. Bộ máy tìm kiếm gởi spider lên Web để “đọc” thông tin trên những trang Web và ghi lại dữ liệu, sau đó đem các tài liệu web về bộ máy tìm kiếm. Chính ở giai đoạn tiếp theo mới khẳng định tính hữu ích của spider. Như chúng ta biết, hầu hết các trang Web đều có phần “links” (liên kết) với các Website khác, vì thế spider cần phải tìm ra những links này để đến những website liên kết. Để cập nhật dữ liệu, spider thường xuyên quay lại những trang web nó đã “thăm qua” theo định kỳ một tháng hay hai tháng để ghi lại những thay đổi. Tất cả những tài liệu Web spider tìm được sẽ được chuyển đến bộ phận thứ hai trong bộ máy tìm kiếm: index (chỉ mục). Index đôi khi còn được gọi là catalog (bảng mục lục) - giống như một thư viện khổng lồ lưu trữ bản copy tất cả những trang Web mà spider tìm thấy. Nếu 1 trang web thay đổi và khi spider tìm thấy những thay đổi này nó sẽ cập nhật một bảng thông tin mới và gửi cho thư viện. Chính những thông tin do spider mang về đã xây dựng nên cơ sở dữ
- 17 - liệu của bộ máy tìm kiếm giúp đáp ứng các câu hỏi tìm kiếm thông tin của người dùng. Đôi khi phải mất một khoảng thời gian spider mới có thể bổ sung những thông tin cập nhật vào index. Vì vậy, có trường hợp một trang Web đã được spider nhưng chưa được chỉ mục. Nó sẽ được dùng cho những công việc tìm kiếm cho đến khi nó được lập chỉ mục (ví dụ như thêm vào bảng chỉ mục). Chính điều này sẽ giải thích cho những điểm khác biệt về kết quả tìm kiếm giữa các máy tìm kiếm khác nhau đối với cùng một thuật ngữ tìm kiếm. Một máy tìm kiếm sẽ tìm và lập chỉ mục cho một trang web mới nhưng máy tìm kiếm khác chưa vào đến hay lập chỉ mục cho trang này. Như vậy, rất có khả năng là nếu tìm trong một thời gian ngắn, những máy tìm kiếm sẽ cung cấp kết quả khác nhau cho cùng một yêu cầu. Phần tử thứ ba trong bộ máy tìm kiếm là phần mềm cài trong bộ máy tìm kiếm. Chương trình phần mềm này sẽ xem qua hàng triệu các trang Web lưu trong index để tìm ra những tài liệu có liên quan đến yêu cầu tìm tin của người dùng và sắp xếp thứ tự các trang web theo mức độ liên quan. Giả sử bạn nhập vào thuật ngữ tìm kiếm: “Vietnam” và “football”, thì chương trình phần mềm trong bộ máy tìm kiếm sẽ tìm trong index tất cả những tài liệu có liên quan đến 2 thuật ngữ này. Các bộ máy tìm kiếm sắp xếp thứ tự các kết quả tìm kiếm như thế nào? Theo những giáo trình trước đây, một lý do giải thích tại sao đối với cùng một thuật ngữ tìm kiếm sử dụng các bộ máy tìm kiếm khác nhau lại cho những kết quả khác nhau là spider đã tìm thấy những trang Web vào những thời điểm khác nhau. Điều này tất nhiên là hợp lý nhưng còn có một lý do khác quan trọng hơn. Chương trình phần mềm trong bộ máy tìm kiếm sắp xếp thứ tự tất cả các kết quả tìm kiếm đáp ứng một yêu cầu tìm tin theo một số quy luật đã được cài đặt trước và mỗi một bộ máy tìm kiếm lại có những quy luật sắp xếp kết quả tìm kiếm khác nhau. Sở dĩ phần mềm này sắp xếp các kết quả tìm kiếm là nhằm chọn lọc những tài liệu hữu ích có liên quan nhất để cung cấp cho người dùng và sắp xếp chúng theo mức độ phù hợp với yêu cầu tìm tin. Giả sử bạn đang sử dụng một bộ máy tìm kiếm để tìm tin và bạn nhập vào thuật ngữ tìm kiếm là “Vietnam”. Sẽ có khoảng 400,000,000 tài liệu trong index có liên quan đến thuật ngữ này. Thay vì chỉ cần cung cấp cho bạn tất cả 400,000,000 tài liệu này, bộ máy tìm kiếm sẽ sắp xếp 400,000, 000 theo mức độ “có liên quan” đến thuật ngữ tìm kiếm bạn nhập vào.
- 18 - Chắc hẳn bạn sẽ thắc mắc là làm thế nào những bộ máy tìm kiếm có cài spider này lại có thể đánh giá được mức độ liên quan của hàng trăm triệu trang Web đến đề tài người dùng tin cần tìm để sắp xếp thứ tự của chúng theo mức độ có liên quan. Tất nhiên, những cỗ máy này phải tuân thủ theo những quy luật đã được cài sẵn trong phần mềm của bộ máy tìm kiếm. Những quy luật sắp xếp này được gọi chung là thuật toán (algorithm). Chúng được những người chủ các bộ máy tìm kiếm giữ kín và chỉ có một số người biết được chi tiết những quy luật này . Tuy nhiên, hầu hết các bộ máy tìm kiếm chủ yếu đều tuân theo những quy luật sắp xếp kết quả tìm kiếm chung. Ngoài ra, những người cung cấp các bộ máy tìm kiếm chủ yếu cũng cung cấp thông tin về cách thức hoạt động của các bộ máy tìm kiếm trên các trang trợ giúp. Dưới đây là những quy luật sắp xếp kết quả tìm kiếm chung của các công cụ tìm kiếm chủ yếu: Một trong những quy luật quan trọng nhất là dựa trên vị trí và số lần lặp lại của từ khoá trong một trang Web. Bạn có thể gọi tắt là phương pháp sắp xếp theo vị trí và số lần lặp lại. Những trang Web nào thẻ tiêu đề có chứa thuật ngữ tìm kiếm được xem như có liên quan đến đề tài tìm kiếm hơn so với những trang Web khác. Điều này hoàn toàn hợp lý - một quyển sách có nhan đề có chứa từ “Vietnam” thì chắc hẳn thông tin trong quyển sách đó có liên quan đến đề tài Vietnam nhiều hơn so với một quyển sách có từ “Vietnam” chỉ xuất hiện một lần ở đâu đó trong phần văn bản. Ngoài ra, bộ máy tìm kiếm cũng sẽ tìm xem từ khoá tìm kiếm (thuật ngữ tìm kiếm) có xuất hiện ở phần đầu của trang Web hay không, ví dụ như xuất hiện trong tiêu đề hay trong một vài đoạn văn bản đầu. Suy luận trong quy luật sắp xếp này là những trang web nào có liên quan đến một (hay những) từ khoá tìm kiếm sẽ chứa những từ khoá này ngay từ đầu. Phương pháp cuối cùng các thuật toán sử dụng để đánh giá mức độ liên quan của một trang web là so sánh số lần lặp lại của từ khoá tìm kiếm với những từ khác trong một trang Web, những trang Web tần suất lặp lại của từ khoá cao hơn chắc hẳn sẽ có liên quan nhiều hơn so với những trang Web khác. Tất cả những phương pháp nêu trên đều được xem là những tiêu chuẩn cho hầu hết những bộ máy tìm kiếm phổ biến. Tuy nhiên, mỗi một bộ máy tìm kiếm lại có một số biến đổi so với chuẩn, cũng chính vì điều này mà một bộ máy tìm kiếm chỉ thích hợp dùng với một số trường hợp tìm tin còn trong những trường hợp tìm tin khác thì sử dụng một cỗ máy khác lại hiệu quả hơn. Index của một số bộ máy tìm kiếm chứa nhiều trang Web hơn so với những cỗ máy khác (phụ thuộc vào quyết định về chính sách), một số bộ máy tìm kiếm cập nhật các trang Web vào index thường xuyên hơn những cỗ máy khác (những cỗ máy này gởi spider lên các trang web spider đã thăm qua thường xuyên hơn). Kết quả là bộ sưu tập trang web trong index của mỗi bộ máy tìm kiếm không giống nhau,
- 19 - cũng vì thế mà đối với cùng một yêu cầu tìm tin mỗi công cụ tìm kiếm lại cho những kết quả tìm kiếm khác nhau. Những bộ máy tìm kiếm này còn có khả năng phát hiện ra thủ thuật “spamming” - một thủ thuật dùng để “đánh lừa” các bộ máy tìm kiếm bằng cách cố ý sử dụng nhiều lần một thuật ngữ tìm kiếm trong một trang web để những cỗ máy này xếp trang Web đó lên đầu danh sách kết quả tìm kiếm. Ví dụ như lặp lại một từ hàng trăm lần trong một trang Web để tăng tần suất xuất hiện của từ đó nhằm đưa trang web lên đầu danh sách kết quả tìm kiếm. Giả sử một Website chèn từ “Vietnam” vào đầu trang HTML hàng trăm lần nhằm mục đích làm tăng mức độ liên quan của trang Web đến đề tài trong từ khoá tìm kiếm “Vietnam” của một người dùng tin nào đó. Nếu những bộ máy tìm kiếm không phát hiện ra thủ thuật spamming thì trang Web này chắc chắn sẽ được liệt kê vào đầu danh sách những trang Web có liên quan đến từ khoá tìm kiếm “Vietnam” mặc dù thực chất đây không phải là trang Web hay nhất. Các bộ máy tìm kiếm có nhiều biện pháp khác nhau để phát hiện ra thủ thuật spamming, trong đó có phương pháp dựa trên những lời than phiền của người dùng. Những bộ máy tìm kiếm còn dùng những phương pháp phát hiện khác gọi chung là các nhân tố trang (off the page factors), ngăn chặn những Webmaster (người quản lý web) đang cố ý đưa những trang web của họ lên đầu những danh sách xếp hạng những trang web có liên quan. Các Webmaster khó có thể “qua mặt” được những phương pháp nhân tố trang. Một trong những phương pháp này là phân tích các “link” - đường kết nối giữa các trang Web, khi bạn click vào mục “link” trong một trang web, bạn có thể kết nối với một trang web khác. Thông qua việc phân tích cách liên kết giữa các trang Web, một bộ máy tìm kiếm có thể xác định được: (a) đề tài của trang web và (b) “tầm quan trọng” của trang web để quyết định có nên đưa trang web đó lên đầu danh sách kết quả tìm kiếm hay không. Một phương pháp nhân tố quan trọng khác là “clickthrough measurement”. Điều này có nghĩa là máy tìm kiếm có thể xem kết quả mà người dùng tin chọn khi tìm tin về một đề tài nào đó để “hạ bậc” những trang web mà người tìm tin ít chọn đồng thời “nâng cấp” cho những trang web ở cuối danh sách nhưng người tìm tin lại thấy hữu dụng (người tìm tin đánh giá và chọn từ danh sách các tài liệu có liên quan). Các bộ máy tìm kiếm chuyên về gì? Các máy tìm kiếm thích hợp sử dụng để tìm: Những đề tài bạn có thể dùng những thuật ngữ chi tiết để miêu tả Những đề tài có ít site đề cập đến
- 20 - Vì mỗi bộ máy tìm kiếm có cách hoạt động khác nhau nên đối với cùng một thuật ngữ tìm kiếm mỗi bộ máy tìm kiếm lại cho kết quả tìm kiếm khác nhau. Chính vì vậy, bạn không nên chỉ dựa vào một bộ máy tìm kiếm. Là một chuyên viên thông tin, bạn phải làm quen với một vài bộ máy tìm kiếm và nắm được những điểm mạnh cũng như những điểm yếu của từng bộ máy. Bạn hãy nghĩ ra một yêu cầu tìm tin có trên 2 từ, ví dụ như “computer service psychology” chẳng hạn. Sau đó bạn thử tìm thông tin về từ khoá này bằng những bộ máy tìm kiếm dưới đây: A9: http://a9.com Ask Jeeves: http://www.ask.com/ Google: http://www.google.co.nz/ Teoma: http://www.teoma.com/ Yahoo: http://search.yahoo.com/ Bạn hãy so sánh các kết quả tìm kiếm xem có giống nhau không? Ngoài ra, chúng ta còn có những bộ máy tìm kiếm meta. Dưới đây là 2 tên và địa chỉ 2 bộ máy tìm kiếm meta: Vivisimo: http://vivisimo.com/ MetaCrawler: http://www.metacrawler.com/ Greg Notess đã so sánh những đặc điểm của các bộ máy tìm kiếm và đã rút ra được bảng tóm tắt. Bạn có thể xem bảng này ở: <http://www.notess.com/search/ features/>. Có rất nhiều bộ máy tìm kiếm đáng cho bạn khám phá chứ không nên chỉ xem qua. Đầu tiên bạn hãy thử tìm hiểu về Google. Tại trang chủ, bạn hãy thử tìm một hình ảnh (về một người nào đó chẳng hạn). Bạn hãy chọn tìm với phần “advanced search” (tìm kiếm nâng cao). Ngoài ra, tại trang chủ, bạn hãy click vào “more” để xem những tiện ích khác mà Google cung cấp như: Google Scholar <http://scholar.google.com/>, đây là một bước phát triển có ý nghĩa quan trọng đối với các nhà quản trị thông tin trong môi trường học thuật. Google Earth <http://earth.google.com/> dành cho mục đích giải trí chứ không thiết thực cho việc tìm tài liệu học tập và nghiên cứu.
- 21 - Tên của những người sáng lập bộ máy tìm kiếm Google đã được đưa lên trang bìa tạp chí Time số ra ngày 20 tháng 02 năm 2006. Bạn cũng nên đọc qua câu chuyện về công ty cung cấp công cụ tìm kiếm này. Cũng đã có rất nhiều sách viết về Google. “Google (Firm)” hiện nay là một đề mục chủ đề của Library of Congress (Thư Viện Quốc hội Hoa Kỳ). Một vấn đề nữa chúng ta cần xem xét là các bộ máy tìm kiếm KHÔNG THỂ truy cập tất cả thông tin từ World Wide Web. Có rất nhiều thông tin không thể truy cập được vì nhiều lý do khác nhau. Trong phần bài đọc dưới đây sẽ đề cập 2 vấn đề chính trong việc truy xuất dạng thông tin (information form) mà chúng ta thường gọi là “độ sâu của web” (the deep web). Tài liệu cần đọc: Phần “Going beyond the Web’s surface” trong quyển Teacher Librarian, của tác giả Reid Goldsborough, năm 2006, 33(5):5. (Bài đọc 1) Dựa trên những thông tin có được trong Bài đọc 1 và từ những website đề cập ở trên, bạn hãy trả lời câu hỏi sau: ? Tại sao các bộ máy tìm kiếm không thể tìm được tất cả các nguồn thông tin trên Internet? Các danh bạ Web (Directories) Các danh bạ sắp xếp các nguồn thông tin theo chủ đề dưới dạng cấu trúc tầng bậc. Các site được con người phân loại. Cũng chính vì vậy mà các danh bạ web site không được cập nhật như các bộ máy tìm kiếm, tuy nhiên lại mang tính đặc trưng hơn. Đặc biệt, một số danh bạ còn có công cụ hỗ trợ tìm kiếm trong khắp danh bạ. Khi tìm trong danh bạ website bạn chỉ có thể tìm thấy tên một (hay nhiều) trang bạn thấy có thể liên quan đến đề tài cần tìm chứ không thể xem nội dung cụ thể một trang web có liên quan. Vì vậy, công cụ tìm kiếm này không dùng để tìm một đề tài chi tiết, mà chỉ để tìm những trang bạn nhận thấy có thể sẽ chứa những thông tin chi tiết về đề tài bạn đang tìm. Một số danh bạ Web chỉ giới hạn ở một chủ đề hay một lĩnh vực, một quốc gia hay một khu vực nào đó…
- 22 - Bạn hãy nghĩ ra một yêu cầu tìm tin. Ví dụ như: “Tìm thông tin về Hiến Pháp ở Chi-lê” và hãy tìm thông tin có liên quan đến đề tài này trong những danh bạ sau: 1. Edinburgh Engineering Virtual Library: http://www.eevl.ac.uk/ 2. Librarian's Index to the Internet: http://lii.org/ 3. Open Directory Project: http://dmoz.org/ 4. Scout Report: http://scout.wisc.edu/ 5. Social Science Information Gateway: http://www.sosig.ac.uk/ 6. Yahoo: http://dir.yahoo.com/ Bạn có thể xác định được đâu là các danh bạ chủ đề cụ thể không? Có danh bạ các website của Việt Nam nào không? Cũng như trường hợp của các bộ máy tìm kiếm, có rất nhiều danh bạ bạn nên khám khá chứ không nên chỉ xem qua cho biết. Một quyển sách của Randolph Hock có nhan đề Yahoo! to the max: an Extreme Searcher's guide (Information Today, 2005) sẽ cho bạn biết tất cả những tiện ích của dịch vụ này. Bạn hãy lưu ý mức độ cá nhân hoá ngày càng tăng. ? Hãy cho biết những điểm khác nhau chủ yếu giữa một bộ máy tìm kiếm và một thư mục?
- 23 - Chương 4 Nguồn thông tin và dịch vụ thông tin Mục tiêu. Cuối chương này, học viên có thể: Phân biệt các loại cơ sở dữ liệu khác nhau và cách sử dụng mỗi loại cơ sở dữ liệu trong thư viện. Giải thích mục đích của cơ sở dữ liệu tại chỗ và đề xuất một số cơ sở dữ liệu hữu dụng trong thư viện. Giải thích kiểu URL mở với siêu dữ liệu điển hình. Giải thích công dụng của tiêu chuẩn URL mở để kết nối các tham khảo trực tuyến đến các tài liệu nguyên văn trực tuyến. Liệt kê một số gợi ý của các nguồn tham khảo điện tử dành cho cán bộ thư viện. Đọc giáo trình Trong chương này, bạn nên đọc Ferguson và Hebels, Chương 2. Giới thiệu Trong chương này, chúng ta nên xem xét các phương thức sử dụng công nghệ thông tin để giúp người dùng truy cập thông tin — khía cạnh của công tác quản lý thông tin – thư viện thường được nói đến như công tác tham khảo. Chương này bắt đầu với định nghĩa thuật ngữ “cơ sở dữ liệu” và danh sách các loại cơ sở dữ liệu khác nhau, sau đó bàn về cơ sở dữ liệu trực tuyến với cơ sở dữ liệu di động. Cơ sở dữ liệu tại chỗ cũng được thảo luận, mặc dù chủ đề này sẽ được khai thác sâu hơn trong khóa học này hay các khóa khác. Cuối cùng, trong chương 2 bạn sẽ học được một phương pháp mới – đó là ứng dụng của thiết bị giải kết nối (link resolvers) dành cho việc hỗ trợ người dùng tìm tài liệu toàn văn trên cơ sở dữ liệu trực tuyến.
- 24 - Bây giờ đọc Ferguson và Hebels, Chương 2, và trả lời các câu hỏi ôn tập trang 77-78 và xem đáp án trang 302. Cần đọc lại chương 1, trang 26-32, chương 1 khai thác các tính năng tìm kiếm cơ bản của công cụ tìm kiếm; đa phần chức năng này cũng là đặc điểm của nhiều cơ sở dữ liệu trực tuyến. Cơ sở dữ liệu Ferguson và Hebels định nghĩa cơ sở dữ liệu là “một bộ các tập tin máy tính có liên quan”; và hai tác giả định nghĩa tập tin là “một bộ các mẫu tin được sắp xếp và lưu trữ có tổ chức dưới dạng điện tử”. ? Có phải danh sách các tập tin trong một danh mục trên ổ đĩa cứng của máy tính cá nhân là một cơ sở dữ liệu? Nếu phải thì đặc điểm nào khiến nó là một cơ sở dữ liệu? Nếu không thì thiếu đặc tính nào của cơ sở dữ liệu? Tiếp theo, Ferguson và Hebels thảo luận 4 loại cơ sở dữ liệu khác nhau: • Thư mục; • Toàn văn; • Số; • Thư mục. Các nhóm này (nên bổ sung thêm “hình ảnh”) dựa trên loại thông tin trong cơ sở dữ liệu. Ferguson và Hebels nêu rõ vấn đề quan trọng là thuật ngữ “toàn văn” có thể dẫn sai đường, vì phiên bản điện tử của tạp chí khoa học có thể không giống như phiên bản in. Ví dụ như phiên bản điện tử có thể bao gồm các bài báo được chọn, hoặc đôi khi loại bỏ các tính năng như bảng và minh họa. Trong một số trường hợp, phiên bản điện tử của xuất bản phẩm được tăng cường thêm nội dung bổ sung không có trong phiên bản in tương đương, mặc dù việc này cũng hiếm có. Loại thứ 5 là cơ sở dữ liệu toàn văn ngoại lai hay thư mục lai, trong đó một số mẫu tin chỉ chứa dữ liệu thư mục, trong khi các mẫu tin khác trong cùng cơ sở
- 25 - dữ liệu cũng chứa những mẫu tin toàn văn được phát triển từ năm 2000. Cơ sở dữ liệu ProQuest là một minh họa cho cơ sở dữ liệu lai. Cơ sở dữ liệu trực tuyến và di động Công nghiệp cơ sở dữ liệu đã phát triển vào khoảng năm 1970, từ những khởi đầu tương đối đơn giản cho đến một cấu trúc phức tạp của các công ty và sản phẩm, đã tạo ra cho cán bộ thư viện và người quản lý thông tin vô số tùy chọn. Ferguson và Hebels thảo luận nền tảng phổ biến nhất mà cơ sở dữ liệu sử dụng như: • Dịch vụ thông tin trực tuyến, chủ yếu do nhà cung cấp cơ sở dữ liệu quản lý trên máy tính từ xa. • Cơ sở dữ liệu di động, phần lớn được mua trên CD-ROM và cài đặt vào mạng máy tính cục bộ. Đây là danh sách cơ sở dữ liệu trực tuyến có sẵn cho các thành viên của Hội Đồng Anh – Hà Nội: <http://www.britishcouncil.org/vietnam-information- services-online- databases.htm> Bạn nên khám phá thêm và tìm ra các cơ sở dữ liệu tiếng Việt có sẵn. Một số cơ sở dữ liệu truy cập miễn phí, còn số khác phải đăng ký và trả phí sử dụng. Nếu có nhiều cơ sở dữ liệu chỉ có thể sử dụng sau khi trả tiền thì có thể có “chủ cơ sở dữ liệu” cung cấp dịch vụ kết hợp cho cơ sở dữ liệu. Đó chính là ProQuest. ProQuest là một dịch vụ thương mại quản lý vô số các cơ sở dữ liệu. Khách hàng có thể truy cập tất cả các cơ sở dữ liệu riêng lẻ từ cùng một nguồn. Cũng có thể tìm kiếm trên nhiều cơ sở dữ liệu. Ferguson và Hebels mô tả 4 phương pháp truy cập các dịch vụ thông tin trực tuyến: • Trực tiếp sử dụng phần mềm truyền thông; • Sử dụng phần mềm dựa vào máy chủ ở lớp ngoài cùng. (server-based front- end); • Sử dụng phần mềm dựa vào máy khách ở lớp ngoài cùng (client-based front- end software); • Sử dụng dịch vụ cổng kết nối.
- 26 - ? Nêu các điểm khác biệt chính giữa việc sử dụng dịch vụ cổng vào và phần mềm đầu cuối (front-end)? Một phương pháp khác để truy cập các dịch vụ thông tin trực tuyến đã ngày càng trở nên phổ biến trong vài năm gần đây – đó là thông qua trình duyệt Internet. Hiện nay, nhiều nhà cung cấp cơ sở dữ liệu cho phép người dùng kết nối với phần mềm truy xuất thông qua giao diện dựa trên web. Nếu bạn xem xét danh sách cơ sở dữ liệu và tài nguyên điện tử của một thư viện đại học điển hình, bạn sẽ thấy rằng phần lớn những cơ sở dữ liệu và tài nguyên điện tử này có thể truy cập thông qua giao diện Web. Nghĩa là mọi người có thể truy cập cơ sở dữ liệu từ văn phòng làm việc hay máy tính ở nhà mà không cần phần mềm đầu cuối (front-end) đặc biệt nào. ? Bạn sẽ sửa đổi Hình 2.2 của Ferguson và Hebels như thế nào để minh họa cấu trúc của truy cập dựa trên web? Công nghiệp cơ sở dữ liệu trực tuyến đang phát triển nhanh chóng vì những đại lý cung cấp cơ sở dữ liệu thường xuyên cập nhật sản phẩm để tạo ra các đặc điểm bổ sung. Bài đọc dưới đây thảo luận về tiến trình phát triển của một sản phẩm trong suốt 7 năm, đó là OCLC’s FirstSearch. Bây giờ đọc Jane Bambrick, “OCLC’s FirstSearch: A Rookie Matures,” Searcher 8, no. 3 (March 2000): 36–41. (Bài đọc 1) ? Bambrick mô tả kỹ phương thức thay đổi của FirstSearch từ khi thư viện của tác giả lần đầu tiên đưa vào sử dụng sản phẩm này vào năm 1993. Bạn có thể rút ra kết luận gì về mức độ thay đổi trong nền công nghiệp cơ sở dữ liệu? Sự thay đổi này liên quan như thế nào đến mô hình vòng đời công nghệ đã được bàn đến trong chương 1? Tại sao nó quan trọng đối với cán bộ thư viện và chuyên gia thông tin để kịp thời nắm bắt những thay đổi trên?
- 27 - Loại nền cơ sở dữ liệu thứ 3 mà Ferguson và Hebels xác định là “cơ sở dữ liệu tại chỗ”, trong đó thư viện tạo ra cơ sở dữ liệu chuyên môn riêng, bằng cách mua một bộ con các dữ liệu từ người tạo cơ sở dữ liệu và có thể nâng cấp bộ này, hoặc bằng cách tạo cơ sở dữ liệu cục bộ riêng. Có thể có một số thư viện Việt Nam tạo nên cơ sở dữ liệu riêng, và một số các thư viện này có thể công khai rộng rãi thông qua giao diện Internet. Đây là cơ hội tốt cho cán bộ thư viện ở một quốc gia như Việt Nam. Bạn có thể bắt đầu một cơ sở dữ liệu mới cung cấp truy cập đến các tài nguyên không có sẵn trên những phương tiện khác. Ví dụ: Tài liệu về lịch sử của một thành phố hoặc một vùng. Tài liệu về một thể loại nhạc hay nghệ thuật ở Việt Nam. Tài liệu về thể thao hoặc một loại hình hoạt động nào đó ở Việt Nam Tài liệu về các loài chim và động vật trong vùng. Trên thực tế, thật sự không có giới hạn nào cho những việc có thể thực hiện. Bạn chỉ cần nghĩ về nhu cầu tài nguyên thông tin của người dùng, dù cho đủ hay không đủ tài liệu về vấn đề đó để chứng minh cơ sở dữ liệu, và tài liệu có trong cơ sở dữ liệu không cần phải xuất bản – có lẽ cơ sở dữ liệu sẽ hữu dụng hơn nếu không xuất bản tài liệu – sau đó tiếp tục tạo ra và duy trì cơ sở dữ liệu. Truy cập cơ sở dữ liệu Thư viện đang phải đối mặt một trong những thách thức khi cung cấp cho khách hàng truy cập các cơ sở dữ liệu thư mục là phương pháp tạo truy cập toàn văn tài liệu nguồn hiệu quả nhất. Cách giải quyết vấn đề này là sử dụng thiết bị giải kết nối (link resolvers) dựa trên tiêu chuẩn OpenURL. Trước khi tiến hành việc thực thi của thiết bị giải kết nối, không có một chuỗi lệnh liên tục từ khách hàng tìm ra một tham khảo cho tài nguyên điện tử trong một nguồn trực tuyến như mục lục và truy xuất tuần tự tài nguyên đó. Ví dụ, khách hàng có thể tìm thấy một trích dẫn thư mục ở cuối tài liệu trang web, nhưng để tìm được tài liệu đó thì phải ghi lại các chi tiết thư mục và thực hiện truy xuất riêng lẻ từ một cơ sở dữ liệu. Sau đó nó càng trở nên phức tạp hơn vì khách hàng sẽ không biết sử dụng cơ sở dữ liệu nào để thấy tài liệu cần tìm – không có tạp chí khoa học nào liệt kê tiện lợi trong cơ sở dữ liệu, do đó nếu không biết trước thao tác này việc tìm kiếm dữ liệu sẽ gặp khó khăn. Ngay cả
- 28 - các đại lý cung cấp cơ sở dữ liệu cũng không thể đưa ra danh sách chính xác các nhan đề mà họ tạo truy cập thông qua cơ sở dữ liệu riêng vì họ thay đổi quá thường xuyên. Sau đây là ví dụ về những gì đã xảy ra khoảng 5 năm về trước (2000), nếu khách hàng thư viện tìm thấy bài tham khảo ở cuối tài liệu điện tử: o Steven Kirby, (2000) \"Free to choose: the real power of Linux,\" Library Hi Tech, 18(1), 85-88 Trước tiên khách hàng đó phải ghi lại bài tham khảo, sau đó có gắng truy xuất tài liệu bằng cách chọn một trong nhiều cơ sở dữ liệu do thư viện cung cấp và kiểm tra xem cơ sở dữ liệu có truy cập vào Library Hi Tech được không. Nếu được thì khách hàng sẽ phải tìm một số của tập hay kỳ tạp chí khoa học nào đó, và sau đó là tìm một bài báo cụ thể trong kỳ đó. Nếu cơ sở dữ liệu đầu tiên không có tạp chí đó thì khách hàng có thể tìm trong các cơ sở dữ liệu khác hoặc tìm trong tài liệu in của thư viện (trong trường hợp những sinh viên ở xa thì cần phải yêu cầu lấy bản sao). Điều này đã thay đổi đáng kể trong suốt 5 năm qua nhờ vào sự phát triển của liên kết nhạy ngữ cảnh (context-sensitive linking). Ngày nay, nếu thư viện dùng thiết bị giải kết nối thì bạn có thể tìm kiếm tạp chí khoa học trong danh mục thư viện, và nếu thư viện vẫn còn giữ lại nhan đề đó thì bạn có thể kết nối trực tiếp với một tài nguyên điện tử như cơ sở dữ liệu có nhan đề đó (ví dụ: dùng ví dụ trên, thiết bị giải có thể chỉ bạn vào cơ sở dữ liệu ProQuest). Không chỉ có vậy, nhưng bạn sẽ kết nối vào chính nhan đề đó (nghĩa là kết nối này sẽ đưa bạn thẳng đến Library Hi Tech). Giả sử rằng bạn đang tìm kiếm trên một cơ sở dữ liệu trực tuyến và tìm thấy một bài báo bạn quan tâm nhưng cơ sở dữ liệu không có phiên bản toàn văn. Bạn có thể nhấp chuột vào kết nối và thấy tất cả các ví dụ của bài báo đó trong bộ sưu tập của thư viện, và một số ví dụ có thể là toàn văn. Để thật sự cung cấp liên kết liên tục vào bản sao toàn văn phù hợp, một ngữ cảnh người dùng, hoặc việc đăng kí hay đặt chỗ của thư viện họ, phải kết hợp với giải pháp kết nối. Thiết bị giải kết nối OpenURL thực hiện chính xác điều đó. Bây giờ đọc Christine Ferguson và Jill E. Grogg (2004), “OpenURL link resolvers,” Computers in Libraries 24(9): 17-18 and 24. [đề nghị bỏ trang 19-23] (Bài đọc 2)
- 29 - ? Dịch vụ thiết bị giải kết nối (link resolvers) chỉ hoạt động tốt như cơ sở kiến thức của nó. Công việc nào phải tạo nên một cơ sở kiến thức chính xác? OpenURL là gì? Nó là một cú pháp chuẩn để tạo ra kết nối giữa một nguồn thông tin và một thiết bị giải kết nối (link resolvers). Nó xác định trước bộ các yếu tố dữ liệu dùng để mô tả một 'mục'. Nó được HTTP truyền đi (đó là Web). Có thể truy cập thiết bị giải kết nối (link resolvers) từ cơ quan đặt mua tài liệu (subscribing institution) để tìm và truy xuất tài nguyên thông tin. Trong bài đọc 2, có thể xem ví dụ về OpenURL và cách mô tả một tài nguyên thông tin, ví dụ như thể loại, nhan đề, số ISSN, dữ liệu, tập, kỳ hoặc tên tác giả… Có thể định nghĩa bài toàn văn bằng một bộ các yếu tố metadata chứ không bằng URL. Kế đó giao thức OpenURL tiêu chuẩn hóa việc trích và truyền của các yếu tố metadata này. Các kết nối được gởi từ các nguồn (như trích dẫn trong cơ sở dữ liệu, bài báo toàn văn trên site của nhà xuất) cho đến đích (như mẫu tin trong danh mục trực tuyến, bài toàn văn trong cơ sở dữ liệu trực tuyến, dịch vụ mượn liên thư viện….). Thiết bị giải kết nối là một công nghệ đóng vai trò trung gian giữa nguồn và đích. Thiết bị giải kết nối cần cơ sở kiến thức để thực hiện những điều hữu ích, và cơ sở kiến thức phải được những cán bộ địa phương tùy chỉnh, do đó nếu thư viện mua một thiết bị giải kết nối thì cán bộ phải phổ biến cơ sở kiến thức này. Hiệu quả của thiết bị giải kết nối đòi hỏi tính cẩn thận và chính xác cao của cơ sở kiến thức, nên cán bộ thư viện phải nỗ lực hết mình để đảm bảo dữ liệu nhập vào chính xác và hiện hành. Dĩ nhiên có một số hạn chế trong Open URL, ví dụ: 1. Những loại và yếu tố metadata cho phép được định trước, nên người dùng không có cách nào định nghĩa những cái mới. 2. Giới hạn của các liên kết: Thiết bị giải, Mục chọn, Nguồn. Gắn liền với giao thức HTTP
- 30 - Các vấn đề Ferguson và Hebels đưa ra hàng loạt các vấn đề phát sinh của tài nguyên tham khảo điện tử đối với nghề thông tin và thư viện. Để kết thúc chương này, hãy nghĩ về những vấn đề này và các hàm ý chung đối với nghề thông tin – thư viện. Bài đọc sau nêu lên một số vấn đề xảy ra trong thư viện đại học. Bây giờ đọc Carol Tenopir và Lisa A. Ennis, “Các Dịch Vụ Tham Khảo Trong Thiên Niên Kỷ Mới,” Online 25, số 4 (Tháng 7/ tháng 8 2001): 40–42, 44–45. (Bài đọc 3) ? Nêu lên một số ẩn ý về các nguồn tham khảo điện tử dành cho cán bộ quản lý thông tin – thư viện và khách hàng do Tenopir và Ennis đã xác định. Những ấn ý này liên quan với mô hình vòng đời công nghệ (đã thảo luận trong chương 1) như thế nào? Chuẩn bị cho tiết học hàng tuần Bài tập Có nhiều bài tập tìm kiếm cơ sở dữ liệu có thể dùng trong chương này. Dưới đây là một ví dụ đơn giản được lấy từ New Zealand. Bài tập này cần phải điều chỉnh phù hợp với bối cảnh Việt Nam. Tiến hành tìm kiếm 3 cơ sở dữ liệu sau đây, có thể truy cập qua thư viện: [Sử dụng các cơ sở dữ liệu từ Trung tâm Học liệu Đại học Cần Thơ] Các kỷ yếu Công nghệ và Ngành Thông tin – Thư viện Toàn văn ngành Thông tin – Thư viện LISA: Library and Information Science (ngành Thông tin – Thư viện) Chọn 1 trong số các chủ đề sau [đổi sang bối cảnh ở Việt Nam] Sử dụng công nghệ cho Maori Archives
- 31 - Các vấn đề an ninh trong Quản lý Biểu ghi Chất lượng phục vụ của các dịch vụ thư viện điện tử Trong tài liệu xử lý văn bản: Gồm tên bạn và chủ đề tìm kiếm là dòng tiêu đề in đậm, canh giữa. Viết khoảng 200 từ bàn về những điểm khác nhau giữa việc tìm kiếm 3 cơ sở dữ liệu theo chủ đề của bạn. Sao lại 3 bài tham khảo có liên quan từ kết quả tìm kiếm của bạn vào tài liệu, và và định dạng theo kiểu trích dẫn APA. Nộp lại tập tin xử lý văn bản dưới đây. Đánh dấu tiêu chí: Tên bạn là tiêu đề in đậm, canh giữa trong phần đính kèm. Phần bình luận về những điểm khác biệt giữa tìm kiếm 3 cơ sở dữ liệu thì đúng và phù hợp. Các trích dẫn của bạn được định dạng đúng. Câu hỏi ôn tập Trả lời tất cả các câu hỏi để đảm bảo rằng bạn hiểu giáo trình và bài đọc, chuẩn bị thảo luận các câu hỏi vào tiết học hàng tuần. 1. Có phải danh sách các tập tin trong một danh mục trên ổ đĩa cứng của máy tính cá nhân là một cơ sở dữ liệu? Nếu phải thì đặc điểm nào khiến nó là một cơ sở dữ liệu? Nếu không thì thiếu đặc tính nào của cơ sở dữ liệu? 2. Nêu các điểm khác biệt chính giữa việc sử dụng dịch vụ cổng vào và phần mềm đầu cuối (front-end)? 3. Bạn sẽ sửa đổi Hình 2.2 của Ferguson và Hebels như thế nào để minh họa cấu trúc của truy cập dựa trên web?
- 32 - 4. Bambrick (Bài đọc 1) mô tả kỹ phương thức thay đổi của FirstSearch từ khi thư viện của tác giả lần đầu tiên đưa vào sử dụng sản phẩm này vào năm 1993. Bạn có thể rút ra kết luận gì về mức độ thay đổi trong nền công nghiệp cơ sở dữ liệu? Sự thay đổi này liên quan như thế nào đến mô hình vòng đời công nghệ đã được bàn đến trong chương 1? Tại sao nó quan trọng đối với cán bộ thư viện và chuyên gia thông tin để kịp thời nắm bắt những thay đổi trên? 5. Dịch vụ thiết bị giải kết nối chỉ hoạt động tốt như cơ sở kiến thức của nó. Công việc nào phải tạo nên một cơ sở kiến thức chính xác? 6. Nêu lên một số ẩn ý về các nguồn tham khảo điện tử dành cho cán bộ quản lý thông tin – thư viện và khách hàng do Tenopir và Ennis đã xác định. Những ấn ý này liên quan với mô hình vòng đời công nghệ (đã thảo luận trong chương 1) như thế nào?
- 33 - Chương 5: Các hệ thống thư viện tích hợp 1. Khái niệm Ở chương 2, chúng ta được tìm hiểu khái quát về tự động hóa và các hệ thống tự động hóa; trong chương này chúng ta sẽ tập trung vào cụ thể một dạng hệ thống tự động hóa (tin học hóa) thư viện là Hệ thống TV tích hợp. Hệ thống thư viện tích hợp là gì? Tại sao gọi là tích hợp? Trước hết tích hợp ở đây có nghĩa là toàn bộ các quy trình quản lý được liên thông dữ liệu giữa các thành phần với nhau. Dữ liệu đầu vào được xuyên suốt qua các hệ thống con như 1 dòng chảy dữ liệu. Hệ thống thư viện tích hợp là hệ thống phần mềm quản lý tất cả các quy trình nghiệp vụ thư viện theo một thể hợp nhất các chức năng nghiệp vụ. cụ thể là tất cả các chức năng quản lý của 1 thư viện đều được hợp nhất trên 1 hệ thống tổ chức thông tin. Lượt đồ dòng dữ liệu của 1 Hệ thống thư viện tích hợp thông thường bao gồm các thành phần sau đây: 2. Mục tiêu của Hệ thống thư viện tích hợp + Nâng cao khả năng quản lý, đưa ra kế hoạch và điều hành tất cả các nguồn lực (tài liệu, tài chính, đọc giả, nguồn cung cấp...) hiện có trong nhà trường một cách có hiệu quả theo quy trình đổi mới quản lý trong ngành giáo dục thông qua việc ứng dụng CNTT + Cho phép các trường tin học hóa các hoạt động quản lý dạy và học + Tăng cường khả năng kiểm soát các hoạt động nghiệp vụ; cung cấp thông tin kịp thời, chính xác, hiệu quả cho công tác quản lý cũng như hỗ trợ ra quyết định trong việc điều hành + Chuẩn hóa việc sử dụng 1 hệ thống cơ sở dữ liệu dùng chung
- 34 - 3. Đặc điểm chức năng của một hệ thống Thư Viện Tích hợp 3.1. Đặc điểm Hệ thống quản lý thư viện tích hợp 3.2. Chức năng Hệ thống quản lý thư viện tích hợp Như ở lượt đồ dòng dữ liệu thì chúng ta đã biết quản lý thư viện bao gồm 3 phân đoạn chính: danh mục đầu vào, chuỗi các xử lý theo quy trình nghiệp vụ, danh mục đầu ra. Hệ thống QLTVTH thông thường bao gồm một số chức năng cơ bản sau: i. Quản lý Bổ sung (đặt mua tài liệu): cung cấp và hỗ trợ đầy đủ các chức năng nghiệp vụ phục vụ công tác bổ sung của một thư viện như Thiết lập các đơn đặt và đơn nhận tài liệu; Lưu trữ tất cả các thông tin của đơn đặt và nhận => theo dõi sát sao công tác bổ sung tài liệu của thư viện; Cho phép thống kê, quyết toán, tạo các báo cáo, các khiếu nại... liên quan đến công tác bổ sung tài liệu. ii. Quản lý Biên mục: Biên mục tài liệu theo chuẩn quốc tế cho thư mục đọc được bằng máy tính, khổ mẫu MARC21 thuận tiện cho việc truy suất và chia sẻ dữ liệu thư mục liên thư viện. Cung cấp Worksheet nhập dữ liệu linh hoạt cho từng nhân viên biên mục và từng loại hình tài liệu đặc thù: sách, báo, tạp chí, băng đĩa CD,… iii. Quản lý Bạn đọc: Quản lý tất cả hoạt động giao dịch của bạn đọc với thư viện, cho phép đăng ký bạn đọc mới, lập chính sách sử dụng thư viện cho từng nhóm bạn đọc khác nhau. iv. Quản lý Lưu thông: Quản lý hoạt động giao dịch với bạn đọc bằng tích hợp công nghệ mã vạch gán cho mỗi tài liệu để thư viện biết được các thông tin về mượn - trả tài liệu của bạn đọc, thời gian mượn, tài liệu mượn, hạn trả tài liệu,…đặc biệt tiết kiệm thời gian thao tác trong quá trình mượn trả tài liệu. v. Quản lý Kho: cho phép tạo lập, tổ chức và quản lý kho tài liệu trong cơ sở dữ liệu theo yêu cầu của từng thư viện. Nhằm tạo thuận lợi cho việc quản lý từng loại hình tài liệu và quy định chính sách khai thác
- 35 - phù hợp (kho chính, kho phụ, kho chức năng, phòng, giá, ngăn, sách tham khảo, giáo trình, media,…) vi. Quản lý tài liệu số: cho phép tạo lập các bộ sưu tập tài liệu số hóa theo nhu cầu sử dụng của thư viện. Tài liệu số được tổ chức và biên tập theo chuẩn quốc tế Dublin Core để có thể truy suất và chia sẻ dữ liệu liên thư viện. vii. Tra cứu mục lục trực tuyến (OPAC): Tìm kiếm tài liệu trong thư viện qua mạng máy tính để xác định vị trí của tài liệu và cũng là công cụ hỗ trợ bạn đọc xác định đúng nhu cầu đọc trước khi tới thư viện. viii. Quản trị hệ thống: Quản lý hệ thống đảm bảo thông suốt quá trình hoạt động của toàn bộ phần mềm. 4.3. Cách thức vận hành một Hệ thống quản lý thư viện tích hợp 4. Xây dựng hệ Thống Thư viện tích hợp Kế hoạch xây dựng một hệ thống thư viện hoàn chỉnh cũng giống như 1 hệ thống tổ chức truy cập thông tin cũng bao gồm các bước cơ bản nhưng có một số điểm mới. (sẽ được học chi tiết ở chương 3 – Lập kế hoạch lựa chọn, triển khai hệ thống) Các bước xây dựng kế hoạch tin học hóa quản lý thư viện thực sự là các bước kế hoạch quản lý dự án CNTT thực thụ. Quy trình triển khai 1 hệ thống thư viện tích hợp: - Đề ra mục tiêu vì sao phải tự động hoá thư viện hoặc chuyển đổi từ hệ thống cũ sang hệ thống mới thông qua việc bảo lưu phần cài đặt trước đó. Đặc biệt nếu trước đó thư viện đang sử dụng hệ thống củ thì phải cần thêm rất nhiều bước chuẩn bị cho tiến trình triển khai trước đó. - Lập ban quản lý dự án - Phân tích hệ thống các chức năng cần thiết cho thư viện. - Đấu thầu xét quyệt. - Phân tích, đánh giá để lựa chọn hệ thống. - Đàm phán hợp đồng. - Cài đặt và kích hoạt hệ thống. - Tổ chức tập huấn nghiệp vụ và tập huấn quản lý Hệ thống - Đi vào sử dụng và bảo trì hệ thống: giai đoạn này các bên mua hệ thống và bên sử dụng hệ thống đều phải thống nhất các điều khoản trong hợp đồng: bên sử dụng phải kết hợp với bên bàn giao sản phẩm liên tục để nhận được sự trợ giúp vê kỹ thuật. 5. Đánh giá Hệ thống quản lý thư viện 5.1. Tổng quan Hoạt động đánh giá hệ thống QLTV là hoạt động nằm trong khuôn khổ tiến trình phát triển của Hệ thống; nhằm nhận định lại các giá trị mà hệ thống sau khi được vận hành. Trọng tâm công tác đánh gái hệ thống không chỉ đơn thuần
- 36 - 1 vài đối tượng tham gia mà phải tập hợp tất cả các thành phần liên quan cùng xem xét đánh giá. Thông thường, các hệ thống đánh giá chất lượng bao gồm rất nhiều khâu vàtuân thủ 1 tiêu chuẩn thống nhất 5.2. Tiếp cận đánh giá Cách thức tiến hành đánh giá theo 1 khuôn khổ nhất định, ví dụ đánh giá cái gì? Ai đánh giá? Đánh giá các thành phần nào? Giá trị kết quả đánh gái đó dùng để làm gì? Các phương pháp đánh giá thông qua đánh gái trong và đánh giá ngoài… 5.3. Các tiêu chí đánh giá 5.3.1. Nhóm tiêu chí về công nghệ thông tin và truyền thông Một hệ thống QLTV được thiết kế, triển khai và vận hành trên cơ sở áp dụng những thành tựu tiên tiến của CNTT và truyền thông. Ngoài ra, HT QLTV sinh ra và phát triển để hoạt động trong môi trường nối mạng. Do vậy, các tiêu chí về CNTT và truyền thông dưới đây có thể được coi là các tiêu chí cơ bản cần được đáp ứng đối với hệ thống TC. Kỹ thuật và nguyên tắc trong thiết kế HT: Phần mềm phải được thiết kế, xây dựng và vận hành theo các chuẩn công nghệ mở để đảm bảo khả năng nâng cấp, thay đổi, bổ sung, kết nối thêm các module mới mà không kéo theo sự đổ vỡ hệ thống cũng như phải đảm bảo được sự kế thừa các thành quả đã đạt được. Kiến trúc xây dựng của mô hình HT QLTV - Hiện nay, các hệ thống QLTV được thiết kế chủ yếu theo mô hình Client – Server; cụ thể với website, cũng được thiết kế theo Webrowser – Webserver - Khả năng kết nối nhiều máy khách với máy chủ cùng 1 thời điểm có đam bảo không. - Hệ thống phải có khả năng chịu tải lớn, đảm bảo các kết nối duy trì liên tục - Hỗ trợ các giao thức TCP/IP để đảm bảo khả năng kết nối mạng toàn cầu và triển khai các dịch vụ liên quan tới chia sẻ và khai thác các nguồn tin điện tử trên thế giới. - Có thể làm việc trên ,môi trường GUI (desktop và webase) nhưng Làm việc trong môi trường Web đang là xu hướng và rất phổ biến, bằng tiếng Việt và tiếng Anh hoặc một số ngôn ngữ phổ biến khác. - Máy chủ sử dụng hệ điều hành Windows server và có thể chuyển sang Linux một cách dễ dàng; máy trạm có thể sử dụng bất cứ hệ điều hành nào để hỗ trợ Web.
- 37 - Một số bước đánh giá chuyên môn phổ biến khác về kỹ thuật + Đánh giá lại việc thiết kế, triển khai hệ thống và vận hành của hệ thống quản lý thông tin về mức độ hiệu quả của HT + Kiểm tra các máy trạm và thiết bị đầu cuối nằm trong tầm kiểm soát của nhà quản trị mạng + Đánh giá dữ liệu lưu trữ trên máy tính hay trên server được an toàn và bảo mật + Đánh giá tính bảo mật trong kết nối giữa máy tính cá nhân và máy chủ + Kiểm tra các máy tính tuân thủ theo chính sách IT + Kiểm tra việc cập nhật bản vá lỗi của hệ thống gồm máy tính cá nhân và máy chủ + Thiết lập hệ thống kiểm tra và báo cáo định kỳ cho hệ thống Nhóm tiêu chí về truy cập thông tin Một hệ Quản lý TV phải đáp ứng được các câu trả lời sau: - Mức độ đáp ứng hệ thống truy cập là 24/7 - Khả năng sử dụng linh hoạt cua các thành phân bên trong hệ thống - Có thể thiết lập được nhiều điểm truy cập (access point) - Chức năng truy xuất thông tin - Khả năng tìm kiếm thông tin đa dạng và nhanh chóng - Kết xuất thông tin hỗ trợ có tốt không - Hệ thống có hỗ trợ tốt các chức năng chia sẽ thong tin với các hệ thống các cùng cấp. - Các hệ thống thong tin có đảm bảo yếu tố tăng cường khả năng đáp ứng thông tin cả tổ chức. - Chính sách thông tin có được đảm bảo đúng tiêu chuẩn chặt chẽ không, ngoài ra sự phân luồng thong tin trong hệ thong tổ chức giúp tăng cường khả năng truy xuất. - Mức độ tiếp cận và khả năng lưu trữ lịch sử sử dụng hệ thống có đảm bảo không…. - Và một số tiêu chí khác
- 38 - Chương 6: TRÌNH BÀY DỮ LIỆU, IN VÀ TẢI DỮ LIỆU Giới thiệu Các nội dung sinh viên phải nắm sau khi kết thúc chương này - Một số công cụ đóng gói hữu cích cho việc biễu diễn thông tin đầu ra của các định dạng dữ liệu thư mục - Tạo ra các trường thông tin để xuất bản tạp chí đa dạng, với mỗi một dạng có một kiểu định dạng khác nhau - Sử dụng Endote và Reference Manager - Cài đặt và sử dụng - Áp dụng các kiến thức đã học ở chương 4 – 7 Nội dung Xác định trước và định dạng đầu ra sử dụng Hầu hết các phần mềm được đề xướng 2 định dạng đầu ra trước: cho phép một danh sách kết quả tìm kiếm tóm tắt và một hiển thị kết quả đầy đủ của biểu ghi. Tuy nhiên, sẽ không có nhiều sự tùy chọn linh hoạt cho người sử dụng đặc biệt là các định dạng dữ liệu đầu ra. Điều này sẽ làm hạn chế sự thỏa mản nhu cầu của người dùng bởi vì thông thường người dung cần những định dạng mà không có được thiết lập sẳn. Đôi khi, người dùng có thể muốn có một định dạng nhanh chóng của riêng mình mà chỉ bao gồm tiêu đề bài viết và tên tạp chí, hoặc chỉ liên kết các tác giả, tiêu đề bài báo, và năm xuất bản, hoặc tiêu đề thích hợp, các ISSN, và nhà xuất bản trong trường hợp của một thư mục nối tiếp Nội dung định nghĩa Xác định nội dung phần tử dữ liệu đầu ra (cả hai danh sách kết quả ngắn hạn và đầu ra đầy đủ) nên được dễ dàng như việc chọn các thành phần dữ liệu từ một danh sách, và làm như vậy trên các kích thích của thời điểm này. đáng ngạc nhiên vài chương trình cho phép tùy chọn này, mặc dù nó thường được tìm thấy trong cơ sở dữ liệu thương mại được xuất bản bởi DIALOG, Ovid, và SilverPlatter ít nhất là cho sản lượng đầy đủ. RM cung cấp các giải pháp linh hoạt nhất và tự do bằng cách cho phép người dùng quyết định những phần tử dữ liệu sẽ được hiển thị trong danh sách kết quả ngắn Cách bố trí Thiết kế và xác định cách bố trí của đầu ra là một quá trình phức tạp hơn định nghĩa nội dung. Cách này không thực sự thích hợp để ứng biến cách bố trí. một
- 39 - số chương trình cung cấp tùy chọn mạnh mẽ để kiểm soát bố trí tốt nhất khi quyết định trong việc thiết kế cơ sở dữ liệu và giai đoạn phát triển chứ không phải là người sử dụng sau đây để lựa chọn bố trí khác nhau. Giao diện tính năng liên quan đến bố trí cả các trang và các hồ sơ cá nhân. Trang bố trí bao gồm các định nghĩa của các lề, in tiêu đề và cuối trang, sử dụng và sự sắp chư của nhóm, và khoảng cách giữa các hồ sơ. Bố trì mẫu tin bao gồm khoảng cách ngang và dọc của các yếu tố dữ liệu trong hồ sơ, loại font chữ và kích thước font chữ, dấu chấm câu và ghi nhãn của dữ liệu phần tử, và điều trị đặc biệt của lần xuất hiện đầu tiên và cuối của các trường lặp lại Các định dạng thư mục và phần mềm quản lý cũng cung cấp trợ giúp đồ họa trong việc xác định bố cục trang. Mặc dù con số 10-9 10-11 cho thấy đặc điểm kỹ thuật bố trí kiểm soát kẻ thù DB/TextWorks, Procite, và Reference Manager Cửa sổ và kiểm soát các phần rời rạc Một cửa sổ là một dòng đoạn ngắn(hoặc một phần hồ sơ a) ở đầu trang. Một đứa trẻ mồ côi là một dòng chuỗi đơn(hoặc một phần hồ sơ) ở dưới cùng của trang. Cửa sổ và kiểm soát mồ côi có khả năng không điển hình của Micro-CDISIS cho phép các nhà thiết kế để xác định rằng một vài hồ sơ được chuyển đến trang tiếp theo nếu có ít hơn một số ngành, nghề được để lại trên trang. Điều này có thể tránh được các hồ sơ trên các trang chia tách. Trong trường hợp của một thư mục rất lớn, điều này có thể làm việc ra hoàn hảo, nhưng tải về danh sách kết quả và đục nó bằng cách sử dụng một bộ xử lý từ luôn luôn là một lựa chọn. Ví dụ, nếu không phải là một từ hoặc hai luồng sang trang tiếp theo, giảm kích thước font 12-11 cho các trừu tượng có thể giải quyết được vấn đề. Độc giả sẽ không thất kinh, nếu họ nhận thấy nó ở tất cả. Xem thêm ví dụ minh họa hình 10-12 Định dạng cho xuất dữ liệu Hầu hết các chương trình cung cấp một số tùy chọn cho việc xuất khẩu các dữ liệu hoặc trong các định dạng sở hữu độc quyền của một số sử dụng rộng rãi các chương trình khác thư mục hoặc trong một định dạng trao đổi tiêu chuẩn như định dạng dấu phẩy-và-b-giới hạn hoặc được phân định tab format.only Micro- CDISIS cung cấp xuất khẩu của các bản ghi trong MARC xuất khẩu chỉ ở định dạng truyền thông format.DBTextWorks là định dạng được dán nhãn riêng của nó, trừ khi các MARC xuất nhập khẩu tiện ích được phát triển bởi MITINET là purchesd khoảng $ 250 - một mức giá cao cho phần mềm chuyển đổi hai chiều.
- 40 - Chương 7 Phần cứng và phần mềm máy tính Mục tiêu. 1. Liệt kê và giải thích các thành phần phần cứng chính của máy tính để nhập, xuất và xử lý. 2. Liệt kê và giải thích các loạiphần mềm khác nhau trong máy tính. Giới thiệu Chương nàyđề cập đến công nghệ và phần mềm máy tính – hai thành phần cơ bản của một hệ thống máy tính. Phầnđầu thảo luận tính năng của các thành phần phần cứng chủ yếu trong một hệ thống máy tính, tiếptheo là phần mô tả các nhóm phần mềm chính. Sau đó, xem xét các kỹ thuật được sử dụng để viết chương trình máy tính. Bây giờđọcFerguson và Hebels, Chương 6, trang 167-178. Làm các câu hỏiôn tập số 1-7 trang 195. Có thể kiểm tra phần trả lời trang 306-7. Phần mô tả công nghệ trong Ferguson và Hebels phần lớn đều dựa trên các khái niệm vàítđề cậpđến từng bộ xử lý cụ thể. Để biết thêm mô tả chi tiết hơn về phần cứng và phần mềm, hãy tham khảo: Paling, Stephen. A Hardware and Software Primer for Librarians: What Your Vendor Forgot to Tell You. Lanham, Md.: Scarecrow, 1999
- 41 - Paling đãđưa ra mô tả công nghệ sâu hơn, gồm ứng dụng của khe cắm mở rộngđể nâng cấp các chức năng máy tính cá nhân. Để có minh họa và giải thích rõ ràng về cách thức hoạtđộng của các thành phần khác nhau, hãy tham khảo: White, Ron. How computer work. ấn bản thứ 7. Indianapolis, IN: Que, 2004 Các khái niệm căn bản Mặc dù chúng ta đều có khuynh hướng nghĩ rằng công nghệđang phát triển nhanh chóng, nhưng các thành phần dựa trên khái niệm cơ bản của một hệ thống máy tính vẫn tương đốiổn định trong suốt 35 năm qua. Trang 168, Ferguson và Hebels đãđưa ra hai mô hình miêu tả các chức năng của hệ thống máy tính trong Hình 6.1. ? Theo bạn, biểuđồ thứ nhất trong Hình 6.1 có phải là cách chính xác nhất để thể hiệnmối quan hệ giữa phần cứng và phần mềm, giữa dữ liệu thô và các thông tin hữu ích không? Nếu không thì bạn sẽ thay đổi biểuđồ như thế nào? Nếu có thì nêu lý do tại sao? Phần cứng Như Ferguson Hebels nói, phần cứng là thuật ngữ chung dành cho các thành phần vật lý có thể thấy và tiếp xúcđược trong một hệ thống máy tính (đôi khi gọi là những bộ phận bạn có thểđá!). Biểuđồ của hai tác giả trong Hình 6.2 cho thấy mối quan hệ giữa 4 nhóm phần cứng chính. ? Tại sao Hình 6.2 có mũi tên hai chiều giữa “Bộ phận lưu trữ” với “bộ phận xử lý và điều khiển”? Thiết bị nhập Thiết bị nhập chuyển đổi dữ liệu “thế giới thật” thành dạng dữ liệu máy tính có thểđọcđược, Ferguson và Hebels đề cập cậpđến các loại thiết bị nhập phổ biến nhất như bàn phím, chuột, đầuđọc mã vạch, máy quét vàmáy nhận biết giọng nói. Đối với phần lớn mọi người thì bàn phím và chuột là hai thiết bị nhập quan
- 42 - trọng nhất. Bàn phím có từ thời máyđánh chữ, vàđược thiết kế theo kiểu QWERTY. Đã từng có một số kiểu bố trí bàn phím hiệu quả hơn nhưng đều không thành công. (Bạn có thể hỏi lý do tại sao vìđiều này sẽ giúp bạn biết nhiều hơn về những đổi mới có lúc thành công vàđôi khi cũng thất bại.) Ngược lại, chuộtđược phát minh dành cho máy tính, do đóít có tính trì trệ ngăn cản sự phát triển máy tính. Tuy nhiên, máy nhận biết giọng nói không đơn giản chỉ là thiết bị nhập. Nó thường liên quan đến micro cũng như một phần mềmđặc biệt “nhận biết” âm thanh của lời nói và chuyển đổi âm thanh này thành một chuỗi các ký tự thích hợp. Máy quétđã nổi lên từ nhiều năm nay, nhưng cho đến thời gian gần đây, máy quét ảnh gần giống như thiết bị ngoại biên đối với việc quản lý thông tin. Điềuđã tạo ra sự thay đổi nàyđó là mối quan tâm lớnđến số hóa và sự phát triển của thư viện số. Vẫn còn một số lượng khổng lồ các tài liệu chỉ tồn tại dưới dạng in ấn, do đó nếu chúng ta muốn sử dụng công nghệđể bảo quản nguyên bản vàđể giúp có thể truy cập rộng rãi nội dung trong thư viện số thì lượng tài liệu này cần phải quét thành dạng số. Máy quét ngày nay nhỏ, nhanh và nhẹ hơn so với trướcđây. Có nghĩa là thay vì mang tài liệuđến máy quét ảnh, nếu muốn thì ta có thể mang máyđến tài liệu. Một khía cạnh khác của máy quét là chọn chất lượngđộ phân giải củaảnh. Bạn sẽ cầnđộ phân giải tối thiểu 300dpi ; tối thiểu 600dpi là tiêu chuẩn để số hoá cho các tài liệu trong những dựán số. Máy chụp ảnh kỹ thuật số vừa trở thành một thiết bị nhập khá phổ biến. Bạn có thể tự sử dụng và tải hình ảnh về máy tính để chỉnh sửa và hiển thị. Đôi lúc không thể quétảnh tài liệu thì lúcấy máyảnh là một công nghệ rất cóích. Nếu bạn không muốn làm hỏng gáy sách thìđừng đưa quyển sách vào máy quétảnh phẳng. ? Đối với mỗi thiết bị nhập Ferguson và Hebels phân loại, hãy xácđịnh loại dữ liệu‘thực’để thiết bị có thể nhận biết. Tại sao quá trình chuyển đổi này lại cần thiết? Bộ xử lý và điều khiển Phần cứng liên quan đến quá trình xử lý và kiểm soát có hai mụcđích: • Thứ nhất, làđể thực hiện các bước cần để biến đổi dữ liệu thô thành thông tin cóích;
- 43 - • Thứ hai, làđể kết hợp thao tác thực hiện bằng các thành phần khác của hệ thống máy tính. Thành phần phần cứng chính liên quan đến quá trình xử lý và kiểm soát chức năng làđơn vị xử lý trung tâm, thường viết tắt là CPU; đôi khi được gọi là bộ xử lý. CPU là trái tim của máy tính. Ferguson và Hebels đã minh họa cho các thành phần chính của CPU trong Hình 6.3, do đó bạn nên chắc chắn rằng có thể giải thích chức năng của mỗi thành phần. Ghi chú vị trí của‘bus’ trong bộ xử lý. Bus dữ liệu (có thể là rộng 8, 16, 32 hay 64 bits) truyền những bit nhỏ của dữ liệu qua lại giữa bộ nhớ máy tính. Busđịa chỉ truyền địa chỉđến bộ nhớ (“đi và lấy dữ liệu lưu trong địa chỉ này”). ? “Tốcđộđồng hồ” của CPU là gì? Và tại sao nó quan trọngkhi xácđịnh tốcđộ nào hệ thống máy tính có thể xử lý dữ liệu? Sức mạnh của bộ vi xử lývẫn tiếp tục nhảy vọt với tốcđộ phi thường — phải gọiđây là một hiện tượng — và George Moore của Intel đã dựđoán trước sự việc này vào năm 1965. Nhiềuthiết bị bán dẫn hơn hơn giúp xử lý nhanh hơn, nhưng hầu hết các bộ xử lý hiện nay có quá nhiều thiết bị bán dẫn đến nỗi một sốthiết bị bán dẫn sẽ ngồi nhàn rỗi chờ những phần khác của bộ xử lý thực hiện chức năng. Một quá trình gọi là “đường ống dẫn” làm giảm thời gian chờđợi vì các thao tác có thể trùng lấp. Mặc dù có thể mất 5 xung nhịpđể thực hiện mỗi chỉ dẫn, nhưng có thể cóđồng thời 5 chỉ dẫn trong nhiều giai đoạn khác nhau khi thực hiện. Vỉ mạch chính Vỉ mạch chính là trung tâm của máy tính, vì nó là bảng mạch chính. CPU nằm trên bảng mạch in chính, cũng như bộ nhớ truy cập ngẫu nhiên RAM (có một số thông tin trên bộ nhớ sắp được thảo luận). Các vỉ mạch có “khe cắm mở rộng” thì rất phổ biến, các khe cắm này cho phép bổ sung thêm nhiều RAM hơn. Đôi khi chúng ta nghĩ rằng cần một máy tính hoàn toàn mới, nhưng thật ra mua nhiều RAM hơn cũng đãđủ rồi. Vỉ mạch chính kết nối với các thiết bị khác thông qua những “khe cắm” phù hợp với nhiều tiêu chuẩn khác nhau. Một câu hỏi cần cần trả lời là liệu một thiết bị có thể sử dụng khe cắm trên máy tính của bạnđược không. Những máy tính cũ hơn sử dụng bus kiến trúc tiêu
- 44 - chuẩn công nghiệpISA (Industry Standard Architecture), trong khi một số máy tính khá mới khác sẽ có khe cắm tương kết thành phần ngoại vi PCI (Peripheral Component Interconnect). Một số máy tính có khe cắm giao diện hệ thống máy tính nhỏ SCSI (Small Computer System Interface) dùng để kết nối các máyquétảnh… Hầu hết tất cả các máy tính mới sẽ có một, hai hay nhiều cổng USB (Universal Serial Bus). CóUSB chúng ta có thể tiến gần hơn đến mối tương kết thật sự khi ngày càng nhiều thiết bị ngoại vi có thể kết nối với bộ xử lý trung tâm thông qua USB. Card âm thanh Trước khi cóthẻ âm thanh, máy tính nhỏ chỉ kêu bíp bíp. Sự có mặt của thẻ SoundBlaster vào năm 1989 (mộtđóng góp vĩđại nhất vào ngành công nghệ thông tin củaSingapore) đã thay đổi tất cả. Mặc dù mụcđích củathẻ âm thanh là nhập và xuấtâm thanh, bạn có thể xem nó như một máy tính siêu nhỏ vì nó bao gồm một bộ xử lý nhỏ kiểm soát tất cả các hành động của nó. Có một số hình thức quản lý thông tin có thểđòi hỏi phải cóâm thanh chất lượng rất caodo đóthẻ âm thanh trở thành một nhân tố quan trọng. Một minh họa rõ ràng nhất là thư viện nhạc, đó là kho lưu trữ với nhìều tài liệuđa phương tiện (ví dụ như các cảnh trong phần chương trình thời sự của tivi, lịch sử truyền miệng hay âm nhạc). Máy tính cóthẻ âm thanh (hay bất kỳ thiết bị tương tự nào) đều cần phần mềm riêng để làm nó hoạtđộng, thường gọi là “trìnhđiều khiển thiết bị”. Thẻ âm thanh thường cắm vàoổ cắm PCI. Thẻ video Thẻ video khá giống vớithẻ âm thanh vềý nghĩa thiết kế. Một sốứng dụngđồ họa đòi hỏi một loại thẻ video nàođó và sẽ không thể hoạtđộng nếu không có loại thẻ nàođó, do đó nếu công việc của bạn yêu cầu phải có video kỹ thuật cao thì lúcấy thẻ video sẽ rất quan trọngđối với bạn. Bộ lưu trữ Như Ferguson và Hebels đã nói, nếu không có thiết bị lưu thì máy tính sử dụng rất chán, mỗi lần chúng ta muốn làm điều gìđó chúng ta sẽ cần nhập lại tất cả các dữ liệu cần thiết. Dung lượng lưu trữ thường được tính bằng byte, trong đó một byte tương đương với một ký tự hay một nhóm 8 bits. Có hai loại lưu trữ chính: • Bộ nhớ, thường ở dưới dạng bộ nhớ truy xuất ngẫu nhiên RAM
- 45 - • Bộ nhớ thứ cấp (hay còn gọi là bộ nhớ phụ) RAM dùng để lưu dữ liệu và các chương trình trong CPU khi xử lý dữ liệu, và dung lượng RAM cũng là một yếu tố có thểảnh hưởng đến thời gian thực thi của một hệ thống máy tính. RAM được gọi là linh động, nghĩa là dữ liệu và chương trình lưu trong RAM biến mất khi tắt máy tính. Khi máy tính ngày càng trở nên phức tạp hơn thì dung lượng RAM cần cho thời gian đáp ứng hợp lýđã tăng lên — dung lượng bộ nhớ của con chip dụng cụ bán dẫn mới nhất trung bình đã tăng lên mỗi lần 18 tháng. Dung lượng RAM thường được tính bằng Mb (megabytes), trong đó 1Mb = 1,048,576 bytes. (Như Ferguson và Hebels đề cậpđến trong trang 180-1, cách tính này dựa trên lũy thừa của 2, do đó 1 Mb=220 bytes.) ? Tại sao dung lượng bộ nhớ của máy tính lại quan trọng? Có phải kích thước của RAM luôn luôn quan trọng trong môi trường quản lý thông tin? Bộ nhớ thứ cấp là hình thức lưu trữ thường xuyên — thông tin lưu trong phương tiện truyền thông này khá cốđịnh và thường có sẵn cho đến khi bị xóa đi (và thực tế thìđôi khi có thể phục hồi lại dữ liệuđã bị xóa, miễn sao các thông tin khác chưa viếtđè lên nó). Bộ nhớ thứ cấpđặc biệt là có từ, dưới dạngđĩa (đĩa cứng vàđĩa mềm) hay băng từ hay đĩa quang (CD-ROM hoặc DVD). Ngày nay, bộ nhớđĩa thường được tính bằng Gb (gigabytes), trong đó 1Gb = 1,073,741,824 bytes (230 bytes, hay 1,024 Mb). Cách đây không lâu, giá thành của bộ nhớ thứ cấp là một yếu tố chúng ta phải xem xét khi mua máy tính. Nó cũng ảnh hưởng đến những quyếtđịnh thiết kế cơ sở dữ liệu, vì nóđược xem là “thiết kế hay” để tiết kiệm lượng dữ liệuđược lưu, ví dụ như dành cho loại dữ liệu “năm” là 2 kí số. Hiện nay khó mà xem xét bộ nhớ thứ cấp này và giá thành của nó dường như luôn luôn hạ xuống. Một hình thức mới của lưu trữ dữ liệu là “thẻ nhớ”. Các thiết bị nhỏ này chỉ cần một cổng USB trên máy tính, nghĩa là thẻ nhớ rất hữu dụng cho việc chuyển đổi các tập tin lớn từ máy tính này sang máy tính khác. Cuối cùng, máy tính của bạn cần một kết nối với thiết bị bộ nhớ (ví dụ nhưđĩa cứng, ổđĩa CD-ROM), và thông thường là thiết bị chuẩn IDE (Integrated Drive Electronics). Thiết bị này thường ở trên vỉ mạch chính.
- 46 - ? Nêu cácđiểm khác biệt giữa bộ nhớ và bộ nhớ thứ cấp? Tại sao những bộ nhớ này quan trọng? Nêu cácđiểm khác biệt giữa bộ nhớ và bộ nhớ thứ cấp? Tại sao những bộ nhớ này quan trọng? Giáo trình của bạn không đề cậpđến bộ nhớ nhanh. Bộ nhớ này thường được dùng trong PDA (máy hỗ trợ cá nhân kỹ thuật số) và máy ghi hình kỹ thuật số, vì vậy có thể là bạnđang có một bộ nhớ nhanh ởđâu đó. Đây là một công nghệ bán dẫn, nghĩa là không có các bộ phận có thể di dời – Bạn có thể hiểu tại sao điều này lại quan trọng trong PDA (Personal Digital Assistants) và máy chụp ảnh kỹ thuật số? Thiết bị xuất Các thiết bị này thực hiện chức năng ngược lại với thiết bị nhập – thiết bị xuất chuyển đổi thông tin dạng dữ liệu máy tính có thể đọc được thành dạng dạng‘thực’. Ferguson và Hebels đã xácđịnh các loại thiết bị xuất phổ biến nhất như màn hình, máy in, loa và COM. Trong các loại này thì màn hình là thiết bị xuất phổ biến nhất, và máy in gần nhưđứng thứ hai. Những nhân viên hỗ trợ kỹ thuậtđôi khi gọi màn hình là mànảnh. ? Đối với mỗi loại thiết bị xuất Ferguson và Hebels xácđịnh, hãy chỉ rõ loại dữ liệu “thực” thiết bị xuấtđó tạo ra. Tại sao sự chuyển hoán này lại cần thiết? Thiết bị nhập / xuất Ferguson và Hebels xácđịnh thêm một loại thiết bị, đó là thiết bị lai nhập/ lai xuất. Phương pháp này dựa trên tính năng của thiết bị (ví dụ nhưđĩa cứng), và không nhất thiết liên quan đến sự chuyển đổi thông tin thành dạng dữ liệu máy tính có thể đọc được. Thiết bị duy nhất trên danh sách cho thấy cùng loại chuyển đổi từđịnh dạng thực thành dạng máy có thểđọc được là màn hình điều khiển bằng cách chạm tay vào - bạn hiểu tại sao không? Quan điểm đơn giản dựa trên khái niệm do Ferguson và Hebels cung cấp sẽ giúp người mới vào nghề biếtđược những gìđang hoạtđộng trong máy tính. Bạn sẽ không bao giờ hiểu tại sao những việc xảy ra – có lẽ không còn ai hiểu được mọi khía cạnh của cách máy tính vận hành — nhưng bạn phảiđứng ở vị tríđể thực hiện hai điều sau đây:
- 47 - Đọc thông tin thương mại, hoặc trò chuyện với chuyên viên máy tính để biết các thuật ngữđược sử dụng; ví dụ, nếu người ta bảo bạn rằng “máy tính của bạn không đủ bộ nhớ RAM cho thao tác này” thì liệu bạn có biết nó nghĩa là gì không? Có thể thực hiện những chẩnđoán đơn giản khi máy tính có vấn đề; ví dụ, nếu máy tính nói “không thể ghi vào thiết bị” thì bạn có thể khắc phục vấn đề này không? Phần mềm Cùng với dữ liệu, phần mềm là thành phần “vô hình” của một hệ thống máy tính. Phần mềm thường định nghĩa như các chỉ dẫn dùng để thực hiện quy trình xử lý cần thiết trên dữ liệu, và thuật ngữ này thường đề cậpđến một bộ sưu tập các chương trình. Ferguson và Hebels xácđịnh 3 loại phần mềm chính: • phần mềm hệđiều hành; • phần mềm tiệních; • phần mềm ứng dụng. Các hệđiều hành Hệđiều hành máy tính là một bộ phần mềm cho phép nhiều thiết bị khác nhau liên lạc với CPU. Không có hệđiều hành, máy tính sẽ chỉ là một bộ sưu tập các hộp chứa bụi không hơn không kém. Ferguson và Hebels mô tả các chức năng và thành phần tiêu biểu của hệđiều hành, đồng thờiđưa ra một danh sách một số các hệđiều hành phổ biến hiện này. Cần ghi chú rằng hệđiều hành thông thường chỉ kết hợp với một tổ hợp các bộ xử lý cụ thể. Ví dụ, Windows là loại hệđiều hành thông thường có trong bộ xử lý Intel (và các bộ xử lý tương tự Intel). Một hệđiều hànhđang bắtđầu gây chúý trong giới báo chí công nghệ là Linux. Linux tương tự như Unix, nhưng miễn phí hoặc có giá thành thấp. Các phiên bản có sẵn cho tất cả các loại bộ xử lý chính, và Linux thỉnh thoảng được nâng cấp thành hệđiều hành có thểđược lựa chọn với Windows. Phần mềm tiện ích Ferguson và Hebels giải thích công dụng của phần mềm tiệních khi thực hiện một loạt các thao tác bảo trì và “giữ nhà”. Một số hệđiều hành bao gồm các tính
- 48 - năng cơ bản của phần mềm tiệních, như phần mềm để xác định và sửa lỗi lưu đĩa, nhưng có nhiều những gói phần mềm tiệních hoàn chỉnh hơn có sẵn từ những nhà cung cấp bên thứ 3. Một loại phần mềm Ferguson và Hebels đãđề cậpđến là phần mềm chống virus. Đây là phầm mềm quét tìm các loại virus đã biết trong các tập tin nhận được, hay dò tìm các hoạtđộng giống virus. Trong hầu hết các trường hợp, phần mềm chống virus cũng có thể loại bỏ những con virus phần mềm dò tìm được. Phần mềm ứng dụng Ở phần lớn các trường hợp, thư viện và trung tâm thông tin sẽ mua phần mềm thương mại có sẵn chứ không tự phát triển. Hầu hết phần mềm ứng dụngđều được viết cho một môi trườngđiều hành cụ thể. Tuy nhiên, mặc dùđa số phần mềm đềuđược mua chứ không được phát triển từ những thứ linh tinh hỗn tạp, nhưng vẫn đáng xem xét những gì liên quan đến viết một chương trình, vấn đề này sẽđượcđề cậpđến trong phần tới. Lập trình Bàiđọc sau đây giới thiệu các kỹ thuật cơ bản dùngđể viết các chương trình máy tính, và bao gồm các chương trình mẫu bằng nhiều ngôn ngữ của thế hệ thứ 3. Bây giờđọc Harold C. Ogg, “Programming Languages”, trong Introduction to the Use of Computers in Libraries (Medford, N.J.: Information Today, 1997), 115–29. (Bàiđọc 1) Ogg giới thiệu một số thuật ngữ và khái niệm lập trình. Trong đó, quan trọng nhất là khái niệm thực hiện một chương trình theo chế độ“bó”— ngày nay chúng ta chỉ có khuynh hướng nghĩ theo các thuật ngữ củatương tác trực tuyếnvới máy tính, nhưng nhiều hệ thống vẫn có thành phần ‘xử lý theo khối’. Ví dụ, hầu hết các hệ quản trị thư việnđều tạo ra những thông báo quá hạnnhư là khối công việc, chủ yếu chạy vào giữađêm. Có thể là bạn sẽ không bao giờ cần lập trình máy tính nếu bạn không muốn làm vậy. Bí quyếtđể sử dụng máy tính hiệu quả là sử dụng các chương trình ứng dụng phù hợp, như các gói cơ sở dữ liệu, phần mềm quản lý hồ sơ, xử lý văn bản, hệ thống thư viện… nên bạn không cần phải “lập trình” bất kỳ chương trình nào
- 49 - trong đây. Do đó, mụcđích của bàiđọc này là nhằm giúp bạn hiểu rõ những điều đang xảy ra trong chương trình bạn cho chạy. Nên chúý những nguyên lý thiết kế máy tính có trong tất cả các ví dụ về chương trình. Hai yêu cầu cá nhân của một nhà lập trình giỏi là (i) thứ nhất, người có não trái lý luận logic thường là nhà lập trình giỏi và (ii) thứ hai là kiên nhẫn, do cần phải xem qua nhiều trang mãđể phát hiện ra lỗi nhỏ. Trong tương lai bạn có thể muốn có thể viết vài chương trình nhỏđể tạo ra hệ quản lý thông tin của bạn hoạtđộng hiệu quả hơn. Có lẽ bạnđã cố gắng viết‘macro’ cho bảng công tác hay phần mềm tương tự. Nếu bạn muốn tạo một trang Web thì bạn có thể muốn viết ngôn ngữđánhdấu siêu văn bản HTML. Ngày càng có nhiều nhu cầu với nhà quản lý thông tin viết ngôn ngữđánh dấu mở rộng XML. Chuẩn bị cho tiết học Bạn cũng nên hoàn thành các bài tập thực hành bên dưới và chuẩn bị thảo luận các câu trả lời trong tiết học hằng tuần. Bài tập thực hành 1. Đối với máy tính cá nhân bạn sử dụng thường nhất, hãy cố gắng tìm: • Cấu tạo và mô hình bộ xử lý; • Dung lượng RAM (thật vàảo); • Dung lượng bộ nhớ truy cập nhanh (nếu có); • Tốcđộđồng hồ; • Thiết bị lưu trong máy tính; • Dung lượng bộ nhớđĩa theo Mb; • Hệđiều hành (bao gồm phiên bản); • Tuổi thọ của máy tính. Tại sao cần phải nắm nhữngđiều này? Có phải một sốđặcđiểm thì quan trọng hơn so với những đặcđiểm khác? [2- ? Đây làđề nghị cho phần bài tập. Lấy một số tập quảng cáo ở các cửa hàng máy tính địa phương và photo vừađủ cho học viên trong lớp. Đưa ra câu hỏi về mô tả máy tính kiểm tra kiến thức học viên về phần cứng máy tính. Ví dụ: Máy tính nào “mạnh” nhất? Điều gì tạo nên bộ xử lý trong máy tính này hay máy tính kia?
- 50 - ‘Chache’ nghĩa là gì? Bus hệ thống 133MHz là gì? …. Câu hỏiôn tập Đảm bảo hiểu giáo trình và bàiđọc khi đọc qua tất cả các câu hỏiôn tập và chuẩn bị thảo luận trong lớp. 1. Theo bạn, biểuđồ thứ nhất trong Hình 6.1 có phải là cách chính xác nhất để biểu thị mối quan hệ giữa phần cứng và phần mềm, giữa dữ liệu thô và các thông tin hữu ích không? Nếu không thì bạn sẽ thay đổi biểuđồ như thế nào? Nếu có thì nêu lý do tại sao? 2. Tại sao Hình 6.2 có mũi tên hai chiều giữa “Bộ phận lưu trữ” với “bộ phận xử lý vàđiều khiển”? 3. Đối với mỗi thiết bị nhập Ferguson và Hebels phân loại, hãy xácđịnh loại dữ liệu‘thực’để thiết bị có thể nhận biết. Tại sao quá trình chuyển đổi này lại cần thiết? 4. “Tốcđộđồng hồ” của CPU là gì? Và tại sao nó quan trọngkhi xácđịnh tốcđộ nào hệ thống máy tính có thể xử lý dữ liệu? 5. Tại sao dung lượng bộ nhớ của máy tính lại quan trọng? Có phải kích thước của RAM luôn luôn quan trọng trong môi trường quản lý thông tin? 6. Nêu cácđiểm khác biệt giữa bộ nhớ và bộ nhớ thứ cấp? Tại sao những bộ nhớ này quan trọng? Nêu cácđiểm khác biệt giữa bộ nhớ và bộ nhớ thứ cấp? Tại sao những bộ nhớ này quan trọng? 7. Đối với mỗi loại thiết bị xuất Ferguson và Hebels xácđịnh, hãy chỉ rõ loại dữ liệu“thực” thiết bị xuấtđó tạo ra. Tại sao sự chuyển hoán này lại cần thiết?
Search