• Thứ Sáu, 07/08/2009 16:25 (GMT+7)

    Khai thác sức mạnh công cụ tìm kiếm

    "Thông tin là sức mạnh" (Information is power) - đây là câu nói quen thuộc của nhiều người và nó trở thành phương tiện không thể thiếu trong Kỷ nguyên thông tin (Information Age) hiện nay. Bạn có thể "lượm lặt" thông tin từ các bài báo, tạp chí, sách kỹ thuật và Internet... để cập nhật, trau dồi kiến thức cho công việc cũng như học tập. Việc tìm kiếm thông tin không chỉ giới hạn trên các tài liệu mà song song đó bạn cũng cần học cách trích dẫn thông tin từ nguồn Internet, đó là công cụ hữu hiệu giúp bạn tìm được thông tin nhanh và tiết kiệm thời gian. Thông thường, mọi người tra cứu thông tin nhờ vào Google, Yahoo hay gần đây nhất là Bing, đơn giản bằng cách nhập từ khóa tìm kiếm, chứ chưa tận dụng và khai thác hết các tính năng sẵn có của các công cụ tìm kiếm này.

    Dưới đây sẽ phân loại các công cụ tìm kiếm hiện có trên Internet và một số "mẹo" giúp bạn tra cứu thông tin nhanh chóng và chính xác.

    Công cụ tìm kiếm (Search engines)

    Công cụ tìm kiếm giúp bạn tìm thấy các website dựa vào những cơ sở dữ liệu riêng của nó. Bạn nhập từ khóa (keyword), công cụ tìm kiếm có nhiệm vụ trả về các website tương ứng với từ khóa đó dựa trên cơ sở dữ liệu được cập nhật liên tục bởi các chương trình gọi là robot, spider hoặc webcrawler. Các chương trình này tự động dò tìm, phân tích các website nằm trong cơ sở dữ liệu và cập nhật dữ liệu cho các công cụ tìm kiếm sau khi phân tích. Một số công cụ tìm kiếm vận dụng theo quy tắc này: www.google.com, www.altavista.com, www.excite.com, www.lycos.com, www.nlsearch.com, www.alltheweb.com, www.bing.com. Bạn có thể tham khảo thêm trong bài "Tối ưu hóa website cho công cụ tìm kiếm" (ID: A0904_112).

    Siêu tìm kiếm (Meta-search engines)

    Không giống như công cụ tìm kiếm, meta-search engine (tạm gọi là công cụ siêu tìm kiếm hay tìm kiếm liên hợp) không có cơ sở dữ liệu riêng. Thay vào đó, khi bạn nhập một từ khóa, công cụ tìm kiếm liên hợp lập tức gởi từ khóa này đến các công cụ tìm kiếm khác và bạn sẽ nhận được đồng loạt tất cả các kết quả từ cơ sở dữ liệu của nhiều trang tìm kiếm. Nhiệm vụ của công cụ tìm kiếm liên hợp là phân tích, sắp xếp lại dữ liệu. Meta-search engine chỉ lấy khoảng 10% kết quả từ mỗi công cụ tìm kiếm. Các công cụ tìm kiếm liên hợp đều có những đặc điểm riêng biệt nhau nhưng tựu chung là khả năng tận dụng cơ sở dữ liệu của các công cụ tìm kiếm. Các website meta-search engine: www.dogpile.com, www.askjeeves.com, www.metacrawler.com, www.search.com. Bạn tham khảo thêm trong bài "Máy tìm kiếm liên hợp" (ID: A0809_117).

    Thư mục đối tượng (Subject Directories)

    Thư mục đối tượng hay còn gọi là Thư mục ảo (Virtual Directories) được cập nhật thông tin từ các cá nhân tình nguyện. Cơ sở dữ liệu của Subject Directories nhỏ hơn nhiều so với các công cụ tìm kiếm. Những thư mục này được phân loại theo nhánh chính và nhánh phụ, tùy thuộc vào lượng thông tin nhiều hay ít. Thư mục đối tượng giúp tìm kiếm thông tin về các website liên quan đến thương mại, sản phẩm hay tổ chức nhưng bạn không thể tìm kiếm những thông tin mới nhất vì dữ liệu được cập nhật bằng tay và không bao gồm mọi chủ đề, đây là khuyết điểm của Subject Directories.

    Tham khảo một số website : www.dmoz.org, http://infomine.ucr.edu

    Một vài thủ thuật tìm kiếm hiệu quả

    Việc tìm kiếm trên mạng giúp bạn lấy được thông tin chính xác, nhưng nó cũng khiến bạn phải "mò mẫm" rất lâu vì kết quả tìm kiếm không như mong đợi. Vì vậy, bạn nên biết cách vận dụng những kỹ thuật và phương pháp đơn giản để "thu hẹp" phạm vi kết quả tìm kiếm.

    Trước khi nhập một từ khóa, bạn nên xác định chủ đề rồi sau đó mới quyết định việc tìm kiếm. Nếu biết chính xác lĩnh vực, bạn nên chọn công cụ tìm kiếm là thư mục đối tượng.

    Ví dụ, nếu muốn tìm thông tin về một nhân vật nổi tiếng, chỉ cần gõ ký tự đầu tiên bằng chữ hoa, các website Yahoo, Google, Infoseek, HotBot sẽ giúp bạn.

    Hầu hết các công cụ tìm kiếm đều cung cấp hai dạng cơ bản và nâng cao. Tìm kiếm cơ bản cho phép nhập từ khóa hoặc cụm từ và nhận kết quả trả về, trong khi tìm kiếm nâng cao có nhiều tinh chỉnh chi tiết hơn để thu hẹp vùng tìm kiếm theo mong muốn của bạn. Điều này tạo nên sự khác biệt giữa các công cụ tìm kiếm.

    Các công cụ tìm kiếm đều sử dụng cơ sở dữ liệu lớn, lưu trữ liên kết (links) đến nhiều nguồn tài nguyên. Việc truy vấn được thực hiện từ cơ sở dữ liệu, chủ yếu sử dụng các toán tử luận lý (Boolean) "AND", "OR", "NOT" (toán tử phải viết bằng chữ in). Bạn có thể tận dụng các toán tử này để kết quả tìm kiếm chi tiết hơn. Ngoài ra, ở một số công cụ tìm kiếm khác có thể sử dụng thêm ký hiệu (+), (-) thay vì dùng toán tử Boolean. Altavista.com, excite.com, google.com hỗ trợ tốt các phép toán tử trong tìm kiếm nâng cao.

    Một số ví dụ cách sử dụng toán tử Boolean

    - Toán tử "OR", bạn nhập từ khóa "TCP/IP OR NetBEUI", kết quả sẽ hiển thị giao thức mạng TCP/IP hoặc NetBEUI.

    - Toán tử "AND", nhập từ khóa "heart AND attack", công cụ tìm kiếm sẽ liệt kê các trang có xuất hiện cả hai từ nói trên. Điều này, giúp tránh được các kết quả đưa ra không phù hợp.

    - Toán tử "NOT", nhập từ khóa "orange NOT juice", kết quả sẽ hiển thị thông tin chứa từ orange nhưng không có từ juice.

    - Đối với dấu (+), nhập từ khóa "+Java+Script" hiển thị các trang có chữ Java Script. Cách này sẽ giúp lược bỏ và thu hẹp được phạm vi tìm kiếm.

    - Đối với dấu (-), nhập từ khóa "sheep+clone-chicken", cho biết những thông tin liên quan đến đến sinh sản vô tính trên cừu, không phải trên gà.

    - Wildcard (ký tự phỏng định) có biểu tượng dấu (*) dùng để thay thế cho một chuỗi ký tự tìm kiếm, không quan tâm độ dài các ký tự.

    - Ký tự (~) cho phép tìm kiếm thông tin có chứa từ khóa cần tìm và các chữ đồng nghĩa với từ khóa. Ví dụ : ~run drink

    Bên cạnh đó, bạn có thể sử dụng dấu ngoặc kép ("") trong trường hợp muốn tìm kiếm chính xác tên riêng, cụm từ liên quan đến tên tổ chức, cá nhân.

    Phương Nga
    -----------------------------------------------
    Tham khảo:
    Pcworld.com.vn, Thuvienkhoahoc.com, google.com, dmoz.org, tài liệu từ học viện NIIT

    ID: A0907_139