• Thứ Ba, 14/12/2010 09:28 (GMT+7)

    20 năm của công cụ tìm kiếm

    Phương Nga
    Công cụ tìm kiếm đã phát triển vượt trội bởi người dùng luôn muốn biết những thông tin họ cần. Hãy điểm qua một số công cụ tìm kiếm phổ biến từ sơ khai đến nay.

    Giai đoạn từ 1990-1992, Archie là công cụ tìm kiếm xuất hiện đầu tiên trên thế giới, sau đó là sự nổi lên của Gopher.

    Archie

    Alan Emtage, Bill Heelan và J.Peter Deutsch đã viết Archie trong lúc họ cùng gặp nhau tại trường đại học McGill. Vào kỷ nguyên trước khi có mạng toàn cầu (World Wide Web), Archie được xem như một công cụ tìm kiếm các trang FTP.

    Trước đây, người dùng chỉ truy cập Archie qua giao thức Telnet, nhưng về sau có thể sử dụng giao thức Gopher và web.

    Veronica

    Trong những năm đầu thập niên 90, giao thức Gopher đã phổ biến hơn trên mạng toàn cầu. Gopher là một mạng lưới kết nối, gồm các danh mục phân cấp trên Internet, cho phép người dùng tìm kiếm các trang web, các tập tin (file) văn bản và tải xuống các file nhị phân.

    Khi số lượng các trang Gopher tăng lên, người dùng cần tìm một cách nào đó để tìm kiếm trên Gopher. Lúc này, trình tìm kiếm Veronica xuất hiện, giúp tìm kiếm tên tập tin và các tiêu đề được lưu trong các hệ thống chỉ mục của Gopher (tương tự như Archie), có thể tìm kiếm trong “không gian Gopher” (Gopherspace) nhờ vào trình duyệt web Mosaic.

    Tính đến mùa hè năm 1993, thật sự vẫn chưa công cụ tìm kiếm nào hỗ trợ nền web, dù vẫn có một số các danh mục chuyên ngành vẫn duy trì. Sau đó, giáo sư Oscar Nierstrasz đã viết hàng loạt kịch bản (script) bằng ngôn ngữ Perl và từ đó đã hình thành nên công cụ tìm kiếm đầu tiên trên nền web, cũng vào thời điểm này Matthew Gray tại trường đại học MIT đã phát triển web robot (xem thêm mục "Cách hoạt động của công cụ tìm kiếm" ở trang web www.pcworld.com.vn/T1221526).

    ALIWEB

    ALIWEB (Archie-Like Indexing for the WEB) là công cụ tìm kiếm được thiết kế dành cho mạng toàn cầu. Cách thức hoạt động của ALIWEB là dựa vào thông tin của người dùng cung cấp để cập nhật các trang web vào chỉ mục ALIWEB, không sử dụng web robot. Thực tế, chỉ một nhóm nhỏ làm điều này nên ALIWEB nhanh chóng bị quên lãng.

    EINet Galaxy

    Galaxy là một trong những danh mục web đầu tiên tích hợp bộ tìm kiếm dữ liệu do con người quản lý và cập nhật (khác với web crawler là một chương trình tự động được thiết kết để thu thập tài nguyên Internet). Đây cũng là giao diện web thời kỳ đầu trước khi ngôn ngữ HTML ra đời có hỗ trợ nền màu.

    Yahoo

    Yahoo bắt đầu tạo công cụ tìm kiếm bằng cách cung cấp danh mục của các link đến các trang khác trên web. Yahoo đã trở thành nguồn tài nguyên không thể thiếu trong việc tìm kiếm trang web dựa theo từng chủ đề cho đến khi bị Google lấn át trong nhiều thập niên tiếp theo. Điểm mạnh của Yahoo là giúp người dùng web có thể tìm kiếm những nội dung theo chủ đề phù hợp.

    WebCrawler

    WebCrawler là một trong những công cụ tìm kiếm toàn văn (full-text) đầu tiên có khả năng chủ động tìm kiếm và cập nhật trang web bằng cách “trườn” (crawl) từ liên kết (link) này sang liên kết khác giữa các trang web. Khác với các công cụ tìm kiếm trước đó, WebCrawler có thể cho phép người dùng tìm kiếm bất cứ từ nào trên bất kỳ trang web nào. Ngày nay, hầu hết các công cụ tìm kiếm dù có biến thể khác nhau nhưng đều dựa vào cách thức chủ yếu này để có thể cập nhật thường xuyên vào các chỉ mục.

    Lycos

    Michael Loren Mauldin đã tạo ra Lycos như là một dự án nghiên cứu tại trường đại học Carnegie Mellon. Chẳng lâu sau, Lycos đã xuất hiện như là một trang web riêng và nhanh chóng được đón nhận với số lượng người truy cập ngày càng tăng. Sau đó, Lycos đã chuyển thành cổng thông tin, và hiện nay Lycos vẫn còn có ảnh hưởng đến cộng đồng mạng ảo.

    Giai đoạn từ năm 1995-1998 có nhiều công cụ tìm kiếm xuất hiện hơn và đã bắt đầu có sự cạnh tranh giữa các công cụ tìm kiếm, đó là Excite, Northern Light, Yahoo, AltaVista… Vào thời điểm này, Yahoo đã dùng phương thức phổ biến là thư mục đối tượng để giúp người dùng tìm kiếm thông tin.

    Infoseek

    Infoseek được xem là sự nỗ lực mới của nhóm phát triển nhằm cải tiến công cụ tìm kiếm nhờ vào việc tra cứu danh bạ của các trang web. Infoseek cũng đạt những thành công nhất định với khoảng 7,3 triệu lượt khách ghé thăm vào tháng 9/1997 - con số ấn tượng vào thời điểm đó. Nhưng rốt cuộc, Infoseek tỏ ra mờ nhạt dần so với các đối thủ khác như Yahoo, AltaVista và sau này là Google.

     

    MetaCrawler

    MetaCrawler là một trong các trang web đầu tiên cho phép người dùng tìm kiếm đồng thời nhiều chỉ mục web. Ví dụ, bạn tìm kiếm cụm từ “loại cây” thì tất cả kết quả liên quan đến cụm từ này sẽ được lấy từ trang Yahoo, Lycos, WebCrawler... sẽ hiển thị trên cùng một trang.

    Excite

    Excite xuất hiện như một trang danh bạ và cổng thông tin trên web, dù có nguồn vốn đầu tư lớn, nhưng Excite vẫn chưa bao giờ gặt hái những thành công xứng tầm trong thế giới trực tuyến. Excite vẫn tồn tại nhưng chỉ được xem là dấu tích cũ giữa thập niên 90.

    AltaVista

    AltaVista nằm trong dự án tìm kiếm trang web của Digital Equipment Corporation. Công cụ tìm kiếm này phổ biến nhất từ giữa đến cuối những năm 1990, sử dụng phương thức web crawling, trước khi chính thức bị Google qua mặt vài năm sau đó.

    Năm 1996, Yahoo sử dụng AltaVista để tăng sức mạnh ở các kết quả tìm kiếm trên web, sau đó Yahoo đã dần nổi lên về giao diện, cùng lúc đó AltaVista đã nhanh chóng mất thị phần trong năm 1999.

    Giao diện Yahoo được chăm chút hơn, có nhiều nét mới và màu sắc hơn. Trong giai đoạn này, dấu ấn của Yahoo trên Internet là khá ấn tượng và đang có bước phát triển khả quan. Bên cạnh chức năng chính là công cụ tìm kiếm, Yahoo cũng bắt đầu thêm vào các dịch vụ như e-mail, trò chơi và tin tức, góp phần thay đổi loại hình web trở nên hấp dẫn hơn thay vì chỉ có một nhiệm vụ là công cụ tìm kiếm.

    HotBot

    HotBot là một dịch vụ tìm kiếm của Wired Digital (cùng thuộc Wired Magazine). Sau đó, Lycos tiếp quản HotBot và dịch vụ tìm kiếm này vẫn tiếp tục tồn tại như một trang web dành cho các công cụ tìm kiếm web khác.

    Ask Jeeves

    Ask Jeeves khuyến khích người dùng tìm kiếm thông tin trên web bằng cách sử dụng cụm từ truy vấn, như “PC World Vietnam có bao nhiêu độc giả?”, sau đó Ask Jeeves sẽ tổng hợp các kết quả và đưa ra câu trả lời tốt nhất có thể. Năm 2006, Ask Jeeves đã lượt bỏ chữ “Jeeves” để rút ngắn thành Ask.com.

    Northern Light

    Northern Light xuất hiện vào năm 1997 như là kiểu thiết kế có thể thay thế cho trang AltaVista, và nó đã được ca ngợi do có chỉ mục khá lớn về các trang web. Vào năm 2002, trang web này chính thức đóng cửa sau khi công ty mẹ bị đổi chủ.

    Google bắt nguồn từ Stanford

     

    Larry Page và Sergey Brin đã bắt đầu phát triển dự án nghiên cứu công cụ tìm kiếm tại đại học Stanford với tên gọi “Backrub”. Đây là dự án phân tích các link trả về trang web với kết quả tìm kiếm phù hợp – một xu hướng tiếp cận mới vào thời điểm đó. Sau đó, Backrub mang tên “Google” với mác thương hiệu gắn liền với Stanford, google.stanford.edu.

    Yahooligans

    Yahoo còn giới thiệu một trang web Yahooligans với giao diện đầy màu sắc, thân thiện là môi trường tìm kiếm dành cho trẻ em. Sau này, Yahooligans được biến thế vào trong mục Yahoo Kids.

    Google

    Trong giai đoạn này, Google đã tách ra và thành lập một trang web riêng Google.com. Ngay lần đầu tiên, Google đã gây sự chú ý đến các cư dân mạng với cái tên đặc biệt này cùng khả năng trả về các kết quả ưu việt. Chẳng lâu sau, Google đã nghiễm nhiên trở thành công cụ tìm kiếm phổ biến nhất trên Internet.

    Giai đoạn từ năm 1999-nay, Google được xem là công cụ tìm kiếm chiếm ưu thế so với công cụ tìm kiếm khác trên thị trường. Tuy nhiên, nhà tìm kiếm công cụ khổng lồ này vẫn phải chịu sự cạnh tranh từ các đối thủ khác, chẳng hạn như Bing từ Microsoft cũng đang dần gia tăng thị phần.

    MSN Search

    Đây cũng là lần đầu tiên Microsoft chính thức chinh phục thị trường tìm kiếm dữ liệu trên web bằng việc giới thiệu MSN Search. Mọi người biết nhiều đến công cụ tìm kiếm này là do nó được đặt mặc định trong trình duyệt Internet Explorer. MSN Search luôn gắn liền với trình duyệt của Windows, và hệ điều hành của Microsoft luôn được xem là phổ biến nhất thế giới.

    Vào năm 2006, MSN Search đã đổi tên thành Windows Live Search, sau đó chuyển thành Live Search vào 2007, và cuối cùng Bing vào năm 2009. MSN Search có thể trả về kết quả của bộ máy tìm kiếm do Microsoft xây dựng, chỉ mục của nó được cập nhật hàng tuần. Windows Live Search là công cụ tìm kiếm thay thế hoàn toàn MSN Search giúp người dùng có thể tìm thông tin cụ thể bằng cách dùng thẻ (tab) tìm kiếm. Sau đó Microsoft đã tách Live Search ra khỏi dịch vụ Windows Live. Cuối cùng, với nỗ lực cải tiến đáng kể về các dịch vụ tìm kiếm, một lần nữa Live Search được chính thức thay thế bằng Bing.

    Vào tháng 9 năm nay, Google đã giới thiệu một tính năng mới “Google Instant” cho phép trả kết quả tìm kiếm trong thời gian thực với tốc độ trung bình khoảng 300 mili-giây lên màn hình. Thông thường, người dùng mất khoảng 9 giây để gõ vào từ cần tìm và mất 15 giây để nhấp chuột. Google cho biết tính năng này giúp người dùng tiết kiệm 2 đến 5 giây tìm kiếm, nghĩa là giúp tiết kiệm 3,5 tỷ giây mỗi ngày.

    Với nhiều đối thủ cạnh tranh hiện tại và tiềm năng sắp tới, Google ắt hẳn phải dè chừng để vừa duy trì thương hiệu và cũng vừa cải tiến để bắt nhịp với sự phát triển trong lĩnh vực tìm kiếm trên web

    ID: A1010_96