• Thứ Hai, 13/09/2004 09:18 (GMT+7)

    Bí mật của các công cụ tìm kiếm

    Tìm kiếm trên Internet là công việc kinh doanh lớn. Vì động cơ lợi nhuận, các công ty cung cấp dịch vụ tìm kiếm đang thao túng kết quả trả về trong trình duyệt.

     

    Tìm kiếm trên Internet là công việc kinh doanh lớn. Vì động cơ lợi nhuận, các công ty cung cấp dịch vụ tìm kiếm đang thao túng kết quả trả về trong trình duyệt.

    Thử dùng Google để tìm từ "ionic breeze" và bạn sẽ thấy 9 trong 10 kết quả hiển thị đầu tiên chỉ tới các trang web bán máy lọc không khí của hãng Sharper Image, chỉ có một đường dẫn duy nhất không liên quan gì đến các trang web thương mại là epinions.com và đường dẫn này được hiển thị ở cuối cùng đó là vào đầu tháng 6 vừa rồi.

    Bây giờ đến Yahoo, bạn thử gõ "spas and hot tubs", một lần nữa cũng trong khoảng đầu tháng 6, kết quả thứ 1 và thứ 5 chỉ ra các trang web Hotspring và Caldera Spa của Watkins Manufacturing. Watkins trả một khoản phí hằng năm để Yahoo hiển thị trang web của họ và trả thêm số tiền nhỏ cho mỗi cú nhấn chuột vào liên kết đến trang web của họ trong cửa sổ tìm kiếm.

    Yahoo và Google, hai gã khổng lồ trong lĩnh vực tìm kiếm, đã từ lâu dành phần trong các trang kết quả tìm kiếm của mình cho các liên kết thương mại có ghi nhãn rõ ràng "sponsored" (được tài trợ) và hiển thị trong một vùng khác tách biệt.

    Nhưng trên bất kỳ dịch vụ tìm kiếm (DVTK - search engine) nào, cái thực sự đáng giá chính là "kết quả thật" mà ở đó bạn mong đợi tìm thấy câu trả lời cho truy vấn của mình. Và đây chính là nơi mà một số công ty cung cấp dịch vụ tìm kiếm và các website thương mại đang sử dụng những kỹ thuật mới để thao túng kết quả tìm kiếm. Đa phần các kỹ thuật này đều hợp pháp, số còn lại là trò lừa bịp và không đúng luật.

    Tuy nhiên, có một điều rõ ràng: kết quả tìm kiếm đang bị thao túng ở mức chưa từng có. Google đang dần trở thành công ty thương mại được nhiều người biết đến, và Microsoft đang chuẩn bị tung ra dịch vụ tìm kiếm của riêng hãng. Tìm kiếm là công việc kinh doanh lớn và có khả năng ngày càng lớn hơn. Việc theo đuổi lợi nhuận của các công ty cung cấp dịch vụ tìm kiếm và các website tài trợ đã làm ảnh hưởng đến kết quả tìm kiếm.

    Cuộc chơi tốn tiền

    Một vấn đề của các DVTK gây tranh luận trong vài năm gần đây gọi là paid inclusion (trả tiền để được hiển thị trong kết quả tìm kiếm). Bởi vì ngay cả DVTK tốt nhất cũng không thể liệt kê toàn bộ Internet. Một số DVTK như Yahoo và Ask Jeeves cho phép chủ sở hữu website trả số tiền nhỏ để đảm bảo site của mình được hiển thị trong kết quả tìm kiếm của Yahoo hay Ask Jeeves. Tuy nhiên, cả hai hãng khăng khăng cho rằng số tiền đó không ảnh hưởng gì đến thứ tự kết quả tìm kiếm.

    Google không nhận phí đăng ký để được hiển thị. Bạn có thể thông báo một site nào đó miễn phí cho Google nhưng không đảm bảo rằng site đó sẽ được đưa vào danh sách tìm kiếm của Google.

    Chương trình Site Submit của Ask Jeeves dùng cho DVTK Ask.com tính phí 30 USD một lần cho trang kết quả đầu tiên và 18 USD cho các trang tiếp sau. Một bản thỏa thuận ngay bên cạnh kết quả tìm kiếm Ask.com cho biết một số site trả tiền để được hiển thị trong kết quả tìm kiếm.

    Vào tháng 3, Yahoo đưa ra chương trình Site Match Exchange (có paid inclusion). Người tham dự phải trả phí hằng năm là 49 USD cho URL đầu tiên, 29 USD cho 9 URL tiếp theo và 10 USD/trang tiếp sau để đảm bảo những trang này không chỉ được hiển thị mà còn được duyệt lại sau mỗi 48 tiếng, so với lịch duyệt hàng tháng của những site không trả tiền. Người tham dự có thể cập nhật nội dung với những sản phẩm và giá cả mới nhất, và có thể tin chắc là site của mình được lập chỉ mục toàn bộ (các DVTK thường chỉ lập chỉ mục đến 1000 trang cho mỗi lần duyệt và chúng cũng không lập chỉ mục toàn bộ CSDL của site).

    Thêm nữa, các site đăng ký còn phải trả cho Yahoo một khoản tiền nhỏ mỗi lần có người dùng nhấn chuột vào liên kết đến site (Yahoo cho các website phi lợi nhuận tham gia miễn phí, còn phí cho mỗi lần nhấn chuột tùy thuộc vào độ lớn của site).

    Ảnh hưởng của Site Match đến kết quả tìm kiếm cũng đang gây tranh cãi quyết liệt. Nhiều lời chỉ trích, ngay cả của những người ủng hộ phương thức đăng ký trả phí, cho rằng các site trả phí được ưu tiên hơn các site không trả phí trong kết quả của Yahoo.

    Các công ty cung cấp DVTK rất phiền lòng về ý kiến cho rằng kết quả tìm kiếm của họ đượm đầy mùi tiền. Một đại diện của Yahoo nói rằng chất lượng của Yahoo tự nói lên điều đó, "người ta sẽ không trở lại với Yahoo nếu nó không đáng tin cậy".

    Tương tự như Ask Jeeves, Yahoo hiển thị liên kết "What's this?" (ngay phía trên khu vực kết quả tìm kiếm) mà khi nhấn vào, bạn sẽ đọc được bản thỏa thuận cho biết chỉ có khoảng 1/100 site trong danh sách liệt kê có trả tiền. Nhưng nhiều site khác sử dụng kết quả tìm kiếm của Yahoo, gồm Dogpile.com, Excite.com và MSN thì không hiển thị bản thỏa thuận này.

    Tuy nhiên, MSN đã có kế hoạch kết thúc quan hệ với Yahoo và thực hiện công nghệ tìm kiếm riêng. Đồng thời, MSN và Ask Jeeves đều cho biết có kế hoạch phân biệt rõ ràng hơn danh sách thương mại và có trả tiền do Yahoo cung cấp.

    Vấn đề của Google

    Google, DVTK hiện đang đứng đầu, cũng vấp phải những vấn đề riêng. Có một số công ty hứa hẹn nâng vị trí sắp xếp cho website của khách hàng trong danh sách kết quả của Google. Việc làm này có thể làm giảm chất lượng tìm kiếm của Google.

    Có một số kỹ thuật tác động đến vị trí sắp xếp được xem là hợp lệ. Ví dụ, Marketleap và Position Technologies giúp người chủ website phân tích nội dung và mô tả sản phẩm của mình tốt hơn để các DVTK có thể nhanh chóng nhận diện và xếp hạng nội dung thích hợp. Những biện pháp này giúp giải thích tại sao việc tìm kiếm sản phẩm phần lớn liệt kê ra các liên kết đến nhà cung cấp sản phẩm đó chứ không đến các bài nhận xét sản phẩm hay tin tức sản phẩm. Tuy vậy, cũng có một số kỹ thuật gây nhiều tranh cãi.

    Một kỹ thuật gọi là cloaking (đội lốt), khi trang web được thể hiện đối với DVTK và khi người dùng nhấn vào liên kết hoàn toàn khác nhau. Ví dụ: National Public Radio tạo các trang web đội lốt với bản ghi thô chương trình radio. Khi người dùng nhấn vào liên kết đến những trang này trong kết quả tìm kiếm sẽ được dẫn đến các tập tin audio của đài mà không nhìn thấy bản ghi chương trình.

     

    TƯƠNG LAI CỦA TÌM KIẾM: KẾT HỢP GIỮA CHUNG VÀ RIÊNG

     

    Giai đoạn tiếp theo của việc tìm kiếm sẽ tập trung vào bạn và chiếc máy tính của bạn. Microsoft đang đưa ra những thay đổi công nghệ tìm kiếm mới để cho bạn sục sạo e-mail, các PC trên mạng hay ngay cả một ổ cứng gắn ngoài để tìm cây kim số trong biển dữ liệu ngày một phình to. MSN cho biết công cụ tìm kiếm trên PC sẽ xuất hiện sớm hơn HĐH Longhorn tiếp theo của Windows (bao gồm những khả năng tìm kiếm nâng cao, dự kiến ra mắt vào năm 2006).

     

     

     

    Yahoo cho biết hãng đang xem xét công nghệ tìm kiếm trên PC tương tự nhưng chưa cho biết chi tiết. Google vẫn lặng lẽ dẫn đầu về công cụ tìm kiếm. Tuy nhiên, theo các bài báo được đăng tải thì Google cũng đang phát triển phần mềm tìm kiếm trên PC.
    Những cải tiến tìm kiếm khác cũng đáng chú ý, ví dụ tìm "Chinese food Houston" ở Yahoo, bạn sẽ nhận được những kết quả không chỉ là tên nhưng còn có địa chỉ, số điện thoại của các nhà hàng Trung Hoa gần với khu vực địa lý Houston. Yahoo tin người dùng thích có những câu trả lời trực tiếp ở ngay đường dẫn. Hơn 140 triệu người sẵn sàng cung cấp thông tin cá nhân cho Yahoo và hãng có kế hoạch sử dụng dữ liệu đó để tạo kết quả tìm kiếm thích đáng hơn và mang tính cá nhân hơn.
    Trong khi đó, MSN cho biết DVTK kế tiếp của hãng cũng sẽ tập trung vào việc đưa ra câu trả lời mang tính cá nhân hơn.
    Amazon.com đang đẩy mạnh con bài tìm kiếm với DVTK đang trong giai đoạn thử nghiệm có tên là A9.com. Công bố hồi đầu năm 2004, A9 gói gém các kết quả tìm kiếm web từ Google (được cải tiến thêm với các chi tiết khác như tên của những trang web có liên quan khác) đến kết quả "search inside the book" của Amazon. Nó cũng chứa lịch sử tìm kiếm A9 của người dùng gần đây.
    Ra mắt vào đầu năm nay, Eurekster kết hợp tìm kiếm tổng thể với tìm kiếm cá nhân. Kết quả hiển thị kết hợp nhiều yếu tố cá nhân (như lịch sử tìm kiếm của bạn) với kết quả chung. Nếu bạn chọn các trang web nhạc cổ điển sau khi tìm kiếm về nhạc, các trang web nhạc cổ điển đó sẽ hiển thị nhiều hơn trên trang web tìm kiếm.
    Bạn có thể tìm kiếm gắn với nhóm đặc biệt của Eurekster, có thể là nhóm tổng quát như Parents or Organic Gardening hay một nhóm riêng. Kết quả của những tìm kiếm này sẽ gồm những site phổ biến giữa những thành viên khác trong nhóm.

     

    Nội dung đội lốt

    Vào tháng 5 vừa qua, công ty quảng cáo Desktop WhenU cũng đã dùng trang web đội lốt đánh lừa người dùng Google khi tìm từ "WhenU". Các trang đội lốt này, gồm cả những bài báo chỉ trích việc làm của WhenU, được đặt khá cao trong danh sách kết quả tìm kiếm của Google, nhưng khi người dùng nhấn vào thì chỉ thấy các bài báo đề cập đến mặt tích cực. Google loại WhenU ra khỏi danh sách liệt kê vì đã vi phạm qui định và cho đến thời điểm này WhenU vẫn bị cấm. WhenU biện luận rằng một công ty tối ưu việc tìm kiếm đã tạo ra các trang web này mà không báo cho WhenU. Ngay khi biết vấn đề này, WhenU đã nhờ một công ty khác làm lại toàn bộ các trang web.

    Một cách khác nữa là các công ty cố thay đổi kết quả tìm kiếm bằng cách sử dụng nhiều domain để bán cùng sản phẩm. Điều này làm tăng nhiều liên kết thừa ở trang kết quả tìm kiếm và sản phẩm đó được liệt kê nhiều lần. Google cố gắng cắt bỏ những kết quả trùng lắp nhưng tìm trang web vi phạm chính sách thì nhanh và dễ hơn.

    Thật dễ hiểu tại sao Google và Yahoo lại sử dụng quyền lực của họ. Theo Comscore Search, họ cung cấp hơn 90% kết quả của 25 DVTK hàng đầu. Và Jupiter Research dự kiến việc bán quảng cáo trên DVTK ở Mỹ sẽ đạt 2,1 tỉ USD trong năm 2004, cao hơn so với 1,6 tỉ USD trong năm 2003.

    Điều gì tiếp theo?

    Tìm kiếm trên web rõ ràng là thiết thực. Các sáng kiến của Microsoft sẽ làm nóng thêm sự cạnh tranh này (xem "Tương lai của tìm kiếm") và các DVTK mới cũng đang xuất hiện ở chân trời. DVTK nào đưa ra kết quả thích đáng nhất sẽ giành chiến thắng trong cuộc đua này.

    PC World Mỹ 08/2004

    ID: A0408_14