• Chủ Nhật, 19/12/2010 23:38 (GMT+7)

    Google ra mắt thêm 2 công cụ tìm kiếm

    Huy Thắng
    Google vừa giới thiệu 2 công cụ giúp người dùng khám phá những phương pháp mới để phân tích một khối lượng đồ sộ các thông tin công khai.

    Một công cụ sẽ tính số lần một cụm từ nào đó đã từng xuất hiện trong các sách được số hóa trong khoảng thời gian 500 năm, trong khi một công cụ khác sẽ sắp xếp các kết quả tìm kiếm tùy theo mức độ đọc khó hay dễ.

    Dịch vụ đầu tiên được gọi là Books Ngram Viewer, cho phép bạn tìm kiếm các cụm từ cụ thể trong số lượng lớn sách đã số hóa của Google. Ngoài các đường dẫn đến tài liệu nguồn, các kết quả tìm kiếm cũng sẽ cung cấp một danh sách mốc thời gian, cho biết thời điểm cụm từ nào được dùng nhiều nhất.

    Công cụ này sẽ tìm kiếm trong một cơ sở dữ liệu gồm 500 tỷ từ được dùng trong 5,2 triệu cuốn sách đã được Google số hóa. Các sách tiêu biểu được xuất bản trong khoảng thời gian từ năm 1500 đến năm 2008, viết bằng tiếng Hoa, Anh, Đức, Pháp, Nga và Tây Ban Nha.

    Với dịch vụ này, Google hy vọng sẽ giới thiệu một dạng phân tích định lượng mới đối với các ngành học thuật, một dạng phân tích cung cấp kiến thức về các khuynh hướng lịch sử hay về sự hình thành các ý tưởng mới bằng cách theo dõi mức độ phổ biến của các từ hay cụm từ liên đới. Phương pháp này được một nhóm các nhà nghiên cứu gọi là “culturomics” (phương pháp phân tích xu hướng văn hóa).

    Các số liệu thống kê như trên có thể cho thấy các cụm từ đã được đưa vào sử dụng thịnh hành và bị đào thải như thế nào, thường là do các sự kiện lịch sử.

    Chẳng hạn, khi tìm kiếm cụm từ “World War One” (Thế chiến thứ I), ta thấy cụm từ này bắt đầu được sử dụng trước khi Thế chiến thứ II bùng nổ. Cũng không lấy làm ngạc nhiên khi cụm từ “The Great War” (cuộc chiến vĩ đại) hết được sử dụng vào thập niên 1950, và đây là cụm từ thường được dùng để chỉ Thế chiến thứ I trước khi người ta nhận thấy là sẽ có một cuộc chiến tiếp theo.

    Google cũng cung cấp thêm một công cụ phân tích khác ngoài công cụ tìm kiếm chính của mình. Đó là một công cụ tìm kiếm nâng cao, có thể phân chia kết quả tìm kiếm theo trình độ đọc. Công cụ tìm kiếm này chia kết quả theo 3 trình độ đọc là cơ bản, trung cấp, và cao cấp.

    Dù Google không cho biết cụ thể thuộc tính nào được dùng để xác định trình độ đọc, nhưng hầu hết các thử nghiệm về trình độ đọc đã được phân tích văn bản bằng cách xét đến các thuộc tính như số từ trong mỗi câu, hay số chữ cái hay âm tiết trong mỗi từ, với giả thuyết là câu phức tạp nhất là khó đọc nhất.

    Theo tư liệu của Google, người dùng có thể thấy việc phân biệt trình độ đọc có thể hữu ích để giúp họ hoàn tất việc tìm kiếm. Một giáo sư đại học có thể chỉ cần các kết quả tìm kiếm cao cấp, trong khi một giáo viên phổ thông cơ sở có thể chỉ muốn tìm tài liệu cơ bản cho học sinh của mình.

    Nguồn: IDG News, 17/12/2010