• Thứ Năm, 09/07/2009 07:31 (GMT+7)

    Bí mật từ công cụ tìm kiếm

    Những công cụ tìm kiếm đặc thù có thể đào bới nhiều thông tin về bạn. Đó là những thông tin gì và bạn có thể tự bảo vệ mình như thế nào?

    Tôi biết vài điều về vị luật sư của tôi mà lẽ ra tôi không thể biết được. Ông ta 55 tuổi, thích nghe nhạc trữ tình và la toáng lên mỗi khi chơi tàu lượn siêu tốc. Ông ta thích đi vật lý trị liệu và đang định mua cái máy tỉa lông mũi... Đó mới chỉ là một chút thông tin sơ khởi.

    Tôi không bao giờ la cà ngoài văn phòng với vị luật sư đó (và tôi cũng không có sở thích dòm ngó những thói quen riêng tư của ông ta). Tôi biết được mọi thông tin kể trên bằng cách theo dõi dấu vết của ông ta trên web. Và có lẽ ông ta cũng không biết tại sao mình để lại những dấu vết rành rành như thế trên mạng.

    Lúc này, chúng ta thường giãi bày ý tưởng của mình trên mạng. Và dần dần, ý tưởng của chúng ta trên mạng ngày một nhiều lên và những engine tìm kiếm chuyên biệt càng dễ dàng thu thập chúng lại với nhau để tạo thành một bản “hồ sơ cá nhân” đầy ắp chi tiết về đời sống ảo của chúng ta.

    Kết quả này không phải luôn luôn như mong đợi. Thậm chí nếu bạn không có một tí thông tin gì trên mạng thì liệu bạn có muốn cả thế giới biết rằng mình đang chữa bệnh hôi miệng hay bạn đang là fan của bộ phim nào đó?

    Đào sâu trên web

    Người ta gọi loại engine tìm kiếm mới này bằng nhiều từ. Vài dịch vụ gọi chúng là các công cụ “tìm kiếm xã hội” (social search), một số khác gọi là “tìm người” (people search). Nhiều dịch vụ thậm chí thổi phồng lên là có thể lục lọi sâu (Deep Web) hơn cả Google. CEO của dịch vụ tìm kiếm Spokeo cho rằng mặc dù hầu hết mọi người nghĩ rằng kích thước của web cơ bản chỉ nằm trong tầm với của Google nhưng thực ra có nhiều thông tin mà Google không với tới được.

    Giống như các dịch vụ cạnh tranh Pipl và CVGadget, Spokeo được thiết kế để giúp bạn đào bới thông tin của bạn bè, đối phương và bất kỳ ai khác. Nhưng Spokeo lại bước xa hơn các dịch vụ cạnh tranh khác bằng cách nhập toàn bộ sổ địa chỉ e-mail của bạn.

    Chỉ việc bỏ ra ít tiền mỗi tháng, dịch vụ này liên tục giám sát những người trong sổ địa chỉ và cho bạn biết có ai làm chuyện gì mới không, khi nào, ở đâu trên mạng. (Trang chủ của trang web này còn hứa giúp bạn “lục những tấm ảnh, video và bí mật riêng tư” nữa).

    Mỗi thông tin nho nhỏ về cá nhân nào đó có thể xem là không mấy quan trọng, nhưng hiệu ứng tích lũy của những thông tin này cũng đủ để tạo thành một bản tường trình gọn gàng, đủ để bất cứ ai cũng phải giật mình.

    Theo Spokeo, sự tập hợp danh tính này thực sự là một loại định danh mới, và người ta chơi chữ khi gọi dịch vụ của Spokeo bằng từ không mấy thiện cảm: spooky (như ma quỷ). Nhiều người có trang thông tin cá nhân chia sẻ trên MySpace; nhiều người cũng có một album chia sẻ trên Twitter nhưng khi kết hợp cả 2 lại thì không phải 1+1=2 mà thực sự tạo ra một “chân dung” mới.

    Spokeo đảm bảo là sẽ bới được hình, video và các bí mật của người khác, chứng tỏ khả năng tìm kiếm của dịch vụ sẽ mang đến một điều gì đó hấp dẫn.


    Hoạt động của Spokeo

    Hệ thống Spokeo sử dụng địa chỉ e-mail trong sổ liên lạc của bạn để theo dõi các hoạt động của những người trong sổ địa chỉ đó về nhiều mặt, từ blog, mạng cộng đồng cơ bản cho đến các trang web chia sẻ hình ảnh, video. Vì vậy, một tấm ảnh ngẫu nhiên nào đó mà bạn tải lên Flickr cách nay cả thập kỷ cũng sẽ hiện ngay dưới tên bạn chỉ vài giây sau khi một ai đó tìm tên bạn.

    Các nguồn khác ít rõ rệt hơn như Amazon Wish Lists, danh sách nhạc của Pandora và các tranh web đánh giá phim có nhiều chi tiết hấp dẫn, ví dụ có những thứ tìm được của ông luật sư kể trên như ông ta thích nhạc thể loại New Age và cần tỉa lông mũi. Bên cạnh đó, thông tin của ông ta cũng có trên trang MySpace và đoạn video về ông cũng có trên YouTube và còn nhiều thông tin khác nữa.

    Bán thông tin

    Đây là mọi thứ về Benjamin: dịch vụ CVGadget hiển thị kết
    quả tìm được theo thể loại dựa trên nguồn mà nó tìm được
    ở mỗi kết quả.

    Các dịch vụ tìm kiếm khác cũng tìm cách lấy được những dữ liệu dạng như trên và bán lại thông tin này ở dạng nghiên cứu thị trường. Một ví dụ điển hình nhất là Rapleaf, công ty này mô tả công việc của họ là “tìm kiếm dữ liệu và con người”. Khách hàng trả hàng ngàn USD để có được đặc tả chi tiết của những nhóm nhân khẩu gồm nhiều cá nhân trong những cơ sở dữ liệu khách hàng của riêng họ. Giống như kiểu của Spokeo, thông tin này thực ra có sẵn trên mạng và Rapleaf chỉ việc tập hợp chúng lại. Theo ông Joel Jewitt, phó chủ tịch mảng phát triển kinh doanh của Rapleaf thì những thứ mà bạn phổ biến trên mạng nghĩa là bạn muốn cho mọi người xem và Rapleaf không khai thác quá giới hạn đó.

    Theo Rapleaf, hầu hết khách hàng của họ đơn giản chỉ cố tìm cách tận dụng thông tin cộng đồng hiệu quả hơn cho việc tiếp thị mà thôi. Ví dụ một nhà sản xuất xe hơi có thể muốn biết khách hàng đang bàn tán về mẫu xe nào trên các mạng cộng đồng. Sử dụng danh sách địa chỉ e-mail từ khách hàng của mình, Rapleaf chỉ làm công việc thâm nhập đến mọi ngõ ngách của web để thu thập thông tin của từng người một. Phương pháp của Rapleaf cũng chỉ là cách truy tìm thông tin phổ biến nhằm tái tạo thông tin tự động như bất kỳ ai trên mạng đều có thể thực hiện được.

    Lộ mình

    Bất kể các dịch vụ này nhắm đến doanh nghiệp hay cá nhân thì họ cũng có một điểm chung: không như các công cụ tìm kiếm trước đây dựa trên các bản ghi (record) công khai, các công cụ theo dõi con người này xây dựng một hồ sơ rất chi tiết về bạn dựa trên các thông tin mà bạn từng đưa lên mạng. Theo một chuyên gia an ninh mạng, các dịch vụ này đã làm cho ý niệm tổng thể về một thế giới chia sẻ thông tin và tiếp cận “không giới hạn” mà chính Internet được thiết kế trở nên rất thật với mọi người.

    Đây là một thực tế đáng sợ nếu thông tin này lọt vào tay một số kẻ nào đó, ví dụ, một khách hàng tọc mạch hoặc ông chủ muốn kiểm tra lý lịch của nhân viên, hay ai đó bị ám ảnh những chuyện trước kia... Một nghiên cứu tại Anh cho biết ½ số người lướt web tại đây nói rằng họ đã từng dùng Internet để tìm thông tin về người quen cũ.

    Còn theo một chuyên gia khác, hành động này có vẻ như lén lút theo dõi người khác. Nếu thông tin này bị phát tán thì rõ ràng là một hình thức xâm phạm tính riêng tư. Còn khi thông tin của cá nhân được thu thập về 1 nơi thì tạo ra một số nguy cơ. Thực ra thì một ai đó đưa thông tin của mình lên mạng không có nghĩa là người khác có thể bán thông tin đó và nếu có một thị trường cho dữ liệu cá nhân thì người dùng đó nên được phần trăm từ giá trị dữ liệu.

    Quản lý

    Có điều bạn cần nhớ là những dịch vụ này không làm gì trái pháp luật. Thông tin họ thu thập là thông tin mà bất kỳ ai cũng biết cách tìm được. Thay vì làm ngơ với những tập tin cực lớn chứa dữ liệu về bạn thì bạn nên thử dùng nó như một công cụ để hiểu và kiểm soát “chân dung” trực tuyến của mình. Mọi điều bạn có thể làm là hãy học để sống chung với điều đó - những ràng buộc của thế giới mà chúng ta đang sống.

    Để giảm được nguy cơ “phơi mình” trên thế giới trực tuyến, bạn tham khảo thêm bài “Công cụ tìm kiếm con người: hạn chế thông tin có thể bị thu thập” bên dưới.

    CÔNG CỤ TÌM KIẾM CON NGƯỜI: HẠN CHẾ THÔNG TIN CÓ THỂ BỊ THU THẬP

    Những công cụ tìm kiếm chuyên biệt trong thế giới ảo giúp ta dễ dàng có được những bản thông tin cá nhân đầy ắp thông tin.
    Có một cách để quản lý thông tin của bạn là sử dụng các dịch vụ mới này để tìm kiếm chính mình. Spokeo cho bạn xem danh sách giới hạn dữ liệu mà không cần đăng ký; Pipl và CVGaget miễn phí; và Rapleaf có một công cụ mở để quản lý chi tiết về bạn trên Internet.
    "Nếu bạn muốn cố loại bỏ thông tin về bản thân mình đã xuất hiện trên mạng, dưới đây là vài tùy chọn.

    Tạm thời loại bỏ dữ liệu của bạn khỏi cơ sở dữ liệu của rapleaf bằng cách gửi yêu cầu lên dịch vụ, không tính phí.

    1. Rapleaf cho phép bạn loại thông tin của mình ra khỏi dịch vụ của hãng. Bằng cách gõ vào địa chỉ e-mail trong trang loại bỏ thông tin của Rapleaf và sau đó phúc đáp tin nhắn xác nhận của Rapleaf, bạn có thể xóa vĩnh viễn thông tin của mình khỏi cơ sở dữ liệu của Rapleaf, miễn phí.
    2. Nhiều dịch vụ cập nhật bộ đệm cache dựa trên các thiết lập bên ngoài của bạn. Spokeo và các dịch vụ khác hoạt động giống như cách mà các engine tìm kiếm chuẩn khác vẫn làm: khi nội dung biến mất trên web, nó cũng biến mất trong kết quả tìm kiếm. Hãy đến các trang web cá nhân kết nối đến địa chỉ e-mail của bạn và điều chỉnh lại thiết lập tính riêng tư cho mỗi trang đó. Trong vòng khoảng 1 tuần, thông tin đó sẽ không hiển thị trong các công cụ tìm kiếm nữa.
    3. Hầu hết trang web thông dụng cho bạn tùy chọn không công bố dữ liệu. Các công cụ tìm kiếm con người lượm lặt thông tin từ nhiều trang web thông dụng này, trong đó có Amazon.com, các trang mạng cộng đồng như Facebook và các trang nhạc như Pandora. Bạn có thể can thiệp vào những trang này để chỉnh lại tùy chọn về tính riêng tư trong trang cấu hình tài khoản.
    Cuối cùng, sức mạnh để đòi lại quyền riêng tư nằm trong tay bạn. Vấn đề chỉ là tắt tính năng tự động và nắm quyền kiểm soát.

    PC World Mỹ 6/2009

    ID: A0906_10