• Thứ Sáu, 26/12/2003 14:08 (GMT+7)

    Loại bỏ spam bằng phương cách của thế kỷ 18


    Hoạt động của SpamBayes trong môi trường Outlook

    Dựa vào công trình nghiên cứu có từ thế kỷ thứ 18 của nhà toán học Thomas Bayes, chuyên viên phần mềm Paul Graham đã đưa ra một giải thuật phát hiện hiệu quả thư spam (truy cập đến địa chỉ internet: www.paulgraham.com/spam.html để có thông tin chi tiết về phương pháp của Paul Graham). Khác với cách phát hiện spam thông thường, mỗi khi có thư điện tử gửi tới, phần mềm lọc bỏ spam áp dụng lý thuyết của Bayes để tiến hành phân tích nội dung thông tin trong thư gửi tới dựa vào tất cả các thư đã được xác định là spam và không phải là spam đang lưu trong máy của người sử dụng. Trong quá trình phân tích, các thư điện tử bị đánh giá 90% khả năng là spam sẽ được chuyển đến hộp thư Spam, các thư điện tử bị đánh giá từ 15% đến 90% được chuyển đến hộp thư Unsure Spam, và chỉ các thư điện tử có khả năng spam dưới 15% thì mới được lưu vào Inbox. (Các hộp thư Spam, Unsure Spam do người sử dụng tự tạo mới và cấu hình cho tiện ích biết vị trí lưu trữ).
    Dựa vào công trình của Paul Graham, đến nay đã có rất nhiều tiện ích lọc spam áp dụng thuật toán Bayes. Trong số các tiện ích này, xuất sắc nhất phải kể đến tiện ích miễn phí SpamBayes có dung lượng 3,2MB (tải về tại địa chỉ find.pcworld.com/36953). SpamBayes hoạt động trong Outlook 2000 và 2002 (xem hình).
    Thử nghiệm cho thấy tiện ích SpamBayes ngăn chặn gần 99% thư spam, có một vài thư spam xuất hiện trong mục Unsure Spam và điểm nổi bật nhất là không hề có một thư điện tử nào bị SpamBayes nhận diện nhầm. Hạn chế của SpamBayes là không sử dụng được cho Outlook Express.
    Nếu bạn sử dụng Outlook Express, hãy xem xét các tiện ích ngăn chặn spam trước khi nó đưọc gửi đến trình email, ví dụ như phần mềm dùng thử SAproxy của Stata Lab (dung lượng 1,53MB, tải về tại địa chỉ find.pcworld.com/36956), phần mềm tiện ích này cũng hoạt động tốt với tất cả các trình email khác hiện có trên trị trường và được tạp chí Người tiêu dùng tại Mỹ bình chọn là phần mềm tốt nhất trong tháng 8/2003. Một phần mềm khác miễn phí là Spamihilator của Michel Kramer (tải về tại địa chỉ find.pcworld.com/36959). Nhược điểm lớn nhất của các tiện ích lọc spam trong Outlook Express có áp dụng Bayes là bạn phải tự mình xác định trong tất cả các thư điện tử gửi tới cái nào là spam, cái nào không phải spam.
    Các trình duyệt email Mozilla 1.4 và Netscape 7.1 đều có chức năng lọc bỏ spam áp dụng Bayes.ÿ

    Lê Thu
    PCWorld Mỹ 11/2003

     

     

    ID: A0311_130