• Thứ Sáu, 15/08/2014 09:05 (GMT+7)

    Thuật toán phát hiện ổ dịch Ebola trước khi công bố chính thức

    Huy Thắng
    Trang web HealthMap đã áp dụng một thuật toán phát hiện các bệnh truyền nhiễm một cách sớm nhất nhờ tổng hợp thông tin từ báo chí, mạng xã hội và số liệu từ các cơ quan khác trên toàn thế giới.

    Ngày 23/3 năm nay, Tổ chức Y tế Thế giới WHO (World Health Organization) phát đi một cảnh báo cho biết đã có 29 người chết vì virus Ebola tại quốc gia Guinea ở Tây Phi. Cảnh báo của WHO đánh dấu sự xác nhận chính thức đầu tiên về cơn dịch bệnh đang bùng phát một cách tồi tệ với con số tử vong hiện vượt trên 1.000 người.

    Đối với những căn bệnh lây lan nhanh như Ebola, việc phát hiện sớm để điều trị kịp thời là rất quan trọng. Cho đến nay, vẫn chưa có thuốc chữa hay phương pháp điều trị hiệu quả chống lại virus Ebola, vì vậy cách duy nhất để tránh lây nhiễm dịch bệnh là cô lập nạn nhân. Bất kỳ phương pháp hoặc công cụ nào có thể nhanh chóng phát hiện các ổ dịch, ngay cả khi chỉ sớm một vài ngày, có thể là một trợ giúp rất lớn trong việc ngăn chặn căn bệnh này.

    Một thành viên của nhóm "Bác sỹ không biên giới" phục vụ tại Guinea.
    Đó chính là những gì HealthMap đang cố gắng thực hiện. HealthMap là một trang web chuyên theo dõi các bệnh truyền nhiễm trên thế giới bằng cách sử dụng các thuật toán đặc biệt để tổng hợp thông tin từ tin tức báo chí, mạng xã hội và số liệu chính thức khác từ các cơ quan chính phủ và các tổ chức như WHO. Trong cuộc khủng hoảng dịch bệnh Ebola gần đây, HealthMap đầu tiên phát hiện ra một bản tin mô tả một "bệnh sốt xuất huyết bí ẩn" giết chết nhiều người ở Guinea. Một dấu chấm màu tím ngay lập tức xuất hiện trên bản đồ theo dõi bệnh của trang này, khiến nhân viên HealthMap bắt đầu tập trung vào bản tin. Đó là vào ngày 14/3/2014, chín ngày trước khi WHO chính thức báo động về căn bệnh Ebola.

    Ra mắt hồi năm 2006, HealthMap được tạo ra bởi hai nhà nghiên cứu tại Bệnh viện Boston Children’s Hospital: John Brownstein, một nhà dịch tễ học kiêm giáo sư nhi khoa, và Clark Freifeld, một nhà phát triển phần mềm đang học tiến sĩ ngành kỹ thuật y sinh tại Đại học Boston. Công cụ này được xây dựng để thu thập dữ liệu từ Internet theo thời gian thực, dựa vào nhiều nguồn khác nhau bao gồm các bài đăng trên mạng xã hội Twitter, các bài báo địa phương hoặc báo cáo của các nhân chứng. Trên trang web HealthMap, người xem có thể duyệt qua một bản đồ tương tác chứa danh mục tất cả dữ liệu này.

    John Brownstein giải thích, HealthMap sử dụng quá trình xử lý ngôn ngữ tự nhiên, phương pháp máy học (machine learning) và phát hiện theo nhóm để thể hiện cho một cái nhìn toàn cầu của dịch bệnh. Khi những nguồn này được hình thành, chúng sẽ cùng mang lại một hình ảnh về tình trạng nghiêm trọng của dịch bệnh đối với chúng ta. Các nhà phân tích sẽ làm việc để tổng hợp và HealthMap sau đó phổ biến thông tin qua các kênh khác nhau.

    Cảnh báo đầu tiên của HealthMap về ổ dịch Ebola tại Guinea hôm 19/3.
    Các thuật toán của HealthMap được tối ưu hóa để bỏ qua các nguồn không đáng tin cậy và không thích hợp. Nhưng đồng thời sẽ có một nhóm các nhà khoa học khác tiếp tục phân loại và chọn thủ công thông qua các kết quả phân tích cú pháp để xóa bỏ bất kỳ nghi ngờ nào trước khi thêm chúng vào bản đồ dịch bệnh.

    Khi các cảnh báo bắt đầu chồng chất lên trong một khu vực cụ thể, các chỉ số trên giao diện HealthMap có màu xấu hơn sẽ cho biết rằng tình trạng nghiêm trọng có thể xảy ra. Đây là những gì đã xảy ra trên trang web HealthMap hồi tháng 3 vừa qua khi hệ thống bắt đầu phát hiện nhiều bài báo cho thấy một đợt bùng phát Ebola sắp diễn ra.

    HealthMap không có ý định thay thế các đánh giá chính thức được cung cấp bởi các tổ chức lớn như WHO, mà họ cho rằng đây là một dịch vụ hoàn toàn khác. Theo Sumiko Mekaru, một nhà dịch tễ học đang đóng góp cho HealthMap, mục tiêu là họ sẽ trở thành một thông tin trực tuyến tự động về dịch bệnh truyền nhiễm trên thế giới để các chuyên gia y tế có thể tìm thấy những gì họ cần chỉ với một thao tác tìm kiếm đơn giản nhất. Bà Mekaru cho biết thêm rằng, WHO được xem như là tiêu chuẩn vàng vì họ phải trải qua tất cả các bước kiểm tra và cần có thời gian. Trong thực tế, WHO đã có những nỗ lực hỗ trợ để phát triển các phương pháp tiếp cận chính thức theo dõi bệnh.

    Trong khi đó, một hệ thống như HealthMap có thể nhạy cảm hơn cách đánh giá truyền thống trong việc phát hiện các dấu hiệu sớm của dịch bệnh. Do đó, nó có thể giúp đẩy nhanh quá trình phản ứng toàn cầu cho các cuộc khủng hoảng giống như tình hình dịch bệnh Ebola mà chúng ta đang chứng kiến ở Tây Phi. Các hệ thống thu thập báo cáo sớm và đặc biệt có thể loại bỏ những nguồn không đáng tin cậy sẽ hỗ trợ ứng phó tốt hơn nhiều.