• Thứ Ba, 15/05/2007 09:51 (GMT+7)

  Chương trình down db web tự động

  Câu hỏi :
  Trên 1 trang web có 1 bảng dữ liệu thường xuyên cập nhật. Tôi muốn viết chương trình tự động copy bảng dữ liệu này về máy tính và vẽ đồ thị theo sự thay đổi dữ liệu từ trang web. Xin hướng dẫn.

  Trả lời :

  Trang web có bảng dữ liệu thay đổi theo thời gian không phải là trang HTML bình thường, nó thường được viết bằng 1 công nghệ lập trình web chạy ở server nào đó như PHP, ASP, JSP, Perl... Mỗi khi người dùng truy xuất nó, trang web này sẽ được chạy ở phía server, đoạn code trong nó sẽ đọc dữ liệu từ database (nằm ở server database nào đó) rồi tạo bảng dữ liệu theo định dạng mong muốn vào trang web trước khi gửi kết quả về cho người dùng. Kể từ lúc gửi về người dùng, nếu dữ liệu trong database lại được cập nhật thì server không bao giờ tự động thông báo cho người dùng cập nhật, người dùng phải tự mình truy xuất lại trang web sau đó nếu muốn có được thông tin cập nhật.

   Có nhiều phương pháp viết chương trình download trang web dữ liệu về rồi vẽ đồ thị theo dữ liệu đó, thí dụ:

   1. Phương pháp lập trình mạng trực tiếp, bạn phải nắm vững giao thức HTTP để giao tiếp với web server. Khi cần, chương trình sẽ tạo cầu nối TCP đến web server ở cổng 80, gửi thông báo 'get URLofWebPage' theo giao thức HTTP về Web server rồi chờ web server gửi nội dung trang web về (nội dung sau khi trang web đã chạy ở server). Kết quả nhận được là 1 file viết bằng ngôn ngữ HTML, bạn phải nắm vững ngôn ngữ HTML và định dạng cụ thể của trang web kết quả để truy xuất nội dung của nó, lấy các dữ liệu theo yêu cầu, dựa vào nội dung dữ liệu lấy ra được hiển thị nó thành đồ thị tương ứng.

   2. Phương pháp dùng đối tượng 'Web Browser' của Microsoft, nhờ đối tượng này download trang web về. Sau đó chương trình của bạn lấy nội dung trang web từ đối tượng 'Web Browser' và xử lý nội dung HTML giống như phương pháp 1.

  Về ngôn ngữ lập trình, bạn có thể dùng bất kỳ ngôn ngữ nào bạn đã nắm vững.

  Chuyên mục: Lập trình