• Thứ Tư, 18/05/2011 09:31 (GMT+7)

    Kiến trúc dữ liệu: Lõi của hệ thống thông tin

    Nguyễn Tuấn Hoa
    Hàng ngày, các cơ quan quản lý nhà nước (QLNN) xử lý các hồ sơ, vụ việc theo chức năng QLNN của mình. Thực chất, các công việc đó là quá trình xử lý dữ liệu.

    Thuộc tính cơ bản

    Cho dù có tin học hoá (THH) hay không thì việc tổ chức dữ liệu trong bộ máy nhà nước cũng phải được chú trọng để đảm bảo các nhiệm vụ QLNN được thực thi. Chính vì phương pháp tổ chức dữ liệu thủ công gây ra quá nhiều hạn chế (mất thời gian tìm kiếm và xử lý thủ công, khó khăn trong tổ chức và lưu trữ dữ liệu, tốn kém khi thực hiện…) nên THH các hoạt động QLNN mới được đặt ra với kỳ vọng tìm kiếm thông tin nhanh hơn, tổ chức và xử lý dữ liệu dễ hơn.

    Kiến trúc tổng thể chính phủ điện tử (CPĐT) là bức tranh “động” về quá trình chuyển đổi bộ máy QLNN từ trạng thái hiện thời đến trạng thái đích. Điều đặc biệt là trong bức tranh toàn cảnh đó, nếu như kiến trúc quy trình luôn trong trạng thái thay đổi theo hướng hoàn thiện dần thì kiến trúc dữ liệu lại gần như không đổi: Cách xử lý dữ liệu có thể thay đổi nhưng bản thân dữ liệu lại không đổi. Ví dụ, công dân là đối tượng QLNN, cách thức nhà nước quản lý công dân có thể thay đổi nhưng dữ liệu về công dân (họ và tên, giới tính, nơi sinh, quê quán, quốc tịch…) về cơ bản là không đổi. Cái thay đổi là mức độ số hóa dữ liệu. Trong hệ thống thủ công tất cả các dữ liệu này đều nằm trên giấy. Trong hệ thống đang được tin học hóa một số dữ liệu được số hoá, số còn lại vẫn nằm trên giấy. Trong hệ thống điện tử hóa hoàn toàn, toàn bộ dữ liệu được tổ chức trong hệ thống máy tính mặc dù giấy vẫn còn được sử dụng. 

    Tất cả cơ quan QLNN ở nước ta hiện nay (các bộ, ngành và địa phương) đều trong trạng thái đang tiến hành THH, một phần dữ liệu được số hoá, tổ chức trong các hệ thống máy tính, phần khác còn nằm trên giấy. Phần dữ liệu được số hóa cũng phân tán theo các cơ quan chức năng và việc định nghĩa dữ liệu cũng do từng cơ quan thực hiện theo chức năng QLNN của mình. Để triển khai CPĐT cần phải tổ chức lại dữ liệu trong hệ thống theo 1 kiến trúc thống nhất như mô hình đã nêu.

    Dù thủ công hay đã tin học hóa một phần, việc định nghĩa đầy đủ, chính xác tập hợp dữ liệu phục vụ QLNN cũng được tiến hành một cách nghiêm túc. Trong bộ máy nhà nước có nhiều cơ quan chức năng khác nhau, tạo ra và sử dụng các tập hợp dữ liệu giao nhau nên việc cần làm là xác định tập hợp của tất cả các tập dữ liệu đó với những yêu cầu cụ thể như sau:

    • Có bao nhiêu tập thực thể là đối tượng QLNN trong hệ thống?

    • Mỗi tập thực thể được định nghĩa bằng các thuộc tính gì?

    • Xác định rõ các quy tắc áp dụng đối với dữ liệu: Nơi lưu trữ, cách lưu trữ, cập nhật, xử lý, sao lưu bảo vệ, khôi phục dữ liệu, kiểm toán và đối chiếu thông qua các tiêu chuẩn và quy trình chung
    • Dữ liệu được phát sinh ở đâu? Ai (cơ quan nào) cập nhật dữ liệu và chịu trách nhiệm về độ chính xác và chất lượng của dữ liệu?

    • Ai (cơ quan nào) sử dụng phần dữ liệu nào của mỗi tập thực thể là đối tượng QLNN trong hệ thống và cho mục đích gì?

    • Các cơ quan chức năng phối hợp với nhau để giải quyết những công việc gì, sử dụng những tập dữ liệu nào?

    Kiến trúc đa tầng

    Sau khi xác định được tập hợp tất cả các dữ liệu vận động trong hệ thống như trên, chúng ta bắt tay vào thiết kế kiến trúc dữ liệu mà mục tiêu cần đạt là một cơ sở hạ tầng cho phép các cơ quan QLNN truy cập dữ liệu chất lượng cao và ổn định tại bất cứ nơi nào và bất cứ khi nào nếu được phép. Vì có nhiều cơ quan chức năng (các sở, ban, ngành, quận, huyện, phường, xã) sử dụng chung dữ liệu của các tập thực thể cho những yêu cầu quản lý khác nhau nên để nhất quán, người ta xây dựng một trung tâm dữ liệu mô tả tập trung (metadata –siêu dữ liệu). Đây là nơi cung cấp mô tả về tất cả các dữ liệu có mặt trong hệ thống.

    Bản thân các dữ liệu được tổ chức trong các cơ sở dữ liệu được gọi là các dữ liệu ứng dụng tích hợp. Bất cứ một ứng dụng nào được kích hoạt tại một trong các cơ quan chức năng của bộ máy nhà nước cũng cần sử dụng dữ liệu để hoạt động. Dữ liệu trong hệ thống CPĐT được tổ chức tập trung nên mọi quá trình truy cập, cập nhật, sao lưu, phục hồi, quản lý, bảo mật, tích hợp… đều phải là chuẩn và được kiểm soát chặt chẽ trong hệ thống. Kiến trúc dữ liệu có sứ mệnh tạo ra và duy trì một hạ tầng có khả năng đáp ứng các yêu cầu đó.

    Kiến trúc dữ liệu trong hệ thống CPĐT là kiến trúc đa tầng.

    Mô hình kiến trúc dữ liệu. (Nguồn: Ban quản lý dự án CNTT-TT Đà Nẵng)

    Đó là các tầng:

    • Tầng người sử dụng (NSD): Có 2 nhóm NSD trong tầng này là những NSD nội bộ (cán bộ, chuyên viên trong bộ máy QLNN) và những NSD bên ngoài như doanh nghiệp, người dân nói chung. NSD nội bộ truy cập vào hệ thống thông qua các mạng nội bộ (intranet), còn những NSD bên ngoài truy cập vào hệ thống thông qua Internet. Hệ thống xác nhận NSD thông qua danh tính (tài khoản riêng hay tên NSD và mật khẩu đã đăng ký).

    • Tầng truy cập đa kênh: NSD có thể truy cập vào hệ thống thông qua nhiều kênh truy cập khác nhau như: Mạng không dây, qua bộ phận trợ giúp, cổng thông tin điện tử, ki-ốt thông tin…

    • Tầng kiểm soát truy cập: Hệ thống kiểm soát quyền truy cập của NSD thông qua vai trò, chức năng và quyền hạn của mỗi NSD được gắn với tài khoản (đối với NSD nội bộ) hay tên và mật khẩu đã đăng ký của NSD bên ngoài.
    • Tùy từng trường hợp cụ thể, hệ thống sẽ cho phép NSD được truy cập vào các ứng dụng gì trong hệ thống.

    • Tầng tích hợp: Nhiều NSD truy cập vào hệ thống đồng thời, qua nhiều kênh khác nhau, có những quyền hạn và chức năng khác nhau, có yêu cầu truy cập vào những ứng dụng khác nhau. Tất cả được phân tích, điều hướng, “kết mạch” trong tầng này đảm bảo đáp ứng mọi yêu cầu được phép một cách hiệu quả nhất và có kiểm soát.

    • Tầng ứng dụng: Đây là nơi tổ chức tất cả các phân hệ chức năng QLNN được phát triển trong hệ thống mà phần quan trọng nhất là các ứng dụng cung cấp dịch vụ công như đăng ký kinh doanh, giấy phép lái xe, đăng kiểm tàu biển, cấp phép xây dựng, hoạt động báo chí… Tất cả các ứng dụng này đều sử dụng một nguồn tài nguyên thông tin chung là hệ thống các CSDL phục vụ QLNN. Như đã nêu trên, mỗi ứng dụng chỉ sử dụng một phần của nguồn tài nguyên này chứ không phải tất cả, nên một cơ chế kiểm soát an ninh thông tin cấp thực thể và thuộc tính của thực thể được thiết lập để bảo vệ kho dữ liệu.

    • Tầng dữ liệu (hay tầng đáy của kiến trúc dữ liệu): Là nơi tổ chức toàn bộ hệ thống CSDL tập trung tại Data center của hệ thống. Tầng này có 2 phần: các CSDL ứng dụng tích hợp - nơi đáp ứng mọi yêu cầu dữ liệu từ các ứng dụng trong hệ thống và kho dữ liệu mô tả tập trung – nơi cung cấp mô tả thống nhất về toàn bộ dữ liệu có mặt trong hệ thống.

    ID: B1103_20