• Thứ Bảy, 03/03/2012 10:15 (GMT+7)

    Microsoft, Hortonworks sẽ nối kết Excel và Hadoop

    Mai Phương
    Microsoft đang phát triển cách thức nối kết để người dùng Excel có thể tải về và phân tích dữ liệu xuất ra từ Hadoop - nền tảng xử lý dữ liệu nguồn mở hỗ trợ các ứng dụng dữ liệu lớn.

    Nhóm chuyên gia Microsoft sẽ hợp tác cùng Hortonworks để phát triển giải pháp kết nối cơ sở dữ liệu trực tuyến (ODBC – Online Database Connector) và thư viện JavaScript cho Hadoop. Microsoft hiện làm việc với Hortonworks để phân phối Hadoop và các dịch vụ hỗ trợ kèm theo.

    Hortonworks cho biết việc hợp tác lần này sẽ giúp dữ liệu Apache Hadoop có thể tiếp cận hàng triệu người dùng mới. Hiện tại, hàng triệu người dùng Excel và PowerPivot có thể kế thừa giá trị từ Apache Hadoop qua việc sử dụng phần mềm đã quen thuộc với người dùng.

    Dự án phát triển nối kết ODBC này cũng nằm trong một số dự án liên quan đến nguồn mở Hadoop mà Microsoft và Hortonworks hợp tác. Năm ngoái, 2 công ty đã hợp tác để điều chỉnh Hadoop cho hợp với hệ sinh thái Windows. Microsoft và Hortonworks cũng đang phát triển cấu trúc JavaScript, cấu trúc này cho phép chương trình JavaScript có thể khai thác dữ liệu Hadoop.

    Hai công ty đang thực hiện hàng loạt bản vá lỗi cho lõi Hadoop để phần mềm này chạy trên Windows Server. Việc kết nối sẽ là ODBC tương tác với Hadoop thông qua hệ thống kho dữ liệu Hive. Người dùng có thể phân tích dữ liệu được tải về từ Hive trong Excel thông qua công cụ như Excel PowerPivot.

    Trình điều khiển ODBC của Microsoft được xây dựng để Excel, PowerPivot và các công cụ khác của Microsoft có thể kết nối đến Hadoop thông qua Hive được dễ dàng hơn. Hortonworks làm việc cùng Microsoft để đưa công nghệ này vào trong nguồn mở với mục đích để nhiều người dùng biết đến, đặc biệt đối với cộng đồng Apache Hadoop.

    Theo Hortonworks, hiện vẫn chưa có sẵn cách thức kết nối cũng như cấu trúc Javascript, nhưng trong tương lai gần cả 2 sẽ được giới thiệu như dự án nguồn mở. Microsoft cho biết công ty đang nỗ lực để nhúng Hadoop vào hệ sinh thái Windows, cụ thể là đã ra mắt cách kết nối Hadoop với SQL Server cũng như việc kết nối Hadoop vào dịch vụ mây Azure.

    Từ khóa: Excel, Hadoop, Microsoft
    Nguồn: PCWorld, Mỹ