• Thứ Năm, 01/04/2010 15:00 (GMT+7)

    Công nghệ nhận dạng tiếng nói: Khi nào?

    Tân Khoa

    Hiện nay, hệ thống dịch với đầu vào bằng tiếng nói đang được manh nha nghiên cứu tại Việt Nam. Đây là công trình của Viện CNTT - Viện KHCN Việt Nam và là sản phẩm thuộc đề tài khoa học công nghệ trọng điểm cấp nhà nước về “Nghiên cứu, phát triển một số sản phẩm tiêu biểu và thiết yếu về xử lý tiếng nói và văn bản tiếng Việt” giai đoạn 2006 - 2010 (KC01.01/06-10) do PGS TS Lương Chi Mai, Phó Viện trưởng Viện CNTT, làm chủ nhiệm. Từ năm 2000 đến nay, nhóm nghiên cứu sưu tầm giọng nói của gần 550 người ở khắp 3 miền Bắc, Trung, Nam và chọn khoảng 5.700 từ tiếng Việt và những mẫu câu thông dụng làm dữ liệu đầu vào. Nhóm nghiên cứu bước đầu đặt tên cho phần mềm nhận dạng tiếng Việt của mình là VN Mobile vì sản phẩm được dùng để điều khiển với điện thoại di động. Mục tiêu của đề tài là thu thập giọng nói của khoảng 10.000 người để có thêm dữ liệu cho máy nhận dạng âm thanh. Khi đó, Viện có thể thiết kế phần mềm nhận dạng âm thanh để chuyển thành văn bản chính xác hơn, mở ra hướng ứng dụng mới cho khoa học máy tính và trí tuệ nhân tạo.

    Ngoài ra, phần mềm nói trên đang được nâng cấp khi Việt Nam tham gia dự án Astar do Viện Nghiên cứu Phát triển Công nghệ cao Nhật Bản khởi xướng năm 2008, với sự tham gia của 9 nước châu Á, gồm: Việt Nam, Nhật Bản, Trung Quốc, Singapore, Hàn Quốc, Ấn Độ, Thái Lan, Malaysia và Philippines. Theo đó, các nước cùng xây dựng phần mềm nhận dạng âm thanh ngôn ngữ nước mình để tích hợp phương thức nhận dạng âm thanh vào hệ thống nhận dạng âm thanh chung của dự án. Hệ thống sẽ dịch sang ngôn ngữ đích và gửi đến số điện thoại người gửi để phát âm bằng thứ tiếng họ cần. Khi đó, ai cũng có thể dễ dàng giao dịch bằng các thứ tiếng thông dụng ở châu Âu, châu Á như tiếng Anh, tiếng Trung Quốc… dù chưa biết ngoại ngữ.

    Dẫu vậy, vẫn phải nhìn nhận lại tình hình và có lẽ định hướng này khó trở thành hiện thực nếu như nó không được đưa vào một cách sắc nét trong các định hướng chiến lược quốc gia về CNTT-TT. Trong chuyến thăm công ty Naiscorp - một doanh nghiệp (DN) của các trí thức trẻ hiện mới chỉ làm về xử lý, tìm kiếm trực tuyến dữ liệu tiếng Việt với trang web www.socbay.vn, Bộ trưởng Bộ KHCN Hoàng Văn Phong đã bày tỏ mong muốn tìm kiếm xem có bao nhiêu đơn vị như Naiscorp, kể cả sinh viên có khả năng nghiên cứu để cùng với các đơn vị hỗ trợ cho họ có cơ hội phát triển. Bộ KHCN cũng đã ban hành Danh mục Công nghệ cao được ưu tiên đầu tư và Danh mục Sản phẩm Công nghệ cao được khuyến khích phát triển. Trong cả hai danh mục này, công nghệ và sản phẩm xử lý dữ liệu tiếng Việt đều được ưu tiên đầu tư. Tiếp sau đó, Bộ trưởng Bộ TTTT Lê Doãn Hợp cũng đến thăm DN này và khẳng định sẽ chỉ đạo các tập đoàn lớn phối hợp với Naiscorp phát triển công nghệ xử lý dữ liệu và tìm kiếm của Việt Nam để Việt Nam không còn phải nhập khẩu quá nhiều công nghệ, sản phẩm của nước ngoài trong thời gian sớm nhất. Đây là công nghệ lõi và là một trong các định hướng phát triển của Bộ TTTT đối với CNTT. Đó cũng là một trong những nhiệm vụ chính của Đề án Tăng tốc sớm đưa VN trở thành quốc gia mạnh về CNTT vào năm 2015.

    Tuy nhiên, những khó khăn cho định hướng này vẫn còn rất lớn bởi nó dường như không được đề cập trong chương trình đào tạo cử nhân CNTT và còn ít đề cập hơn với cử nhân Ngôn ngữ học. Theo ông Nguyễn Xuân Tài - Tổng giám đốc Naiscorp, để có thể thành công thì Naiscorp rất cần hợp tác với các chủ sở hữu nguồn dữ liệu điện tử tiếng Việt. Ở nước ngoài, hình thức hợp tác nghiên cứu giữa DN với các viện nghiên cứu rất phổ biến. Nhưng ở Việt Nam, các DN rất khó hợp tác với các viện nghiên cứu và các trường đại học, do các cơ quan này yêu cầu giữ bản quyền. Điều đó là không hợp lý bởi DN đã đầu tư chi phí, nguồn lực và đề tài nghiên cứu.

    Nguồn tham khảo:
    Đất Việt 6/2/2010
    ICT News 25/1/2010
    ICT News 31/1/2010

    Tân Khoa tổng hợp

    ID: B1003_7