• Thứ Ba, 10/08/2010 16:15 (GMT+7)

    Windows Phone 7 tận dụng tính năng nhận dạng giọng nói

    Song Du Ca
    Windows Phone 7 hướng đến mục tiêu "hạ gục" Android và iPhone OS nhờ tính năng nhận dạng giọng nói.

    Cuối tuần qua, Microsoft cho biết sẽ sử dụng công nghệ nhận dạng giọng nói và xử lý ngôn ngữ tự nhiên trên nền điện toán mây như là một phần của "giao diện người dùng tự nhiên" để kiểm soát, điều khiển các thiết bị cầm tay chạy trên nền hệ điều hành Windows Phone 7. Đây được xem là tính năng thể hiện sự khác biệt trong giao diện người dùng mà các thiết bị nền Android hay iOS hiện không có.

    "Chúng tôi cho rằng nhận dạng giọng nói không phải là một ứng dụng độc lập, đó là một phần tích hợp trong trải nghiệm người dùng", ông Zig Serafin, Giám đốc phụ trách mảng dịch vụ truyền thông hợp nhất của Microsoft phát biểu tại Hội thảo SpeechTEK 2010. Cũng theo Serafin, để cải thiện các tính năng của Windows Phone 7 nhằm hiểu được một khẩu lệnh và trả về một tác vụ tương ứng, Microsoft có kế hoạch "cột" các thiết bị cầm tay Windows Phone 7 vào dịch vụ nhận dạng giọng nói và ngôn ngữ tự nhiên Tellme. Được biết, Microsoft đã mua lại Tellme Network vào năm 2007.

    Trước đông đảo khách tham dự tại SpeechTEK, Serafin đã lên tiếng đả kích Android và iOS trong việc sử dụng các biểu tượng như một hình thức tương tác chính. "Hầu hết smartphone là những lưới chằng chịt biểu tượng", Serafin nói, "Cách điều khiển điện thoại tốt nhất là nói cho thiết bị biết bạn cần gì. Khi bạn chuyển sang sử dụng một thiết bị không có bàn phím lớn thì giọng nói là một sự trợ giúp đầy thuyết phục mà người dùng cần trải nghiệm".

    Tại hội thảo này, Microsoft đã trình diễn 3 tính năng điều khiển thiết bị Windows Phone 7 qua khẩu lệnh như gọi điện thoại bằng giọng nói (đọc tên trong danh bạ), mở thư viện ảnh cũng như ảnh của bạn bè trên mạng xã hội, và tìm kiếm địa danh cần đến (tích hợp với dịch vụ tìm kiếm của Bing).

    Theo Serafin, các tính năng điều khiển bằng khẩu lệnh trên Windows Phone 7 sẽ cho phép người dùng kiểm soát toàn bộ thiết bị cũng như cung cấp tính tương tác cao - ví dụ, khi nhận được một khẩu lệnh khó hiểu, thiết bị sẽ yêu cầu một lệnh mới hay làm rõ nghĩa cho khẩu lệnh trên.

    Serafin cũng cho rằng, giọng nói là một phần của giao diện người dùng tự nhiên (NUI - Natural User Interface), và NUI hoạt động dựa vào đầu vào là giọng nói, sự tác động (từ bàn phím hay màn hình cảm ứng) và thậm chí là những hình thức di chuyển (thiết bị) khác. "Giọng nói là thành phần cốt lõi của NUI", Serafin nhận định.

    Nguồn: Infoworld; 4/8/2010