Xây dựng hệ thống dịch văn bản Anh-Việt bằng phương pháp dịch theo thống kê (phiên bản 1.0).

Chủ nhiệm đề tài PGS.TS Lương Chi Mai
Đơn vị thực hiện Viện Công nghệ Thông tin
Thời gian thực hiện 2008 - 2009
Tổng kinh phí 350 triệu đồng
Mục tiêu đề tài
  • Xây dựng một hệ dịch thử nghiệm phiên bản EVSMT 1.0 để dịch tự động các câu tiếng Anh sang tiếng Việt. Hệ có cấu trúc mở, đầy đủ, cho phép dễ dàng mở rộng và phát triển tiếp.
  •  Khai thác các tài nguyên và công cụ của đề tài cấp nhà nước KC01.10 “Nghiên cứu và phát triển một số sản phẩm thiết yếu về tiếng nói và văn bản tiếng Việt” (kho ngữ liệu câu tiếng Việt, kho ngữ liệu câu song ngữ Anh-Việt, tài nguyên về ngữ liệu và phát triển các công cụ như phân đoạn từ, phân loại từ, phân tích câu, …), một mặt để tăng khả năng thực hiện hệ EVSMT 1.0, mặt khác nhằm khẳng định giá trị và tầm quan trọng thiết  yếu của các tài nguyên và công cụ trong việc dịch tự động và xử lý ngôn ngữ tiếng Việt nói chung.
Nội dung đề tài

 Dựa trên khung kiến trúc của hệ dịch đề xuất, đề tài đã tập trung nghiên cứu những nội dung sau:

  •  Phần nhân hệ dịch.
  •  Phần tiền xử lí ngữ liệu.
  •  Phần thu thập ngữ liệu, rút trích và xử lí tài nguyên.
  •  Các bước huấn luyện mô hình .
Sản phẩm

 Hệ dịch EVSMT 1.0  để dịch tự động các câu tiếng Anh sang tiếng Việt.

  •  Đầu vào của hệ thống là đoạn văn bản bằng tiếng Anh.
  •  Dịch thuật trong một lĩnh vực được lựa chọn là  tin tức về du lịch.
  •  Đầu ra của hệ thống sẽ là đoạn văn bản tiếng Việt tương ứng dưới định dạng text theo chuẩn font Unicode. 
  •  Hệ thống cho phép thực hiện các chức năng xoá, sửa đổi, lưu đoạn văn bản bằng phép copy kết quả đã dịch thuật.
  •  Môi trường: Xây dựng hệ dịch trên nền Web trên môi trường Windows, địa chỉ dịch Anh – Việt trực tiếp tại:
     http://server316.dyndns.org:2010/EVEngine.tran.
    Do việc sử dụng đơn giản, đưa vào câu dịch trong hộp văn bản và nhần phím “Translate” nên không cần thiết có Hướng dẫn sử dụng.

Bản quyền thuộc về Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Địa chỉ: 18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội. Email: This email address is being protected from spambots. You need JavaScript enabled to view it.
Khi phát hành lại thông tin trên Website cần ghi rõ nguồn: "Viện Hàn lâm Khoa học và Công nghệ Việt Nam".