Phát triển PhởGPT tương tự ChatGPT, dành riêng cho tiếng Việt

Admin

PhởGPT phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hóa của người Việt.

Ngày 5/12, Ngày Trí tuệ nhân tạo 2023 (AI Day) với chủ đề “AI – tái thiết thực tại” khai mạc tại TP.HCM với chủ đề trọng tâm là AI tạo sinh – GenAI. Đây là năm thứ 5 liên tiếp AI Day được tổ chức và trở thành hội nghị khoa học thường niên quy mô hàng đầu trong lĩnh vực AI của thế giới và Việt Nam.

Sự kiện cũng lần đầu tiên giới thiệu tới công chúng một dự án thú vị của AI Việt Nam với tên gọi PhởGPT. Dự án này do Công ty VinAI thuộc tập đoàn Vingroup thực hiện.

Phát triển PhởGPT tương tự ChatGPT, dành riêng cho tiếng Việt - Ảnh 1.

PhởGPT được giới thiệu trong Ngày Trí tuệ nhân tạo 2023 (AI Day) tổ chức tại TP.HCM. (Ảnh: Đại Việt)

PhởGPT là dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá của người Việt. PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước.

Mô hình cũng được huấn luyện từ đầu với tệp dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.

PhởGPT sẽ song hành cùng trào lưu các mô hình ngôn ngữ lớn với mã nguồn mở của thế giới như Llama của Meta hay Mistral được phát triển để cạnh tranh với ChatGPT của OpenAI.

Theo các chuyên gia, nếu so sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác thì PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá. Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.

Phát triển PhởGPT tương tự ChatGPT, dành riêng cho tiếng Việt - Ảnh 2.

Các diễn giả chia sẻ về các công nghệ liên quan mô hình ngôn ngữ lớn (Large language model). (Ảnh: Đại Việt)

Tiến sĩ Bùi Hải Hưng, Tổng giám đốc VinAI cho biết, nhân lực phát triển công nghệ lõi trên thế giới không phải là nhiều. Doanh nghiệp rất tự hào khi thế giới vừa phát triển ChatGPT thì ngay lập tức Việt Nam cũng bắt kịp.

“ Việt Nam đang dần hiểu công nghệ, thậm chí là phát triển công nghệ cho riêng mình. Đối với việc nghiên cứu mã nguồn mở thì Việt Nam đang đi đầu tại Đông Nam Á về lĩnh vực này. Chúng ta đang phát triển công nghệ AI rất nhanh ”, ông Hưng nói.

Theo ông Hưng, ngoài khoảng cách về địa lý thì TP.HCM, Jakarta (Indonesia), Singapore hay bất cứ nơi nào trên thế giới còn có một “rào cản” lớn, đó chính là ngôn ngữ. Mặc dù mọi người có thể giao tiếp với nhau bằng tiếng Anh, tiếng Trung Quốc hay tiếng Pháp.

Ông Hưng nhận định, trong tương lai, du khách nói bằng ngôn ngữ này thì điện thoại sẽ phát ra một ngôn ngữ khác để “phiên dịch”. Rào cản về ngôn ngữ sẽ được xóa bỏ và xử lý bởi công nghệ và AI.

Phát triển PhởGPT tương tự ChatGPT, dành riêng cho tiếng Việt - Ảnh 3.

Tiến sĩ Bùi Hải Hưng, Tổng giám đốc VinAI. (Ảnh: Hoàng Chi)

Ông Trần Duy Đông, Thứ trưởng Bộ Kế hoạch và Đầu tư nhận định, AI sẽ là một trong những lĩnh vực mà Việt Nam có nhiều tiềm năng để phát triển và sớm bắt kịp với trình độ của thế giới. Bộ Kế hoạch và Đầu tư sẽ luôn ủng hộ, đồng hành cùng cộng đồng AI nói riêng và cộng đồng khoa học công nghệ nói chung.

Theo ông Đông, Việt Nam đang đứng trước tiềm năng không giới hạn của trí tuệ nhân tạo tạo sinh (Generative AI) - một trong những công cụ sẽ giúp nâng cao năng suất lao động trí óc của con người một cách mạnh mẽ trong thời gian tới. Sự phát triển của Generative AI không chỉ trong lĩnh vực công nghệ mà còn thay đổi cơ bản cách con người nghiên cứu, làm việc, sáng tạo nội dung và được dự đoán sẽ đóng góp hàng nghìn tỷ USD vào kinh tế toàn cầu mỗi năm.

Cũng theo ông Đông, Việt Nam đã có những doanh nghiệp đạt nhiều thành tựu đáng ghi nhận về nghiên cứu ứng dụng trí tuệ nhân tạo như FPT, Viettel AI, VNPT AI và đặc biệt là VinAI. Tuy mới được thành lập 4 năm nhưng VinAI đã vào Top 20 công ty toàn cầu dẫn đầu về nghiên cứu trí tuệ nhân tạo do Thundermark Capital tổ chức bình chọn vào năm 2022, sánh ngang nhiều công ty tên tuổi đến từ các nước phát triển. Điều này càng chứng tỏ năng lực và vị thế của chuyên gia Việt Nam trong việc nghiên cứu, phát triển ứng dụng công nghệ AI.

Thứ trưởng Trần Duy Đông chia sẻ, ông rất vui mừng khi biết VinAI công bố nghiên cứu ứng dụng ChatGPT dành riêng cho người Việt, áp dụng các kỹ thuật tiên tiến nhất hiện nay để phù hợp với ngôn ngữ tiếng Việt. Đây cũng là ứng dụng AI với mã nguồn mở để sẵn sàng cung cấp cho người dùng Việt Nam, đặt nền móng cho sự phát triển các mô hình ngôn ngữ tiếng Việt hiệu suất cao, từ đó phát triển các ứng dụng thực tế, phù hợp với nhu cầu sử dụng của người Việt và định hướng phát triển công nghệ của Chính phủ.

Theo hãng nghiên cứu Precedence Research, chi tiêu cho phần cứng AI đang tăng lên nhanh chóng, từ 43 tỷ USD năm 2021 có thể lên tới 248 tỷ USD vào năm 2030. Những con số này đã và đang trở thành một vấn đề gây đau đầu cho các nhà sản xuất.

AI Day là sự kiện thường niên do Công ty Vin AI và New Turning Institute đồng tổ chức với sự đồng hành của Bộ Khoa học và Công nghệ cùng Trung tâm Đổi mới sáng tạo Quốc Gia NIC.

Sự kiện AI Day năm nay thu hút hơn 30 chuyên gia là các giáo sư, nhà khoa học hàng đầu trong lĩnh vực trí tuệ nhân tạo đến từ khắp nơi trên thế giới cùng hơn 100 đại diện doanh nghiệp và 1.500 khách mời trong lĩnh vực công nghệ, sản xuất và chế tạo trong nước và quốc tế.

Ngoài ra, sự kiện còn có sự tham gia của các đối tác lớn như: Intel, AWS, Elsa Speak, Do Ventures, AMD, Lenovo, Trusting Social, Google, VinFuture Prize, New World Saigon Hotel, NIC, Sovico Group, Vietjet Air, Vietsuccess, VietAI và The Global City.

AI Day 2023 có 4 phiên thảo luận chính với tầm ảnh hưởng lớn đến nhiều lĩnh vực như: Tương lai của mô hình ngôn ngữ lớn (LLMs); Định hình lại tầm nhìn về tương lai trí tuệ nhân tạo; Tác động toàn cầu của trí tuệ nhân tạo tạo sinh GenAI và Tiềm năng của GenAI trong nền kinh tế Đông Nam Á. Đặc biệt, AI tạo sinh - GenAI là chủ đề nóng, được quan tâm bởi tính thiết thực và công năng.