Trong kỷ nguyên AI bùng nổ trên toàn cầu, các sản phẩm công nghệ ứng dụng trí tuệ nhân tạo không còn là đặc quyền của những tập đoàn công nghệ quốc tế. Tại Việt Nam, Zalo AI đang dần khẳng định vị thế tiên phong khi phát triển thành công mô hình ngôn ngữ lớn (LLM) tiếng Việt, đưa vào triển khai hàng loạt sản phẩm thực tiễn. Tiêu biểu trong số đó là Trợ lý hỏi đáp Kiki Info và ứng dụng thiệp AI – hai cái tên đã nhanh chóng thu hút hàng triệu người dùng chỉ trong vòng hai tháng ra mắt.
Ở cấp độ toàn cầu, LLM đã không còn xa lạ khi những “gã khổng lồ” công nghệ như OpenAI, Google hay Meta liên tiếp ra mắt các phiên bản GPT, Gemini hay Llama với quy mô tham số khổng lồ, xử lý nhiều ngôn ngữ. Tuy nhiên, tiếng Việt vốn là ngôn ngữ có cộng đồng người dùng nhỏ hơn, dữ liệu huấn luyện hạn chế và tài nguyên ngôn ngữ số ít ỏi. Chính vì vậy, việc Zalo AI tự phát triển một mô hình LLM tiếng Việt với quy mô lên đến 13 tỷ tham số đã trở thành một bước tiến quan trọng, khẳng định năng lực công nghệ nội địa.
Mô hình này được đội ngũ kỹ sư Zalo xây dựng và huấn luyện hoàn toàn từ đầu, tự quyết định toàn bộ kiến trúc, tham số, cũng như thuật toán tối ưu trên nền tảng dữ liệu tiếng Việt đa dạng. Đây là cách làm được cộng đồng công nghệ đánh giá rất cao, vì thay vì chỉ dựa vào mô hình mã nguồn mở và tinh chỉnh lại, Zalo đã lựa chọn con đường gian nan hơn đó là tự tay đặt những viên gạch đầu tiên cho nền móng LLM tiếng Việt.
Một trong những thành tựu nổi bật khi ứng dụng mô hình ngôn ngữ lớn này là Trợ lý hỏi đáp Kiki Info. Không còn chỉ là lý thuyết trong phòng nghiên cứu, LLM của Zalo đã bước ra thế giới thực dưới dạng Official Account (OA) – tài khoản chính thức trên nền tảng Zalo.
Kiki Info được thiết kế như một trợ lý tổng hợp, hoạt động 24/7 để trả lời các câu hỏi thuộc nhiều lĩnh vực đa dạng: từ khoa học, lịch sử, pháp luật, giao thông, cho đến kiến thức đời sống thường nhật. Bất kỳ ai cũng có thể đặt câu hỏi và nhận câu trả lời tức thì, với độ chính xác và ngữ nghĩa phù hợp với đặc thù tiếng Việt.
Điểm khác biệt của Kiki Info không chỉ dừng lại ở việc trả lời câu hỏi khô khan. Nhờ nền tảng LLM tiếng Việt được huấn luyện bài bản, Kiki Info còn hỗ trợ người dùng sáng tạo nội dung như soạn thảo email, viết văn bản, tạo tin đăng mạng xã hội, những công việc trước đây thường tốn thời gian và đòi hỏi kỹ năng viết lách.
Ngoài ra, Kiki Info còn mang tính giải trí và gợi ý cá nhân hóa, với các đề xuất về địa điểm du lịch, âm nhạc, sách hay phù hợp với nhu cầu từng người dùng. Nhờ vậy, ứng dụng này nhanh chóng trở thành công cụ hỗ trợ đắc lực cho công việc, học tập và cuộc sống hàng ngày.
Một sản phẩm AI thành công không chỉ được đánh giá qua công nghệ mà còn bởi khả năng chạm đến cộng đồng. Thống kê từ đội ngũ phát triển cho thấy Kiki Info đã đạt hơn 1 triệu lượt truy cập chỉ trong gần hai tháng, trở thành một trong những OA phát triển nhanh nhất trên hệ sinh thái Zalo.
Điều này chứng minh nhu cầu sử dụng một trợ lý ảo tiếng Việt thân thiện, dễ tiếp cận là rất lớn. Trong bối cảnh AI toàn cầu vẫn còn nhiều rào cản ngôn ngữ với tiếng Việt, Kiki Info đã chứng minh tiềm năng phát triển của các sản phẩm AI nội địa – khi công nghệ thực sự gắn liền với nhu cầu và thói quen của người Việt.
Song song với Kiki Info, Zalo còn ra mắt một ứng dụng độc đáo: Thiệp AI. Không chỉ là một sản phẩm công nghệ đơn thuần, thiệp AI còn mang ý nghĩa gắn kết con người, thổi làn gió mới cho văn hóa gửi lời chúc trong các dịp lễ, Tết, sinh nhật hay sự kiện quan trọng.
Chỉ trong vòng hai tháng, ứng dụng thiệp AI đã chạm mốc 15 triệu thiệp được người dùng khởi tạo và gửi đi. Con số này không chỉ phản ánh sức hút từ yếu tố công nghệ, mà còn cho thấy người Việt sẵn sàng đón nhận những trải nghiệm cá nhân hóa, mới lạ khi công nghệ AI trở nên thân thiện và gần gũi hơn bao giờ hết.
Người dùng chỉ cần nhập nội dung mong muốn, lựa chọn phong cách, thiệp AI sẽ tự động sáng tạo ra những câu chúc hay ho, thiết kế bắt mắt để gửi tặng bạn bè, người thân. Trong nhịp sống bận rộn, đây là một cách tinh tế để duy trì kết nối và lan tỏa sự quan tâm theo cách hiện đại.
Điểm cộng của Kiki Info và thiệp AI không chỉ nằm ở công nghệ nền tảng mà còn ở cách chúng giải quyết các vấn đề rất thực tế. Với Kiki Info, người dùng không mất thời gian tra cứu, tìm kiếm thông tin từ nhiều nguồn khác nhau mà có thể nhận câu trả lời tức thì, chính xác, dễ hiểu. Tương tự, thiệp AI giúp tiết kiệm công sức nghĩ ra lời chúc hay, thiết kế thiệp đẹp và gửi đi chỉ trong vài thao tác.
Các ứng dụng này được cộng đồng người dùng đánh giá cao ở tính tiện lợi và khả năng mở rộng, đặc biệt là tính cá nhân hóa phù hợp với ngữ cảnh tiếng Việt – điều mà nhiều trợ lý AI quốc tế chưa thực sự làm tốt. Chính nhờ vậy, sản phẩm AI của Zalo đã góp phần rút ngắn thời gian tìm kiếm thông tin, đưa ra quyết định nhanh hơn và duy trì kết nối giữa con người theo cách sáng tạo, đầy tính nhân văn.
Phía sau những con số ấn tượng và sản phẩm hữu ích là một hành trình đầy thách thức của đội ngũ Zalo AI. So với những “ông lớn” quốc tế như OpenAI hay Meta, các doanh nghiệp Việt Nam phải đối mặt với không ít rào cản về hạ tầng phần cứng và tài nguyên dữ liệu.
Ngay từ những ngày đầu, trong khi các công ty toàn cầu sở hữu hệ thống GPU hiện đại của Nvidia, hạ tầng máy chủ tại Việt Nam còn hạn chế cả về số lượng lẫn chất lượng. Chưa kể, tiếng Việt là ngôn ngữ có tài nguyên dữ liệu nghèo hơn rất nhiều so với tiếng Anh hay tiếng Trung – vốn được ưu ái trong các dự án AI lớn. Nguồn lực con người cũng chưa thật sự dồi dào, còn thiếu kinh nghiệm huấn luyện LLM quy mô lớn.
Một bài toán nan giải khác là nguồn dữ liệu tiếng Việt. Nếu như tiếng Anh có vô vàn bộ dữ liệu công khai, được chuẩn hóa, phục vụ huấn luyện LLM, thì tiếng Việt vẫn còn manh mún, chưa đồng nhất và thiếu tính hệ thống.
Nhằm khắc phục điều này, đội ngũ kỹ sư Zalo đã chủ động thu thập, làm sạch và phát triển tập dữ liệu tiếng Việt phù hợp để huấn luyện LLM. Trước khi sở hữu hệ thống máy chủ DGX H100, nhóm phát triển còn tranh thủ chạy thử nghiệm trên các GPU dân dụng nhỏ hơn, để mài dũa kinh nghiệm, tối ưu thuật toán và sẵn sàng “chạy đua” khi có hạ tầng lớn.
Đây là cách làm thể hiện quyết tâm phát triển công nghệ nội địa bài bản, không phụ thuộc vào bên ngoài. Chính những nỗ lực âm thầm này đã đặt nền móng quan trọng để Zalo tự tin trình làng LLM tiếng Việt, sánh ngang nhiều tên tuổi toàn cầu.
Những kết quả đạt được đã minh chứng cho lựa chọn đúng đắn và bền bỉ. Cuối năm 2024, mô hình LLM của Zalo cán đích vị trí top 2 trên bảng xếp hạng VMLU – nền tảng đánh giá và xếp hạng năng lực xử lý ngôn ngữ tiếng Việt dành cho các mô hình LLM.
Đáng nói hơn, Zalo đã vượt qua nhiều tên tuổi lớn như GPT-4 của OpenAI, gemma-2-9b-it của Google hay microsoft/Phi-3-small-128k-instruct của Microsoft, chỉ đứng sau Llama-3-70B của Meta – một “ông lớn” sở hữu hạ tầng khổng lồ và hệ sinh thái dữ liệu toàn cầu.
Không dừng lại ở đó, trước đó vào năm 2023, Zalo đã công bố một mô hình 7 tỷ tham số tập trung chuyên sâu cho tiếng Việt, chỉ sau 6 tháng huấn luyện, đã đạt 150% năng lực so với GPT-3.5 (theo tiêu chuẩn VMLU). Điều này cho thấy đội ngũ kỹ sư trong nước hoàn toàn có thể tự tin tạo ra các sản phẩm AI chất lượng cao, không hề thua kém thế giới.
Những thành công bước đầu với Kiki Info, thiệp AI và mô hình LLM tiếng Việt chỉ là những viên gạch đầu tiên. Đại diện Zalo khẳng định họ sẽ tiếp tục đầu tư phát triển để đưa mô hình LLM tiến xa hơn, mở ra nhiều ứng dụng AI mới phục vụ nhu cầu người Việt.
Hướng đi này hoàn toàn phù hợp với định hướng quốc gia về khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số là ba yếu tố then chốt để Việt Nam không bị bỏ lại phía sau trong cuộc đua công nghệ toàn cầu. Trong bối cảnh AI đang được xem là “chìa khóa” mở ra thế hệ sản phẩm mới cho mọi ngành nghề, việc làm chủ mô hình ngôn ngữ lớn bản địa sẽ trở thành lợi thế chiến lược dài hạn.
Trong tương lai gần, người dùng Việt chắc chắn sẽ còn đón nhận thêm nhiều ứng dụng AI mới, thông minh hơn, tiện ích hơn từ mô hình ngôn ngữ lớn này. Và biết đâu, chính những bước đi tiên phong hôm nay sẽ đặt nền móng để Việt Nam trở thành một “điểm sáng” trên bản đồ AI toàn cầu.
Bạn có chắc chắn muốn Reset Key/ Đổi Máy trên Key này không?
Máy tính đã kích hoạt Key này sẽ bị gỡ và bạn dùng Key này để kích hoạt trên máy tính bất kỳ.