Theo thông báo từ Bộ Chuyển đổi số Ukraine cùng với nhà mạng Kyivstar, Ukraine đang phát triển một mô hình ngôn ngữ lớn (LLM) sử dụng khung mã nguồn mở Gemma do Google cung cấp. Mục tiêu của dự án là tạo ra hệ thống trí tuệ nhân tạo độc lập vừa để phục vụ nhu cầu dân sự, vừa đáp ứng các yêu cầu về an ninh và quốc phòng.
Ban đầu, quá trình huấn luyện mô hình sẽ diễn ra trên hạ tầng máy tính của Google — tận dụng sức mạnh điện toán sẵn có. Sau đó, toàn bộ hệ thống sẽ được chuyển sang chạy trên các trung tâm dữ liệu nội địa của Ukraine. Phương án này nhằm đảm bảo rằng toàn quyền kiểm soát quyền truy cập và dữ liệu được giữ trong tay quốc gia, tránh phụ thuộc liên tục vào các nền tảng nước ngoài.
Ukraine lựa chọn tự phát triển AI thay vì tiếp tục trả phí hàng triệu USD cho các dịch vụ nước ngoài. Theo Thứ trưởng chịu trách nhiệm về số hóa, ông Oleksandr Bornyakov, việc phụ thuộc vào các hệ thống thuộc sở hữu tư nhân hoặc của quốc gia khác không phù hợp với bối cảnh hiện nay, đặc biệt khi quốc gia đang phải đối mặt với xung đột và nguy cơ gián đoạn an ninh.

Ảnh: Cryptopolitan
Bên cạnh đó, hiện các mô hình AI quốc tế thường gặp khó khăn khi xử lý các ngôn ngữ bản địa, phương ngữ hoặc tiếng dân tộc thiểu số điều phổ biến tại Ukraine. Việc phát triển LLM nội địa với dữ liệu đặc thù của Ukraine kỳ vọng sẽ khắc phục được các hạn chế về dịch thuật, hiểu ngôn ngữ địa phương, kể cả đối với những vùng sử dụng tiếng pha trộn như tiếng Ukraine – Nga – Bulgaria tại một số khu vực.
Ngoài ra, dự án còn nhằm hỗ trợ các ứng dụng quan trọng như phân tích dữ liệu chiến tranh, quản lý thông tin quân sự, điều phối tác chiến, giám sát tin giả (disinformation campaigns), hỗ trợ nhận dạng dữ liệu tình báo, tất cả đều cần một hệ thống AI mà Ukraine hoàn toàn làm chủ.
Mặc dù khung Gemma của Google được chọn nhờ khả năng hỗ trợ nhiều ngôn ngữ và đa năng, quá trình thích nghi để phù hợp với thực tế Ukraine không hề đơn giản. Để đảm bảo tính phù hợp, một số ủy ban tư vấn gồm các chuyên gia kỹ thuật, pháp lý, lịch sử, ngôn ngữ và văn hóa đã được thành lập, nhằm kiểm soát chặt chẽ dữ liệu đầu vào, tính chính xác về văn bản, và đảm bảo không xảy ra sai lệch về mặt ngôn ngữ hay ngữ cảnh.
Một điểm nhạy cảm khác là vấn đề an ninh khi Ukraine đang đối mặt với các cuộc tấn công mạng liên tục. Chính Kyivstar cũng cho biết họ đã chuẩn bị các biện pháp phòng ngừa như hệ thống dự phòng điện, bảo vệ dữ liệu, đồng thời phát triển chiến lược chống lại những hình thức tấn công AI như “prompt injection” (lệnh đầu vào độc hại).
Việc chuyển đổi sang hạ tầng nội địa cũng đặt ra yêu cầu lớn về năng lực vận hành, bảo trì, bảo mật — đồng nghĩa Ukraine phải đầu tư không nhỏ vào trung tâm dữ liệu, nhân lực kỹ thuật, quản lý rủi ro. Đây là một thử thách không nhỏ, nhất là trong bối cảnh quốc gia đang có nhiều áp lực khác.
Dự án AI quốc gia của Ukraine với Gemma là một minh chứng rõ ràng rằng ngay cả các quốc gia có quy mô vừa và đang chịu áp lực từ chiến tranh và khủng hoảng, vẫn có thể theo đuổi chiến lược tự chủ công nghệ thông qua việc tận dụng các công nghệ mã nguồn mở.
Thay vì phụ thuộc vào các “ông lớn” công nghệ nước ngoài với chi phí cao, quyền kiểm soát dữ liệu hạn chế và rủi ro phụ thuộc, Ukraine đang xây dựng khả năng chủ động, bảo vệ dữ liệu nội địa, và phát triển ứng dụng phù hợp cho nhu cầu riêng biệt của quốc gia.
Nếu thành công, mô hình này có thể trở thành tham chiếu cho nhiều quốc gia khác, đặc biệt ở khu vực có sử dụng ngôn ngữ, phương ngữ đa dạng trong việc phát triển AI nội địa, bảo đảm chủ quyền số, và phát triển dịch vụ công nghệ cao mà không phụ thuộc quá lớn vào nước ngoài.