Google thử nghiệm kiến trúc Diffusion cho mô hình ngôn ngữ lớn: Bước ngoặt vượt ra khỏi GPT truyền thống
Trong một động thái có thể định hình lại cách triển khai các mô hình ngôn ngữ lớn (LLM), Google DeepMind vừa công bố thử nghiệm Gemini Diffusion – một mô hình ngôn ngữ dựa trên kiến trúc diffusion, vốn từng được sử dụng chủ yếu trong lĩnh vực tạo ảnh như DALL·E hay Imagen. Đây là nỗ lực của Google nhằm vượt qua những giới hạn của kiến trúc autoregressive truyền thống như GPT.