Photo by John Schnobrich on Unsplash

Alibaba Ra Mắt Mô Hình AI Qwen Mới Và Tuyên Bố Nó Vượt Trội Hơn DeepSeek-V3

Thời gian đọc: 3 phút

Cập nhật mới nhất: Jan 31, 2025

Được viết bởi Andrea Miliani Chuyên gia tin tức công nghệ
Dịch bởi Nhóm Bản địa hóa và Dịch thuật Dịch vụ Bản địa hóa và Dịch thuật

Tập đoàn khổng lồ của Trung Quốc, Alibaba, đã ra mắt phiên bản mới nhất của mô hình AI hàng đầu của họ, Qwen, vào thứ Tư này. Công ty tuyên bố rằng nó có thể hoạt động tốt hơn mô hình DeepSeek-V3 đang được ưa chuộng.

Bận rộn? Dưới đây là những thông tin nhanh!

Alibaba đã công bố mô hình suy luận mới nhất của mình là Qwen 2.5-Max vào thứ Tư tuần này.
Gã khổng lồ Trung Quốc khẳng định rằng nó vượt trội hơn các mô hình phổ biến như DeepSeek-V3, GPT-4o, và Llama-3.1-405B.
Công ty cũng đã ra mắt Qwen2.5-VL tuần này, một mô hình AI có khả năng xử lý hình ảnh và hoạt động như một đại lý AI sử dụng máy tính và điện thoại di động để thực hiện các nhiệm vụ.

Theo Reuters, Alibaba đã ra mắt mô hình lý thuyết mới Qwen 2.5-Max, như họ đã đặt tên cho mô hình mới, ngay trong kỳ nghỉ Tết Nguyên Đán ở Trung Quốc, để tham gia vào những phát triển AI quy mô lớn trong những ngày qua và tăng cường sự cạnh tranh nội địa.

Vào thứ Hai, DeepSeek đã lên vị trí đầu tiên trên App Store của Apple tại Hoa Kỳ, vượt qua ChatGPT, gây lo ngại cho các công ty khác trong ngành công nghệ AI và làm báo động các nhà đầu tư – cổ phiếu Nvidia giảm 17% chỉ trong một ngày.

Bây giờ, Alibaba đã công bố các phiên bản mới nhất của mô hình Qwen của mình – nó đã phát hành 100 mô hình AI mã nguồn mở cho bộ Qwen vào tháng Chín năm trước – hứa hẹn sẽ cho kết quả tốt hơn so với các mô hình tiên tiến phổ biến.

“Qwen 2.5-Max vượt trội hơn (…) hầu hết các lĩnh vực so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B,” công ty đã viết trên tài khoản WeChat chính thức của mình.

API mới của mô hình suy luận Qwen 2.5-Max có sẵn qua điện toán đám mây của Alibaba và người dùng cũng có thể thử nghiệm mô hình trên trang chat của nó.

“Chúng tôi đang phát triển Qwen2.5-Max, một mô hình MoE quy mô lớn đã được tiền huấn luyện trên hơn 20 nghìn tỷ token và sau đó được huấn luyện thêm với các phương pháp Supervised Fine-Tuning (SFT) và Reinforcement Learning from Human Feedback (RLHF) được lựa chọn cẩn thận,” đội ngũ Qwen viết trên Github.

Công ty khổng lồ Trung Quốc cũng đã phát hành Qwen2.5-VL vào thứ Hai, một chuỗi các mô hình AI đa phương tiện có thể xử lý hình ảnh và truy cập vào điện thoại di động và máy tính để thực hiện các tác vụ. OpenAI đã công bố một tính năng tương tự, Operator, cho phép ChatGPT thực hiện các tác vụ tự động bằng cách kiểm soát máy tính của người dùng.

Theo nhóm của Alibaba, tất cả các mô hình Qwen đều vượt trội hơn các phiên bản tương tự từ OpenAI, Microsoft, Google, Meta và DeepSeek.

Alibaba Ra Mắt Mô Hình AI Qwen Mới Và Tuyên Bố Nó Vượt Trội Hơn DeepSeek-V3

Chúng tôi rất vui khi bạn thích sản phẩm của chúng tôi!

Để lại bình luận