Alibaba Ra Mắt Mô Hình AI Qwen Mới Và Tuyên Bố Nó Vượt Trội Hơn DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba Ra Mắt Mô Hình AI Qwen Mới Và Tuyên Bố Nó Vượt Trội Hơn DeepSeek-V3

Thời gian đọc: 3 phút

Tập đoàn khổng lồ của Trung Quốc, Alibaba, đã ra mắt phiên bản mới nhất của mô hình AI hàng đầu của họ, Qwen, vào thứ Tư này. Công ty tuyên bố rằng nó có thể hoạt động tốt hơn mô hình DeepSeek-V3 đang được ưa chuộng.

Bận rộn? Dưới đây là những thông tin nhanh!

  • Alibaba đã công bố mô hình suy luận mới nhất của mình là Qwen 2.5-Max vào thứ Tư tuần này.
  • Gã khổng lồ Trung Quốc khẳng định rằng nó vượt trội hơn các mô hình phổ biến như DeepSeek-V3, GPT-4o, và Llama-3.1-405B.
  • Công ty cũng đã ra mắt Qwen2.5-VL tuần này, một mô hình AI có khả năng xử lý hình ảnh và hoạt động như một đại lý AI sử dụng máy tính và điện thoại di động để thực hiện các nhiệm vụ.

Theo Reuters, Alibaba đã ra mắt mô hình lý thuyết mới Qwen 2.5-Max, như họ đã đặt tên cho mô hình mới, ngay trong kỳ nghỉ Tết Nguyên Đán ở Trung Quốc, để tham gia vào những phát triển AI quy mô lớn trong những ngày qua và tăng cường sự cạnh tranh nội địa.

Vào thứ Hai, DeepSeek đã lên vị trí đầu tiên trên App Store của Apple tại Hoa Kỳ, vượt qua ChatGPT, gây lo ngại cho các công ty khác trong ngành công nghệ AI và làm báo động các nhà đầu tư – cổ phiếu Nvidia giảm 17% chỉ trong một ngày.

Bây giờ, Alibaba đã công bố các phiên bản mới nhất của mô hình Qwen của mình – nó đã phát hành 100 mô hình AI mã nguồn mở cho bộ Qwen vào tháng Chín năm trước – hứa hẹn sẽ cho kết quả tốt hơn so với các mô hình tiên tiến phổ biến.

“Qwen 2.5-Max vượt trội hơn (…) hầu hết các lĩnh vực so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B,” công ty đã viết trên tài khoản WeChat chính thức của mình.

API mới của mô hình suy luận Qwen 2.5-Max có sẵn qua điện toán đám mây của Alibaba và người dùng cũng có thể thử nghiệm mô hình trên trang chat của nó.

“Chúng tôi đang phát triển Qwen2.5-Max, một mô hình MoE quy mô lớn đã được tiền huấn luyện trên hơn 20 nghìn tỷ token và sau đó được huấn luyện thêm với các phương pháp Supervised Fine-Tuning (SFT) và Reinforcement Learning from Human Feedback (RLHF) được lựa chọn cẩn thận,” đội ngũ Qwen viết trên Github.

Công ty khổng lồ Trung Quốc cũng đã phát hành Qwen2.5-VL vào thứ Hai, một chuỗi các mô hình AI đa phương tiện có thể xử lý hình ảnh và truy cập vào điện thoại di động và máy tính để thực hiện các tác vụ. OpenAI đã công bố một tính năng tương tự, Operator, cho phép ChatGPT thực hiện các tác vụ tự động bằng cách kiểm soát máy tính của người dùng.

Theo nhóm của Alibaba, tất cả các mô hình Qwen đều vượt trội hơn các phiên bản tương tự từ OpenAI, Microsoft, Google, Meta và DeepSeek.

Bạn có thích bài viết này không?
Hãy để lại đánh giá nhé!
Tôi không thích Tôi thực sự rất thích Cũng ổn đấy Khá tốt! Thích lắm!

Chúng tôi rất vui khi bạn thích sản phẩm của chúng tôi!

Với tư cách là một độc giả quý giá, bạn có thể vui lòng đánh giá về chúng tôi trên Trustpilot không? Việc này rất nhanh và có ý nghĩa vô cùng to lớn đối với chúng tôi. Xin cảm ơn vì bạn thật tuyệt vời!

Đánh giá chúng tôi trên Trustpilot
0 Được bình chọn bởi 0 người dùng
Tiêu đề
Bình luận
Cảm ơn bạn đã phản hồi
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Để lại bình luận

Loader
Loader Hiển thị thêm...