
Image by TechCrunch, from Flickr
Trí tuệ nhân tạo suy nghĩ trước khi nói? Claude 3.7 Sonnet ra mắt Tính năng suy luận lai
Anthropic đã triển khai Claude 3.7 Sonnet, một phiên bản mới của mô hình AI của họ, giới thiệu một chế độ “suy nghĩ mở rộng” tùy chọn, cho phép người dùng kiểm soát nhiều hơn cách mô hình xử lý các tác vụ phức tạp.
Bận rộn? Đây là những thông tin nhanh!
- Mô hình cải thiện khả năng tư duy và giải quyết vấn đề bằng cách cho phép tự phản chiếu trước khi trả lời.
- Chế độ tư duy mở rộng chỉ có sẵn trên các gói trả phí.
- Claude Code, trợ lý lập trình, đang trong giai đoạn xem trước hạn chế cho các nhà phát triển
Anthropic đã phát hành Claude 3.7 Sonnet, một mô hình AI được cập nhật giới thiệu khả năng suy luận kết hợp, cho phép người dùng lựa chọn giữa việc phản ứng nhanh và suy nghĩ mở rộng.
Phương pháp mới này nhằm cải thiện khả năng giải quyết vấn đề bằng cách cho phép mô hình dành thêm thời gian để đánh giá và chỉnh sửa các phản hồi của mình khi cần thiết.
Trong chế độ tiêu chuẩn, Claude 3.7 Sonnet hoạt động như một sự cải tiến lặp lại so với tiền nhiệm của nó, Claude 3.5 Sonnet. Tuy nhiên, trong chế độ suy nghĩ kéo dài, mô hình tham gia vào quá trình tự phản chiếu trước khi đưa ra câu trả lời.
Michael Gerstenhaber, người dẫn dắt sản phẩm của Anthropic về AI, mô tả tính năng này như một cách để người dùng cân nhắc giữa thời gian phản hồi và độ sâu của lý thuyết. “Người dùng [user] có rất nhiều quyền kiểm soát hành vi – bao lâu nó suy nghĩ, và có thể trao đổi lý thuyết và trí tuệ với thời gian và ngân sách,” anh nói, theo như được báo cáo bởi WIRED.
Quy trình này nhằm tăng cường độ chính xác trong các lĩnh vực yêu cầu suy luận nhiều bước, như toán học, vật lý, lập trình, và việc tuân theo hướng dẫn. Người dùng tương tác với mô hình thông qua API có thể xác định giới hạn về số lượng token mà nó sử dụng để “suy nghĩ,” cho phép kiểm soát tốc độ phản hồi và chi phí.
WIRED ghi nhận rằng bản cập nhật cũng bao gồm tính năng “scratchpad”, cho phép xem các bước suy luận của mô hình khi xử lý một yêu cầu. Phương pháp này tương tự như các kỹ thuật được sử dụng trong các mô hình AI khác, như DeepSeek.
Anthropic cho biết Claude 3.7 Sonnet đã được tối ưu hóa cho các ứng dụng thực tế hơn là các tiêu chuẩn kiểu thi đấu. Thử nghiệm sớm cho thấy rằng chế độ suy luận mở rộng cải thiện hiệu suất trong các tác vụ liên quan đến các cơ sở mã phức tạp, sử dụng công cụ tiên tiến và phát triển phần mềm full-stack.
Mô hình đã được đánh giá trên SWE-bench Verified và TAU-bench, nơi mà theo báo cáo, nó vượt trội hơn các phiên bản trước, như được Anthropic thông báo.
CNN ghi nhận rằng Anthropic đã giữ giá cho Claude 3.7 giống như các mô hình trước, đặt nó dưới các sản phẩm mới nhất của OpenAI. Nó có giá $3 cho mỗi triệu token đầu vào và $15 cho mỗi triệu token đầu ra, so với $15 và $60 của OpenAI cho các tầng tương tự.
Để lại bình luận
Hủy