Image generated with OpenAI

Ý kiến: Tại sao các Đại diện Trí tuệ Nhân tạo là Tương lai của Trí tuệ Nhân tạo hàng ngày

Thời gian đọc: 10 phút

Cập nhật mới nhất: Apr 29, 2025

Được viết bởi Andrea Miliani Chuyên gia tin tức công nghệ
Dịch bởi Nhóm Bản địa hóa và Dịch thuật Dịch vụ Bản địa hóa và Dịch thuật

Năm 2025 dường như là năm của AI Đại Diện. OpenAI, Microsoft, Anthropic và các công ty công nghệ lớn khác đã phát hành những mô hình AI tiên tiến nhất của họ, có khả năng thực hiện các nhiệm vụ phức tạp mà không thể thực hiện được chỉ trong năm ngoái. Nhưng thực chất, AI đại diện là gì và bao nhiêu phần của công nghệ này là thực sự so với sự quảng cáo?

Việc theo kịp xu hướng AI trong những năm gần đây có thể làm bạn mệt mỏi. Chúng ta đã đi từ AI cơ bản đến AI tạo ra, sau đó là AI suy luận, và bây giờ, AI đại diện đang chiếm ưu thế trong cuộc đối thoại. Trong vài tháng qua, nhiều công ty công nghệ đã giới thiệu những đại diện AI mới và nêu bật cách mà các dòng công việc kết nối chúng đang trở nên ngày càng hấp dẫn.

Vào tháng Giêng, OpenAI đã ra mắt tác nhân AI đầu tiên của mình, Operator, có khả năng thực hiện các tác vụ một cách tự động, như duyệt web, đặt chỗ nhà hàng, hoặc mua vé xem hòa nhạc cho bạn, dựa trên sở thích và tiêu chí của bạn.

Hai tháng sau đó, start-up AI Trung Quốc Zhipu đã phát hành AutoGLM Rumination, một tác nhân AI miễn phí có thể hoạt động độc lập và lên kế hoạch du lịch cho người dùng. Và chỉ vài ngày trước đây, Microsoft đã giới thiệu “Computer Use” cho Copilot Studio, thêm nhiều khả năng tự động hơn vào tác nhân AI, bao gồm khả năng điều khiển máy tính của người dùng.

Nhưng xu hướng này không chỉ đơn thuần là các công ty ra mắt những sản phẩm mới tuyệt vời – đó là một lĩnh vực phức tạp và đang phát triển, kết hợp các hình thức khác nhau của AI với sự tương tác của con người. Các tín đồ công nghệ và chuyên gia đều tỏ ra rất lạc quan về AI đại diện.

“Xu hướng mà tôi cũng rất hào hứng là quy trình làm việc của AI đại diện,” chia sẻ chuyên gia AI, đồng sáng lập Coursera và DeepLearning, Andrew Ng, tại hội nghị BUILD 2024 của Snowflake vào tháng 11. “Nếu bạn hỏi, công nghệ AI quan trọng nhất cần chú ý là gì? Tôi sẽ nói đó là AI đại diện.”

Vậy, AI agents là gì chính xác? Chúng có thực hiện tốt như những chuyên gia khẳng định không? Dưới đây là một cái nhìn tổng quan ngắn gọn về những khía cạnh quan trọng nhất của công nghệ đang nổi lên này và những phát triển mới nhất.

AI Agents là gì?

Như các công ty như OpenAI và Microsoft đã chỉ ra, AI agents là công nghệ có khả năng thực hiện các tác vụ phức tạp bằng cách tự động kết hợp các ứng dụng và phần mềm khác nhau.

Về cơ bản, chúng là “chatbot AI truyền thống” – nhưng tiên tiến hơn, có khả năng thực hiện các công việc vượt xa những gì chúng ta đã quen thuộc trong hai năm qua. Những công việc này bao gồm lập kế hoạch, tìm kiếm trên web, nhớ đến sở thích của bạn, và thậm chí làm sắm hàng hóa mà không cần hướng dẫn từng bước, vì chúng tự tìm hiểu mọi thứ.

Google Cloud định nghĩa các đại lý AI là “hệ thống phần mềm sử dụng AI để theo đuổi mục tiêu và hoàn thành nhiệm vụ thay mặt cho người dùng.”

Điều thực sự đặc biệt ở những mô hình AI này là khả năng suy luận tiên tiến của chúng, cho phép chúng xử lý đồng thời nhiều loại thông tin – âm thanh, văn bản, video, mã, và hình ảnh. Chúng có thể hiểu các tình huống phức tạp theo cách mà con người thực hiện, hành động và tương tác với phần mềm và các nền tảng.

Hiện nay, nhiều công ty công nghệ đang đẩy mạnh mô hình AI của họ lên tầm cao mới.

Chỉ vài ngày trước, OpenAI đã công bố rằng các mô hình AI của họ o3 và o4-mini có thể “suy nghĩ” bằng hình ảnh và thao tác chúng – cắt hoặc biến đổi chúng, chẳng hạn. Trong khi đó, tính năng “Sử dụng Máy Tính” mới của Microsoft cho phép các đại diện AI của nó nhận biết giao diện người dùng đồ họa.

“Nếu một người có thể sử dụng ứng dụng, đại diện cũng có thể,” Charles Lamanna, Phó Chủ tịch Tập đoàn, Đối tác Kinh doanh & Ngành nghề tại Microsoft, đã nói trong thông cáo.

Trình độ tiếp theo: Công nghệ AI Đại diện

Trong khi nhiều công ty công nghệ đang phát triển các chatbot AI thông minh đến mức tối đa, AI đại diện lại đi một bước xa hơn. Công nghệ này tập trung vào việc xây dựng các hệ thống trong đó nhiều đại diện AI này có thể tương tác và thực hiện các nhiệm vụ khác nhau để mang lại kết quả chính xác và hoàn chỉnh hơn.

Trong buổi thuyết trình về “Sức mạnh của các đại diện AI” tại một sự kiện Tech Talk gần đây mà tôi đã tham dự, do eDreams tổ chức, chuyên gia AI Patricia Gutierrez Faxas đã giải thích rằng các hệ thống này có thể nhận những cấu trúc khác nhau. Các hệ thống đa đại diện có thể chia nhỏ các nhiệm vụ phức tạp thành những nhiệm vụ đơn giản hơn, giao chúng cho các đại diện chuyên môn, và hình thành các loại mạng khác nhau.

Một đại diện AI có thể đảm nhận vai trò “Người giám sát”, giao các nhiệm vụ nhỏ hơn cho các đại diện chuyên môn khác, hoặc nhiều đại diện có thể làm việc cùng một lúc trên các nhiệm vụ riêng biệt và phối hợp để cung cấp kết quả cuối cùng. Một số lợi ích của những hệ thống này bao gồm độ chính xác cải thiện, quyền riêng tư lớn hơn và lỗi giảm bớt.

Andrew Ng đồng ý với cách tiếp cận này. Trong bài phát biểu của mình tại BUILD 2024, anh ấy nhấn mạnh tầm quan trọng của quy trình làm việc Agentic AI trong việc xử lý các nhiệm vụ phức tạp với kết quả tốt hơn nhiều. Bước tiến vượt trội trong hiệu suất từ các mô hình như GPT-3.5 đến GPT-4 – và kết quả mạnh mẽ hơn của họ trên các chuẩn mực lập trình – chủ yếu là do quy trình làm việc agentic và lý thuyết agentic.

AI sẽ ảnh hưởng đến cuộc sống của chúng ta như thế nào?

Các công ty công nghệ đang áp dụng những phương pháp khác nhau cho AI đại diện. OpenAI đã tập trung vào các ý tưởng cho người dùng hàng ngày. Khi ra mắt Operator, nhóm đã giải thích trong một video rằng một người chỉ cần nghĩ về một món ăn mà họ muốn chuẩn bị, yêu cầu ChatGPT tìm công thức tốt nhất, thậm chí có thể yêu cầu nó mua những nguyên liệu cần thiết từ một siêu thị trực tuyến.

Mô hình AI có thể đặt các câu hỏi bổ sung và tạm dừng trước khi thực hiện các tác vụ quan trọng, như hoàn thành một giao dịch mua hàng sử dụng thẻ tín dụng của người dùng. Người dùng có thể đặt giới hạn chi tiêu hoặc yêu cầu trợ lý yêu cầu sự xác nhận trước khi mua bất cứ thứ gì.

Các khả năng mà người dùng thông thường có thể sử dụng trợ lý AI dường như không có hạn, nhưng những tình huống sử dụng phổ biến nhất cho đến nay bao gồm hành động như một đại lý du lịch, người mua sắm cá nhân, và trợ lý hành chính – rốt cuộc, ai lại không muốn có một công nghệ cá nhân hóa gửi email, nhớ các sinh nhật quan trọng, và lo lắng về việc đóng thuế?

Microsoft đã tiếp cận theo phong cách doanh nghiệp hơn. Công ty đã minh họa cách các công ty quảng cáo có thể sử dụng đại diện AI để tự động hóa việc thu thập dữ liệu thị trường và tạo ra các phân tích dựa trên thông tin chi tiết, hoặc cách các doanh nghiệp lớn có thể sử dụng chúng để xử lý hóa đơn trong hệ thống của mình.

Tuy nhiên, mặc dù tất cả những ứng dụng này nghe có vẻ đột phá, các chuyên gia đều đồng ý rằng chúng ta còn có một quãng đường dài phía trước. Hầu hết mọi người chưa thể sử dụng đại diện AI để cải thiện cuộc sống hàng ngày của họ, vì nhiều tính năng như Operator chỉ dành cho người dùng Pro, một gói đăng ký có giá 200 đô la mỗi tháng.

Vậy, AI đại diện có đáng với sự kỳ vọng không?

Nhiều tiêu đề trên các phương tiện truyền thông đang hứa hẹn một cuộc cách mạng AI mới do Agentic AI dẫn đầu. Chắc chắn rằng ngành công nghiệp này đang chứng kiến rất nhiều sự hoàng tưởng – và thực tế có thể không còn xa nữa. Một báo cáo mới được chia sẻ bởi IBM cho thấy rằng nhiều lập trình viên đang tích cực khám phá và phát triển công nghệ này.

“IBM và Morning Consult đã thực hiện một cuộc khảo sát với 1.000 lập trình viên đang xây dựng ứng dụng AI cho doanh nghiệp, và 99% trong số họ cho biết họ đang khám phá hoặc phát triển các đại diện AI,” giải thích Tiến sĩ Maryam Ashoori, Giám đốc Quản lý Sản phẩm tại IBM watsonx.ai. “Vì vậy, câu trả lời là năm 2025 sẽ là năm của đại diện.”

Tuy nhiên, các chuyên gia lưu ý rằng có nhiều cách hiểu khác nhau về thực chất của các đại diện AI và cách họ hoạt động. Do đó, tiến trình và hiệu suất của các đại diện AI hiện tại thường phụ thuộc vào quan điểm và tiêu chuẩn của người đánh giá công nghệ này.

Điều chắc chắn là rất nhiều chuyên gia và người ra quyết định tin tưởng sâu sắc vào công nghệ này và đang đầu tư mạnh mẽ vào việc phát triển nó. Một nghiên cứu gần đây đã tiết lộ rằng 84% các lãnh đạo IT tin tưởng các đại diện AI cũng như con người, và OpenAI dự kiến doanh thu khoảng 125 tỷ đô la vào năm 2029.

Mặc dù công nghệ AI Agentic chưa được phát triển hoàn thiện và việc áp dụng nó chưa được phổ biến như chatbots – chủ yếu do chi phí cao – rõ ràng là sự lạc quan và hứng khởi vượt trội xung quanh xu hướng này đủ mạnh mẽ để thúc đẩy những thay đổi lớn trong những tháng tới.