
Image generated with OpenAI
Ý kiến: Các Mô hình AI là những “sinh vật” bí ẩn, và thậm chí cả những người tạo ra chúng cũng không hoàn toàn hiểu rõ về chúng
Nghiên cứu gần đây của Anthropic về cách mô hình Haiku Claude 3.5 của họ hoạt động hứa hẹn những khám phá đột phá và tia sáng tri thức trong việc hiểu cách các công nghệ AI tiên tiến hoạt động. Nhưng khi họ nói rằng LLMs là “các sinh vật sống” mà “suy nghĩ”, họ muốn nói gì?
Vài ngày trước, Anthropic đã công bố hai bài báo với những nghiên cứu đột phá về cách các Mô hình Ngôn ngữ Lớn (LLMs) hoạt động. Mặc dù các phát triển kỹ thuật đã thú vị và liên quan, điều thu hút sự chú ý của tôi nhất là từ vựng được sử dụng bởi các chuyên gia AI.
Trong nghiên cứu Về Sinh học của Mô hình Ngôn ngữ Lớn, các nhà nghiên cứu đã tự so sánh mình với những nhà sinh học nghiên cứu về những “sinh vật sống” phức tạp đã tiến hóa qua hàng tỷ năm.
“Tương tự, trong khi mô hình ngôn ngữ được tạo ra bằng những thuật toán đào tạo đơn giản, do con người thiết kế, thì những cơ chế sinh ra từ những thuật toán này dường như rất phức tạp,” các nhà khoa học đã viết.
Trong vài năm qua, các mô hình AI đã phát triển đáng kể. Và chúng tôi đã chứng kiến sự phát triển nhanh chóng của nó trong vài tháng qua. Chúng tôi đã thấy ChatGPT chuyển từ một mô hình chỉ dùng văn bản thành một đối tác trò chuyện, và giờ đây là một tác nhân đa chiều có thể còn tạo ra những hình ảnh phong cách Studio Ghibli ấn tượng.
Nhưng, nếu như các mô hình AI hiện tại đã tiến tới mức sci-fi trong việc phát triển những khả năng suy luận tiên tiến đến mức mà ngay cả người tạo ra chúng cũng không thể hiểu được quá trình và hệ thống của chúng? Có nhiều bí ẩn xung quanh các công nghệ AI có thể cần được xem xét lại – hoặc tìm hiểu – vào năm 2025.
Nghịch lý Black-Box Ma Quái của Các Mô Hình AI
Có nhiều cuộc thảo luận về việc áp dụng AI và trình độ hiểu biết về AI, và cách những người hiểu cách hoạt động của các mô hình AI sinh thái ít có khả năng xem chatbot là “bạn bè” hay ứng dụng “ma thuật”. Tuy nhiên, còn một cuộc tranh luận khác — giữa các chuyên gia và những người quen thuộc hơn với công nghệ này — về việc có nên so sánh hay coi LLMs như những tạo vật độc lập. Về vấn đề sau cùng này, có một thành phần đặc biệt, một bí ẩn được gọi là “đối nghịch đen của AI”, đóng vai trò quan trọng trong cuộc thảo luận.
Các hệ thống học sâu được đào tạo để nhận ra các yếu tố và xu hướng theo cách tương tự như con người. Giống như chúng ta dạy trẻ em nhận biết mẫu và gán các từ cụ thể cho các đối tượng khác nhau, LLMs đã được đào tạo để tạo ra các kết nối độc đáo và xây dựng các mạng lưới ngày càng phức tạp hơn khi chúng “lớn lên”.
Samir Rawashdeh, Giáo sư Phụ tá về Kỹ thuật Điện và Máy Tính, chuyên về trí tuệ nhân tạo và giải thích rằng giống như khi chúng ta nghiên cứu trí thông minh con người, hầu như không thể thực sự nhìn thấy cách hệ thống học sâu đưa ra quyết định và đạt đến kết luận. Đây là những gì các chuyên gia gọi là “vấn đề hộp đen.”
Vấn đề hiểu biết con người với Mô hình AI
Nghiên cứu gần đây của Anthropic đã làm sáng tỏ tình hình hộp đen AI bằng cách giải thích cách mô hình của họ “suy nghĩ” trong những tình huống nhất định mà trước đây bị mờ nhạt hoặc thậm chí hoàn toàn sai lầm. Mặc dù nghiên cứu dựa trên mô hình Claude 3.5 Haiku, nó cho phép các chuyên gia phát triển công cụ và phân tích các đặc điểm tương tự trên các mô hình AI khác.
“Hiểu được bản chất của trí thông minh này là một thách thức khoa học sâu sắc, có khả năng thay đổi cách chúng ta nhìn nhận ý nghĩa của việc ‘suy nghĩ’,” theo những gì được nêu trong bài báo mà các nhà nghiên cứu của Anthropic chia sẻ.
Tuy nhiên, việc gán cho công nghệ AI khả năng “suy nghĩ,” đã làm một số chuyên gia trong ngành cảm thấy không hài lòng và đây cũng là một phần trong những lời chỉ trích đối với cuộc điều tra. Một người dùng Reddit đã giải thích lý do tại sao điều này làm phiền một nhóm người: “Có quá nhiều việc nhân cách hóa trong bài viết làm mờ đi công việc thực sự. Ví dụ, nó cứ sử dụng từ ‘suy nghĩ’ khi nên nói ‘tính toán’. Chúng ta đang nói về phần mềm máy tính, không phải bộ não sinh học.”
Trong khi những thuật ngữ “nhân hóa” giúp những người không chuyên môn hiểu rõ hơn về các mô hình AI và tạo ra cuộc tranh luận trong cộng đồng, thực tế là, dù chúng ta nói “tính toán” hay “suy nghĩ,” thách thức vẫn giữ nguyên: chúng ta không có sự hiểu biết đầy đủ hoặc sự minh bạch hoàn toàn về cách thức hoạt động của LLM.
Điều Gì Đáng Mong Đợi Từ Các Mô Hình AI Tiên Tiến Trong Tương Lai Gần
Bạn có thể tưởng tượng việc phớt lờ sự tồn tại của các công nghệ AI tiên tiến như ChatGPT, DeepSeek, Perplexity, hoặc Claude – bây giờ hoặc trong tương lai gần không? Tất cả các dấu hiệu đều cho thấy rằng không có chỗ để quay trở lại. AI tạo ra và suy luận đã biến đổi cuộc sống hàng ngày của chúng ta, và chúng sẽ chỉ tiếp tục phát triển.
Hầu như mỗi ngày tại WizCase, chúng tôi đưa tin về một sự phát triển mới trong ngành công nghiệp – một mô hình AI mới, một công cụ AI mới, một công ty AI mới – có tiềm năng tạo ra tác động lớn trong xã hội của chúng ta. Ý tưởng về việc nghỉ ngơi để đầu tiên hiểu rõ hơn về những mô hình tiên tiến này và cách hoạt động của chúng – hoặc thậm chí là hãy chậm lại một chút – dường như không thể, bởi tốc độ nhanh chóng của cuộc đua AI và sự tham gia của các chính phủ và những công ty lớn nhất thế giới.
“Các mô hình AI ngày càng tác động mạnh mẽ lên cách chúng ta sống và làm việc, chúng ta phải hiểu chúng đủ để đảm bảo rằng tác động của chúng là tích cực,” Anthropic’s paper khẳng định. Mặc dù có vẻ hơi không thực tế, nhưng các nhà nghiên cứu vẫn lạc quan: “Chúng tôi tin rằng kết quả của chúng tôi tại đây, và quỹ đạo tiến bộ mà chúng được xây dựng trên, là bằng chứng thú vị cho thấy chúng tôi có thể đáp ứng thách thức này.”
Nhưng những phát hiện này có thể diễn ra nhanh chóng đến mức nào? Bài báo cũng chỉ ra rằng kết quả chỉ bao gồm một vài lĩnh vực và trường hợp cụ thể, và không thể xây dựng nên những kết luận chung chung. Vì vậy, có lẽ không đủ nhanh.
Trong khi các nhà quản lý đưa ra những biện pháp như Luật AI của EU, đòi hỏi sự minh bạch hơn, họ cũng gây ra sự buộc tội và phàn nàn từ các công ty công nghệ lớn vì bị cho là làm chậm tiến trình, các mô hình AI mạnh mẽ vẫn tiếp tục tiến bộ.
Là một xã hội, chúng ta phải nỗ lực tìm kiếm sự cân đối giữa việc mở rộng hiểu biết về cách những công nghệ này hoạt động và việc áp dụng chúng theo những cách mang lại lợi ích và sự tiến bộ có ý nghĩa cho cộng đồng của chúng ta. Liệu điều này có thể thực hiện được không? Ý tưởng chỉ cần cầu nguyện hoặc hy vọng rằng những “sinh vật” này vẫn giữ được tính “đạo đức” và “tốt” không còn xa vời ngay bây giờ.
Để lại bình luận
Hủy