Chọn trang

Cuộc Cách Mạng World Models: Yann LeCun Huy Động 1 Tỷ USD Cho AMI Labs Thách Thức LLM Truyền Thống

Yann LeCun và mô hình thế giới AMI Labs

Trong bối cảnh cả thế giới đang phát cuồng vì các mô hình ngôn ngữ lớn (LLM) như GPT-4 của OpenAI hay Claude của Anthropic, Yann LeCun – một trong ‘ba cha đẻ’ của AI hiện đại – đã chọn một con đường hoàn toàn khác biệt. Công ty khởi nghiệp mới của ông, Advanced Machine Intelligence (AMI) Labs, vừa công bố vòng gọi vốn hạt giống (seed round) trị giá lên tới 1,03 tỷ USD. Đây là một con số chưa từng có đối với một công ty ở giai đoạn sơ khởi, cho thấy niềm tin mãnh liệt của các nhà đầu tư vào tầm nhìn mới về trí tuệ nhân tạo.

Sự trỗi dậy của AMI Labs và sự hậu thuẫn từ các ‘người khổng lồ’

Vòng gọi vốn này không chỉ gây sốc về con số mà còn về danh sách các nhà đầu tư. Nvidia, tập đoàn chip giá trị nhất thế giới, và Bezos Expeditions của tỷ phú Jeff Bezos đã dẫn đầu thương vụ này. Sự tham gia của Nvidia cho thấy AMI Labs sẽ cần một nguồn lực tính toán khổng lồ để huấn luyện các mô hình của mình. Trong khi đó, sự hiện diện của Jeff Bezos ám chỉ tiềm năng ứng dụng cực lớn của công nghệ này trong lĩnh vực logistics, kho vận và robot tự hành – những mảng kinh doanh cốt lõi của Amazon.

Yann LeCun, hiện vẫn giữ chức Giám đốc Khoa học AI tại Meta, đã thành lập AMI Labs với mục tiêu giải quyết vấn đề mà ông gọi là ‘bức tường gạch’ của AI hiện nay. Theo ông, các mô hình ngôn ngữ chỉ dựa trên văn bản sẽ không bao giờ đạt được trí tuệ nhân tạo tổng quát (AGI) vì chúng thiếu đi sự hiểu biết về thế giới vật lý xung quanh.

Tại sao ‘World Models’ lại là tương lai thay thế cho LLMs?

Trong nhiều năm qua, Yann LeCun đã không ngần ngại chỉ trích các mô hình ngôn ngữ lớn. Ông cho rằng chúng thực chất chỉ là những ‘con vẹt thống kê’ (stochastic parrots), có khả năng dự đoán từ tiếp theo cực tốt nhưng không hề hiểu tại sao một vật thể lại rơi xuống đất hoặc tại sao một chiếc xe không thể đi xuyên qua tường. Mô hình thế giới (World Models) của AMI Labs được thiết kế để khắc phục chính xác điểm yếu này.

Hạn chế của AI dựa trên văn bản

Các hệ thống như ChatGPT học từ hàng tỷ trang văn bản do con người viết ra. Tuy nhiên, kiến thức của nhân loại không chỉ nằm ở câu chữ. Một đứa trẻ có thể học cách thế giới vận hành chỉ bằng cách quan sát và tương tác: đẩy một khối gỗ, nhìn nước chảy, hoặc cảm nhận trọng lực. Trẻ em không cần đọc hàng triệu cuốn sách để biết rằng nếu thả một cái cốc, nó sẽ vỡ. Các LLM hiện nay thiếu đi cơ chế Common Sense (lẽ thường) và sự hiểu biết về quan hệ nhân quả trong không gian ba chiều.

Định nghĩa về World Models (Mô hình thế giới)

Mô hình thế giới là một kiến trúc AI có khả năng xây dựng một mô hình nội bộ về thực tại. Thay vì dự đoán từ, nó dự đoán trạng thái tiếp theo của thế giới dựa trên hành động và quan sát. AMI Labs sử dụng kiến trúc JEPA (Joint-Embedding Predictive Architecture), một mô hình do LeCun đề xuất, cho phép AI học các biểu diễn trừu tượng của video và dữ liệu cảm biến mà không cần con người phải dán nhãn thủ công. Điều này giúp AI hình thành một ‘bản đồ tư duy’ về vật lý, từ đó có thể lập kế hoạch cho các hành động phức tạp trong thế giới thực.

Ứng dụng đột phá trong Robotics và Sản xuất

Khoản đầu tư 1 tỷ USD sẽ được AMI Labs tập trung vào việc áp dụng các mô hình thế giới vào robot công nghiệp và sản xuất thông minh. Hiện tại, robot trong các nhà máy phần lớn vẫn hoạt động dựa trên các kịch bản được lập trình sẵn. Nếu có một biến số nhỏ thay đổi trong môi trường, chúng thường bị lỗi. Với công nghệ của AMI Labs, robot sẽ có khả năng ‘suy nghĩ’ và thích nghi.

Cách mạng hóa ngành Robotics

Một robot được trang bị mô hình thế giới có thể hiểu được độ cứng của vật liệu, độ ma sát và quỹ đạo chuyển động. Điều này cực kỳ quan trọng đối với các nhiệm vụ tinh vi như lắp ráp linh kiện điện tử hoặc xử lý thực phẩm. Thay vì phải thử sai hàng triệu lần trong môi trường mô phỏng (Reinforcement Learning truyền thống), AI của AMI Labs có thể mô phỏng các khả năng trong ‘đầu’ của nó trước khi thực hiện hành động thực tế, giúp tiết kiệm thời gian và năng lượng đáng kể.

Tối ưu hóa chuỗi cung ứng và sản xuất

Trong sản xuất, việc dự đoán hỏng hóc máy móc hoặc tối ưu hóa dòng chảy vật tư đòi hỏi sự hiểu biết sâu sắc về các quy trình vật lý. AMI Labs hứa hẹn sẽ cung cấp các giải pháp AI có thể quản lý toàn bộ nhà máy như một thực thể sống, nơi mỗi bộ phận đều hiểu được tác động của mình lên các bộ phận khác trong một không gian vật lý thực tế.

Tầm nhìn về Trí tuệ Nhân tạo Tổng quát (AGI)

Yann LeCun tin rằng việc xây dựng AI hiểu thế giới vật lý là bước đi bắt buộc để tiến tới AGI. Ông lập luận rằng một hệ thống không hiểu được ‘lẽ thường’ thì không bao giờ có thể được tin cậy hoàn toàn trong các quyết định quan trọng của con người. AMI Labs không chỉ là một dự án kinh doanh, nó là một thử nghiệm khoa học quy mô lớn để chứng minh rằng con đường tiến tới AI siêu thông minh không nằm ở việc nạp thêm nhiều dữ liệu văn bản hơn, mà nằm ở việc dạy máy tính cách nhìn và cảm nhận thế giới.

Sự cạnh tranh trong lĩnh vực này đang nóng lên từng ngày. Trong khi Sam Altman của OpenAI đang huy động hàng nghìn tỷ USD cho hạ tầng chip, thì Yann LeCun lại tập trung vào việc thay đổi thuật toán cốt lõi. Sự thành công của AMI Labs có thể định nghĩa lại toàn bộ bản đồ AI trong thập kỷ tới, chuyển dịch trọng tâm từ các chatbot sang các thực thể AI có khả năng tương tác vật lý hoàn hảo.

Kết luận

Với 1,03 tỷ USD và sự dẫn dắt của một trong những bộ óc vĩ đại nhất ngành AI, AMI Labs đang đứng trước cơ hội thay đổi hoàn toàn cách chúng ta định nghĩa về trí tuệ máy móc. Nếu các mô hình thế giới thực sự hoạt động hiệu quả như kỳ vọng, chúng ta sẽ sớm thấy những robot có khả năng tự học, những nhà máy tự vận hành không cần can thiệp và một thế hệ AI mới không chỉ biết nói mà còn biết ‘làm’. Cuộc đua này mới chỉ bắt đầu, và Yann LeCun vừa đặt một quân bài vô cùng nặng ký lên bàn cờ công nghệ toàn cầu.