Chọn trang

World Labs và Cuộc Cách Mạng Trí Tuệ Không Gian: Đế Chế 1 Tỷ USD Của Fei-Fei Li Có Gì Khiến Nvidia, AMD Và Autodesk Phải Đổ Tiền?

World Labs Spatial Intelligence AI Revolution

Thung lũng Silicon đang chứng kiến một cuộc đua vũ trang mới trong lĩnh vực trí tuệ nhân tạo (AI), nhưng lần này không chỉ là về các mô hình ngôn ngữ lớn (LLM) như ChatGPT. Tâm điểm chú ý đang đổ dồn vào World Labs, một công ty khởi nghiệp chỉ mới thành lập vào năm 2024 bởi Fei-Fei Li, người được mệnh danh là ‘mẹ đẻ’ của ngành thị giác máy tính hiện đại. Với vòng gọi vốn khổng lồ lên tới 1 tỷ USD, World Labs đang định nghĩa lại ranh giới giữa thế giới số và thế giới thực thông qua khái niệm Trí tuệ không gian (Spatial Intelligence).

Sự trỗi dậy của World Labs và Tầm vóc của Fei-Fei Li

Để hiểu tại sao World Labs lại có giá trị lớn đến vậy chỉ sau một thời gian ngắn, chúng ta cần nhìn vào người đứng sau nó. Giáo sư Fei-Fei Li không chỉ là một nhà khoa học tại Stanford; bà là người đã tạo ra ImageNet, bộ cơ sở dữ liệu khổng lồ đã kích ngòi cho cuộc cách mạng Deep Learning hơn một thập kỷ trước. Với World Labs, bà đang thực hiện một sứ mệnh thậm chí còn tham vọng hơn: dạy cho AI cách ‘nhìn’ và ‘hiểu’ không gian ba chiều giống như con người.

Các mô hình AI hiện nay, mặc dù rất giỏi trong việc tạo văn bản hoặc hình ảnh 2D, nhưng vẫn còn rất lóng ngóng khi phải đối mặt với các quy luật vật lý của thế giới 3D. Chúng có thể tạo ra một bức ảnh đẹp về một chiếc cốc, nhưng không thực sự hiểu chiếc cốc đó có thể chứa nước, có thể bị rơi vỡ hay có vị trí tương đối như thế nào trong một căn phòng. World Labs ra đời để lấp đầy khoảng trống đó bằng cách xây dựng các ‘Mô hình thế giới’ (World Models).

Trí tuệ không gian: Mảnh ghép còn thiếu của AI

Trí tuệ không gian là khả năng nhận thức, lập luận và tương tác với môi trường vật lý. Đây là kỹ năng cơ bản của con người nhưng lại là thách thức cực đại đối với máy tính. Tại sao điều này lại quan trọng? Bởi vì nếu chúng ta muốn có những robot tự hành thực sự thông minh, những hệ thống thiết kế kiến trúc tự động hay những môi trường thực tế ảo (VR) sống động như thật, AI cần phải hiểu được chiều sâu, kích thước và sự tương tác giữa các vật thể.

World Labs đang phát triển các mô hình có khả năng tạo ra các cảnh 3D hoàn chỉnh từ các mô tả văn bản hoặc hình ảnh đơn giản. Không giống như các công cụ tạo video thông thường, các mô hình của World Labs cho phép người dùng điều hướng bên trong không gian đó, thay đổi góc nhìn và tương tác với các đối tượng theo các quy luật vật lý thực tế. Đây chính là bước tiến từ Generative AI (AI tạo sinh nội dung) sang Interactive AI (AI tương tác thế giới).

Cú hích 200 triệu USD từ Autodesk và sự đồng hành của các ‘Gã khổng lồ’

Trong số các nhà đầu tư vào World Labs, Autodesk nổi lên như một đối tác chiến lược quan trọng với khoản đầu tư trực tiếp 200 triệu USD. Tại sao một công ty phần mềm thiết kế hàng đầu lại sẵn sàng chi đậm như vậy? Câu trả lời nằm ở tương lai của ngành xây dựng và sản xuất. Autodesk muốn tích hợp công nghệ của World Labs vào các công cụ như AutoCAD, Revit và Maya. Hãy tưởng tượng một kiến trúc sư chỉ cần mô tả ý tưởng bằng lời nói, và AI sẽ tự động dựng lên một mô hình tòa nhà 3D chính xác về mặt kỹ thuật, có thể kiểm tra được khả năng chịu lực và sự tương tác với ánh sáng mặt trời ngay lập tức.

Bên cạnh đó, sự góp mặt của NvidiaAMD cũng không phải ngẫu nhiên. Để vận hành các mô hình trí tuệ không gian, cần một năng lượng tính toán khổng lồ. Nvidia với các chip H100 và hệ sinh thái Omniverse, cùng với AMD đang trỗi dậy mạnh mẽ, đều muốn đảm bảo rằng nền tảng phần cứng của họ sẽ là ‘xương sống’ cho kỷ nguyên tiếp theo của AI. Sự hợp tác này tạo ra một vòng lặp hoàn hảo: World Labs cung cấp thuật toán, Autodesk cung cấp ứng dụng thực tiễn, và Nvidia/AMD cung cấp sức mạnh tính toán.

Tác động đến ngành Công nghiệp Sáng tạo và Game

Không chỉ dừng lại ở kiến trúc, World Labs hứa hẹn sẽ làm thay đổi hoàn toàn cách chúng ta tạo ra nội dung giải trí. Các nhà phát triển game hiện nay phải mất hàng năm trời để thiết kế các thế giới mở. Với công nghệ của World Labs, quá trình này có thể được rút ngắn xuống còn vài ngày. AI có thể tự động sinh ra các thành phố, rừng rậm với độ chi tiết kinh ngạc và quan trọng nhất là chúng ‘tuân thủ’ các quy luật vật lý, giúp giảm thiểu lỗi (bug) trong trò chơi.

Thách thức và Cuộc đua với OpenAI

Tất nhiên, World Labs không đơn độc. OpenAI với mô hình Sora cũng đã cho thấy khả năng tạo video 3D ấn tượng. Tuy nhiên, hướng đi của World Labs tập trung sâu hơn vào tính ‘mô hình hóa’ và khả năng can thiệp kỹ thuật hơn là chỉ tạo ra các đoạn video mang tính quan sát. Cuộc chiến này sẽ quyết định ai là người nắm giữ chìa khóa của ‘Metaverse’ thực thụ – một không gian số mà ở đó mọi thứ đều chân thực như đời thực.

Một thách thức lớn khác là dữ liệu. Để đào tạo AI hiểu về không gian 3D, lượng dữ liệu cần thiết lớn hơn gấp nhiều lần so với dữ liệu văn bản. World Labs sẽ phải tìm cách thu thập và xử lý các dữ liệu từ cảm biến LiDAR, bản đồ 3D và các mô phỏng vật lý để làm giàu cho ‘bộ não’ của mình.

Kết luận: Tương lai nằm ở chiều thứ ba

Với sự dẫn dắt của Fei-Fei Li và nguồn lực tài chính dồi dào, World Labs không chỉ là một startup tỷ đô thông thường. Nó là biểu tượng cho bước chuyển mình tiếp theo của nhân loại: nơi AI không còn bị nhốt trong những dòng code phẳng lì mà bắt đầu ‘bước ra’ để hiểu và kiến tạo thế giới ba chiều. Việc Nvidia, AMD và Autodesk cùng đứng chung một chiến tuyến cho thấy niềm tin tuyệt đối vào tầm nhìn này. Chúng ta đang đứng trước ngưỡng cửa của một kỷ nguyên mà ranh giới giữa thực và ảo sẽ mờ nhạt hơn bao giờ hết, nơi trí tuệ không gian sẽ là động cơ chính thúc đẩy sự đổi mới trong mọi ngành công nghiệp.