Ngày 31 tháng 3 năm 2025, công ty Hangzhou Qianxun Intelligent (Spirit AI) chỉ mới 14 tháng tuổi đã công bố hoàn thành vòng gọi vốn Pre-A trị giá 528 triệu nhân dân tệ, do Prosperity7 Ventures (P7), một công ty con của Saudi Aramco, dẫn đầu. Nhiều tổ chức khác như Quỹ đầu tư Changjiang và Guangfa Xinde cũng tham gia đầu tư. Đây là vòng gọi vốn thứ tư của công ty kể từ khi thành lập, với tổng số tiền vượt quá 900 triệu nhân dân tệ, lập kỷ lục mới về tốc độ gọi vốn trong lĩnh vực trí tuệ nhân tạo tại Trung Quốc. Đến nay, Qianxun Intelligent đã xây dựng một mạng lưới vốn liếng với mô hình “Hệ sinh thái Xiaomi + Ningde + Trung Đông”, cung cấp động lực mạnh mẽ cho sự tiến bộ công nghệ và triển khai ứng dụng.
Nguồn ảnh: Qianxun Intelligent
Logic đầu tư của Prosperity7 Ventures cho thấy niềm tin lâu dài vào sự mở rộng quy mô công nghệ. Trưởng đại diện quỹ tại Trung Quốc, Cai Xiang, đã nhấn mạnh: “Trí tuệ nhân tạo thân thể là giao diện cuối cùng giữa AI và thế giới vật lý.” Việc dẫn đầu đầu tư vào Qianxun là vì họ nhìn nhận thực lực “AI + phần cứng” toàn diện của công ty – từ thuật toán mô hình lớn đến thiết kế khớp đa dạng. Qianxun Intelligent đã cho thấy khả năng kết hợp phần mềm và phần cứng hiếm có. Mục tiêu “500 tỷ quy mô ngành robot hình người vào năm 2029” của chính quyền thành phố Hàng Châu sẽ mang lại lợi ích chính sách cho việc tích hợp chuỗi công nghiệp địa phương.
Đột phá công nghệ: từ gấp quần áo đến các cảnh công nghiệp
Tại phòng thí nghiệm của Qianxun Intelligent, hai cánh tay robot đang hoàn thành nhiệm vụ gấp quần áo với độ chính xác milimet. Hành động có vẻ đơn giản này thực sự là đỉnh cao của công nghệ xử lý vật thể linh hoạt. Robot truyền thống phụ thuộc vào chương trình được lập trình sẵn, khi đối mặt với nếp nhăn quần áo và sự ngẫu nhiên về hình dạng thì không thể hoạt động. Tuy nhiên, mô hình VLA (Thị giác – Ngôn ngữ – Hành động) Spirit v1 tự nghiên cứu của Qianxun Intelligent, thông qua công nghệ nhận thức tình huống động và điều khiển theo thời gian, đã thực hiện đóng vòng điều khiển cho việc xử lý vật thể linh hoạt đầu tiên tại Trung Quốc.
CEO Han Fengtang giải thích: “Tính phức tạp không gian trạng thái trong việc gấp quần áo gấp 100 lần so với nhiệm vụ rót nước. Chúng tôi kết hợp học giả lập và thuật toán học tăng cường để giúp robot hiểu bản chất của ‘sắp xếp’ thay vì chỉ lặp lại hành động một cách máy móc.” Mô hình này đã được cải tiến tới phiên bản đầu tiên và sẽ được trang bị trên robot hình người thương mại được phát hành sớm nhất, Moz1. Chiếc robot này có 26 độ tự do (không bao gồm tay khéo léo), sử dụng khớp lực kiểm soát tích hợp có mật độ công suất cao nhất toàn cầu, nâng cao 15% mật độ công suất so với Tesla Optimus, và độ chính xác lực mô phỏng có thể đáp ứng nhu cầu phân loại vật liệu trong xưởng bán dẫn ở mức 0,1 milimet.
Động lực chính cho sự đột phá công nghệ đến từ đội ngũ hàng đầu. Đồng sáng lập Gao Yang (Tiến sĩ UC Berkeley, trợ lý giáo sư Đại học Tsinghua) đã đề xuất thuật toán học mô phỏng EfficientImitate với hiệu suất vượt qua thuật toán Stanford VMAIL tới 600%; đội ngũ của anh đã phát triển khung ATM với hiệu suất cải thiện 500% trong các nhiệm vụ dài hạn, và đã giành giải thưởng bài báo xuất sắc nhất tại CoRL 2024. Những thành công học thuật này trực tiếp chuyển hóa thành rào cản thương mại – robot Figure đã áp dụng mô hình ViLa mà Gao Yang đề xuất, trong khi khả năng tổng quát của mô hình CoPa của Qianxun Intelligent đã vượt qua Stanford VoxPoser.
Tham gia vào cuộc đua thương mại: từ phòng thí nghiệm đến thị trường hàng nghìn tỷ
Đối mặt với dự đoán từ Goldman Sachs về “thị trường robot hình người toàn cầu 154 tỷ đô la vào năm 2035”, Qianxun Intelligent đã chọn con đường thương mại “vượt qua các cảnh đóng kín”. Han Fengtang cho biết: “Kế hoạch sẽ giao hàng hàng trăm sản phẩm vào năm 2025, tập trung vào các cảnh có giá trị gia tăng cao như sản xuất thông minh và logistics.” Chiến lược này rất phù hợp với DNA của đội ngũ: Han Fengtang từng là CTO của Robot Lattice, dẫn dắt việc giao hàng hơn 20.000 robot công nghiệp; đồng sáng lập Zheng Lingyin có kinh nghiệm phong phú trong việc mở rộng ra thị trường quốc tế, từng dẫn dắt đội ngũ xâm nhập vào thị trường Châu Âu.
Dưới sự hỗ trợ của vốn đầu tư, Qianxun Intelligent đang xây dựng mô hình “giải pháp + hợp tác hệ sinh thái”. Nhờ vào tài nguyên chuỗi công nghiệp từ Xiaomi và Ningde, sản phẩm của họ sẽ được triển khai đầu tiên trong các cảnh như sản xuất điện tử tiêu dùng và kiểm tra pin năng lượng mới. Ví dụ, trong ngành 3C, Moz1 có thể hoàn thành nhiệm vụ gắn chip trên bo mạch điện thoại với độ chính xác 0,02 milimet nhờ vào công nghệ kết hợp thị giác – cảm giác lực; trong các cảnh lưu trữ logistics, hệ thống nhận thức đa mô hình của họ có thể đồng thời phân tích thông tin nhãn hàng hóa, phân bố trọng lượng và các vật cản trong môi trường, từ đó thực hiện lập kế hoạch tuyến đường động.
Cuộc ganh đua tam giác: công nghệ, chi phí và sự gấp rút trong các cảnh
Mặc dù nhiệt độ đầu tư đang tăng cao, trí tuệ nhân tạo thân thể vẫn đối mặt với “thử thách tam giác” khắc nghiệt. Về công nghệ, sự chuyển giao kết quả nghiên cứu từ phòng thí nghiệm đến các cảnh công nghiệp vẫn còn một khoảng cách lớn. Mặc dù Spirit v1 đã thực hiện nhiệm vụ gấp quần áo trong môi trường kiểm soát, nhưng sự khác biệt về ánh sáng trong môi trường gia đình và các yếu tố gây trở ngại không gian vẫn có thể ảnh hưởng đến độ ổn định của mô hình; về phần cứng, Moz1 chưa công bố giá cả, nếu chi phí mỗi máy không thể kiểm soát dưới một triệu nhân dân tệ sẽ khó mở rộng thị trường quy mô.
Cạnh tranh trong ngành đang ngày càng gay gắt hơn. Robot Zhiyuan trong nước (được Tencent đầu tư), Taishi Intelligent (vòng gọi vốn thiên thần 120 triệu đô la) đang thúc đẩy quá trình cải tiến sản phẩm; trong khi đó, Physical Intelligence (Pi) ở Mỹ, với mô hình π0 được phát triển từ 400 triệu đô la vốn, đã thiết lập lợi thế về khả năng tổng quát trên nhiều nền tảng. Qianxun Intelligent cần chứng minh trong khoảng thời gian giao hàng năm 2025: liệu tổ hợp “ViLa + CoPa” có duy trì tỷ lệ thành công nhiệm vụ trên 95% trong các cảnh thực tế hay không?
Sự đột phá “điểm tới hạn” của trí tuệ nhân tạo thân thể Trung Quốc
Trong cuộc đua robot hình người toàn cầu, Qianxun Intelligent đại diện cho hướng đột phá của sức mạnh đổi mới của Trung Quốc – thông qua sự kết hợp giữa những tài năng hàng đầu trong học thuật và những tay lão luyện trong ngành, để phá vỡ chuỗi chuyển đổi “báo cáo – bằng sáng chế – sản phẩm”. Đường đi công nghệ của họ tạo ra sự cạnh tranh khác biệt với các ông lớn nước ngoài: so với công ty Pi nhấn mạnh vào mô hình kiểm soát tổng quát, Qianxun Intelligent lại chú trọng hơn đến “chuỗi khép kín dữ liệu theo cảnh cụ thể”. Ví dụ, dữ liệu hoạt động cấp trăm ngàn trong các cảnh logistics có thể tối ưu hóa ngược lại chiến lược tạo hành động của mô hình lớn, tạo ra hiệu ứng vòng lặp về sự hiểu biết cảnh và sự cải tiến phần cứng.
Theo dữ liệu từ Robot Đại Giảng Đường, trong năm 2024-2025, lĩnh vực trí tuệ nhân tạo thân thể Trung Quốc đã xảy ra hơn 60 vụ đầu tư, tổng số tiền vượt 28 tỷ nhân dân tệ. Trên vùng đất màu mỡ này, logic định giá của Qianxun Intelligent đang được tái định giá – khi công ty Pi của Mỹ thiết lập chuẩn mực với định giá 17,3 tỷ đô la, Qianxun Intelligent với 900 triệu đô la vốn đầu tư và hỗ trợ từ ba hệ phái đầu tư lớn, có thể đang ở ngưỡng bùng nổ giá trị.