Từ bản đồ độ chính xác cao đến VLA, một cuộc đua về công nghệ.

Gần đây, trưởng nhóm mô hình hỗ trợ lái xe “từ đầu đến cuối” của Ô tô Lý Tưởng, Tạ Trung Phú, sắp rời khỏi công ty, chưa rõ hướng đi của anh sau khi rời nhiệm sở. Các nguồn tin thân cận cho biết Tạ Trung Phú đã rút lui khỏi nhóm dự án VLA, dự án hỗ trợ lái xe mới nhất của Lý Tưởng, và việc anh rời đi có thể liên quan đến sự thay đổi trong lộ trình hỗ trợ lái xe của Lý Tưởng.

Năm 2023, Tạ Trung Phú gia nhập Ô tô Lý Tưởng phụ trách “từ đầu đến cuối”. Vào thời điểm đó, Lý Tưởng đang nỗ lực mạnh mẽ để thúc đẩy giải pháp hỗ trợ lái xe “từ đầu đến cuối”. Trước khi tham gia Lý Tưởng, Tạ Trung Phú từng làm việc tại Baidu Apollo, chuyên trách quy hoạch và kiểm soát hệ thống hỗ trợ lái, cũng như tích hợp mạng nơ-ron AI – một trong những công nghệ then chốt để hiện thực hóa giải pháp hỗ trợ lái xe “từ đầu đến cuối”.

Vào tháng 11 năm ngoái, sau khi Lý Tưởng tiến hành điều chỉnh cấu trúc đội ngũ hỗ trợ lái xe, Tạ Trung Phú trở thành trưởng nhóm bộ phận hỗ trợ lái xe “từ đầu đến cuối”, phụ trách thuật toán mô hình “từ đầu đến cuối” và triển khai, báo cáo trực tiếp với trưởng bộ phận hỗ trợ lái, Lương Hiền Bằng.

Từ trưởng nhóm hỗ trợ lái xe “từ đầu đến cuối” đến việc rời đi, chỉ trong vòng một năm, cho thấy sự biến đổi nhanh chóng của công nghệ hỗ trợ lái xe.

Bản đồ độ chính xác cao, từ “góc nhìn của chúa” đến mục tiêu chính

Bản đồ độ chính xác cao, đơn giản mà nói, chính là bản đồ điện tử có độ chính xác cao hơn và nhiều chiều dữ liệu hơn, có thể đạt độ chính xác đến từng centimet, bao gồm thông tin về đường bộ cùng với các thông tin tĩnh liên quan đến giao thông xung quanh. Bản đồ độ chính xác cao có khả năng hợp tác với hệ thống cảm nhận trên xe để thực hiện chức năng hỗ trợ lái như tránh vật cản, vượt lên…

Khi thời gian quay ngược về trước năm 2022, bản đồ độ chính xác cao đang ở thời kỳ vàng son. Lúc đó, khả năng của hệ thống cảm nhận xe còn hạn chế, và bản đồ độ chính xác cao trở thành “miếng mồi ngon” trong ngành công nghiệp này vì nó có thể cung cấp thông tin bản đồ độ chính xác cao ngoài tầm nhìn của hệ thống cảm nhận.

Theo dữ liệu từ IDC, thị trường bản đồ độ chính xác cao ở Trung Quốc năm 2020 đạt tổng giá trị 474 triệu nhân dân tệ, với tỷ lệ tăng trưởng đạt 70%. Baidu, Tứ Vi Đồ Tân, Y Đồ Thông, Cao Đà và HERE đứng đầu về thị phần. Năm 2021, quy mô thị trường bản đồ độ chính xác cao ở Trung Quốc là 646 triệu nhân dân tệ, tăng trưởng 36,3%, với Baidu, Tứ Vi Đồ Tân và Cao Đà đứng đầu trong thị phần.

Lúc đó, ngành công nghiệp hỗ trợ lái xe buộc phải phụ thuộc vào bản đồ độ chính xác cao, trong khi vẫn phải chịu đựng chi phí cao mà bản đồ này mang lại. Báo cáo liên quan cho thấy mô hình hợp tác giữa các nhà sản xuất xe và nhà cung cấp bản đồ yêu cầu thanh toán một khoản phí lên tới hàng chục triệu nhân dân tệ khi đặt hàng. Thêm vào đó, mỗi xe tải cũng phải trả phí bản quyền, khoảng 100 nhân dân tệ mỗi năm. Những công ty như “Vệ Tiểu Lý” dẫn đầu trong lĩnh vực hỗ trợ lái xe, thì đây là một khoản chi phí không nhỏ với họ.

Để tiết kiệm chi phí, các công ty như Xiaopeng và SAIC bắt đầu tự sản xuất bản đồ độ chính xác cao. Vào tháng 6 năm 2021, Xiaopeng thông qua việc thâu tóm Công ty Trí Đồ Từ, đã có được chứng nhận sản xuất bản đồ điện tử điều hướng cấp A. SAIC cũng đã đầu tư vào Wuhan Guangting và Momenta, trong khi Geely đã có kế hoạch đầu tư vào YĐồ Thông và Y Kha Thông, cho thấy mức độ chú trọng của các công ty xe đối với bản đồ độ chính xác cao lúc đó.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Tuy nhiên, trong thông báo tái cấp chứng nhận của Bộ Tài nguyên Thiên nhiên năm 2022, cả Zhitu Technology và Momenta đều không qua được kỳ thi tái cấp chứng nhận. Vào tháng 9 cùng năm, Xiaopeng đã ra mắt chức năng NOA phiên bản thành phố và tiến hành thử nghiệm tại Quảng Châu, sau đó vào tháng 10, trong buổi lễ công nghệ 1024 của Xiaopeng, họ đã chính thức giới thiệu kiến trúc cảm nhận Xnet, đồng thời cho biết giải pháp hỗ trợ lái xe thế hệ mới XNGP sẽ không còn phụ thuộc vào bản đồ độ chính xác cao.

Tiếp theo là Huawei, vào tháng 4 năm 2023, Huawei đã ra mắt Huawei ADS 2.0 không phụ thuộc vào bản đồ độ chính xác cao. Ông Dư Thừa Đông đã không ít lần nhấn mạnh rằng “cập nhật bản đồ độ chính xác cao quá chậm, tốn thời gian và công sức”. Sau đó, Lý Tưởng vào tháng 6 năm 2023 đã bắt đầu thử nghiệm nội bộ NOA thành phố, đồng thời cho ra mắt chức năng NOA đi lại hướng đến các tình huống sử dụng của người dùng.

Trong thời gian này, các công ty xe lần lượt kích hoạt NOA thành phố, từ đó hình thành khái niệm “mở thành phố” trong ngành hỗ trợ lái xe. Không chỉ các công ty xe, mà hướng đi công nghệ của các công ty tự lái cũng đã thay đổi. 小马智行 chính thức phát hành một giải pháp hỗ trợ lái sản xuất chỉ thông qua bản đồ dẫn đường. 元戎启行 công bố giải pháp hỗ trợ lái sản xuất DeepRoute-Driver 3.0 không phụ thuộc vào bản đồ độ chính xác cao, tuyên bố rằng họ sẽ từ bỏ sự phụ thuộc vào bản đồ độ chính xác.

Bắt đầu từ năm 2022, lộ trình công nghệ của ngành hỗ trợ lái xe đã bắt đầu hướng tới “nặng về cảm nhận, nhẹ về bản đồ độ chính xác cao”, và trở thành sự đồng thuận trong ngành vào năm 2023. Rõ ràng, điểm chuyển tiếp xuất hiện trong quá trình các hãng xe chuyển mình từ NOA đường cao tốc sang NOA thành phố. So với đường cao tốc, tần suất sử dụng xe trong thành phố cao hơn, và độ phức tạp của đường phố thành phố không thể so sánh với đường cao tốc. Mỗi công ty đều cạnh tranh trên “đường đua mở thành phố”, và những hạn chế của bản đồ độ chính xác cao về giá cả và tốc độ cập nhật càng trở nên rõ ràng, không đủ để đáp ứng nhu cầu cạnh tranh lớn của các nhà sản xuất ô tô.

Trước đây, bản đồ độ chính xác cao từng có nhiều danh hiệu như “gậy chống”, “mắt ngàn dặm”, “góc nhìn của chúa”, nhưng giờ đây, cái tên bản đồ độ chính xác cao hầu như không còn xuất hiện trong ngành hỗ trợ lái xe. Chỉ trong 3 năm từ 2020 đến 2023, bản đồ độ chính xác cao đã trở thành mục tiêu chỉ trích.

Từ góc độ của các nhà cung cấp bản đồ, họ không chỉ phải đối mặt với sự suy giảm nhanh chóng của thị trường và doanh thu, mà còn phải chấp nhận sự chênh lệch tinh thần. Một người trong nội bộ một nhà cung cấp bản đồ cho biết bản đồ vẫn cần thiết cho hỗ trợ lái xe cao cấp. Việc nói rằng từ bỏ bản đồ độ chính xác cao thực chất vẫn dựa trên khả năng của cảm biến trên xe mạnh mẽ để thực hiện việc xây dựng bản đồ theo thời gian thực, thêm vào đó là việc huấn luyện ban đầu cho cảm nhận xe không thể thiếu bản đồ độ chính xác cao.

Điều đáng lưu ý là có người khẳng định rằng việc phụ thuộc vào bản đồ độ chính xác cao hay từ bỏ chúng, vấn đề lớn nhất vẫn là khả năng cảm nhận của xe không đủ. Bản đồ độ chính xác cao vẫn có tính khả dụng và cần thiết cho tự lái. Các nhà sản xuất ô tô và nhà cung cấp hỗ trợ lái hiện tại không sử dụng, nhưng đó không phải vì họ không có khả năng sử dụng.

Có những phân tích viên liên quan cũng cho rằng, các nhà sản xuất ô tô và nhà cung cấp hỗ trợ lái trong nước không hoàn toàn loại trừ bản đồ độ chính xác cao khỏi phương án công nghệ, mà thực tế không thể từ bỏ nếu có thể, đây là thái độ thực sự của các doanh nghiệp đối với bản đồ độ chính xác cao hiện nay.

Từ đầu đến cuối: Đỉnh cao công nghệ hay mánh khóe tiếp thị?

Năm 2024, “từ đầu đến cuối” trở thành từ khóa nóng trong ngành hỗ trợ lái. Năm nay thậm chí còn được coi là kỷ nguyên mới trong lĩnh vực hỗ trợ lái xe. Từ đầu đến cuối đã phá vỡ ranh giới giữa các mô-đun cảm nhận, quyết策, điều khiển trong hệ thống hỗ trợ lái truyền thống, mà thay vào đó kết hợp cả ba vào trong một mạng nơ-ron thống nhất, xuất trực tiếp lệnh lái từ mạng nơ-ron, không còn phụ thuộc vào quy tắc nhân tạo. Lợi thế của nó là có thể huấn luyện mô hình từ dữ liệu tình huống thực tế khổng lồ, từ đó bắt chước hành vi lái xe của con người, đồng thời có khả năng tổng quát mạnh mẽ hơn trong các tình huống lái phức tạp.

Sau khi Tesla phát hành FSD V12 vào tháng 8 năm 2023, các nhà sản xuất trong nước nhanh chóng bắt kịp. Các công ty hàng đầu như 鸿蒙智行, Xiaopeng, Lý Tưởng và 商汤 đều nhanh chóng tham gia vào việc nghiên cứu phát triển “từ đầu đến cuối” và trong nửa năm tiếp theo đã lần lượt công bố kế hoạch sản xuất xe.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: 鸿蒙智行

Vào tháng 4 năm 2024, Huawei giới thiệu hệ thống tự lái Huawei QianKun ADS 3.0 sử dụng kiến trúc từ đầu đến cuối, phiên bản ADS 3.0 không còn sử dụng mạng BEV, mà thông qua mạng lớn GOD thực hiện bước nhảy từ “nhận diện vật cản” sang “hiểu biết tình huống”, không chỉ có thể nhận diện các mục tiêu trong danh sách trắng và vật cản đặc biệt, mà còn có khả năng cảm nhận cấu trúc đường và hiểu biết tình huống.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: Xiaopeng

Phía Xiaopeng, vào ngày 20 tháng 5, trong sự kiện AI DAY, đã công bố triển khai rộng rãi hệ thống AI Thiên Cơ cho người dùng và giới thiệu mô hình lớn “từ đầu đến cuối” lần đầu tiên sản xuất tại Trung Quốc: mạng nơ-ron XNet + mô hình lớn quy trình XPlanner + mô hình ngôn ngữ lớn XBrain.

Mạng nơ-ron cảm nhận thị giác XNet giúp hệ thống hỗ trợ lái có khả năng quan sát như mắt thường, cải thiện phạm vi cảm nhận gấp đôi. Mô hình quy hoạch chính XPlanner, dựa trên mạng nơ-ron giống như bộ não nhỏ của con người, được huấn luyện thông qua lượng dữ liệu lớn, giúp cho hỗ trợ lái ngày càng trở nên giống con người. Mô hình ngôn ngữ lớn XBrain có khả năng hiểu biết và học hỏi, giúp nâng cao khả năng xử lý trong các tình huống phức tạp.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: Ô tô lý tưởng

Lý Tưởng nhanh chóng bắt kịp, vào tháng 7 năm 2024 đã khởi động thử nghiệm nội bộ “từ đầu đến cuối + VLM” với hàng nghìn người, sau đó vào tháng 10 sẽ phát triển cho các mẫu AD Max trong dòng L và toàn bộ mẫu lý tưởng MEGA “từ đầu đến cuối + VLM”, đây là giải pháp hỗ trợ lái hai hệ thống mà Lý Tưởng sáng tạo ra, hệ thống nhanh xử lý tình huống phổ biến, hệ thống chậm xử lý các tình huống phức tạp, đảm bảo tính ổn định và hiệu quả hơn. Giải pháp “từ đầu đến cuối” của Lý Tưởng khác với mô hình phân vùng truyền thống, mà là sử dụng One Model tích hợp, mô hình ngôn ngữ thị giác VLM được triển khai trên chip xe, có khả năng tư duy và ra quyết định để ứng phó với các tình huống lái phức tạp.

Vào ngày 28 tháng 10 năm 2024, Zhiji đã công bố mô hình lớn “từ đầu đến cuối” được phát triển cùng với Momenta trong ngày công nghệ hỗ trợ lái thương hiệu, đưa từ “trực giác” vào hỗ trợ lái, tuyên bố IMAD sẽ mô phỏng trực giác và suy nghĩ của con người để thích ứng với các tình trạng đường phố phức tạp.

Ngoài các công ty đi đầu như Xiaopeng, Lý Tưởng và Huawei, Xiaomi cũng đang tích cực tham gia, đã chính thức triển khai rộng rãi giải pháp hỗ trợ lái toàn cảnh “từ đầu đến cuối” vào tháng 2 năm nay. Giải pháp này hỗ trợ hỗ trợ lái toàn cảnh từ chỗ đậu xe vào bãi đỗ xe trong những bãi đỗ xe mà nó đã học xong tuyến đường. Zero Run cũng trang bị giải pháp hỗ trợ lái “từ đầu đến cuối” kết hợp với “laser radar” cho mẫu 2026 C10.

Thương hiệu tự thực hiện, BYD sau khi khởi động chiến lược “Thực hiện Tự Do Thực Tế” vào tháng 2 năm nay cũng đang tích cực tiến về hướng sản xuất hàng loạt hỗ trợ lái thành phố tự nghiên cứu, dự kiến sẽ thực hiện trên xe trong năm nay. Chery cũng đã công bố “Thông minh trên Mèo,” CTO Cao Huy Hoa cho biết: “Thông minh trên Mèo dựa vào mô hình lớn ‘từ đầu đến cuối’ để đạt được cảm nhận chính xác và ra quyết định trong toàn bộ tình huống bằng công nghệ tích hợp nhiều cảm biến.”

Ngoài ra,商汤绝影 đã trình diễn giải pháp hỗ trợ lái UniAD “từ đầu đến cuối” đã được triển khai trong triển lãm ô tô Bắc Kinh năm ngoái, và vào tháng 11 cùng năm đã phát hành giải pháp sản xuất uAD Ultra “từ đầu đến cuối”, giải pháp hỗ trợ lái tự động này do 商汤绝影 và Dongfeng phát triển sẽ dự kiến sản xuất vào cuối năm nay. Baidu cũng công bố Apollo ADFM vào tháng 5 năm ngoái, hỗ trợ tài xế không người lái cấp l4, bao gồm mô hình lớn cảm nhận đa mô hình, mô hình quy hoạch đa nguồn và tiến bộ từng bước để đạt được mô hình lớn tự lái từ đầu đến cuối.

Rõ ràng, cho dù là nhà sản xuất chính hay nhà cung cấp, họ đều đang tiến tới hướng “từ đầu đến cuối”, sớm hay muộn.

Mặc dù giải pháp “từ đầu đến cuối” có thể đạt được hỗ trợ lái mượt mà hơn, thông minh hơn, nhưng nó cũng có nhiều giới hạn cố hữu, chẳng hạn như chi phí cao, ngưỡng kỹ thuật lớn và khó giải thích. Theo người trong ngành, mô hình từ đầu đến cuối xử lý lượng dữ liệu hơn 10 lần so với mô hình trước đây, do đó yêu cầu công suất chip cũng cao hơn. Quá trình quyết định của mô hình từ đầu đến cuối không rõ ràng, do đó khó xác định vấn đề cụ thể khi xảy ra lỗi, cũng chính vì lý do này, một số doanh nghiệp sử dụng chip công suất thấp trên các chức năng từ đầu đến cuối cơ bản cũng được gọi là “từ đầu đến cuối,” so với tiến bộ công nghệ thực sự, nên một số doanh nghiệp dường như đang cạnh tranh “từ đầu đến cuối” chỉ để để tạo dựng hình ảnh tiếp thị.

Tuy nhiên, sự tiến bộ công nghệ chưa bao giờ là điều dễ dàng, như Lý Tưởng đã nói: “Chỉ có làm tốt thuật toán quy tắc, mới biết được làm thế nào để làm từ đầu đến cuối, chỉ có làm cho từ đầu đến cuối đạt được mức độ cao nhất, mới có cơ hội để làm VLA, không có con đường tắt trong quá trình này.” Hiện nay, các công ty cũng đang đi trên con đường này, chỉ là có nhanh có chậm.

VLA: Cách mạng “như con người” trong hỗ trợ lái xe

Vào tháng 7 năm 2023, Google DeepMind đã phát hành mô hình VLA đầu tiên trên thế giới điều khiển robot, giờ đây công nghệ này đã được mở rộng sang lĩnh vực hỗ trợ lái xe.

Dù hỗ trợ lái dựa trên “từ đầu đến cuối + VLM” có thể được hỗ trợ bằng mô hình ngôn ngữ thị giác, nhưng vẫn không khắc phục được những giới hạn mà mô hình từ đầu đến cuối gặp phải khi xử lý các vấn đề phức tạp. VLM chỉ có thể phân tích hình ảnh 2D, cung cấp sự hỗ trợ cho giải pháp hỗ trợ lái “từ đầu đến cuối”, trong khi VLA giống như mắt của con người, có thể thấy thế giới vật lý thông qua sự kết hợp giữa thị giác 3D và 2D, và còn có hệ thống não bộ, khả năng ngôn ngữ và tư duy, nói đơn giản là có logic hành động và tư duy giống như khi lái xe của con người: nhìn thấy vật cản, hiểu vật cản và thực hiện tránh vật cản.

Mô hình VLA đã vượt qua giới hạn giải thích kém của mô hình từ đầu đến cuối. Nó có thể đưa ra lý do cho các quyết định thông qua mô hình ngôn ngữ, thực hiện công việc hiện thực hóa các con đường tư duy và quyết định.

Tương ứng, các yêu cầu đi kèm cũng đặt ra những yêu cầu cao hơn, nhu cầu về công suất tính toán đã tăng lên một cấp độ. Một số người trong ngành cho biết hiện tại các hệ thống hỗ trợ lái sản xuất đều sử dụng 2 chip NVIDIA OrinX với công suất đạt 508TOPS, rất khó phục vụ cho việc triển khai mô hình VLA.

Do đó, các công ty hàng đầu trong VLA như Lý Tưởng, 元戎启行, Geely đều sử dụng chip NVIDIA Thor để đảm bảo yêu cầu công suất, mô hình cơ sở thế giới của Xiaopeng sử dụng chip tự phát triển “Turing”.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: 元戎启行

Vào tháng 1, 元戎启行 đã công bố mô hình VLA tại Triển lãm Công nghệ Ô tô Quốc tế lần thứ 17 tại Nhật Bản và cho biết đã phát triển hợp tác sản xuất với các hãng xe hàng đầu, cùng nhau推出 ô tô hỗ trợ lái kết hợp mô hình VLA, xe được trang bị chip NVIDIA Thor. Giám đốc điều hành của 元戎启行, Chu Quang tiết lộ rằng mô hình này chủ yếu tập trung vào lái xe phòng ngừa, với bốn tính năng cốt lõi, bao gồm hiểu biết ngữ nghĩa không gian, nhận diện vật cản đặc biệt, hiểu các biển báo bằng văn bản và điều khiển xe bằng giọng nói. Những tính năng này sẽ được phát hành dần dần cùng với việc sản xuất mô hình VLA.

Hiện tại, 元戎启行 đã hoàn thành thử nghiệm mô hình VLA trên đường thực tế và dự kiến sẽ ra mắt mẫu xe đầu tiên được trang bị mô hình này trong năm nay. Năm nay sẽ có hơn 5 mẫu ô tô AI trang bị mô hình VLA của 元戎启行 được đưa ra thị trường. Trong tương lai, mô hình VLA của 元戎启行 sẽ không chỉ giới hạn trên chip NVIDIA Thor, mà còn sẽ tương thích với nhiều nền tảng chip hơn.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: Ô tô lý tưởng

Vào ngày 18 tháng 3, Lý Tưởng đã công bố kiến trúc tự lái thế hệ tiếp theo MindVLA tại NVIDIA GTC 2025. Người phụ trách nghiên cứu phát triển công nghệ tự lái của Ô tô Lý Tưởng, Giả Phong cho biết về MindVLA: “MindVLA là mô hình lớn cho robot, nó thành công trong việc tích hợp trí tuệ không gian, trí tuệ ngôn ngữ và trí tuệ hành vi. MindVLA sẽ biến ô tô từ một công cụ vận chuyển thông thường thành một tài xế tận tâm, nó hiểu, thấy và tìm. Chúng tôi hy vọng MindVLA sẽ mang lại cho ô tô khả năng nhận thức và thích ứng tương tự như con người, biến nó thành một thực thể thông minh có khả năng suy nghĩ.”

Lý Tưởng trong cuộc nói chuyện AI của Lý Tưởng cho biết, MindVLA là bước quan trọng nhất trên con đường tiến tới L4 của Lý Tưởng, hiện tại hỗ trợ lái đang ở trong bóng tối trước khi bình minh. “MindVLA có thể mang lại cho khả năng tự lái giống như con người, giống như iPhone 4 định nghĩa lại điện thoại, MindVLA cũng sẽ định nghĩa lại tự lái.” Đó là cách Lý Tưởng định nghĩa MindVLA.

Từ bản đồ độ chính xác cao đến VLA, một cuộc đua công nghệ

Nguồn hình ảnh: Xiaopeng

Trong tháng 4 tiếp theo, Xiaopeng đã tổ chức buổi chia sẻ công nghệ AI tại Hồng Kông, chính thức tiết lộ mô hình lớn tự lái với 72 tỷ tham số mà họ đang phát triển – mô hình cơ sở thế giới Xiaopeng. Trưởng bộ phận tự lái của Xiaopeng, Lý Lực Vân cho biết mô hình này có mạng lưới lớn với mô hình ngôn ngữ lớn làm khung xương chính, được huấn luyện từ lượng dữ liệu lái xe chất lượng cao, với ba khả năng cốt lõi: hiểu biết về thị giác, suy luận theo chuỗi và tạo ra hành động. Mô hình này có khả năng tự phát triển thông qua học tập tăng cường và “có triển vọng phát triển các kỹ năng tự lái tương đương hoặc vượt quá con người.”

Được biết, quy mô tham số của mô hình cơ sở thế giới Xiaopeng khoảng gấp 35 lần mô hình VLA phổ biến, thêm vào đó, chip hỗ trợ lái AI tự phát triển của Xiaopeng “Turing” sẽ chính thức ra mắt thị trường vào quý hai năm nay, đầu tiên được trang bị trên mẫu xe mới của Xiaopeng. Theo thông tin từ các nguồn liên quan, chip này là sản phẩm nghiên cứu của Xiaopeng từ năm 2020 và đã thành công trong việc lưu trữ vào tháng 8 năm ngoái.

Ông Hề Tiểu Bằng đã tuyên bố rằng mục tiêu của Xiaopeng là trở thành doanh nghiệp số một trong mô hình lớn của thế giới vật lý, thúc đẩy những thay đổi to lớn trong ngành ô tô, robot và ô tô bay. Mô hình cơ sở thế giới Xiaopeng và chip “Turing” dự kiến cũng sẽ được ứng dụng trong robot AI và ô tô bay trong tương lai.

Gần đây, Xiaomi cũng có một vài động thái trong lĩnh vực hỗ trợ lái. CTO đầu tiên của Viện Nghiên cứu Ô tô Nanjing, Trần Quang đã gia nhập Xiaomi, đảm nhận vị trí phụ trách cảm nhận hỗ trợ lái, tiếp tục đẩy mạnh việc hiện thực hóa các chức năng “từ đầu đến cuối”, báo cáo trực tiếp với trưởng bộ phận hỗ trợ lái Dương Hàng Quân. Theo những người hiểu biết, về mặt nghiên cứu công nghệ, Xiaomi cũng đang tiến hành nghiên cứu mô hình VLA, ông Trần Long – nguyên trưởng khoa học học tự lái của công ty tự lái Wayve tại Anh được tuyển dụng bởi Lei Jun, đang chịu trách nhiệm và cho biết “tiến độ hiện tại có thể tương đương với Li Tương.”

Ngoài ra, Geely, Chery và các hãng xe khác cũng đang tích cực nghiên cứu, phát triển mô hình lớn VLA. Từ xu hướng của ngành, mức độ nổi bật của VLA năm nay không kém gì “từ đầu đến cuối” của năm ngoái, đặc biệt là sau khi Bộ Công nghiệp và Công nghệ Thông tin siết chặt quảng cáo hỗ trợ lái và giới hạn chức năng, các công ty xe muốn tạo ra lợi thế cạnh tranh cá nhân hóa trên con đường hỗ trợ lái chỉ có thể không ngừng kết hợp công nghệ, tiến tới L3, và đúng như Li Tương đã nói “VLA là cấu trúc mạnh nhất vào thời điểm hiện tại.”

Kết luận:

Mỗi lần công nghệ mới được cải tiến lại thu hút một lượng lớn người bắt chước tham gia cạnh tranh. Trong các cuộc mô tả của mỗi công ty, mô hình lớn VLA cho thấy khả năng “như người lái xe”, thậm chí “vượt qua người lái xe”, nhưng trải nghiệm thực tế của người dùng ra sao, chỉ có thể đợi từng công ty đưa vào sản xuất để có câu trả lời, để xem liệu có theo kịp công nghệ hay chỉ là “nói khoác”? Chỉ khi thủy triều rút đi, chúng ta mới biết ai là người đang bơi khỏa thân.