Giám đốc điều hành của Xiaopeng cho rằng việc radar quét laser nhìn xa là một “huyền thuyết”.

Tại một điểm quan trọng trong việc lựa chọn lộ trình công nghệ lái xe tự động, Giám đốc sản phẩm lái xe tự động của Xiaopeng Motors, Yuan Tingting, gần đây đã công khai nghi ngờ về giải pháp lidar, thẳng thắn cho rằng “lidar nhìn xa là một chủ đề sai lầm”. Quan điểm này đã gây ra cuộc thảo luận sâu sắc trong ngành về lộ trình công nghệ cảm biến, đồng thời phản ánh sự chuyển hướng chiến lược từ lidar sang giải pháp thuần thị giác của Xiaopeng Motors.

Giám đốc điều hành Xiaopeng cho rằng lidar nhìn xa là chủ đề sai lầm

Yuan Tingting đã phân tích một cách hệ thống những thiếu sót công nghệ của lidar trong việc phát hiện khoảng cách xa từ ba khía cạnh: đặc tính vật lý, khả năng thích ứng với môi trường và hiệu quả xử lý thông tin.

1. Giới hạn của độ suy giảm năng lượng và mật độ điểm đám: Lidar dựa vào việc phát xạ ánh sáng hồng ngoại gần và tính toán thời gian phản hồi (ToF) để xác định vị trí của vật cản, nhưng nguyên lý này dẫn đến mật độ năng lượng giảm theo bình phương nghịch đảo với khoảng cách. Lấy ví dụ lidar với 192 đường nét công nghệ hàng đầu trong ngành, khi phát hiện ở khoảng cách 200 mét, cường độ tín hiệu hồi âm và mật độ điểm đám chỉ đạt khoảng một phần nghìn so với phát hiện ở gần, dẫn đến khả năng phân biệt vật thể nhẹ (như túi nhựa) và mục tiêu nguy hiểm (như xe điện qua đường) giảm đáng kể. Trong khi đó, camera 8 megapixel vẫn có thể ghi lại đầy đủ thông tin về kết cấu và màu sắc ở khoảng cách tương tự, cung cấp cơ sở tin cậy hơn cho quyết định của thuật toán.

2. Hiệu ứng đa đường và tỷ lệ khung hình thấp làm gia tăng rủi ro sai sót: Lidar dễ xảy ra phản xạ nhiều lần trong các cảnh phức tạp, dẫn đến tín hiệu hồi âm bị trộn lẫn. Ví dụ, cấu trúc cầu thành phố từng khiến một mẫu xe đánh giá sai bóng cầu là một phương tiện đứng yên, dẫn đến hơn mười lần phanh khẩn cấp không cần thiết. Ngoài ra, tỷ lệ làm mới 10Hz của lidar phổ biến chỉ bằng một phần năm tỷ lệ khung hình của camera, khiến các mục tiêu di chuyển ở khoảng cách 200 mét có thể di chuyển hơn 3 mét trong khoảng thời gian quét hai lần, giảm thêm độ chính xác trong việc nhận diện mục tiêu động.

3. Khó khăn “mù lòa” trong thời tiết cực đoan: Lidar nhạy cảm với thời tiết như mưa và sương mù. Dữ liệu đo thực tế cho thấy, trong điều kiện mưa lớn, khoảng cách phát hiện hiệu quả của nó giảm xuống dưới 30 mét và số lượng điểm nhiễu tăng năm lần. Trong khi đó, radar tần số milimet nhờ vào đặc tính bước sóng dài của nó, thể hiện lợi thế độc đáo trong khả năng xuyên thấu. Trong các thử nghiệm đường tháng lũ ở Quảng Đông năm nay, độ chính xác nhận dạng của xe sử dụng giải pháp thị giác thuần khi điều kiện tầm nhìn là 50 mét cao hơn 12% so với giải pháp kết hợp cảm biến, nhấn mạnh giới hạn của giải pháp lidar đơn độc.

Yuan Tingting nhấn mạnh rằng, chuyển hướng của Xiaopeng Motors sang giải pháp thuần thị giác không phải là “sự giảm cấp công nghệ”, mà là sự lựa chọn tất yếu dựa trên sự tích lũy dữ liệu và sự đột phá thuật toán.

1. Lợi thế về mật độ thông tin của camera độ phân giải cao: Trong các tình huống phát hiện ở khoảng cách 200 mét, camera với độ phân giải 8 megapixel và khả năng nhận dạng kết cấu có thể chính xác nắm bắt đặc điểm hình thái của mục tiêu. Ví dụ, trong việc phân biệt túi nhựa và xe điện, camera có thể nhanh chóng xác định thuộc tính của vật thể qua các đặc trưng về kết cấu, trong khi lidar chỉ có thể cung cấp dữ liệu điểm đám thưa thớt, khó khăn trong việc hỗ trợ quyết định trong các cảnh phức tạp.

2. Mô hình điểm tới điểm phá vỡ sự phụ thuộc vào cảm biến: Xiaopeng Motors đã thực hiện “giải phóng” phần cứng cảm biến thông qua việc thu thập thông tin toàn diện và lặp lại thuật toán từ đầu đến cuối. Yuan Tingting chỉ ra rằng, tính nhất quán về khả năng giữa phiên bản thị giác và phiên bản lidar chủ yếu phụ thuộc vào khả năng xử lý tích hợp dữ liệu đa phương thức của mô hình, chứ không phải hiệu suất của một cảm biến đơn lẻ. Ví dụ, giải pháp thị giác AI Eagle Eye trang bị trên P7+ của Xiaopeng được đào tạo bằng dữ liệu thực tế khổng lồ, đã có khả năng ứng phó với các cảnh phức tạp tương đương với phiên bản lidar.

3. Những tính toán thực tế về chi phí và kỹ thuật: Từ góc độ thương mại, chi phí mua một lidar đơn lẻ chỉ chiếm khoảng 2% tổng chi phí BOM, trong khi chi phí phần cứng của giải pháp 8 camera có thể giảm 37%. Cấu trúc cảm biến nhẹ hơn cũng giúp nâng cao quãng đường di chuyển của xe lên 5.2%, mang lại lợi ích trực tiếp cho người tiêu dùng. Sự cân bằng “giảm chi phí và tăng hiệu quả” này chính là động lực cốt lõi thúc đẩy Xiaopeng Motors chuyển hướng công nghệ.

Mặc dù sự nghi ngờ của Yuan Tingting chỉ ra những điểm yếu của lidar, nhưng sự đồng thuận của ngành về việc kết hợp cảm biến vẫn chưa thay đổi. Lidar vẫn không thể thay thế lợi thế của mình trong việc phát hiện ban đêm, nhận dạng vật cản thấp (như nắp cống, đá) và phát hiện mục tiêu không đồng nhất (như xe ngựa). Ví dụ, thử nghiệm của Waymo cho thấy lidar nhanh hơn 0.3 giây trong việc nhận diện vật cản không đồng nhất so với giải pháp thuần thị giác, giảm tỷ lệ phanh khẩn cấp sai trong đô thị.

Các chuyên gia trong ngành chỉ ra rằng, giải pháp cuối cùng cho lái xe tự động không phải là “hoặc thế này hoặc thế kia”, mà cần xây dựng một hệ thống cảm nhận “camera chủ yếu, nhiều cảm biến dự phòng”. Ví dụ, radar tần số milimet có thể bù đắp cho những thiếu sót của lidar trong điều kiện thời tiết mưa và sương mù, trong khi camera chịu trách nhiệm cung cấp thông tin ngữ nghĩa. Chiến lược kết hợp “khai thác thế mạnh và tránh điểm yếu” này mới chính là phương hướng đúng cho sự tiến bộ công nghệ.

Sự nghi ngờ của Yuan Tingting thực chất là sự trở về với bản chất của công nghệ lái xe tự động: cảm biến chỉ là “đôi mắt”, trong khi thuật toán mới là “bộ não”. Trong kỷ nguyên thông minh do dữ liệu và sức mạnh tính toán dẫn dắt, làm thế nào để “bộ não” xử lý thông tin một cách hiệu quả hơn, có lẽ mới là chủ đề cốt lõi mà ngành cần suy ngẫm.