Giám đốc điều hành của Xiaopeng cho rằng việc lidar có tầm nhìn xa là một “giả thuyết sai lầm”.

Tại một điểm then chốt trong việc lựa chọn lộ trình công nghệ lái xe tự động, Giám đốc sản phẩm lái xe tự động của Xpeng Motors, Yuan Tingting, gần đây đã công khai đặt dấu hỏi về giải pháp laser radar, thẳng thắn cho rằng “laser radar có tầm nhìn xa là một giả thuyết sai”. Quan điểm này đã gây ra một cuộc thảo luận sâu sắc trong ngành về lộ trình công nghệ cảm biến, đồng thời phản ánh chiến lược chuyển hướng của Xpeng từ laser radar sang giải pháp hoàn toàn bằng thị giác dựa trên logic kỹ thuật.

Giám đốc Xpeng cho rằng tầm nhìn xa của laser radar là một 'giả thuyết sai'

Yuan Tingting đã phân tích một cách có hệ thống các điểm yếu công nghệ của laser radar trong việc phát hiện ở khoảng cách xa từ ba khía cạnh: đặc tính vật lý, khả năng thích ứng với môi trường và hiệu suất xử lý thông tin.

1. Suy giảm năng lượng và nút thắt mật độ điểm mây: Laser radar phụ thuộc vào việc phát ra ánh sáng hồng ngoại gần và tính toán thời gian phản xạ (ToF) để xác định vị trí của vật cản, nhưng nguyên lý này dẫn đến mật độ năng lượng giảm theo tỷ lệ bình phương với khoảng cách. Với laser radar 192 dòng hàng đầu trong ngành, khi phát hiện ở khoảng cách 200 mét, độ mạnh tín hiệu hồi âm và mật độ điểm mây chỉ đạt 1/1000 so với phát hiện ở khoảng cách gần, làm giảm khả năng phân biệt giữa các vật thể nhẹ (như túi nhựa) và các mục tiêu nguy hiểm (như xe đạp điện). Ngược lại, camera 8 triệu pixel vẫn có thể ghi được thông tin ngữ nghĩa phong phú như kết cấu và màu sắc ở khoảng cách tương tự, cung cấp cơ sở đáng tin cậy hơn cho các quyết định thuật toán.

2. Hiện tượng phản xạ đa chặng và tỷ lệ khung hình thấp làm tăng nguy cơ sai sót: Laser radar dễ bị phản xạ nhiều lần trong các cảnh phức tạp, dẫn đến tín hiệu hồi âm bị chồng chéo. Ví dụ, cấu trúc cầu giao thông đô thị từng gây ra một mẫu xe nhận nhầm bóng của trụ cầu thành xe dừng, dẫn đến hàng chục lần phanh gấp không cần thiết. Hơn nữa, tỷ lệ làm mới 10Hz của các laser radar chính thống chỉ bằng 1/5 tỷ lệ khung hình của camera, ở tốc độ 120 km/h, một mục tiêu di động ở khoảng cách 200 mét sẽ di chuyển hơn 3 mét trong khoảng thời gian giữa hai lần quét, làm giảm độ chính xác nhận diện mục tiêu động.

3. Khó khăn “mù quáng” trong thời tiết cực đoan: Laser radar rất nhạy cảm với thời tiết như mưa và sương mù. Dữ liệu thực tế cho thấy, trong môi trường mưa to, khoảng cách phát hiện hiệu quả của nó giảm xuống dưới 30 mét, và số lượng điểm nhiễu gần tăng gấp năm lần. Radar sóng milimet, với đặc tính sóng dài của nó, đã thể hiện ưu điểm độc đáo về khả năng xuyên thấu. Trong các cuộc thử nghiệm trên đường trong mùa mưa năm nay tại Quảng Đông, tỷ lệ nhận diện của xe sử dụng giải pháp hình ảnh thuần túy trong điều kiện tầm nhìn 50 mét lại cao hơn 12% so với giải pháp cảm biến kết hợp, làm nổi bật giới hạn của giải pháp laser radar đơn lẻ.

Yuan Tingting nhấn mạnh rằng, Xpeng chuyển hướng sang giải pháp hoàn toàn bằng thị giác không phải là “giảm cấp công nghệ”, mà là sự lựa chọn tất yếu dựa trên tích lũy dữ liệu và đột phá thuật toán.

1. Lợi thế về mật độ thông tin của camera có độ phân giải cao: Trong cảnh phát hiện ở khoảng cách 200 mét, nhờ độ phân giải 8 triệu pixel và khả năng nhận diện kết cấu, camera có thể ghi lại chính xác các đặc điểm hình thái của vật thể. Ví dụ, trong việc phân biệt túi nhựa với xe đạp điện, camera có thể nhanh chóng xác định tính chất của vật thể thông qua các đặc điểm kết cấu, trong khi laser radar chỉ cung cấp dữ liệu điểm mây thưa, khó có thể hỗ trợ việc ra quyết định trong các cảnh phức tạp.

2. Mô hình đầu cuối phá vỡ sự phụ thuộc vào cảm biến: Xpeng đã thực hiện “tách rời” cảm biến phần cứng bằng cách thu thập thông tin đầy đủ và lặp lại thuật toán đầu cuối. Yuan Tingting chỉ ra rằng, sự nhất quán khả năng giữa phiên bản thị giác và laser radar về bản chất phụ thuộc vào khả năng xử lý và kết hợp dữ liệu đa mô hình của mô hình, chứ không phải hiệu suất của một cảm biến đơn lẻ. Ví dụ, giải pháp thị giác AI Eagle Eye được trang bị trên Xpeng P7+ đã có thể đạt được khả năng đối phó với các cảnh phức tạp gần giống phiên bản laser radar thông qua việc huấn luyện với dữ liệu từ nhiều cảnh thực tế.

3. Cân nhắc thực tế về chi phí và hiện thực hóa: Từ góc độ thương mại, chi phí mua một laser radar đơn lẻ khoảng 2% tổng chi phí BOM, trong khi chi phí phần cứng của giải pháp 8 camera có thể giảm 37%. Bố trí cảm biến nhẹ hơn còn giúp nâng cao quãng đường di chuyển của xe thêm 5.2%, mang lại lợi ích trực tiếp cho người tiêu dùng. Cân bằng này giữa “giảm chi phí và tăng hiệu suất” chính là động lực cốt lõi thúc đẩy Xpeng chuyển hướng công nghệ.

Mặc dù những nghi vấn của Yuan Tingting nhắm đến điểm yếu của laser radar, nhưng sự đồng thuận trong ngành về sự kết hợp cảm biến vẫn không bị xáo trộn. Laser radar vẫn có ưu thế không thể thay thế trong việc phát hiện vào ban đêm, xác định vật cản thấp (như nắp cống, đá) và phát hiện mục tiêu hình dạng kỳ lạ (như xe ngựa). Ví dụ, việc kiểm tra của Waymo cho thấy laser radar nhanh hơn 0.3 giây so với giải pháp hình ảnh thuần túy trong việc nhận diện vật cản hình dạng kỳ lạ, rõ ràng giảm tỉ lệ phanh gấp không cần thiết trên đường đô thị.

Các chuyên gia trong ngành chỉ ra rằng, giải pháp tối ưu cho lái xe tự động không phải là “nhất thiết phải chọn một trong hai”, mà cần xây dựng hệ thống nhận diện “camera chính, đa cảm biến dự phòng”. Ví dụ, radar sóng milimet có thể bổ sung cho phần yếu trong laser radar trong thời tiết mưa, trong khi camera chịu trách nhiệm cung cấp thông tin ngữ nghĩa. Chiến lược hợp nhất “tận dụng điểm mạnh và tránh điểm yếu” này mới là hướng đi đúng đắn cho sự phát triển công nghệ.

Nghi vấn của Yuan Tingting, về bản chất, là sự trở về với bản chất của công nghệ lái xe tự động: cảm biến chỉ là “đôi mắt”, còn thuật toán mới là “bộ não”. Trong kỷ nguyên thông minh do dữ liệu và sức mạnh tính toán thúc đẩy, cách làm cho “bộ não” xử lý thông tin một cách hiệu quả hơn có lẽ mới là câu hỏi cốt lõi mà ngành cần suy nghĩ.