Антон Слесарев, Яндекс: какой подход победит лидарный или безлидарный - это самый интересный вопрос в развитии беспилотников

Материал подготовил: Аркадий Софрыгин, основатель сайта Беспилот.
Присоединяйтесь к обсуждению темы в Facebook

Друзья, сегодня предлагаю вам прочитать основные тезисы из лекции "Технологии беспилотных автомобилей" главы разработчиков беспилотников Яндекса Антона Слесарева. Весь текст ниже - выступление Антона. 

Какие технологии мы используем и классическая схема работы беспилотника

Эта схема появилась еще в 2007 г., когда проходил Darpa Urban Challenge. Это соревнование беспилотных автомобилей в городских условиях, которое проходило в США. Несколько топовых американских вузов, таких как Carnegie Mellon University, Stamford и Massachusetts Institute of Technology соревновались и, кажется победил Carnegie Mellon.

После этого команды-участники опубликовали подробные отчеты как они сделали беспилотник и как автомобиль проехал в городских условиях. С точки зрения компонентов все расписали примерно одно и то же. И до сих пор эта схема актуальна. 

Из чего состоит схема? Есть Perception, который отвечает за то, какой мир вокруг нас. Есть карты и локализация (Map and Localisation), которые отвечают за то, где автомобиль в мире расположен. Оба эти компонента подаются на вход в Motion Planning, который принимает решение куда ехать, какую траекторию строить, принимая во внимание мир вокруг. 

Затем Motion Planning передает это компоненту Vehicle Control, который выполняет заданную траекторию с учетом физики автомобиля. В-общем, Vehicle Control - это больше про физику. 

Сегодня мы сосредоточимся на Perception, так как это про анализ данных и на мой взгляд самая челледжевая часть в мире в ближайшие годы по поводу всего фронта работ по беспилотникам. Остальные компоненты тоже очень важны, но Perception - самое главное. Чем лучше мы распознаем мир вокруг автомобиля, тем проще будет делать все остальное. 

Другой подход: End-to-end архитектуры и нейросети

Покажу еще один подход. Многие слышали, что есть End-to-end архитектуры. И более специфично, есть Behavior cloning, когда мы собираем датасеты как ездит водитель и повторяем его поведение на беспилотнике. Например используется вариант, когда у нас есть только 3 камеры (чтобы отследить разные траектории поездки), данные с них отдаются в единую нейросеть, а она решает как двигать руль. 

В принципе это рабочий подход, но, как показывает практика, сейчас End-to-end находится еще в состоянии исследований. Мы в Яндексе тоже пробовали этот подход, один человек у нас очень быстро обучил End-to-end. Мы даже немного испугались, что мы уволим сейчас всю остальную команду, потому что он за месяц достиг таких результатов, которые мы за 3 месяца делали большим количеством людей. Но там возникла проблема, что тяжело было двигаться дальше. 

Например мы научились ездить вокруг одного здания, а вокруг этого же здания в противоположную сторону уже получалось гораздо сложнее. И до сих пор нет способа представить это все в единой нейросети, чтобы это нормально работало. 

Поэтому практически все беспилотники в мире, которые сейчас ездят в реальных условиях, это классический подход, который вы видели на картинке выше. Т.е. когда Perception в явном виде строит мир вокруг. 

Как работает Perception

Для начала нужно понять - какие данные и информация в принципе стекаются на вход автомобиля. В беспилотнике много сенсоров. Самые часто используемые это камеры, радары и лидары. 

Радар - это продакшн-сенсор, который уже активно используется в адаптивных круиз-контролях. Он хорошо работает по металлическим объектам, например по автомобилям, хуже работает по пешеходам. Радар определяет не только позицию, но и скорость объекта и мы можем узнать радиальную скорость. 

Камеры - понятно что такое. Это как глаза, дающие обычную картинку. 

Лидар - это лазерный дальномер, который определяет расстояние до объекта с помощью просчета скорости возвращения отраженного от объекта луча. На беспилоте Яндекса есть несколько вертикально расположенных лидаров, они постоянно вращаются и сканируют пространство. И затем мы получаем "картинку" объектов вокруг беспилотника. 

Лидар - это очень крутой сенсор и ключевой компонент беспилотных автомобилей. Хотя с ним есть несколько проблем: он дорого стоит и пока непонятно насколько они надежны. Например он все-время крутится, а значит может рано или поздно открутиться.

Производители обещают сделать статичные лидары и более дешевые по цене. А некоторые разработчики беспилотников уверяют, что сделают машину, которая будет работать только на Computer vision, т.е. только на камерах. И какой поход победит: лидарный или безлидарный - это самый интересный вопрос в развитии беспилотников. 

В-общем у нас есть несколько сенсоров, каждый из них генерит какие-то данные. У нас есть классический pipeline как мы обучаем наши алгоритмы ML. Данные нужно собрать, залить в облако, разметить, выбираем лучшую модель и переобучаем. Затем это все нужно обратно на машину завести и чтобы это все очень быстро работало. 

Продолжение лекции смотрите в видео ниже!

Официальный сайт беспилотников Яндекса: sdc.yandex.com и да пребудет с вами беспилот!  

Cмотрите полную лекцию Антона Слесарева "Технологии беспилотных автомобилей". 

Материалы по теме:

Друзья, всё общение как всегда в моем фейсбуке: https://www.facebook.com/arksofrygin

СМОТРИТЕ ТАКЖЕ:

ВЫБОР ЧИТАТЕЛЕЙ

Популярные статьи

БЕСПИЛОТНЫЙ ЮМОР

СМОТРЕТЬ ВСЁ
×