Scale AI опубликовали в открытом доступе датасеты для беспилотников

Материал подготовил: Аркадий Софрыгин, основатель сайта Беспилот.
Присоединяйтесь к обсуждению темы в Facebook

Платформа данных для ИИ Scale AI опубликовала в открытом доступе наборы данных для обучения беспилотов. Заявленная цель публикации - развитие отрасли автономного транспорта. 

Высококачественные данные - это топливо, которое питает алгоритмы ИИ. Без постоянного потока маркированных данных в обучении ИИ могут возникать "узкие места", алгоритм будет медленно ухудшаться и увеличиться риск для всей системы. Именно поэтому маркированные данные так важны для разработчиков беспилотов, таких как Zoox, Cruise и Waymo, которые используют их для обучения своих автономных транспортных средств. Стартап Scale AI был создан для реализации этой задачи.

Компания использует программное обеспечение и ручной труд сотрудников для обработки и маркировки изображений, данных с лидаров и картографических данных для компаний, создающих алгоритмы машинного обучения. Компании, работающие над технологией беспилотных автомобилей, составляют большую часть клиентской базы Scale AI, хотя ее платформа также используется такими компаниями Airbnb, Pinterest, OpenAI и др.

Пандемия COVID-19 замедлила и даже остановила создание таких датасетов, так как разработчики беспилотников приостановили тестирование на дорогах общего пользования - средство сбора миллиардов изображений, видеороликов и данных с лидаров. Scale AI надеются восполнить эту потерю, причем совершенно бесплатно.

Набор данных для беспилотов PandaSet

Компания, в сотрудничестве с производителем лидаров Hesai, опубликовала на этой неделе набор данных с открытым исходным кодом под названием PandaSet, который может быть использован для обучения беспилотных автомобилей. Бесплатный и лицензированный датасет для учебного и коммерческого использования, включает данные высокого разрешения, собранные с переднего лидара PandarGT Hesai и вращающегося лидара Pandar64.

По данным компании, данные были собраны во время поездок по Сан-Франциско и Кремниевой Долине еще до того, как людям рекомендовали оставаться дома из-за эпидемии. В итоге датасет собран в условиях сложной городской среды, заполненной автомобилями, велосипедами, светофорами и пешеходами. Набор данных включает в себя более 48 000 изображений с камер и несколько сотен сцен с лидаров, с аннотациями и метками. Бесплатная лицензия на использование PandaSet не имеет никаких ограничений.

"ИИ и машинное обучение - это невероятные технологии с огромным потенциалом применения в разных сферах, но также и огромная проблема из-за нехватки нужных данных", - рассказал CEO и сооснователь Scale AI Александр Ванг. "Для того чтобы использовать алгоритмы машинного обучения в своей работе вам действительно нужны высококачественные данные. Именно поэтому мы создали Scale AI, и публикуем сейчас в общем доступе наш набор данных, чтобы помочь компаниям двигаться вперед".

Какие AV-компании публиковали бесплатные наборы данных до Scale AI

Публикация данных в открытом доступе в сфере беспилотников не является чем-то новым. В прошлом году Aptiv и Scale AI выпустили nuScenes - крупномасштабный датасет, собранный беспилотами. Argo AI, Cruise и Waymo также публиковали свои данные в общий доступ. Argo AI выпустила данные на картах высокого разрешения, а Cruise поделился созданным инструментом визуализации данных под названием Webviz, который берет необработанные данные, собранные со всех датчиков на беспилотнике, и превращает этот двоичный код в визуальный.

"Сейчас существует большая потребность в высококачественных данных с метками", - рассказал Ванг. "Недостаточные датасеты - это одно из самых больших препятствий для разработчиков беспилотников. Мы хотим демократизировать доступ к этим данным, особенно во время эпидемии, когда многие компании не могут их собрать".

Публикация в открытый доступ не означает, что Scale AI откроет все свои датасеты. В конце концов, это прибыльный стартап, который зарабатывает на продаже данных. Хотя в компании рассказали, что  рассматривают возможность сбора и открытого доступа новых данных для беспилотов, позднее в 2020 году. 

Cкачать набор данных PandaSet вы можете по этой ссылке. Сайт Scale AI: scale.com и да пребудет с вами беспилот!

Cмотрите интервью Александра Ванга - сооснователя и CEO Scale AI. 

Материалы по теме:

Друзья, всё общение как всегда в моем фейсбуке: https://www.facebook.com/arksofrygin

СМОТРИТЕ ТАКЖЕ:

ВЫБОР ЧИТАТЕЛЕЙ

Популярные статьи

БЕСПИЛОТНЫЙ ЮМОР

СМОТРЕТЬ ВСЁ
×