4 Терабайта – важная цифра, играющая ключевую роль для создателей беспилотных автомобилей

Сможете ли вы что-то разобрать, если 3 000 людей вдруг решат одновременно с вами поговорить?

Как инженеру, мне нравится решать сложные задачи и использовать для понимания окружающего мира язык математики или, другими словами, язык цифр. Иногда цифры способны представить истинный масштаб события или проблемы лучше любых слов. В этой связи особый интерес представляют большие числа, за которыми часто скрывается нечто поистине масштабное. Возьмём, к примеру, цифру 4 Терабайта (Тб). Она играет весьма важную роль для создателей беспилотных автомобилей, и сейчас я расскажу вам почему.

Почему именно это число? Четыре терабайта – именно столько данных будут формировать беспилотные автомобили за полтора часа поездки, то есть за то время, которое каждый из нас ежедневно проводит в машине. Кроме того, столько же данных к 2020 году будут ежедневно передавать по сети 3 000 пользователей. На первый взгляд, цифра может показаться не слишком большой, однако задумайтесь, у скольких из нас есть 3 000 друзей в Facebook? А теперь представьте, что каждый из них будет делать по одной публикации каждый день, а вам потребуется все их прочитать.

При этом тот факт, что беспилотные автомобили будут формировать объём данных в 4 Тб, это далеко не самое интересное. Чтобы понять, что делает «данные новой нефтью» для эпохи беспилотных автомобилей, и какие трудности возникают на этом пути, необходимо научиться извлекать пользу из этого огромного объема информации и создать технологии, на базе которых машины будущего смогут думать, учиться и принимать решения без вмешательства человека. На сегодняшний день около 90% всех ДТП происходит в результате ошибки водителя1, и в наших силах оставить это в прошлом.

Вся деятельность Intel основана на данных. Мы знаем, как создаются, передаются, хранятся, обрабатываются и анализируются большие массивы данных и используем этот объём знаний в индустрии автономных автомобилей. Опираясь на имеющийся опыт, мы знаем, что самый эффективный способ решения проблемы обработки данных для беспилотных автомобилей заключается в активном сотрудничестве всех отраслевых игроков. Нам предстоит проделать большую работу, чтобы в 2021 году увидеть на дорогах машины, которые могли бы управляться без водителя. Я уверена, что при поддержке отраслевых игроков и наших партнёров мы сможем решить поставленную задачу.

Весь поток данных от беспилотных автомобилей можно разделить на три группы: технические данные, данные краудсорсинга и персональные данные.

Понимание технических данных лежит на поверхности. Это данные, поступающие от различных сенсоров и формирующие картину окружающего мира, как его «видит» автомобиль. При помощи этого типа данных машина может распознать на дороге человека или пожарный гидрант, увидеть неожиданно появившуюся яму или вычислить скорость приближения соседнего автомобиля. Технические данные позволяют создавать новые сценарии управления автомобилем, которые должны передаваться в облако и использоваться для обучения и совершенствования программного обеспечения, отвечающего за поведение машины. Очень важно обеспечить моментальное поступление технических данных в облака, чтобы их могли использовать и другие машины в рамках сети.

Данные краудсорсинга – это массив информации, накапливаемый в результате объединения данных от машин, находящихся в пределах одного района. Эти данные позволяют делать выводы о загруженности дорог или изменении дорожных условий. Только представьте весь спектр полезных приложений, которые смогут использовать этот тип данных. Например, вы сможете легче находить свободное место на парковке или избегать попадания в заторы на дорогах.

Наконец, давайте разберёмся с персональными данными. К ним, в частности, относятся сведения о том, какое радио вы предпочитаете слушать в машине, где находятся ваши любимые кофейни и по каким маршрутам вы чаще всего передвигаетесь. На базе этой информации беспилотный автомобиль сможет в максимальной степени соответствовать вашим индивидуальным запросам.

По мере того, как отрасль приближается к созданию полностью автономных машин, задача обработки данных становится всё актуальнее. Давайте вспомним упомянутую в начале цифру: 4 Тб. Экспоненциальный рост объемов данных потребует огромных вычислительных мощностей для упорядочивания, обработки, анализа, понимания, хранения и передачи информации. Обычный компьютер с этим точно не справится, данная задача под силу лишь мощным центрам обработки данных.

Обучение беспилотных автомобилей должно происходить максимально быстро, что порождает ещё одну проблему. Как только датчики идентифицируют новую дорожную ситуацию, системы машинного обучения, имитации и совершенствования используемых алгоритмов должны мгновенно выдавать готовое решение. Этот процесс не может длиться недели или месяцы. При этом доработанная модель управления должна сразу же поступать в автомобиль. Уже сегодня нам надо решить, где и как будет организован данный процесс. Без этого невозможна массовая эксплуатация беспилотных машин.

Также перед нами встаёт задача обеспечения информационной безопасности, которая приобретёт огромную актуальность, как только люди начнут доверять свою жизнь беспилотным автомобилям. Мы с полной ответственностью относимся к вопросам обеспечения защиты при хранении и передаче данных. Какие именно данные требуется хранить? От чего можно избавиться? Какой частью данных необходимо обмениваться? Как защитить эти данные? Чтобы найти правильные ответы на поставленные вопросы, необходимо активное сотрудничество всех отраслевых игроков и использование ресурсов наших лучших специалистов.

Проблемы данных будут становиться всё сложнее по мере того, как на дорогах начнут появляться сотни тысяч и миллионы новых беспилотных автомобилей. Массовое применение машин без водителя станет реальностью лишь тогда, когда мы научимся эффективно обрабатывать постоянно растущие потоки данных. Создаваемые нами системы должны поддерживать масштабирование по мере роста нагрузки. Это касается как технологий внутри самих машин (вспомним ещё раз про 4 Тб), так и архитектуры ЦОД.

Ни одна компания не сможет решить все задачи обработки данных самостоятельно. Мы в Intel считаем, что наилучший способ – это активное сотрудничество всех отраслевых игроков в процессе создания надёжных и безопасных платформ и организации обмена информацией. Все мы хотим увидеть мир, в котором транспортная проблема перестаёт быть проблемой, а на дорогах больше не случаются аварии. Сотрудничество всех отраслевых игроков поможет нам быстрее достичь поставленной цели. Мне очень интересно работать над решением проблемы «4 Тб» вместе с коллегами из Intel и нашими ключевыми партнёрами. Я не сомневаюсь, что решение данной проблемы позволит нам получить более безопасные дороги и достичь принципиально нового уровня комфорта при путешествиях.

Кэти Уинтер занимает пост вице-президента Intel Corporation и руководителя направления Automated Driving Solutions. В 2016 году она перешла на работу в Intel из компании Delphi, где под её руководством полностью автономная машина впервые совершила путешествие между городами. 

Это третья публикация в рамках серии статей на сайте Intel, посвящённых беспилотным автомобилям.

1 Национальное исследование причин ДТП, Министерство Транспорта США, страница 25 (2008), https://crashstats.nhtsa.dot.gov/Api/Public/ViewPublication/811059;http://cyberlaw.stanford.edu/blog/2013/12/human-error-cause-vehicle-crashes

О корпорации Intel

Intel (NASDAQ: INTC) раздвигает границы технологий, чтобы сделать возможными самые удивительные впечатления. Более подробная информация об Intel и о результатах работы более 100 тысяч сотрудников компании представлена на сайтах newsroom.intel.ru и www.intel.com.

Intel и логотип Intel являются торговыми марками корпорации Intel в США и в других странах.

*Прочие наименования и торговые марки могут быть собственностью соответствующих владельцев.