Одна простая истина об искусственном интеллекте в здравоохранении: он уже здесь

Новейшие достижения на базе технологий Intel, свидетельствуют о том, что искусственный интеллект повышает качество здравоохранения

Navin ShenoyАвтор: Нэвин Шеной

В мире Больших данных технологии искусственного интеллекта обладают огромным революционным потенциалом. Использование искусственного интеллекта позволяет улучшить процессы в любых отраслях, начиная с производства и транспорта и заканчивая розничной торговлей и образованием. Но нигде в мире этот потенциал не имеет столь большого значения как в здравоохранении, с которым так или иначе приходится сталкиваться каждому. Представьте, что у нас появляется возможность предсказать следующую крупную эпидемию и предотвратить ее, не допустив жертв? Или, проанализировав зеттабайты накопленных данных, мы сможем выявить наиболее существенные факторы риска и затем быстро и точно предотвратить болезнь? Представьте, что мы сможем создавать настолько индивидуальное лечение и вести хроническое заболевание, что каждый пациент получит свое уникальное лекарство, которое при этом является максимально действенным? Представьте, что мы сможем значительно сократить время и стоимость поиска новых лекарств и быстрее выводить их на рынок. Представьте, что всего этого мы можем добиться уже сейчас?

Благодаря искусственному интеллекту и усилиям корпорации Intel и ее партнеров, у нас уже есть такая возможность.

Значительное влияние уже сегодня

Существует распространенное заблуждение, что использование искусственного интеллекта в здравоохранении – из разряда научной фантастики. Главным образом, речь здесь идет об устройствах, позволяющих ставить диагноз и выписывать рецепты без участия врача. Но это не только крайне маловероятно, но и близко не похоже на те самые лучшие примеры того, как технологии искусственного интеллекта используются в современном здравоохранении.

Корпорация Intel вместе с партнерами– в том числе с GE Healthcare, Siemens, Sharp Healthcare, Broad Institute, UCSF и Mayo Clinic успешно применяют сегодня решения на базе искусственного интеллекта, которые используются как для внутрибольничных рабочих процессов, так и в кабинете врача, в операционной и дома у пациентов. Среди заказчиков, с которыми мы тесно работаем, можно назвать:

Montefiore Medical System: использует технологии предиктивного моделирования для выявления пациентов, у которых может развиться дыхательная недостаточность. Таким образом, лечащий персонал может действовать на основе этих предупреждений и принимать своевременные меры, спасая жизни и экономя ресурсы.

Stanford Medical: использует искусственный интеллект, чтобы ускорить восстановление картины, полученной с помощью магнитно-резонансной томографии. Таким образом, благодаря ИИ для получения полного изображения требуется всего несколько минут, тогда как при стандартной процедуре для этого требуется около часа. Все это позволяет избежать рискованной интубации или применения седативных препаратов при проведении МРТ-сканирования пациентов детского возраста.

ICON plc: Помимо обременительных визитов к врачу и ведения бумажных дневников, здесь используются клинические данные, поступающие с датчиков и носимых устройств, что позволяет моментально оценить эффект новых лекарств при проведении клинических испытаний.

AccuHealth: Применение домашних систем мониторинга наряду с интеллектуальным анализом данных и предиктивным моделированием для выявления опасных изменений у пациентов с хроническими заболеваниями позволяет принимать меры до ухудшения их состояния и перехода заболевания в острую форму.

Улучшение здравоохранения в будущем

Но триумф искусственного интеллекта в отрасли здравоохранения нельзя назвать неизбежным. В настоящее время средняя больница генерирует примерно 665 терабайт данных в год1, но по большей части эти данные бесполезны. Как минимум 80% больничных данных сегодня являются неструктурированными2, например, это клинические комментарии, видеозаписи и изображения. Электронные медицинские карты (EMRs) сегодня становятся обязательными системами учета, однако в их нынешнем виде они не настолько действенны и эффективны, как могли бы быть. Только технологии искусственного интеллекта позволяют использовать медицинские данные для создания комплексных аналитических систем, с помощью которых можно было бы выявлять сложные закономерности.

Было бы весьма кстати, если бы медицинские системы обеспечивали более широкий доступ к хранящимся в них данных. Правительствам также следует проявлять инициативу: создавать стимулы и обеспечивать регуляторную прозрачность для обмена данными. Мы согласны с недавним предложением Белого дома предоставить пациентам полный контроль над всеми их медицинскими данными, с возможностью всегда иметь эти данные при себе, куда бы ни направлялись пациенты. Сегодня же эти данные хранятся у разных врачей в различных клиниках и больницах, куда доводилось обращаться пациенту.

Новые технологии также способны помочь. Например, исследователи Intel делают большие успехи в разработке практических методов гомоморфного шифрования – шифрования, которое позволяет компьютерным системам выполнять вычисления на основе зашифрованной информации без предварительного дешифрования. Благодаря такому шифрованию исследователи могут работать с данными в максимально закрытом и защищенном режиме, и при этом получать значимые выводы.

Нам действительно предстоит еще немало работы, и корпорация Intel обладает уникальным положением, чтобы помочь организациям отрасли здравоохранения добиваться успеха. Сегодня медицинские учреждения генерируют огромные объемы данных – изображения, данные из всевозможных новых «-омик» (геномики, протеомики), видеозаписи – и все это требует как систем хранения, так и сетевой инфраструктуры, которые бы обладали высокой скоростью, надежностью и низкими задержками. Вместе с нашими партнерами мы работаем над созданием подходящих для этого систем – для обработки, хранения и передачи данных. То есть мы создаем полноценную инфраструктуру, которая охватывает буквально все, от периферии до сети и до облака, а также все то, что находится между ними. С учетом наших достижений в области аппаратного обеспечения и за счет оптимизации популярных фреймворков глубинного обучения, процессор Xeon Scalable обеспечивает в 198 раз более высокую производительность при построении логических выводов и в 127 раз более высокую производительность при обучении нейронных сетей по сравнению с процессорами предыдущего поколения3. В результате, платформа Xeon сегодня является центральным звеном для многих рабочих нагрузок с использованием искусственного интеллекта. Всё это стало возможным благодаря тому, что данная платформа отлично подходит для многих задач машинного  и глубинного обучения в самых различных отраслях, в том числе в здравоохранении.

Однако одного только аппаратного обеспечения, систем хранения и сетевой инфраструктуры недостаточно. Нам следует задействовать богатейший опыт наших специалистов по обработке и анализу данных, разработчиков программного обеспечения, отраслевых экспертов и партнеров по экосистеме, чтобы комплексно использовать технологии искусственного интеллекта в здравоохранении. В рамках нашей работы по наращиванию экспертизы в области искусственного интеллекта, мы запустили проект Intel AI Academy, который содержит обучающие материалы и предлагает инструменты и технологии для развития новых проектов в области искусственного интеллекта. В настоящее время ежемесячная аудитория проекта насчитывает более 250 тысяч участников, и я приглашаю и вас бесплатно присоединиться к этой инициативе.

Я очень счастлив работать на такую компанию как Intel, которая разрабатывает технологии для решений на базе искусственного интеллекта – решений, которые помогут найти ответы на важнейшие вопросы современности, в том числе в сфере здравоохранения. Я горжусь тем, что руковожу командой, которая претворяет эти идеи в жизнь.

Нэвин Шеной является исполнительным вице-президентом и генеральным директором подразделения Data Center Group в корпорации Intel.

1Источник: http://www.netapp.com/us/media/wp-7169.pdf

2Источник: http://www.zdnet.com/news/unstructured-data-challenge-or-asset/6356681

3Источник: Конфигурация: производительность ИИ – программное обеспечение + аппаратное обеспечение

ПОСТРОЕНИЕ ЛОГИЧЕСКИХ ВЫВОДОВ в тесте FP32 Batch Size Caffe GoogleNet v1 256 AlexNet 256.

Приведенные оценки производительности были получены до установки недавно выпущенных программных патчей и обновлений микропрограммного обеспечения для защиты от уязвимостей, известных как Spectre и Meltdown. Установка этих обновлений может привести к тому, что эти результаты будут неприменимы к вашему устройству или системе. Программное обеспечение и рабочие нагрузки, используемые в тестах производительности, могут быть оптимизированы для обеспечения высокой производительности только на микропроцессорах Intel. Результаты тестов производительности, таких как SYSmark и MobileMark, измерялись с использованием определенных компьютерных систем, компонентов, ПО, операций и функций. Любые изменения в этих факторах могут повлиять на результаты измерений. Читателям рекомендуется использовать другую информацию и тесты производительности для принятия решения о покупке, включая информацию об эффективности работы этих продуктов с другими компонентами. Более полную информацию можно получить на сайте http://www.intel.com/performance.

Источник: собственные замеры Intel по состоянию на июнь 2017 года. Примечание об оптимизации:  компиляторы  Intel могут быть в той же мере оптимизированы или не оптимизированы для работы с микропроцессорами других компаний в отношении оптимизаций, не являющихся уникальными для микропроцессоров Intel. В числе этих оптимизаций – поддержка наборов инструкций SSE2, SSE3 и SSSE3, а также другие оптимизации. Intel не гарантирует доступности, функциональности или эффективности любых оптимизаций на микропроцессорах, произведенных другими компаниями.  Микропроцессорно-зависимые оптимизации в настоящем продукте предназначены для использования с микропроцессорами Intel. Отдельные оптимизации, не являющиеся специфичными для микроархитектуры Intel, зарезервированы для микропроцессоров Intel. Более подробную информацию относительно отдельных наборов инструкций, упомянутых в настоящем примечании, можно получить в соответствующих руководствах пользователя и справочной документации о продукции.

 

Конфигурации для оценки пропускной способности при построении логических выводов:  

Процессор: 2 сокета Intel(R) Xeon(R) Platinum 8180 CPU @ 2,50ГГц / 28 ядер, HT ON , Turbo ON Совокупный объем памяти 376,46ГБ (12 слотов / 32 ГБ / 2666 МГц). CentOS Linux-7.3.1611-Core , SSD sda RS3WC080 HDD 744,1ГБ,sdb RS3WC080 HDD 1,5ТБ,sdc RS3WC080 HDD 5,5ТБ , фреймворк глубинного обучения caffe версия: f6d01efbe93f70726ea3796a4b89c612365a6341 Топология :googlenet_v1 BIOS:SE5C620.86B.00.01.0004.071220170215 MKLDNN: версия: ae00102be506ed0fe2099c6557df2aa88ad57ec1 NoDataLayer. Измерено: 1190 изобр./с по сравнению с платформой: 2 сокета Intel® Xeon® CPU E5-2699 v3 @ 2,30ГГц  (18 ядер), включен режим HT, режим turbo отключен, говернор установлен в режим “performance” с помощью драйвера intel_pstate, 256ГБ DDR4-2133 ECC RAM. CentOS Linux release 7.3.1611 (Core), Linux kernel 3.10.0-514.el7.x86_64. Накопитель для ОС: Seagate* Enterprise ST2000NX0253 2 ТБ 2.5″ – встроенный дисковый накопитель. Производительность измерялась при следующих переменных окружения: KMP_AFFINITY=’granularity=fine, compact,1,0‘, OMP_NUM_THREADS=36, Частота процессора устанавливалась командой cpupower frequency-set -d 2.3G -u 2.3G -g performance. Фреймворк глубинного обучения: Intel Caffe: (http://github.com/intel/caffe/), revision b0ef3236528a2c7d2988f249d347d5fdae831236. Производительность построения логических выводов измерялась с помощью команды “caffe time –forward_only”, производительность обучения сети измерялась с помощью команды “caffe time”. Для топологий “ConvNet” использовались условные наборы данных (dummy dataset). Для других топологий данные хранились на локальных накопителях и кэшировались в память перед обучением. Спецификации топологий взяты с сайтов https://github.com/intel/caffe/tree/master/models/intel_optimized_models (GoogLeNet, AlexNet и ResNet-50), https://github.com/intel/caffe/tree/master/models/default_vgg_19 (VGG-19), и https://github.com/soumith/convnet-benchmarks/tree/master/caffe/imagenet_winners (тесты ConvNet; файлы были обновлены, чтобы использовать более новый формат Caffe prototxt , но функционально эквивалентны используемым ранее). GCC 4.8.5, MKLML version 2017.0.2.20170110. BVLC-Caffe: https://github.com/BVLC/caffe, Производительность построения логических выводов и обучения была измерена с помощью команды “caffe time”. Для топологий “ConvNet” использовались условные наборы данных. Для других топологий данные хранились на локальных накопителях и кэшировались в память перед обучением. BVLC Caffe (http://github.com/BVLC/caffe), ревизия 91b09280f5233cafc62954c98ce8bc4c204e7475 (дата публикации 5/14/2017). BLAS: atlas ver. 3.10.1.

 

Конфигурация для оценки пропускной способности при обучении:

Процессор: 2 сокета Intel(R) Xeon(R) Platinum 8180 CPU @ 2,50ГГц / 28 ядер, HT ON , Turbo ON Совокупный объем памяти 376,46ГБ (12 слотов / 32 ГБ / 2666 МГц). CentOS Linux-7.3.1611-Core , SSD sda RS3WC080 HDD 744,1ГБ,sdb RS3WC080 HDD 1,5ТБ,sdc RS3WC080 HDD 5,5ТБ , фреймворк глубинного обучения caffe версия: f6d01efbe93f70726ea3796a4b89c612365a6341 Топология:alexnet BIOS:SE5C620.86B.00.01.0009.101920170742 MKLDNN: версия: ae00102be506ed0fe2099c6557df2aa88ad57ec1 NoDataLayer. Измерено: 1023 изобр./с по сравнению с платформой: 2 сокета Intel® Xeon® CPU E5-2699 v3 @ 2,30ГГц (18 ядер), включен режим HT, режим turbo отключен, говернор установлен в режим “performance” с помощью драйвера intel_pstate, 256ГБ DDR4-2133 ECC RAM. CentOS Linux release 7.3.1611 (Core), Linux kernel 3.10.0-514.el7.x86_64. Накопитель для OS: Seagate* Enterprise ST2000NX0253 2 ТБ 2.5″ – встроенный дисковый накопитель. Производительность измерялась при следующих переменных окружения: KMP_AFFINITY=’granularity=fine, compact,1,0‘, OMP_NUM_THREADS=36, частота процессора устанавливалась командой cpupower frequency-set -d 2.3G -u 2.3G -g performance. Фреймворк глубинного обучения: Intel Caffe: (http://github.com/intel/caffe/), revision b0ef3236528a2c7d2988f249d347d5fdae831236. Производительность построения логических выводов измерялась с помощью команды “caffe time –forward_only”, производительность обучения измерялась с помощью команды “caffe time”. Для топологий “ConvNet” использовались условные наборы данных. Для других топологий данные хранились на локальных накопителях и кэшировались в память перед обучением. Спецификации топологий взяты с сайтов https://github.com/intel/caffe/tree/master/models/intel_optimized_models (GoogLeNet, AlexNet и ResNet-50), https://github.com/intel/caffe/tree/master/models/default_vgg_19 (VGG-19), и https://github.com/soumith/convnet-benchmarks/tree/master/caffe/imagenet_winners (тесты ConvNet; файлы были обновлены, чтобы использовать более новый формат Caffe prototxt , но функционально эквивалентны используемым ранее). GCC 4.8.5, MKLML version 2017.0.2.20170110. BVLC-Caffe: https://github.com/BVLC/caffe, Производительность построения логических выводов и обучения была измерена с помощью команды “caffe time”. Для топологий “ConvNet” использовались условные наборы данных. Для других топологий данные хранились на локальных накопителях и кэшировались в память перед обучением. BVLC Caffe (http://github.com/BVLC/caffe), ревизия 91b09280f5233cafc62954c98ce8bc4c204e7475 (дата публикации 5/14/2017). BLAS: atlas ver. 3.10.1.

О корпорации Intel

Intel (NASDAQ: INTC) раздвигает границы технологий, чтобы сделать возможными самые удивительные впечатления. Более подробная информация об Intel и о результатах работы более 100 тысяч сотрудников компании представлена на сайтах newsroom.intel.ru и www.intel.com.

Intel и логотип Intel являются торговыми марками корпорации Intel в США и в других странах.

*Прочие наименования и торговые марки могут быть собственностью соответствующих владельцев.