Стэнфордский университет выпустил ежегодный доклад AI Index о состоянии ИИ-индустрии, ее влиянии на глобальную экономику и общество. Этот отчет измеряет глобальный прогресс технологий. В прошлом году объем мировых инвестиций в технологию составил $67,9 млрд (большая часть в этом объеме — слияния и поглощения компаний). Общий вывод исследователей: ИИ стал сильнее, повсеместнее и влиятельнее. Мы собрали главные тенденции.
Китай впереди по числу исследований в сфере ИИ
Китай опередил ближайших соперников США и Евросоюз как по общему числу публикаций в научных журналах, так и по числу рецензируемых публикаций (тех, которые проверили независимые эксперты, а не члены коллектива журнала). В первом случае на долю Китая приходится 22,4% от общего количества научных статей (у Евросоюза — 16,4%, у США — 14, 6%). Во втором случае — 18% (США — 12,3%, ЕС — 8,6%).
Но, как отмечают специалисты Стэнфорда, США по-прежнему лидируют по объему исследований, подготовленных совместно научными учреждениями и технологическими компаниями, а соответственно — в воплощении идей в жизнь. В итоге США и Китай внесли примерно одинаковый вклад в разработку искусственного интеллекта, если анализировать по разным параметрам, уточнил сопредседатель направления AI Index Джек Кларк.
Ученые в целом стали больше исследовать ИИ
Количество статей, связанных с ИИ, на arXiv (это крупнейший бесплатный архив публикаций научных статей и их препринтов) выросло с примерно 5,5 тыс. в 2015 году до почти 35 тыс. в 2020-м. Научные организации во всем мире — первые по общему количеству статей. На втором месте в США исследования, которые проводят коммерческие компании, а в Европе и Китае — исследования по заказу государства.
В 2020 году число исследований ИИ выросло по сравнению с предыдущим годом больше (на 34%), чем годом ранее (с 2018 по 2019 год рост 19,6%).
Меньше стартапов получили инвестиции
Пандемия не помешала стартапам развиваться. Но разработчиков, получивших деньги, стало меньше. В 2017 году инвестиции распределялись между 4 тыс., а в прошлом году — их получили меньше тысячи компаний.
Причины. В докладе указано, что технология стала более зрелой: отрасль переходит от множества высокотехнологических стартапов к более устойчивым компаниям. Инвестиции делят между собой вторые — доминирующие игроки на рынке. К тому же из-за пандемии инвесторов прежде всего интересовали разработки в сфере медицины, фармацевтики и биотехологий.
Выросло финансирование ИИ для медицины
Разработки с ИИ для создания лекарств, в том числе тех, которые используют в терапии зараженных ковидом, вакцин, технологий для борьбы с раком и других продуктов фармацевтики и медицины получили наибольший объем частных инвестиций в 2020 году — более 13,8 млрд долларов. Это в 4,5 раза больше, чем в 2019 году. За ними в списке следуют разработчики беспилотного транспорта ($4,5 млрд) и образовательных продуктов с ИИ ($4,1 млрд).
"Методы ИИ стали полезны в создании лекарства и разработке вакцин", — сказал Эрик Бриньолфссон, профессор экономики, старший научный сотрудник HAI и директор Стэнфордской лаборатории цифровой экономики. Один из прорывов прошлого года — алгоритм AlphaFold, умеющий предсказывать, в какую форму сворачиваются белковые молекулы. Выяснение этого вопроса помогло решить одну из важных проблем в биологии — ее называют "проблема сворачивания белков". Это дает понимание, как трехмерные формы различных белков влияют на заболевания, что позволяет создавать более совершенные лекарства.
Машины стали реже ошибаться
В Стэнфорде делают вывод, что ИИ стал сильнее и точнее.
Один из примеров прогресса ИИ — языковая нейросетевая модель GPT-3. Она позволяет создавать большие тексты — генерирует их на основе 175 млрд параметров. Посмотреть на то, как она справляется, можно на примере этого эксперимента. Редактор The Gardian поручил GPT-3 написать колонку из около 500 слов о том, "почему люди не должны бояться искусственного интеллекта". Вышло довольно хорошо (почитать можно здесь).
Одно из важных направлений — компьютерное зрение. Это область ИИ, связанная с анализом изображений и видео. Технология применятся в беспилотниках, на ней строятся алгоритмы, анализирующие изображения (пример: нейросети для медицины, которые ищут признаки заболеваний на рентгенах и МРТ). Проводятся конкурсы, где разработчики соревнуются в точности таких алгоритмов: то есть в каком процентном соотношении программы отвечают без ошибок. В разных состязаниях алгоритмы демонстрируют разные успехи. Но общее одно — их точность растет. В состязании на конкурсе ImageNet по одному заданию, где требовалось размечать картинки по классам, в 2012 году лучшие алгоритмы допускали четыре ошибки из 10 попыток, в 2020-м — одну. Модель из команды Google Brain достигла 90,2% точности в январе 2021 года. По некоторым простым задачам точность ИИ, распознающего визуальные объекты, доходит до 99%.
Насколько успешно ИИ может выполнять сразу пару сложных задач — скажем, и классификацию изображений, и генерацию текста? По идее, именно такой ИИ — способный помогать сразу во всем — то будущее, обещанное фантастами. Подобные испытания алгоритмов тоже проводятся. В одном тесте программе выдавали изображение и задавали вопрос о нем. В 2020 году лучший алгоритм отвечал правильно в 76% случаев, в 2015-м — в 40%. Люди набирают в тесте около 81%. В тех же условиях, но если нужно дать развернутый ответ, результаты лучшего алгоритма в 2020 году — 70,5% (в 2018 году — 44%). Точность человека — 85%.
Пользователей заинтересовали этические проблемы
Истории об этике в ИИ-индустрии становятся популярнее. Такой вывод исследователи делают из анализа СМИ и социальных медиа. Первая обсуждаемая тема прошлого года — увольнение из Google эксперта по этике Тимнит Гебру. Она известна как соавтор исследования о том, что алгоритмы распознавания лиц хуже распознают чернокожих, так как разработчики преимущественно обучали их на белых. Гебру рассказывала о проблемах больших языковых моделей вроде GPT-3. Например, их неспособности сохранять непредвзятость и избегать трансляции общественных стереотипов, что может усугубить положение стигматизированных групп общества.
Вторая история — решение IBM отказаться от разработки технологии распознавания лиц. "Сейчас самое время поговорить о том, следует ли использовать технологию распознавания лиц правоохранительным органам страны", — объясняли в компании. Кстати, в главных выводах исследования Стэнфорда сообщается, что технология распознавания лиц, видеоанализ а также другие разработки, позволяющие идентифицировать, к примеру по голосу, в 2020 году "развивались быстро и стали вездесущими". Другие этические сюжеты касались опасности дипфейков (подделок видео) и борьбы европейских государств с техногигантами.
В США стали меньше нанимать на работу
Это, по данным исследователей, говорит о достаточной зрелости технологии в стране. По объемам найма можно отслеживать, в каких странах больше всего растет число разработок. Согласно данным LinkedIn, в Бразилии, Индии, Канаде, Сингапуре и Южной Африке наблюдался самый высокий уровень найма с 2016 по 2020 год.
Чего нет в докладе? Беспилотных автомобилей
Интересно не только то, что есть в докладе Стэнфорда, который максимально подробно анализирует, как в мире развиваются разные направления, связанные с ИИ. Но и то, чего нет или недостаточно охвачено. Обычно исследователям не хватает подробностей о расходах государств на разработки с ИИ. В этом году, кроме того, в отчет не вошли беспилотные автомобили из-за отсутствия данных, сегодня их разработчики по возможности держат закрытой информацию о тестировании и развитии.
Анастасия Акулова