Новая цифровая революция, глубокое обучение

(Ди Андреа Пирас)
07/02/22

Распознать фотографию, песню, привычку пользователя. С искусственным интеллектом это уже возможно. Но почему это важно и как это влияет на наш образ жизни?

Прежде чем ответить на этот вопрос, нам нужно сделать шаг назад, чтобы объяснить разницу между Искусственный интеллект (ИИ), Машинное обучение (МЛ) и Глубокое обучение (DL), термины, которые часто путают, но имеют точное значение.

Для пояснения основной идеи воспользуемся изображением (отверстием), взятым с сайта NVIDIA.

Из изображения видно, что понятие ИИ — это общее понятие ОД, которое, в свою очередь, является более общим понятием ДО. Но не только. Фактически, как мы видим, первые алгоритмы глубокое обучение они родились чуть более 10 лет назад, в отличие от искусственного интеллекта, который родился примерно в 50-х годах с первыми языками, такими как LISP и PROLOG, с целью имитации возможностей человеческого интеллекта.

Первые алгоритмы искусственного интеллекта ограничивались выполнением определенного возможного количества действий по определенной логике, заданной программистом (как в игре в шашки или шахматы).

Через обучение с помощью машины, искусственный интеллект развивался посредством так называемых алгоритмов обучения с учителем и без учителя с целью создания математических моделей автоматического обучения на основе большого количества входных данных, составляющих «опыт» искусственного интеллекта.

В обучении с учителем для создания модели необходимо обучить ИИ, назначив метку каждому элементу: например, если я хочу классифицировать фрукты, я сфотографирую много разных яблок и назову модель «яблоком». так для груши, банана и т.д.

При неконтролируемом обучении процесс будет обратным: модель должна быть создана, исходя из различных изображений фруктов, и модель должна будет извлекать этикетки в соответствии с характеристиками, общими для яблок, груш и бананов.

Модели обучение с помощью машины уже используются в антивирусах, спам-фильтрах, а также в области маркетинга, например, в продуктах, предлагаемых Amazon.

Пример спам-фильтра

Идея спам-фильтра электронной почты состоит в том, чтобы обучить модель, которая «учится» на сотнях тысяч (если не миллионах) электронных писем, помечая каждое письмо как спам или легитимный. После обучения модели операция классификации включает в себя:

Извлечение специфических характеристик (называемых функциями), таких как, например, слова текста, отправитель электронной почты, исходный IP-адрес и т. д.

Рассмотрите «вес» для каждой извлеченной функции (например, если в тексте 1000 слов, некоторые из них могут быть более разборчивыми, чем другие, такие как слово «виагра», «порно» и т. д., они будут иметь другой вес. чем доброе утро, университеты и т.д.)

Выполнение математической функции, которая, принимая в качестве входных признаков (слова, отправитель и т. д.) и их соответствующие веса, возвращает числовое значение.

Проверьте, находится ли это значение выше или ниже определенного порога, чтобы определить, является ли электронное письмо законным или считаться спамом (классификация).

Искусственные нейроны

Приходите Глубокое обучение является филиалом обучение с помощью машины. Разница с обучение с помощью машины это вычислительная сложность, которая приводит в действие огромные объемы данных с «многослойной» структурой обучения, состоящей из искусственных нейронных сетей. Чтобы понять эту концепцию, мы начнем с идеи воспроизведения одного человеческого нейрона, как показано на рисунке ниже.

Как было показано ранее для машинного обучения, у нас есть ряд входных сигналов (слева от изображения), которым мы присваиваем разные веса (Wk), добавляем когнитивное «смещение» (bk), которое является своего рода искажением, и, наконец, применяем функция активации, т. е. математическая функция, такая как сигмовидная функция, гиперболический тангенс, ReLU и т. д. который, взяв ряд взвешенных входных данных и принимая во внимание смещение, возвращает результат (yk).

Это единственный искусственный нейрон. Чтобы создать нейронную сеть, выходы одного нейрона соединяются с одним из входов следующего нейрона, образуя плотную сеть соединений, как показано на рисунке ниже, который представляет фактическую Глубокая нейронная сеть.

Глубокое обучение

Как видно из рисунка выше, у нас есть набор входных данных, которые должны быть переданы в нейронную сеть (входной слой), затем промежуточные уровни, называемые скрытыми слоями, которые представляют «слои» модели, и, наконец, выходной уровень, способный различать ( или узнавать) один объект над другим. Мы можем думать о каждом скрытом слое как о способности к обучению: чем больше количество промежуточных слоев (т. е. чем глубже модель), тем точнее будет понимание, но и тем сложнее будут выполняться вычисления.

Обратите внимание, что выходной слой представляет собой набор выходных значений с определенной долей вероятности, например 95% яблоко, 4,9% груша и 0,1% банан и так далее.

Давайте представим модель DL в области компьютерное зрение: первый слой способен распознавать края объекта, второй слой, начинающийся с краев, может распознавать формы, третий слой, начинающийся с форм, может распознавать сложные объекты, состоящие из нескольких форм, четвертый слой, начинающийся с сложных форм, может узнавать детали и так далее. При определении модели нет точного количества скрытый слой, но ограничение накладывается мощностью, необходимой для обучения модели за определенное время.

Не вдаваясь в подробности, цель обучения нейронной сети состоит в вычислении всех весов и смещений, которые должны применяться ко всем отдельным нейронам, присутствующим в модели: поэтому очевидно, что сложность возрастает экспоненциально по мере увеличения промежуточного значения. слои увеличиваются (скрытый слой). По этой причине процессоры графических карт (GPU) использовались для обучение: эти карты подходят для более требовательных рабочих нагрузок, поскольку, в отличие от ЦП, они могут выполнять тысячи операций параллельно с использованием архитектур SIMD (Single Instruction Multiple Data), а также современных технологий, таких как Тензорное ядро которые позволяют выполнять матричные операции аппаратно.

Приложения глубокого обучения

Обрабатывая огромные объемы данных, эти модели обладают высокой устойчивостью к ошибкам и помехам, несмотря на неполные или неточные данные. Поэтому теперь они обеспечивают фундаментальную поддержку во всех областях науки. Давайте посмотрим на некоторые из них.

Классификация изображений и безопасность

В случае преступлений он позволяет распознавать лицо, начиная с изображения, снятого камерой наблюдения, и сравнивая его с базой данных из миллионов лиц: эта операция, выполняемая человеком вручную, может занять дни, если не месяцы или даже годы. Более того, путем реконструкции изображений некоторые модели позволяют раскрашивать недостающие части одного и того же с точностью, близкой к 100% от исходного цвета.

Обработка естественного языка

Способность компьютера понимать письменный и устный текст так же, как люди. Среди самых известных систем Alexa и Siri способны не только понимать, но и отвечать на вопросы разного характера.

Другие модели умеют делать анализ настроений, всегда используя системы извлечения и мнения из текста или слов.

Медицинские диагнозы

В области медицины эти модели теперь используются для постановки диагноза, включая анализ КТ или МРТ. Результаты, которые в выходном слое имеют достоверность 90-95%, в ряде случаев позволяют прогнозировать терапию пациента без вмешательства человека. Имея возможность работать 24 часа в сутки, каждый день, они также могут оказывать поддержку на этапе сортировки пациентов, что значительно сокращает время ожидания в отделении неотложной помощи.

Автономное руководство

Системы автономного вождения требуют постоянного мониторинга в режиме реального времени. Более продвинутые модели предусматривают транспортные средства, способные управлять любой дорожной ситуацией независимо от водителя, чье присутствие на борту не предусмотрено, обеспечивая присутствие только перевозимых пассажиров.

Прогнозы и профилирование

Финансовые модели глубокого обучения позволяют нам строить гипотезы о будущих рыночных тенденциях или знать риск неплатежеспособности учреждения более точно, чем люди могут сделать сегодня с помощью интервью, исследований, анкет и расчетов вручную.

Эти модели, используемые в маркетинге, позволяют нам узнать вкусы людей, чтобы предлагать новые продукты, например, на основе ассоциаций, созданных с другими пользователями, имеющими аналогичную историю покупок.

Адаптивные эволюции

На основе загруженного «опыта» модель может адаптироваться к ситуациям, возникающим в окружающей среде или из-за действий пользователя. Адаптивные алгоритмы вызывают обновление всей нейронной сети на основе новых взаимодействий с моделью. Например, давайте представим, как YouTube предлагает видео определенной темы в зависимости от периода, адаптируясь день за днем ​​и месяц за месяцем к нашим новым личным вкусам и интересам.

Наконец, Глубокое обучение это область исследований, которая все еще находится в стадии активного расширения. Университеты также обновляют свои учебные программы по этому предмету, который по-прежнему требует прочной математической базы.

Преимущества применения ДО в промышленности, научных исследованиях, здравоохранении и повседневной жизни несомненны.

Однако мы не должны забывать, что это должно дать человеку опору и что только в некоторых ограниченных и очень специфических случаях это может заменить человека. На сегодняшний день фактически не существует моделей «общего назначения», способных решать любые задачи.

Другим аспектом является использование этих шаблонов в незаконных целях, таких как создание видеороликов. DeepFake (см. статью), т. е. методы, используемые для наложения других изображений и видео на оригинальные изображения или видео с целью создания поддельных новостей, мошенничества или порномести.

Еще одним незаконным способом использования этих моделей является создание ряда методов, направленных на компрометацию компьютерной системы, таких как состязательное машинное обучение. С помощью этих методов можно вызвать неправильную классификацию модели (и, таким образом, заставить модель сделать неправильный выбор), получить информацию об используемом наборе данных (вызывая проблемы с конфиденциальностью) или клонировать модель (вызывая проблемы с авторскими правами).

Ссылки

https://blogs.nvidia.com/blog/2016/07/29/whats-difference-artificial-int...

https://it.wikipedia.org/wiki/Lisp

https://it.wikipedia.org/wiki/Prolog

https://it.wikipedia.org/wiki/Apprendimento_supervisionato

https://www.enjoyalgorithms.com/blog/email-spam-and-non-spam-filtering-u...

https://foresta.sisef.org/contents/?id=efor0349-0030098

https://towardsdatascience.com/training-deep-neural-networks-9fdb1964b964

https://hemprasad.wordpress.com/2013/07/18/cpu-vs-gpu-performance/

https://it.wikipedia.org/wiki/Analisi_del_sentiment

https://www.ai4business.it/intelligenza-artificiale/auto-a-guida-autonom...

https://www.linkedin.com/posts/andrea-piras-3a40554b_deepfake-leonardodi...

https://arxiv.org/abs/1712.03141