Бабушка в Алексе

(Ди Марко Роттинги)
07/07/22

Лично я очарован искусственным интеллектом, технологиями и тем, как они постепенно, но неумолимо проникают в нашу жизнь всепроникающим образом.

Улучшая их, конечно, иногда очень разрушительным образом, например… оживляя эмоции, связанные с людьми, которых больше нет.

В этих случаях важно критическое мышление: сама эта мысль заставляет нас оценивать эти воздействия, решать, хотим ли мы быть их частью, а также взвешивать потенциальные негативные аспекты. Это объясняет то увлечение, которое технологии вызывают у меня, как причину частых прозрений и моментов катарсиса.

Один из таких моментов произошел со мной несколько дней назад, после ре-ивента: MARS 2022. Кермессе об искусственном интеллекте, в которой гигант Amazon иллюстрирует миру свои исследования, эксперименты и инновации в области машинного обучения, автоматизации, робототехники и космос… применяется к настоящему и будущему бизнесу.

Само мероприятие увлекательное, полное идей и провокаций, со множеством именитых гостей, в том числе и со стороны. Речи этих гостей, известные на жаргоне как основные доклады, также доступны онлайн на YouTube для повторного просмотра публикой.

Основной доклад второго дня доступен по адресу https://www.youtube.com/watch?v=22cb24-sGhg, ровно через час и две минуты от начала меня поразил отрывок из Рохит Прасад - главный ученый Алекса АИ.

Я действительно хорошо подготовился к его контекстуализации: говоря об эмпатии между человеком и машиной как о чувстве, лежащем в основе построения доверительных отношений, он сосредоточился на том факте, что для многих из нас недавняя чрезвычайная ситуация с пандемией означала потерю любимый человек.

Alexa — часто символ этого технологического присутствия, даже если для простых разговоров — со временем развила навыки, от которых я был буквально поражен: очевидно, не такие, чтобы устранить боль этих потерь, но достаточные, чтобы обеспечить дальнейший способ сделать память людей более настойчивый уход.
Через несколько секунд видео меняется и показывает ребенка, который просит Алексу, чтобы его покойная бабушка прочитала ему отрывок из «Волшебника страны Оз», как он это делал при жизни.

Алекса отвечает «Окей» на просьбу немедленно перейти к идеальной имитации голоса дорогой бабушки, вызывая явно ощутимые эмоции у технологичного внука.

Затем видео возвращается к Рохиту, который сразу же объясняет две вещи, которые очень поразили меня своей новаторской силой: во-первых, только что увиденная возможность проистекает из изменения перспективы в способе анализа голоса; более конкретно, переместив анализ от проблемы генерации речи, т. е. воспроизведения звуковой фразы, к вопросу о преобразовании голоса.

Второй момент, тесно связанный с первым, касается того, как это изменение перспективы позволило воспроизвести только одну минуту существующей записи голоса по сравнению с часами студийной записи, которые потребовались бы при предыдущем подходе !!!

(Рохит Прасад на сцене re: MARS 2022)

Но я говорил сначала о необходимости критического мышления: вау моментна самом деле, я начал размышлять о некоторых аспектах.

Есть несколько онлайн-сервисов, в которых один из способов аутентификации состоит именно в произнесении предложения, чтобы доказать, что вы тот человек, за которого себя выдаете: понятно, что с такой технологией, которая тоже есть не только у Amazon, становится важно доверить надежность процесса аутентификации другим механизмам - конечно, менее поддающимся моделированию.

Голосовая биометрическая аутентификация, безусловно, является молодой технологией, которая, однако, быстро приобрела популярность из-за простоты использования и отсутствия дополнительных инструментов. Большая часть этой популярности связана с тем, что банковские и страховые услуги широко используют ее, хотя в последнее время в сочетании с другими механизмами для повышения общей эффективности процесса. В статье 2020 года комбинация многочастотных тонов телефонной клавиатуры была выдвинута как надежный процесс аутентификации в сочетании с фразой, записанной с голосом клиента, который необходимо было воспроизвести: само собой разумеется, что инновация, представленная Amazon, аннулирует эту силу, подвергая процесс аутентификации риску атак с использованием олицетворения. Атаки, при которых у злоумышленника есть все необходимые инструменты, чтобы действовать так, как если бы он был конечной жертвой, обманывая технологический объект, который должен удостоверить личность.

Еще один процесс, подверженный риску, — это процесс, который включает в себя контроль доступа, физического или виртуального, к работе по причинам ценообразования или проверки рабочего времени. Еще одна область, в которой злоумышленники могут значительно облегчить эти технологии синтеза речи.

Второе размышление немного более эмоциональное: как я сказал в начале, я нахожу эту возможность абсолютно увлекательной и новаторской; Я понимаю, однако, что для разных людей это может быть уже не источником положительных эмоций, а важным и труднопереносимым образом продлевать боль потери близкого человека.

Что ж, если и есть что-то, что отличает человека от техники, так это сознание, из которого берет начало свобода воли. История учит нас тщетности отрицания прогресса, науки и техники в пользу личных чувств и убеждений — правильных или неправильных. Вот почему я просто рекомендую, чтобы эти люди выбрали. Выбор игнорировать эту возможность, предлагаемую технологией, оставляя такое же право остальным людям.