Почему Siri не знает того, чего она не знает?

ТопМоб

Как исследователь, изучающий развитие детей, я считаю, что крайне важно признавать, когда у меня нет ответа как у родителя. Может показаться привлекательным подделывать ответы, чтобы поддерживать их восприятие моей всезнающей натуры, но в конечном итоге это может привести к осложнениям, когда они узнают правду с помощью таких ресурсов, как Google. Например, они могут в конечном итоге узнать, что президент Кубы не Фрай Бентос, что подорвет доверие и открытость в наших отношениях.

В то время как некоторые люди могут открыто говорить о своем незнании, другие, как Siri, часто стремятся взяться за задачи, даже когда не уверены. Например, если вы попросите свой HomePod воспроизвести песню слабым голосом, вместо того, чтобы вежливо попросить повторить, он, как правило, воспроизведет что-то наугад.

За последние несколько лет я выражал свою обеспокоенность по поводу Siri, но, похоже, за это время не было сделано никаких существенных улучшений. Появление Apple Intelligence, как говорили, принесло улучшенную и обновленную версию Siri, однако это, похоже, не относится к устройствам HomePod, и даже на моделях iPhone, оснащенных Apple Intelligence, не наблюдается большей точности; вместо этого кажется, что ответы предоставляются с более высоким уровнем уверенности, хотя они все еще могут быть неточными.

Неделю назад One Foot Tsunami попыталась использовать Siri, чтобы узнать, кто выиграл каждый Суперкубок, задача, которая казалась простой. Однако результаты были одновременно забавными и пугающе неверными. Процент успеха составил всего 34%, причем по крайней мере один правильный ответ был дан по неправильной причине. Например, когда ее спросили о Суперкубке X, Siri продолжила о Суперкубке IX, в котором был тот же победитель. В какой-то момент она дала 15 последовательных неправильных ответов. Чтобы добавить путаницы, она заявила, что Philadelphia Eagles выиграли 33 игры вместо своей фактической единственной победы.

Не так уж важно, чтобы голосовые помощники или искусственный интеллект, стоящий за ними, давали ответы на спортивные вопросы, но важно, чтобы они признавали, когда у них нет правильного ответа. Этот принцип важен, потому что если кто-то спрашивает о чем-то более важном, например, о правильном моменте затяжки гаек для Nissan Frontier 2015 года, предоставление неверной информации может привести к нежелательным результатам. Однако в этом случае, когда темой были спортивные вопросы, никакого реального вреда не было, поскольку это не были важные знания.

По общему признанию, одним из ограничений ИИ является его неспособность распознавать, когда он чего-то не знает, поскольку он просто определяет закономерности, не понимая их значения. Это отсутствие понимания делает его неспособным проверить действительность факта, который человек может немедленно определить как абсурдный. Однако было бы полезно, если бы разработчики ИИ рассмотрели возможность внедрения механизмов для передачи уровня уверенности модели в ее ответах. Это может включать такие факторы, как объем и качество данных, используемых для обучения по определенной теме, или процент похожих запросов, которые получили положительные отзывы.

На мой взгляд, общего отказа от ответственности недостаточно. Получив отзывы о запутанных сводках уведомлений, Apple решила изменить работу Apple Intelligence в этой области. Однако первоначальные корректировки сосредоточены на том, как отображается информация, а не на самой информации. Например, теперь есть более заметная метка, сообщающая, что функция все еще находится в стадии бета-тестирования и может содержать ошибки. Кроме того, обобщенный текст отображается курсивом, чтобы отличать его от обычных уведомлений. Хотя это изменение может помочь на начальном этапе из-за своего особого формата, в конечном итоге оно может слиться с фоном, как отказы от ответственности в результатах ИИ Google, которые призваны предотвратить судебные иски, связанные с неверной информацией о крутящем моменте. Вместо этого нам нужен конкретный отказ от ответственности для отдельных результатов, который предупреждает о потенциальных проблемах («этот продукт содержит орехи»), а не широкий отказ от ответственности, который подразумевает, что все результаты имеют схожие проблемы («все продукты, производимые этой компанией или ее дочерними компаниями, могут содержать орехи»).

В настоящее время ИИ переживает период повышенного интереса, когда различные субъекты соревнуются за получение общественного расположения. В настоящее время их основное внимание сосредоточено на связях с общественностью (PR), что объясняет, почему они могут преувеличивать возможности своих продуктов и отказываться признавать какие-либо ограничения. Однако Apple, больше, чем кто-либо другой, должна понимать, что репутация формируется постепенно и может быть легко испорчена. Разумнее честно признать невежество, чем уверенно предоставлять неверную информацию. Фраза, которую я больше всего надеюсь услышать от Siri, это: «Извините, Дэйв. Я не могу выполнить эту задачу.

Присоединяйтесь к нам каждую неделю для нашего сегмента Apple Breakfast Segment, краткого и удобного обзора последних новостей Apple, которые вы могли пропустить. Мы прозвали его «Apple Breakfast», поскольку считаем, что он отлично сочетается с вашим утренним кофе или чаем в понедельник; однако, не стесняйтесь смотреть его в любое время в течение дня!

В тренде: Главные новости

Если Apple Intelligence настолько хорош, почему Apple не доверяет нам его включение?

Махмуд Итани напоминает нам всем о 6 забытых продуктах Apple, которые получат обновление в этом году.

Объединяйтесь с Apple на свой страх и риск.

На презентации Galaxy S25 стало очевидно, что Samsung неоднократно черпала вдохновение у Apple.

Новый магазин Apple в Майами выводит углеродную нейтральность на новый уровень.

Пользователи iPhone в Великобритании вскоре смогут хранить цифровые лицензии и удостоверения личности.

Подкаст недели

Спекуляции о предстоящем важном запуске iPhone от Apple усиливаются. В последнем выпуске подкаста TopMob мы углубимся в последние разработки, касающиеся iPhone SE, а также в потенциальные обновления, которые мы можем увидеть в ближайшие дни.

У вас есть несколько вариантов доступа к каждому эпизоду подкаста TopMob, включая Spotify, Soundcloud, приложение Podcasts или наш официальный сайт.

Уголок отзывов

  • Обзор Microsoft Word для Mac: что нового в Word 2024?
  • Обзор Microsoft Excel: что нового в Excel 2024?
  • Обзор Apple Passwords: бесплатный и простой менеджер паролей.
  • Обзор pCloud: Резервное копирование данных вашего Mac в облако.

Мельница слухов

Утечка воздуха iPhone 17 демонстрирует новый дизайн «панели камеры».

Новая утечка меняет все, что мы знаем об iPhone SE 4.

Обновления программного обеспечения, ошибки и проблемы

Не любите новое приложение Mail на вашем iPhone? Вот как вернуть его обратно.

Начиная с этой недели вам придется отключить Apple Intelligence, если он вам не нужен.

Пользователи Mac наконец-то получат более умное приложение «Почта» в macOS 15.4.

Обновление AirPods Pro 2 выйдет «в ближайшие недели» и расширит функции слухового аппарата.

Подводим итоги Apple Breakfast этой недели! Если вы хотите получать еженедельные обновления, не забудьте подписаться на наши рассылки. Вы также можете оставаться на связи с нами на Facebook, Threads или Twitter, где мы обсуждаем последние новости Apple по мере их появления. Мы снова встретимся в следующий понедельник, а пока оставайтесь с нами и будьте в стиле Apple!

Смотрите также

2025-01-27 14:02