Я попробовал Gemini для своей электронной почты. Вот почему я этому не доверяю

За последние три месяца я экспериментировал с тремя стеками ИИ, каждый из которых стоит 20 долларов в месяц за базовый уровень. Я начал с ChatGPT Plus, затем перешел на Perplexity Pro и, наконец, поверил обещаниям Gemini Advanced. Я придерживался последнего дольше всего, в первую очередь из-за его глубокой интеграции с другими продуктами Google, такими как Gmail и Docs, которые являются неотъемлемой частью моего рабочего процесса.

Мой путь с Gemini не был таким уж славным, и, как и большинство конкурирующих продуктов генеративного искусственного интеллекта, он столкнулся с изрядной долей сбоев. Проблемы с неточностями стали настолько серьезными, что главе Google Сундару Пичаи пришлось извиняться за них. Исследователи также независимо продемонстрировали, как им можно манипулировать для создания вводящего в заблуждение контента, утечки конфиденциальных данных и даже выполнения вредоносных задач. Давайте на мгновение предположим, что это сбои высокого уровня и что средний пользователь, скорее всего, не столкнется с такими проблемами.

Google продвигает Gemini как более функциональную альтернативу Google Assistant. Однако реальность иная. Я заставлял Близнецов преимущественно выполнять базовые задачи, такие как ускорение работы с почтовым ящиком, управление календарным расписанием и просто слежение за действиями в рабочем пространстве. Однако скорость, с которой он предоставлял совершенно вводящую в заблуждение информацию — для чего требовался просто просмотр моих собственных данных вместо обширного поиска в Интернете — заставила меня усомниться в надежности Gemini и в том, можно ли ей доверять что-либо, выходящее за рамки обычных обязанностей чат-бота.

Спотыкаясь на собственном заднем дворе

Gmail был моей первой испытательной площадкой для экспериментов с Gemini в надежде интегрировать его в свой рабочий процесс. Однако я обнаружил, что он может откровенно лгать. Как видно на изображении выше, я спросил Gemini о статусе моей последней посылки FedEx. Он собрал информацию о поставках за прошлый год, но не смог уловить ни одной детали из более чем двух десятков писем от FedEx в моем почтовом ящике, все из которых поступили в течение одной недели.

Информация, которую он предоставлял в окне чата, хотя и устарела, не была неточной, вплоть до номера отслеживания. Там, где он не попал в цель, я уверенно сообщил мне, что «последнее обновление для вашего пакета FedEx» было таможенным оформлением примерно три месяца назад, а не серией свежих обновлений, которые поступали всего три минуты назад с частотой не менее трех электронных писем в день. , датируемый как минимум неделей.

Точно так же я спросил Близнецов о «последней записи в Календаре». Вместо того, чтобы рассказать мне о трех встречах, которые я закрыл на второй неделе января, он просто ответил: «Я не вижу никаких событий в вашем календаре». Это не только контекстуально неточный ответ, но и совершенно неправильный, потому что вместо того, чтобы смотреть на «недавние» события, Близнецы пытались найти события в будущем.

Записи моего календаря по своей сути привязаны к моему почтовому ящику. Я отправляю и получаю приглашения Google Meet непосредственно через панель входящих сообщений. Просто удивительно, что, несмотря на то, что в мобильных и настольных версиях Gemini он широко представлен как отдельный инструмент, ИИ может ошибаться в таких простых вопросах, как проверка событий, и вместо этого идти в противоположном направлении и менять контекст запроса.

Будет ли это? Не так ли?

Gemini интегрируется с другими приложениями Google Workspace (и их данными) через систему расширений. Аналогичный конвейер существует и для перекрестных помех с другими приложениями, такими как WhatsApp. Тем не менее, этот опыт оставляет много возможностей для совершенствования. На самом деле, поцарапайте это. Иногда Близнецы могут быть до ярости тупыми, несмотря на то, что Google рекламирует свои возможности естественного языка как одни из лучших.

Начнем с самого базового уровня. Подобно приложениям чата, где вы можете использовать ярлык «@» для обращения к человеку или группе, Gemini также использует тот же ярлык для выбора правильной платформы Workspace для выполнения работы. Ну, похоже, это не работает даже для самых простых запросов. Более того, различия в понимании на разных платформах только усугубляют ситуацию.

Я вызвал Близнеца и попросил передать «привет» моей сестре. Я даже использовал ярлык «@» и выбрал Gmail в качестве места назначения для выполнения задачи. Искусственный интеллект-помощник просто отказался сделать это в приложении Gemini для iPhone, хотя несколько минут назад оно работало прекрасно, извлекая мельчайшие подробности из длинной цепочки Gmail об исследовательской работе. В приложении для Android Близнецы просто не могли решить, что делать.

В течение нескольких минут его ответы развернулись на 180 градусов. При первой попытке он спросил меня, о какой «Сабе» из моего почтового ящика я говорю, прежде чем сообщение можно было отправить. Со второй попытки, используя ту же самую подсказку, Близнецы категорически отвергли эту работу, сославшись на неспособность ее выполнить. Кроме того, дополнительная информация об истории общения, которую он предоставил, была совершенно ложной.

Не получается даже в основах

На данный момент попытка выполнить даже самые простые задачи с помощью Gemini — это все равно, что играть в игру с искусственным интеллектом, в которой вам также придется изучать страницы поддержки, чтобы проверить, будет ли Gemini работать на вашем телефоне. Весьма досадно, что, несмотря на оплату 20 долларов в месяц, Gemini не способен выполнить такую ​​простую задачу, как позвонить. На телефоне Android я смог позвонить с помощью простой команды «Позвонить XYZ @Phone».

В iOS приложение Gemini не поддерживает расширение «@Phone», позволяющее совершать звонки. Хорошо, давайте на мгновение предположим, что Apple никогда не разрешит доступ ИИ к приложению «Телефон» по соображениям конфиденциальности и безопасности. Кроме того, у Apple уже есть готовый новый аватар Siri, созданный на базе технологического стека OpenAI, поэтому имеет смысл оставить такие фундаментальные возможности привязанными к собственному помощнику.

А как насчет сторонних коммуникационных платформ, таких как WhatsApp? Что ж, возможность отправлять текстовые сообщения в WhatsApp ограничена Android, где вы можете свободно использовать ярлык «@Whatsapp» в чат-боте. В приложении для iOS у вас нет такой роскоши. Черт возьми, даже расширение «@Gmail» возвращает ответ «Я не могу вам с этим помочь».

Это не маленькие неудачи. Если помощник Google не может выполнить даже такую ​​простую задачу, как отправка электронного письма, и сталкивается с воротами платформы даже со сторонними приложениями, нет смысла платить 20 долларов за Gemini из-за пустых обещаний беспрепятственного доступа к Workspace и совместной работы.