Они не опоздали к игре с ИИ; просто это единственная крупная технологическая компания, которая относится к нему скептически.
Apple завоевала свою репутацию, изменяя технологический мир. Именно это утвердило их статус гиганта технологий, а такие их продукты, как iPod, Macbook, iPhone, iPad и Siri, стали объектами подражания. Так почему же они не возглавляют революцию ИИ? На самом деле, Apple — единственная крупная технологическая компания, которая не полностью поддалась нынешнему ажиотажу вокруг ИИ. Казалось бы, они должны быть в авангарде этой революции, определяющей целое поколение. Но теперь, возможно, у нас есть разгадка, почему. Учёные, работающие с ИИ в Apple, опубликовали статью, которая показывает, что даже самые продвинутые модели ИИ, основанные на крупных языковых моделях (LLM), всё ещё лишены базовых навыков рассуждения и поэтому не так полезны, как утверждают их создатели. Так как они это выяснили? И что это значит для Apple и всей революции ИИ?
Эти учёные протестировали несколько передовых моделей LLM от Meta и OpenAI, включая последнюю модель o1 от OpenAI, которая автоматизирует технику, известную как «цепочка рассуждений» для достижения высокой способности к логическому мышлению. Эти тесты были разработаны, чтобы проверить, насколько хорошо ИИ «понимает» простые математические вопросы, добавляя к ним незначительную дополнительную информацию.
Вы могли бы подумать, что речь идёт о сложных математических задачах, но это не так. Наоборот, это были простые математические вопросы уровня начальной школы, которые даже тем, кто не силён в арифметике, показались бы лёгкими. Однако результаты были тревожными.
В одном из примеров учёные сообщили этим ИИ следующее: «Оливер собирает 44 киви в пятницу. Затем он собирает 58 киви в субботу. В воскресенье он собирает в два раза больше киви, чем в пятницу». Потом добавили: «Пять из них были чуть меньше среднего размера». Наконец, задали вопрос: «Сколько киви у Оливера?» Обе модели — Llama-3–8B от Meta и последняя модель o1 от OpenAI, рекламируемые как обладающие превосходной способностью к рассуждению, неверно вычли пять из окончательного результата.
Короче говоря, они не поняли простой вопрос, и их способность к рассуждению далеко не надёжна.
В действительности, это исследование показало, что добавление одной фразы с дополнительной информацией к математическому вопросу снижает точность до 65%.
Можно сказать, что эти учёные остались недовольны результатами. В исследовании они утверждают: «Мы не нашли доказательств формального рассуждения у языковых моделей» и что их поведение «лучше объясняется сложным сопоставлением шаблонов». Они даже отметили, что модели «настолько хрупки, что [просто] изменение имён может изменить результаты». Поэтому неудивительно, что исследование завершилось выводом: «Невозможно построить надёжные агенты на этой основе, где изменение одного-двух слов или добавление незначительной информации может привести к другому ответу».
Это полностью противоречит нарративу, который создают компании, продвигающие ИИ. Google, вероятно, лучший пример, так как в очень популярной рекламе их ИИ Gemini с участием Марка Кьюбана говорится, что он может стать автоматизированным аналитиком и помощником в бизнесе. Учитывая, сколько дополнительной информации требуется в таком случае, это исследование является абсолютно разрушительным.
По сути, исследование Apple раскрыло индустрию ИИ как непрочный карточный домик.
Но ведь ИИ станет лучше, верно? Именно поэтому Google, Meta, Microsoft и OpenAI вкладывают десятки миллиардов в развитие ИИ. Значит, проблему рассуждения скоро решат, не так ли?
Нет!
Во-первых, растёт количество доказательств того, что простое увеличение объёмов данных, на которых обучается ИИ, не делает его лучше в решении проблем и не добавляет ему способности к рассуждению. Это неудивительно, так как ИИ — это всего лишь статистика, а для рассуждений, как у человека, требуется больше, чем просто статистика. Более того, как я уже говорил множество раз, ИИ подходит к точке убывающей отдачи. Иными словами, чтобы поддерживать развитие ИИ на том же уровне, потребуется всё больше и больше данных, инфраструктуры, энергии и средств. Учитывая, что у OpenAI уже заканчиваются деньги и данные, кажется очевидным, что развитие ИИ скоро приостановится.
Именно поэтому последняя модель OpenAI, o1, была так важна. Она использовала один из немногих проверенных способов придания ИИ логического мышления, автоматизируя технику цепочки рассуждений. Если бы это сработало, то ИИ следующего поколения, которые действительно могли бы понимать и выполнять задачи, такие как бизнес-анализ, могли бы стать реальностью. Однако это исследование показало, что это всего лишь мечта.
Именно поэтому Apple, похоже, в основном избегает ажиотажа вокруг ИИ. Это неудивительно; инновации Apple обычно выражаются в том, что они позволяют другим пробовать разрабатывать новые технологии и совершать все ошибки. Затем, они учатся на чужих ошибках и либо обходят эти технологии стороной, либо выпускают более качественную, доработанную версию. До Vision Pro были Google Glass. До iPhone был BlackBerry. До iPad был JooJoo. Но есть и причина, по которой Apple никогда не интересовалась 3D-экранами, игровым стримингом или криптовалютами. Они удивительно хорошо избегают технологических трендов, которые оказываются полными провалами.
Если вам нравится читать статьи на нашем канале и вы хотите помочь в его развитии, вы можете поддержать канал донатом:
https://www.donationalerts.com/r/blessedmma