ИИ

Почему «проблемы со временем» у GPT — это чаще про инфраструктуру, а не про модель

·2 min read

Самая обсуждаемая «глупость» GPT может оказаться вообще не багом модели. Иногда это просто признак того, что кто-то не доделал базовую инфраструктуру вокруг неё.

Вот видео, из-за которого в очередной раз разгорелась дискуссия:

https://www.youtube.com/watch?v=5VRgk7_X7oc

Откуда взялась история про «ощущение времени»

Я видел вирусный фрагмент интервью, где Сэм Альтман говорил про баг, связанный с «ощущением времени» у GPT. Это быстро разогнали как доказательство того, что «они не могут починить простейшую вещь даже за год».

Но, как по мне, история здесь немного о другом. Судя по свежим пересказам, речь как раз шла о проблеме: без нужного инструмента модель плохо опирается на время и может странно интерпретировать всё, что связано с датами, интервалами и порядком событий.

Нужно разделять модель и продукт

В этой теме важно разделять две вещи.

1) LLM не обязана «чувствовать время»

LLM сама по себе не обязана хорошо работать с временем. Посчитать интервал между сообщениями, понять текущую дату, определить, что было раньше, а что позже — это вообще не задача языковой модели.

Это задача инфраструктуры вокруг неё: таймеров, метаданных, системных полей, нормальной сортировки, календаря, логики в приложении. То, что в классическом софте давно считается «базой».

2) Пользователь воспринимает это как один продукт

Когда люди пользуются ChatGPT или любой другой LLM как готовым продуктом, они не думают категориями «это не проблема модели, это проблема отсутствия tool calling».

Для пользователя это один продукт. И если он путается во времени — значит продукт в этом месте недоделан. И пользователь по-своему прав.

С чем мы сталкивались при проектировании AI-продуктов

Мы с этим тоже сталкивались, когда проектировали свои AI-штуки. Очень быстро выясняется, что модели часто не хватает банальных вещей:

  • какой сейчас день;
  • какое сообщение свежее;
  • какое старое;
  • сколько прошло времени;
  • в каком порядке реально происходили события.

И это хорошо отрезвляет.

«Магические» проблемы часто лечатся не новой моделью

В какой-то момент понимаешь: многие «магические» проблемы AI решаются не новой моделью, а нормальной обвязкой вокруг неё.

Таймером. Метаданными. Сортировкой. Логикой. Простыми техническими костылями — без которых продукт начинает выглядеть умнее, чем он есть на самом деле, а затем внезапно «тупит» на базовых сценариях.

Мораль

Для меня мораль здесь не в том, что «Сэм ошибся». Со всеми бывает.

Мораль в другом: очень часто узкое место AI‑продукта находится не в самой модели, а в самых приземлённых инженерных деталях вокруг неё.

Опубликовано в Telegram
#LLM#ChatGPT#Инженерия#AI-продукты
ПоделитьсяX
Alex Meleshko

Alex Meleshko

Entrepreneur, CEO, and builder at the intersection of blockchain, AI, and startups.

Похожие статьи

Голос как новый интерфейс к AI: быстрее, чем печатать, но не без рисков
ИИ

Голос как новый интерфейс к AI: быстрее, чем печатать, но не без рисков

Клавиатура начинает проигрывать скорости мысли, и voice‑prompting превращается в отдельный рабочий слой между идеей и готовым текстом. Разбираю, почему это стало возможным сейчас и где проходит граница между удобством, приватностью и доверием.

·3 min read
FreeBlock AI: как мы автоматизируем работу PM и сохраняем контекст проектов с помощью AI
ИИ

FreeBlock AI: как мы автоматизируем работу PM и сохраняем контекст проектов с помощью AI

Внутри FreeBlock мы начали разрабатывать FreeBlock AI — систему, которая собирает весь контекст проекта в одном месте и помогает команде работать быстрее, не теряя договоренности и историю решений.

·2 min read
Реальный кейс ChatGPT: как я ускорил аудит смарт‑контракта на Solidity
ИИ

Реальный кейс ChatGPT: как я ускорил аудит смарт‑контракта на Solidity

Делюсь практическим кейсом: как я использовал ChatGPT, чтобы быстро подготовить описание функций смарт‑контракта для аудита децентрализованного приложения и сэкономить часы рутинной работы.

·2 min read