CatoCut

Термин «AI Developer Experience» захвачен. Каждый IDE-плагин, который автодополняет вызов функции, теперь претендует на революцию в AI DX. Давайте будем точны в том, что этот термин должен означать.

Чем AI DX не является

AI DX — это не:

Лучший автокомплит в вашем редакторе
Чат-бот, отвечающий на вопросы о кодовой базе
ИИ, пишущий тесты по описанию
Копайлот, подсказывающий следующую строку

Это инструменты продуктивности. Они полезны. Но это не AI DX.

Что такое AI DX на самом деле

AI DX — это весь опыт разработки систем, где ИИ-агенты являются полноправными участниками. Он охватывает:

Написание спеков — насколько легко объявить, что агент должен делать?
Наблюдаемость — можете ли вы видеть, что агент думает, решает и делает?
Отлаживаемость — когда что-то идёт не так, можете ли вы проследить причинную цепочку?
Компонуемость — можете ли вы комбинировать агентов в более крупные воркфлоу, не теряя контроль?
Петли обратной связи — как быстро вы можете итерировать поведение агента?

«Хороший AI DX означает, что инженеру никогда не приходится гадать, что сделает агент.»

Разрыв наблюдаемости

Самая большая проблема AI DX сегодня — разрыв наблюдаемости. Когда традиционная функция ломается, вы получаете стек-трейс. Когда ломается агент, вы получаете... неправильный результат.

// Традиционный код: ясная цепочка ошибок
function processOrder(order: Order): Result {
  validate(order);    // бросает ValidationError
  calculate(order);   // бросает CalculationError  
  submit(order);      // бросает SubmissionError
}

// Агент: непрозрачный результат
async function agentProcessOrder(spec: OrderSpec): Promise<Result> {
  // Что произошло внутри? Почему такой результат?
  // Какие части спека повлияли на какие решения?
  // Где рассуждения отклонились от намерения?
  return agent.execute(spec);
}

Без ответов на эти вопросы отладка агентных систем — археология: вы реконструируете намерение по артефактам.

Пять слоёв наблюдаемости агентов

Слой 1: Трассировка входных данных

Что именно получил агент? Не просто спек, а разрешённый контекст, извлечённые документы, историю разговора.

Слой 2: Логирование решений

На каждой точке ветвления — какие варианты рассматривал агент и почему выбрал этот путь?

Слой 3: Карта уверенности

Для каждого выходного решения — насколько уверен был агент? Где он сомневался?

Слой 4: Скоринг соответствия спеку

Насколько результат соответствует каждому пункту спека? Оценка пункт за пунктом.

Слой 5: Поведенческий diff

Чем это выполнение отличается от предыдущих выполнений того же спека? Что изменилось и почему?

Перестройка цикла разработки

Традиционный dev loop: написать → запустить → увидеть ошибку → исправить → повторить.

Agent-first dev loop: спек → выполнить → наблюдать → уточнить спек → повторить.

Заметьте сдвиг. Вы не дебажите код. Вы уточняете намерение. Петля обратной связи — о качестве спека, а не о корректности реализации.

Это и есть AI DX. Это не фича. Это парадигма.