Термин «AI Developer Experience» захвачен. Каждый IDE-плагин, который автодополняет вызов функции, теперь претендует на революцию в AI DX. Давайте будем точны в том, что этот термин должен означать.
Чем AI DX не является
AI DX — это не:
- Лучший автокомплит в вашем редакторе
- Чат-бот, отвечающий на вопросы о кодовой базе
- ИИ, пишущий тесты по описанию
- Копайлот, подсказывающий следующую строку
Это инструменты продуктивности. Они полезны. Но это не AI DX.
Что такое AI DX на самом деле
AI DX — это весь опыт разработки систем, где ИИ-агенты являются полноправными участниками. Он охватывает:
- Написание спеков — насколько легко объявить, что агент должен делать?
- Наблюдаемость — можете ли вы видеть, что агент думает, решает и делает?
- Отлаживаемость — когда что-то идёт не так, можете ли вы проследить причинную цепочку?
- Компонуемость — можете ли вы комбинировать агентов в более крупные воркфлоу, не теряя контроль?
- Петли обратной связи — как быстро вы можете итерировать поведение агента?
«Хороший AI DX означает, что инженеру никогда не приходится гадать, что сделает агент.»
Разрыв наблюдаемости
Самая большая проблема AI DX сегодня — разрыв наблюдаемости. Когда традиционная функция ломается, вы получаете стек-трейс. Когда ломается агент, вы получаете... неправильный результат.
// Традиционный код: ясная цепочка ошибок
function processOrder(order: Order): Result {
validate(order); // бросает ValidationError
calculate(order); // бросает CalculationError
submit(order); // бросает SubmissionError
}
// Агент: непрозрачный результат
async function agentProcessOrder(spec: OrderSpec): Promise<Result> {
// Что произошло внутри? Почему такой результат?
// Какие части спека повлияли на какие решения?
// Где рассуждения отклонились от намерения?
return agent.execute(spec);
}
Без ответов на эти вопросы отладка агентных систем — археология: вы реконструируете намерение по артефактам.
Пять слоёв наблюдаемости агентов
Слой 1: Трассировка входных данных
Что именно получил агент? Не просто спек, а разрешённый контекст, извлечённые документы, историю разговора.
Слой 2: Логирование решений
На каждой точке ветвления — какие варианты рассматривал агент и почему выбрал этот путь?
Слой 3: Карта уверенности
Для каждого выходного решения — насколько уверен был агент? Где он сомневался?
Слой 4: Скоринг соответствия спеку
Насколько результат соответствует каждому пункту спека? Оценка пункт за пунктом.
Слой 5: Поведенческий diff
Чем это выполнение отличается от предыдущих выполнений того же спека? Что изменилось и почему?
Перестройка цикла разработки
Традиционный dev loop: написать → запустить → увидеть ошибку → исправить → повторить.
Agent-first dev loop: спек → выполнить → наблюдать → уточнить спек → повторить.
Заметьте сдвиг. Вы не дебажите код. Вы уточняете намерение. Петля обратной связи — о качестве спека, а не о корректности реализации.
Это и есть AI DX. Это не фича. Это парадигма.
