Anthropic Claude‑комплекс из 16 ИИ‑агентов самодостаточно создал компилятор C.

Anthropic Claude‑комплекс из 16 ИИ‑агентов самодостаточно создал компилятор C.

21 software

Краткая версия

В рамках эксперимента компания Anthropic собрала группу 16 автономных агентов ИИ, которые совместно с нуля создали компилятор языка C на Rust. Результат – «чистая» реализация, которая умеет собирать ядро Linux 6.19 и компилировать такие проекты, как PostgreSQL, SQLite, Redis, FFmpeg и QEMU, но остаётся в значительной степени позади GCC по качеству и эффективности.


Как это было сделано

ЭтапЧто произошло
Подготовка16 экземпляров модели Claude Opus 4.6 запущены в отдельных Docker‑контейнерах без доступа к Интернету. Каждый из них клонирует общий репозиторий Git и получает задачи через lock‑файлы.
Самостоятельное планированиеНет центрального координатора: каждый агент сам определяет, какой «очевидный» кусок работы выполнить дальше. При конфликте слияния код объединяется автоматически.
РазработкаАгентам поручено написать компилятор C полностью с нуля. Работа продлилась 2 недели и потребовала почти 2000 сессий Claude Code.
ТестированиеЧтобы не «засорять» контекст модели длинными запросами, тесты запускаются в режиме сводки (только несколько строк вывода). Для ускорения добавлен быстрый режим обработки 1–10 % тестов.

Итоговый продукт

* Объём – около 100 000 строк Rust‑кода.
* Функциональность – может собрать ядро Linux 6.19 на x86, ARM и RISC‑V; компилирует PostgreSQL, SQLite, Redis, FFmpeg, QEMU; проходит ~99 % тестов GCC.
* Ограничения – не генерирует 16‑битный машинный код (для запуска Linux требуется GCC), ассемблер и линкер работают с ошибками, а производительность кода ниже, чем у GCC. Качество исходного Rust‑кода оставляет желать лучшего по сравнению с работой опытного программиста.


Что стоило эксперимента

ПоказательСтоимость
Токены Claude API~\$20 000
Дополнительные затраты (обучение модели, организация проекта, тестовые наборы)Не включены в указанную сумму

Уроки и выводы

1. Предел автономности – при росте кода до ~100 000 строк агенты перестают полностью понимать проект; это, по‑видимому, верхняя граница для самостоятельного ИИ.
2. Необходимость поддержки – попытки расширить функциональность часто ломали уже работающие части кода.
3. Важность среды разработки – изоляция от интернета и правильная настройка тестов оказались критичными для стабильной работы агентов.


Итог

Эксперимент показывает, что современные ИИ‑модели способны генерировать сложные программные системы с минимальным контролем. Однако они пока не могут полностью заменить опытных разработчиков: качество кода, производительность и надёжность остаются ниже, чем у традиционных компиляторов, а масштаб проекта ограничен до сотен тысяч строк. Это важный шаг вперёд, но ещё далеко от полноценной автономной разработки программного обеспечения.

Комментарии (0)

Оставьте отзыв — пожалуйста, будьте вежливы и по теме.

Пока нет комментариев. Оставьте комментарий — поделитесь своим мнением!

Чтобы оставить комментарий, войдите в аккаунт.

Войти, чтобы комментировать