Anthropic Claude‑комплекс из 16 ИИ‑агентов самодостаточно создал компилятор C.
Краткая версия
В рамках эксперимента компания Anthropic собрала группу 16 автономных агентов ИИ, которые совместно с нуля создали компилятор языка C на Rust. Результат – «чистая» реализация, которая умеет собирать ядро Linux 6.19 и компилировать такие проекты, как PostgreSQL, SQLite, Redis, FFmpeg и QEMU, но остаётся в значительной степени позади GCC по качеству и эффективности.
Как это было сделано
| Этап | Что произошло |
|---|---|
| Подготовка | 16 экземпляров модели Claude Opus 4.6 запущены в отдельных Docker‑контейнерах без доступа к Интернету. Каждый из них клонирует общий репозиторий Git и получает задачи через lock‑файлы. |
| Самостоятельное планирование | Нет центрального координатора: каждый агент сам определяет, какой «очевидный» кусок работы выполнить дальше. При конфликте слияния код объединяется автоматически. |
| Разработка | Агентам поручено написать компилятор C полностью с нуля. Работа продлилась 2 недели и потребовала почти 2000 сессий Claude Code. |
| Тестирование | Чтобы не «засорять» контекст модели длинными запросами, тесты запускаются в режиме сводки (только несколько строк вывода). Для ускорения добавлен быстрый режим обработки 1–10 % тестов. |
Итоговый продукт
* Объём – около 100 000 строк Rust‑кода.
* Функциональность – может собрать ядро Linux 6.19 на x86, ARM и RISC‑V; компилирует PostgreSQL, SQLite, Redis, FFmpeg, QEMU; проходит ~99 % тестов GCC.
* Ограничения – не генерирует 16‑битный машинный код (для запуска Linux требуется GCC), ассемблер и линкер работают с ошибками, а производительность кода ниже, чем у GCC. Качество исходного Rust‑кода оставляет желать лучшего по сравнению с работой опытного программиста.
Что стоило эксперимента
| Показатель | Стоимость |
|---|---|
| Токены Claude API | ~\$20 000 |
| Дополнительные затраты (обучение модели, организация проекта, тестовые наборы) | Не включены в указанную сумму |
Уроки и выводы
1. Предел автономности – при росте кода до ~100 000 строк агенты перестают полностью понимать проект; это, по‑видимому, верхняя граница для самостоятельного ИИ.
2. Необходимость поддержки – попытки расширить функциональность часто ломали уже работающие части кода.
3. Важность среды разработки – изоляция от интернета и правильная настройка тестов оказались критичными для стабильной работы агентов.
Итог
Эксперимент показывает, что современные ИИ‑модели способны генерировать сложные программные системы с минимальным контролем. Однако они пока не могут полностью заменить опытных разработчиков: качество кода, производительность и надёжность остаются ниже, чем у традиционных компиляторов, а масштаб проекта ограничен до сотен тысяч строк. Это важный шаг вперёд, но ещё далеко от полноценной автономной разработки программного обеспечения.
Комментарии (0)
Оставьте отзыв — пожалуйста, будьте вежливы и по теме.
Войти, чтобы комментировать