Cognition, лаборатория прикладного ИИ, расположенная в Соединенных Штатах, представила то, что она называет первым в мире AI-софтверным инженером. Согласно словам его создателей, AI-агент по имени Devin успешно прошел практические инженерные собеседования, проводимые ведущими AI-компаниями.
Говорят, что Девин также выполнил реальные задания, размещенные на Upwork, американской платформе фриланса.
“Девин — неутомимый и квалифицированный член команды, готовый как строить вместе с вами, так и самостоятельно выполнять задачи для вашего рассмотрения. С Девином инженеры могут сосредоточиться на более интересных проблемах, а инженерные команды могут стремиться к более амбициозным целям,” говорится в официальном блоге компании.
!
Искусственный агент оснащён продвинутыми возможностями в разработке программного обеспечения, включая кодирование, отладку, решение проблем и многое другое. Девин использует алгоритмы машинного обучения для постоянного обучения и повышения своей производительности, адаптируясь к новым вызовам по мере их появления. Проще говоря, Девин может строить и реализовывать приложения от начала до конца, а также обучать и улучшать свои собственные модели ИИ.
Девин способен планировать и выполнять сложные инженерные задачи, которые обычно требуют тысячи решений. Эта способность стала возможной благодаря достижениям Cognition в области долгосрочного мышления и планирования. Согласно компании, Девин может извлекать соответствующий контекст на каждом этапе, учиться автономно со временем и исправлять ошибки по мере необходимости.
На бенчмарке SWE-Bench (, который используется для оценки крупных языковых моделей по реальным программным проблемам, найденным на GitHub), Девин правильно решил 13.86 процентов проблем без какой-либо помощи по сравнению с 1.96 процента без помощи и 4.80 процента с помощью предыдущей модели, являвшейся наилучшей на тот момент.
Хотя компания подробно описала возможности Девина, некоторые эксперты выражают опасения, что ИИ-программист может столкнуться с трудностями в сложных требованиях или сценариях, которые зависят от человеческой интуиции и креативности. Кроме того, инструменты ИИ, такие как Девин, вызывают опасения по поводу потенциальной замены рабочих мест.
Тем не менее, некоторые люди считают, что Девин мог бы стать ценным партнером для многочисленных программистов, открывая новые возможности для сотрудничества между человеческим творчеством и ИИ.
Следите за нами в Twitter, чтобы получать последние сообщения и обновления
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
ПРЕДСТАВЛЯЕМ | Первый в мире AI программист, Девин, завершил реальные задания на Upwork
Cognition, лаборатория прикладного ИИ, расположенная в Соединенных Штатах, представила то, что она называет первым в мире AI-софтверным инженером. Согласно словам его создателей, AI-агент по имени Devin успешно прошел практические инженерные собеседования, проводимые ведущими AI-компаниями.
Говорят, что Девин также выполнил реальные задания, размещенные на Upwork, американской платформе фриланса.
“Девин — неутомимый и квалифицированный член команды, готовый как строить вместе с вами, так и самостоятельно выполнять задачи для вашего рассмотрения. С Девином инженеры могут сосредоточиться на более интересных проблемах, а инженерные команды могут стремиться к более амбициозным целям,” говорится в официальном блоге компании.
!
Искусственный агент оснащён продвинутыми возможностями в разработке программного обеспечения, включая кодирование, отладку, решение проблем и многое другое. Девин использует алгоритмы машинного обучения для постоянного обучения и повышения своей производительности, адаптируясь к новым вызовам по мере их появления. Проще говоря, Девин может строить и реализовывать приложения от начала до конца, а также обучать и улучшать свои собственные модели ИИ.
Девин способен планировать и выполнять сложные инженерные задачи, которые обычно требуют тысячи решений. Эта способность стала возможной благодаря достижениям Cognition в области долгосрочного мышления и планирования. Согласно компании, Девин может извлекать соответствующий контекст на каждом этапе, учиться автономно со временем и исправлять ошибки по мере необходимости.
На бенчмарке SWE-Bench (, который используется для оценки крупных языковых моделей по реальным программным проблемам, найденным на GitHub), Девин правильно решил 13.86 процентов проблем без какой-либо помощи по сравнению с 1.96 процента без помощи и 4.80 процента с помощью предыдущей модели, являвшейся наилучшей на тот момент.
Хотя компания подробно описала возможности Девина, некоторые эксперты выражают опасения, что ИИ-программист может столкнуться с трудностями в сложных требованиях или сценариях, которые зависят от человеческой интуиции и креативности. Кроме того, инструменты ИИ, такие как Девин, вызывают опасения по поводу потенциальной замены рабочих мест.
Тем не менее, некоторые люди считают, что Девин мог бы стать ценным партнером для многочисленных программистов, открывая новые возможности для сотрудничества между человеческим творчеством и ИИ.
Следите за нами в Twitter, чтобы получать последние сообщения и обновления