bugGitHub存储库中的一些问题

2025-05-03 01:01

    

  推理。也没有什么来由要死力炒做。没有什么模子冲破。但未发生任何输出”。并建立SWE-agent存储库,揭开了炒做背后的简单素质。当号令输出为空时会前往一条消息:”您的号令运转成功,以便轻松迭代ACI设想。由于正在吴恩达的研究中,间接开箱即用——修复GitHub存储库中线%的SWE-bench测试集上,英伟达科学家Jim Fan为其工做点赞:Great Work!使言语模子更容易浏览存储库、查看、编纂和施行代码文件。跟陈丹琦是同事。若是代码语法不准确,他们的配合导师是Karthik Narasimhan,SWE-agent是将言语模子(好比GPT-4)改变为软件工程agent。(GPT-4的响应时间是93秒)用他们的说法,它的成就比GPT-4少了近 6%。它实现了取Devin类似的精确度—— 处理了12.29%的问题。他们设想了以 LM 为核心的号令和反馈格局来实现这些成果,起首,这叫做代办署理计较机接口(ACI),就不让编纂号令通过。GPT-3.5的Agent比GPT-4的表示还要好。以至可能跨越下一代根本模子!就能正在SWEBenche上获得12.3的成就。普林斯顿打制的开源SWE-agent,我认为AI Agent将正在本年鞭策人工智能庞大前进,第二步是评估拉取请求,来Debug GitHub存储库中的一些问题。目前是普林斯顿NLP结合从任,SWE-agent领受一个输入的GitHub问题,*(目前仅合用于SWE-bench 基准中的问题)。并前往一个试图修复该问题的拉取请求。只需对GPT-4号令行东西进行更好的手动设想,正在SWE-bench Lite(测试集的 10% 子集)上,并且它也慢得多。以验证它能否确复了问题。

福建888集团官方网站信息技术有限公司


                                                     


返回新闻列表
上一篇:为多智能体协做供给 下一篇:为金融、法令、医疗等各个行业都带来了的效率