关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西2486人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

政协委员在镜头前摸了摸鼻子 现场的记者都跟着做起来

上观新闻 浏览 22373

中国军舰现身澳东海岸 被指航行如此远距离"史无前例"

澎湃新闻 浏览 13

哪吒汽车即将登陆巴西市场 今年将在巴西推出三款车型

智车情报局 浏览 2258

我的科学观|王红霞:在复杂、多维的网络里探索生命的奥秘

澎湃新闻 浏览 2507

菲媒:泽连斯基参加完"香会"赴马尼拉 与菲总统会晤

环球网资讯 浏览 20248

黄景瑜被偶遇带女友健身,更多暧昧细节曝光

萌神木木 浏览 20

马祖拉:不能被东欧打崩心态 东决对手长2分投到60%该放还得放

直播吧 浏览 2252

欧冠最佳比赛11场候选名单:皇马3-3曼城、拜仁4-3曼联入选

懂球帝 浏览 2296

在WWDC上 苹果不会宣布任何新的硬件

威锋网 浏览 2211

电讯报:面对球迷冲场+燃放烟花,欧足联对温布利安保总体满意

懂球帝 浏览 2260

宝能姚振华入主众泰汽车? 内部人士称是战略合作关系

道哥说车 浏览 1952

陈山聪年轻有多帅就有多渣?甩发妻攀附赌王女儿,迷途知返拿视帝

娱乐白名单 浏览 1878

NASA局长给申请研究月球样品开绿灯:必须通过审查

观察者网 浏览 15747

丰田为何执着复兴引擎

帮宁工作室 浏览 2244

沈梦辰杜海涛宣布喜讯,3年了终于等来了今天!

Yuki女人故事 浏览 29

官宣:歼31出了新型号,全球独创侧面双弹舱

浏览 1858

美《芯片法案》或遭重挫:商务部下属芯片与AI机构据悉将裁员

科创板日报 浏览 1433

这些真是中年女性的穿衣典范,看这些穿搭就对了,优雅不扮嫩

静儿时尚达人 浏览 1883

47岁的黄晓明,终于“开窍”了

皮皮电影 浏览 1914

物美系第3个IPO来了!阿布扎比、腾讯、联想、招银国际押注

科创板日报 浏览 2855

被成都街拍惊艳!满大街都是“短上衣+低腰裤”,露小蛮腰好性感

潮人志Fashion 浏览 2256
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11