关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西2486人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

政协委员在镜头前摸了摸鼻子现场的记者都跟着做起来

上观新闻浏览 22373

中国军舰现身澳东海岸被指航行如此远距离＂史无前例＂

澎湃新闻浏览 13

哪吒汽车即将登陆巴西市场今年将在巴西推出三款车型

智车情报局浏览 2258

我的科学观｜王红霞：在复杂、多维的网络里探索生命的奥秘

澎湃新闻浏览 2507

菲媒：泽连斯基参加完＂香会＂赴马尼拉与菲总统会晤

环球网资讯浏览 20248

黄景瑜被偶遇带女友健身，更多暧昧细节曝光

萌神木木浏览 20

马祖拉：不能被东欧打崩心态东决对手长2分投到60%该放还得放

直播吧浏览 2252

欧冠最佳比赛11场候选名单：皇马3-3曼城、拜仁4-3曼联入选

懂球帝浏览 2296

在WWDC上苹果不会宣布任何新的硬件

威锋网浏览 2211

电讯报：面对球迷冲场+燃放烟花，欧足联对温布利安保总体满意

懂球帝浏览 2260

宝能姚振华入主众泰汽车？内部人士称是战略合作关系

道哥说车浏览 1952

陈山聪年轻有多帅就有多渣？甩发妻攀附赌王女儿，迷途知返拿视帝

娱乐白名单浏览 1878

NASA局长给申请研究月球样品开绿灯：必须通过审查

观察者网浏览 15747

丰田为何执着复兴引擎

帮宁工作室浏览 2244

沈梦辰杜海涛宣布喜讯，3年了终于等来了今天！

Yuki女人故事浏览 29

官宣：歼31出了新型号，全球独创侧面双弹舱

美《芯片法案》或遭重挫：商务部下属芯片与AI机构据悉将裁员

科创板日报浏览 1433

这些真是中年女性的穿衣典范，看这些穿搭就对了，优雅不扮嫩

静儿时尚达人浏览 1883

47岁的黄晓明，终于“开窍”了

皮皮电影浏览 1914

物美系第3个IPO来了！阿布扎比、腾讯、联想、招银国际押注

科创板日报浏览 2855

被成都街拍惊艳！满大街都是“短上衣+低腰裤”，露小蛮腰好性感

潮人志Fashion 浏览 2256

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

环球：董军在...

vivo Y...

香会智库报告...

中国歼-10...

纽约时装周“...

《琅琊榜3》...

看了这些春季穿搭才发现，“优雅风”显气质！40岁女人试试看

意媒：佛罗伦萨关注阿拉维斯中场布兰科，转会费1000万欧

胡塞武装称又击落1架美军“死神”无人机现场披露

政协委员在镜头前摸了摸鼻子现场的记者都跟着做起来

中国军舰现身澳东海岸被指航行如此远距离＂史无前例＂

哪吒汽车即将登陆巴西市场今年将在巴西推出三款车型

我的科学观｜王红霞：在复杂、多维的网络里探索生命的奥秘

菲媒：泽连斯基参加完＂香会＂赴马尼拉与菲总统会晤

黄景瑜被偶遇带女友健身，更多暧昧细节曝光

马祖拉：不能被东欧打崩心态东决对手长2分投到60%该放还得放

欧冠最佳比赛11场候选名单：皇马3-3曼城、拜仁4-3曼联入选

在WWDC上苹果不会宣布任何新的硬件

电讯报：面对球迷冲场+燃放烟花，欧足联对温布利安保总体满意

宝能姚振华入主众泰汽车？内部人士称是战略合作关系

陈山聪年轻有多帅就有多渣？甩发妻攀附赌王女儿，迷途知返拿视帝

NASA局长给申请研究月球样品开绿灯：必须通过审查

丰田为何执着复兴引擎

沈梦辰杜海涛宣布喜讯，3年了终于等来了今天！

官宣：歼31出了新型号，全球独创侧面双弹舱

美《芯片法案》或遭重挫：商务部下属芯片与AI机构据悉将裁员

这些真是中年女性的穿衣典范，看这些穿搭就对了，优雅不扮嫩

47岁的黄晓明，终于“开窍”了

物美系第3个IPO来了！阿布扎比、腾讯、联想、招银国际押注

被成都街拍惊艳！满大街都是“短上衣+低腰裤”，露小蛮腰好性感

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

环球：董军在...

vivo Y...

香会智库报告...

中国歼-10...

纽约时装周“...

《琅琊榜3》...

看了这些春季穿搭才发现，“优雅风”显气质！40岁女人试试看

意媒：佛罗伦萨关注阿拉维斯中场布兰科，转会费1000万欧

胡塞武装称又击落1架美军“死神”无人机 现场披露

政协委员在镜头前摸了摸鼻子 现场的记者都跟着做起来

中国军舰现身澳东海岸 被指航行如此远距离＂史无前例＂

哪吒汽车即将登陆巴西市场 今年将在巴西推出三款车型

我的科学观｜王红霞：在复杂、多维的网络里探索生命的奥秘

菲媒：泽连斯基参加完＂香会＂赴马尼拉 与菲总统会晤

黄景瑜被偶遇带女友健身，更多暧昧细节曝光

马祖拉：不能被东欧打崩心态 东决对手长2分投到60%该放还得放

欧冠最佳比赛11场候选名单：皇马3-3曼城、拜仁4-3曼联入选

在WWDC上 苹果不会宣布任何新的硬件

电讯报：面对球迷冲场+燃放烟花，欧足联对温布利安保总体满意

宝能姚振华入主众泰汽车？ 内部人士称是战略合作关系

陈山聪年轻有多帅就有多渣？甩发妻攀附赌王女儿，迷途知返拿视帝

NASA局长给申请研究月球样品开绿灯：必须通过审查

丰田为何执着复兴引擎

沈梦辰杜海涛宣布喜讯，3年了终于等来了今天！

官宣：歼31出了新型号，全球独创侧面双弹舱

美《芯片法案》或遭重挫：商务部下属芯片与AI机构据悉将裁员

这些真是中年女性的穿衣典范，看这些穿搭就对了，优雅不扮嫩

47岁的黄晓明，终于“开窍”了

物美系第3个IPO来了！阿布扎比、腾讯、联想、招银国际押注

被成都街拍惊艳！满大街都是“短上衣+低腰裤”，露小蛮腰好性感

胡塞武装称又击落1架美军“死神”无人机现场披露

政协委员在镜头前摸了摸鼻子现场的记者都跟着做起来

中国军舰现身澳东海岸被指航行如此远距离＂史无前例＂

哪吒汽车即将登陆巴西市场今年将在巴西推出三款车型

菲媒：泽连斯基参加完＂香会＂赴马尼拉与菲总统会晤

马祖拉：不能被东欧打崩心态东决对手长2分投到60%该放还得放

在WWDC上苹果不会宣布任何新的硬件

宝能姚振华入主众泰汽车？内部人士称是战略合作关系