9月30日消息,據「火山引擎」微信公眾號發文,豆包大模型1.6-vision正式發布,這是豆包大模型家族首個具備工具調用能力的視覺深度思考模型,擁有更強的通用多模態理解和推理能力,並支持Responses API。
新模型以工具調用的差異化能力,將圖像融入其思維鏈中,實現對圖片的定位、剪裁、點選、畫線、縮放、旋轉等精細處理。 並通過模擬人類從「從全局掃描到局部聚焦」的視覺推理過程,在增強推理可解釋性的同時,可高效精準地完成圖像操作。
豆包大模型1.6-vision支持Responses API,可自主選擇調用工具,大幅度減少Agent開發過程中的代碼量,提升開發效率,讓開發 者應用開發更加高效。
此外,對比上一版視覺理解模型Doubao-1.5-thinking-vision-pro,綜合成本降低約50%,以更低成本解鎖更強性能。
文章来源:
快科技
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!