豆包大模型1.6-vision正式發布:首次具備工具調用能力

神马作文网 教育资讯 14

9月30日消息,據「火山引擎」微信公眾號發文,豆包大模型1.6-vision正式發布,這是豆包大模型家族首個具備工具調用能力的視覺深度思考模型,擁有更強的通用多模態理解和推理能力,並支持Responses API。

新模型以工具調用的差異化能力,將圖像融入其思維鏈中,實現對圖片的定位、剪裁、點選、畫線、縮放、旋轉等精細處理。 並通過模擬人類從「從全局掃描到局部聚焦」的視覺推理過程,在增強推理可解釋性的同時,可高效精準地完成圖像操作。

豆包大模型1.6-vision支持Responses API,可自主選擇調用工具,大幅度減少Agent開發過程中的代碼量,提升開發效率,讓開發 者應用開發更加高效。 

此外,對比上一版視覺理解模型Doubao-1.5-thinking-vision-pro,綜合成本降低約50%,以更低成本解鎖更強性能。


抱歉,评论功能暂时关闭!