制造业务
来源:制造业务 | 发布时间:2025-04-30 14:38:44 | 点击率: 16次
快科技2月18日音讯,阶跃星斗、吉祥轿车集团联合宣告,两边协作的阶跃两款Step系列多模态大模型,正式向全球开发者开源,即日起可在跃问APP内体会。
阶跃Step-Video-T2V是现在全世界内参数量最大、功能最好的开源视频生成模型,阶跃Step-Audio则是职业界首款产等第的开源语音交互大模型,可谓最懂中国话。
阶跃星斗(StepFun)是吉祥轿车集团的科技生态战略协作伙伴,企业成立于2023年4月,总部在上海,由微软前全球副总裁姜大昕担任CEO,致力于完成AGI(通用AI),2024年下半年其多模态API的调用量增加超45倍。
在杂乱运动、美感人物、视觉想象力、根底文字生成、原生中英双语输入、镜头言语等方面,它都具有强壮的生成才能,并且语义了解和指令遵从才能杰出。网页端体会链接:
一起,阶跃星斗还发布并开源了针对文生视频质量评测的新基准数据集Step-Video-T2V-Eval,包括128条源于实在用户的中文评测问题,可评价生成视频在运动、景色、动物、组合概念、超现实、人物、3D动画、电影拍摄等11个内容类别上质量。评测成果为,
模型生成的语音具有超自然、高情商等特征,一起也能完成高质量的音色复刻并进行角色扮演,满意影视娱乐、交际、游戏等职业场景下使用需求。
阶跃星斗还自建并开源了多维度评价系统StepEval-Audio-360基准测验,从角色扮演、逻辑推理、生成操控、文字游戏、创造才能、指令操控等9项根底才能的维度,对开源语音模型进行评测。
人工横评成果显现,阶跃Step-Audio的模型才能非常均衡,且在各个维度上均超过了此前市面上作用最佳的开源语音模型。