阿里云通义千问推出开源模型Qwen-7B 成为中英文7B开源模型之最
网络
2023-08-12
8月3日消息,AI模型社区魔搭ModelScope日前发布了两款开源模型,即Qwen-7B和Qwen-7B-Chat,这两款模型由阿里云证实为通义千问的70亿参数通用模型和对话模型。与此同时,阿里云也确认这两款模型均可免费使用,并支持商业应用。通过多个权威测评,Qwen-7B模型的表现远超国内外同等尺寸模型,成为当前业界最强的中英文7B开源模型。
据了解,Qwen-7B是一种支持中英文等多种语言的基座模型,其训练数据集超过2万亿个token,上下文窗口长度达到8k。而Qwen-7B-Chat则是基于Qwen-7B的中英文对话模型,已经实现了与人类认知的对齐。这两款模型的开源代码支持量化,使用户能够在消费级显卡上部署和运行模型。
这一举措使得用户无需从头开始训练模型,而是可以下载预训练好的模型并进行微调,从而快速构建高质量的模型。阿里云表示,开源大模型将有助于简化模型训练和部署过程,为用户提供更便捷的服务。
对于Qwen-7B的推出,阿里云早在今年4月便推出了自研大模型通义千问,引发市场强烈需求。此次推出小型化版本的开源模型,有望降低模型使用门槛,使大量中小企业和AI开发者更早地接触和使用通义千问。阿里云也因此成为国内首个加入大模型开源行列的大型科技企业。
用户可以直接从魔搭社区下载这两款模型,也可以通过阿里云灵积平台访问和调用它们。阿里云为用户提供了包括模型训练、推理、部署和精调等在内的全方位服务,让用户可以更轻松地应用这些先进的AI模型。