阿里云开源Qwen2.5-Coder系列模型;腾讯混元开源两大核心模型
发布时间:2024-11-25阿里云开源Qwen2.5-Coder系列模型
11月12日,阿里云开源“Qwen2.5-Coder”系列模型,包括0.5B、1.5B、3B、7B、14B和32B六个尺寸,每个尺寸都开源了Base和Instruct模型。其中,Base模型可供开发者微调,Instruct模型可以直接使用而无需进一步调整或训练。Qwen2.5-Coder-32B-Instruct是本次开源的旗舰模型,代码生成和修复能力具备较强优势,在代码推理、多语言支持和代码修复方面脱颖而出,覆盖超过40种编程语言。Qwen2.5-Coder全系列可适配多种应用场景,支持在端侧和云上协助开发者完成编程开发,即便是编程小白,也可基于内置Qwen2.5-Coder的代码助手和可视化工具,用自然语言对话方式生成网站、数据图表、简历和游戏等各类应用。
腾讯混元开源两大核心模型
11月5日,腾讯混元宣布最新的MoE模型“混元Large“以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。
腾讯混元Large模型总参数量389B,激活参数量52B,上下文长度高达256K,公开测评结果显示,腾讯混元Large在CMMLU、MMLU、CEval、MATH等多学科综合评测集以及中英文NLP任务、代码和数学等9大维度全面领先。
腾讯混元3D生成大模型解决了现有3D生成模型在生成速度和泛化能力上的不足,帮助3D创作者和艺术家自动化生产3D资产。该模型具有强大的泛化能力和可控性,可重建各类尺度物体,从建筑到工具花草。在两个公开的3D数据集GSO与OmniObject3D上,混元3D生成大模型的效果优于主流开源模型。
当天,腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。
据悉,本次开源是腾讯混元继文生图模型后持续开放的一大举措,未来还将陆续推出混元-M、混元S等模型。
来源:整理自网络