
4月28日的Home报告称,阿里巴巴·汤蒂·Qianwen开源的负责人林·朱阳(Lin Junyang)发布了一个X帖子,其中QWEN3型号预计将于今天发布。值得注意的是,QWEN3系列模型的集合显示在阿里巴巴开源社区Modelscope(Magic Band)的短部分中,并脱机,以及四个型号:QWEN3-4B-BASE,QWEN3-1.7B,QWEN3-1.7B,QWEN3-0.6B和QWEN3-30B-A3B-A3B-A3B-A3B-A3B-A3B-BASE。所有型号均使用Apache许可证2.0开源协议。尽管尚未发布官方公告,但它结合了命名规则和上一代的技术逻辑,可以将其从技术路径和定位方向排除在外。在此时发布的模型中,QWEN3-4B,QWEN3-1.7B和QWEN3-0.6B直接以参数量表命名,对应于40亿,17亿和6亿个参数。这种类型的没有后缀的命名可能表明它是一个单构建密集模型,IS不是由Hybrid Expert(MOE)设计的。猜测它专注于轻量级应用程序方案。 QWEN3-30B-A3B基础是MOE架构的主要模型,30亿(3B)参数是动态的,从总参数为300亿(30B)。根据AIBase的说法,QWEN3支持上下文长度高达256K,涵盖了识别任务和顺序。 Ayon Dito Sa Bahay,Mula Noong Agosto 2023,Sunud-Sunod na Binuksan Ng Alibaba Cloud Ang 4 Na Henerasyon na Henerasyon Na Mga Modelo Tulad ng Qwen,Qwen1.5,Qwen2,qwen2,qwen2.5模态Tulad Ng MGA MaLaking Wika,多模式,Matematika代码。