About 1,340,000 results
Open links in new tab
  1. 为什么同为开源追平 OpenAI,Qwen 没有像 DeepSeek 一样出圈? - 知乎

    Jan 28, 2025 · 如果有人看过我以前的回答,就知道我一直是DeepSeek和Qwen的小迷弟。 我既看好DeepSeek也看好Qwen。 DeepSeek出圈的原因在于免费可用的R1模型确确实实达到甚至超越了O1 …

  2. 千问Qwen - 知乎

    Dec 31, 2025 · 通义千问Qwen在知乎的官方主页,提供关于其模型和技术的讨论与分享。

  3. 阿里开源编程模型Qwen3-Coder,性能比肩全球顶级编程模 …

    本周算Qwen的开源周,一天放一个模型,今天的产品是专注各类编程应用场景的Coder版。 昨天通用模型235B干翻自家最强推理模型,那么参数更高,训练材料里代码占比更高的Coder模型拿下更高分数 …

  4. 华为盘古大模型被指出抄袭阿里Qwen大模型是怎么回事? - 知乎

    华为盘古大模型被指出抄袭阿里Qwen大模型是怎么回事? 7月5日,针对盘古Pro MoE模型被质疑套壳阿里通义千问Qwen-2.5的争议,华为诺亚方舟实验室发布声明称,该模型是基于昇腾硬件平台开发、 …

  5. Qwen-3在实际场景中的表现如何? - 知乎

    Qwen 3 系列通过 MoE 架构实现“深度思考与快速响应”双模式,兼顾处理复杂问题的精准性与日常问题的速度。

  6. 阿里通义千问团队开源了首个图像生成基础模型 Qwen-Image,生图体 …

    上图为采用Qwen Image直接文字生成,这么多文字在复杂排版,大小不同,中英文混杂的情况下不出错很难的。 Qwen-Image是阿里推出 20B 参数的 MMDiT 模型,专门针对带文字的图像生成进行优 …

  7. 如何评价阿里云刚刚发布的Qwen3系列大型语言模型? - 知乎

    以往Qwen发布的纯文本模型中从来没有出现过只有指令模型没有基础模型的情况! 3.没有0.6B、1.7B、8B和14B的官方测评数据,我本来是想去技术报告中找的,结果直到目前仍然没有看到Qwen3的技 …

  8. 通义千问更新 Qwen3 升级版,性能超越Kimi K2 和 DeepSeek V3,有哪 …

    在Qwen系列中,“Instruct”与早期模型中的“Chat”后缀作用类似,都是为了提升模型的“情商”和任务执行能力。 同时这也说明了,它不是一个“think”或者“reasoning”的推理模型,这个其实是Qwen3这次的主 …

  9. 如何评价 Qwen 门控注意力Gated Attention获得 NeurIPS 最佳论文?

    Qwen团队说门控attention已经集成到了即将发布的Qwen3-Next模型里,而且他们计划把这个思路扩展到多模态和长文本领域。 如果一切顺利,"自我过滤的注意力"可能真的会成为下一代大模型的标准组件 …

  10. 如何评价Qwen最新Qwen-Image-Edit模型(2509)? - 知乎

    Sep 23, 2025 · 昨晚,阿里Qwen团队发布并开源了图像编辑新版本模型Qwen-Image-Edit-2509,新版本模型相比8月份开源的Qwen-Image-Edit, 单图编辑的一致性提升,同时新支持多图编辑功能。