分享好友 最新动态首页 最新动态分类 切换频道
腾讯一口气开源4款模型!手机就能跑,还增强了agent能力
2025-08-11 21:32

图片

腾讯混元小模型全家桶开源:4款齐发,单卡部署,微信读书、会议已用上。

作者 |  王涵

编辑 |  漠影

智东西8月4日报道,今天,腾讯混元一口气开源4款小尺寸模型,参数分别为0.5B、1.8B、4B、7B,消费级显卡即可运行

在性能上,Hunyuan 7B在不仅在数学能力上超越了OpenAI o1-mini和Qwen3-8B,在除IFEVal榜单外,均超越OpenAI o1-mini。

模型原生上下文256k,可以一次读完3本《哈利波特》。目前已在微信读书、腾讯会议等多个腾讯应用中落地。

这4款小尺寸模型单卡就可以部署,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗场景,且支持垂直领域低成本微调

目前,4个模型均在Github和Hugging Face等开源社区上线,Arm、高通、Intel、联发科技等多个消费级终端芯片平台也都宣布支持部署。

图片

腾讯混元官网体验地址:

https://hunyuan.tencent.com/

Github地址:

https://github.com/Tencent-Hunyuan

Hugging Face地址:

https://huggingface.co/tencent

01.

数学能力超越Qwen3-8B

能一口气读3本《哈利波特》

腾讯新开源的4个模型属于融合推理模型,并且具备快思考和慢思考两种模式。其中快思考模式提供简洁、高效的输出;而慢思考涉及解决复杂问题,具备更全面的推理步骤。

效果上,4个模型均实现了跟业界同尺寸模型的对标,其中Hunyuan 7B在数学推理测试DROP上取得85.9分的成绩,在AIME2024和AIME2025两个数学榜单上得分分别为81.1分和75.3分,均排名第一超过OpenAI o1-miniQwen3-8B

图片

对比Hunyuan 0.5B、1.8B和4B,在推理能力BBH测评中,1.8B的模型的成绩只与4B的成绩相差0.9分,推理能力不相上下。

图片

这四个模型的亮点在于agent和长文能力,跟此前开源的Hunyuan-A13B模型一样,腾讯团队在技术上通过数据构建和强化学习奖励信号设计,提升了模型在任务规划、工具调用和复杂决策以及反思等agent能力上的表现,让模型实际应用中可以更好地完成深度搜索、Excel操作、旅行攻略规划等任务。

此外,模型原生长上下文窗口达到了256k,意味着模型可以一次性记住并处理相当于40万中文汉字或50万英文单词的超长内容,相当于一口气读完3本《哈利波特》,并且能记住所有人物关系、剧情细节,还能根据这些内容讨论后续故事发展。

部署上,4个模型均只需单卡即可部署,部分PC、手机、平板等设备可直接接入。并且,模型具有较强的开放性,主流推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多种量化格式均能够支持。

02.

已应用到微信读书

智能座舱和金融AI助手等

应用层面,这4款小尺寸模型都能够满足从端侧到云端、从通用到专业的多样化需求,并且已经在腾讯多个业务中应用。

例如,依托模型原生的超长上下文能力,腾讯会议AI小助手、微信读书AI问书AI助手均实现对完整会议内容、整本书籍的一次性理解和处理。

在端侧应用上,腾讯手机管家利用小尺寸模型提升垃圾短信识别准确率,实现毫秒级拦截,保护用户隐私;腾讯智能座舱助手通过双模型协作架构解决车载环境痛点,充分发挥模型低功耗、高效推理的特性。

在高并发场景中,搜狗输入法基于模型的多模态联合训练机制使嘈杂环境下提升识别准确率;腾讯地图采用多模型架构,利用意图分类和推理能力提升了用户交互体验;微信输入法「问AI」基于模型实现输入框与AI即问即答的无缝衔接。

在垂直行业应用中,金融AI助手通过Prompt优化和少量数据微调实现超95%意图识别准确率。依托模型的理解能力,腾讯游戏翻译和QQ飞车手游NPC,在多语言理解能力、方言翻译和智能对话方面,有明显优化,这些能力在专业客服、内容出海以及电商直播等场景有较大应用潜力。

03.

腾讯开源活跃

覆盖多模态

最近,全球开源领域异常热闹,中国大模型表现抢眼。腾讯混元大语言模型也在持续推进开源,其开源模型已覆盖文本、图像、视频和3D生成等多个模态。

在大语言模型领域,腾讯混元此前陆续开源了激活参数量达52B的Hunyuan large和混合推理MoE(混合专家)模型Hunyuan-A13B,这些模型凭借架构上的创新以及在性能和效果上的不错表现,在开源社区受到广泛关注。

多模态方面,混元还开放了完整多模态生成能力及工具集插件,陆续开源了文生图、视频生成和3D生成能力,提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制,图像、视频衍生模型数量达到3000个。

上周,腾讯发布并开源混元3D世界模型1.0,这一模型一经发布即迅速登上Hugging Face趋势榜第二,下载量飙到近9k,混元3D世界模型技术报告还拿下了Hugging Face论文热榜第一。

04.

结语:腾讯开源、应用两手抓

当前全球AI开源生态持续升温,各大科技公司都在加码模型开源,腾讯此次动作是其开源战略的延续。

腾讯混元此次开源4款小尺寸模型,覆盖了从0.5B到7B的参数范围,为不同算力需求的场景提供了适配方案,为AI开发者社区提供了更多选择。

最新文章
三星或重启Galaxy Book Ultra系列 搭载顶级硬件系统
  【CNMO科技消息】据海外媒体报道,三星可能在下一代笔记本产品线中重新推出“Ultra”高端型号,即Galaxy Book 6 Ultra,此举或将标志着其重返高性能旗舰笔记本市场。  在当前的Galaxy Book 5系列中,三星仅推出了标准版和Pro版两款机
暗区突围手游国际服,寻梦盒子下载教程,简单好用
暗区突围作为搜打撤手游中的头部,玩家基数一直很多,在经历了一波波测试之后,暗区突围如今的版本,已经非常适合玩家,整体的玩法完整,各种新内容也陆续上线,目前的暗区已经成为玩家们选择搜打撤手游时的首选,因为国内的成功,暗区突围
【这个城市有点潮】云南普洱:在“以茶为名”的地方与茶“香”遇
2023年9月17日,位于云南省普洱市的“普洱景迈山古茶林文化景观”凭借其林茶共生、人地和谐的“茶魂”理念成功列入《世界遗产名录》,成为全球首个茶主题世界文化遗产。图为景迈山翁基古寨被山林与茶园环绕。(无人机照片)中新社记者 贾天
大发地产被清盘,倒在了行业寒冬里
大发地产没能熬过寒冬。01清盘10月16日,大发地产(06111.HK)公告称,公司及公司间接全资子公司垠壹香港有限公司在HCCW 110/2024及HCCW 111/2024被香港高等法院颁令清盘,而破产管理署署长获委任为公司及垠壹的临时清盘人。法院颁令清盘公
10大经典反贪剧,《狂飙》《罚罪》《人民的名义》上榜,你看过哪些?
反贪题材一直以其紧张刺激的剧情、深刻的社会意义吸引着广大观众的眼球。这类作品不仅揭示了腐败的丑陋面目,更彰显了正义与法治的力量。以下是10部经典反贪剧。《罚罪》以一起错综复杂的犯罪案件为背景,揭露了隐藏在城市暗处的罪恶与腐败
NBA人物志|从篮球论坛水友到NBA第一情报员—最励志篮球新闻记者沙姆斯的故事
年轻的沙姆斯进行采访沃神和沙姆斯今年10月沙姆斯入职ESPN接受采访时说:“也许十年后,当我回顾现在所做的一切时会说‘我擦,我太疯狂了’,但现在我依然觉得自己干劲十足,我依然像高中时期那样,我只想继续树立目标、挑战自己的极限。”
中国太平洋人寿保险被罚353万元:给予投保人合同约定以外的利益等
台海网7月16日讯 根据国家金融监督管理总局网站近日发布的行政处罚信息公开表显示,因未按照规定使用经批准或备案的保险条款、费率,给予投保人合同约定以外的利益,报送的报告、数据不准确等,国家金融监督管理总局对中国太平洋人寿保险股
版本更新公告长达十万字?网友:比追更的小说更管饱
6月27日,《逆水寒》手游再次创造历史。6月26日,《逆水寒》手游发布了两周年庆版本更新公告,全文共长十万字,没有花边、没有修饰、没有任何无关文字!甚至因为「公众号」字数限制,被迫拆成两篇来发,可谓网游圈前所未见,从未耳闻的第一
人保财险今年来被处罚超2000万,近三年已有5名高管落马
伴随严监管力度的持续加码,今年前三季度财产险领域成为焦点。按照业内的不完全统计,截至今年9月底,国家金融监管总局全系统前三季度针对保险业开出的罚单总额达2.63亿元,罚单金额相比去年同期有所扩大。其中,财产险公司成为“重灾区”
相关文章
推荐文章
发表评论
0评