18818713530

最新资讯

【AI行业今天热点】腾讯混元发布多模态理解模型 Large-Vision；B站测试 AI 视频创作工具 “花生 AI”

腾讯混元发布多模态理解模型 Large-Vision

腾讯混元发布多模态理解模型 Large-Vision，采用 MoE 架构，激活参数 52B，支持任意分辨率图像、视频和 3D 空间输入且无需预处理，提升多语言场景理解能力，为 AI 视觉服务提供技术支持。

B站测试 AI 视频创作工具 “花生 AI”

B站测试 “花生 AI” 视频创作工具，支持文案或音频 3 分钟生成视频，提供智能匹配素材与模板两种方式。其自研大语言模型具备多语言实时翻译能力，准确度达 90%。

阿里 1688 “诚信通 AI 版” 会员定于 10 月全面上线

阿里 1688 将于 2025 年 10 月推出 “诚信通 AI 版” 会员，新商家须开通，现有基础版过渡期后下架，同步升级免费 AI 数字员工功能。

图片 1.png

（图片来自网络）

昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维开源「Skywork UniPic 2.0」统一多模态模型，支持文本和图像输入，实现生图与编辑一体化。该模型基于 SD3.5-Medium 架构，2B 参数指标超更大参数量模型，引入强化学习提升复杂指令理解与图像生成一致性。

字节跳动开源基于 Qwen 3 32B 的 M3-Agent-Control 模型

字节跳动开源基于 Qwen 3 32B 训练的 M3-Agent-Control 模型，含 328 亿参数，采用 BF16 张量类型，响应迅速，致力于推动智能技术开放普及。

DeepSeek-R2 模型 8 月发布计划遭官方否认

DeepSeek-R2 模型 8 月发布消息被官方否认，此前传言不实。团队仍在优化其性能，CEO 对模型能力不满，该模型预计能生成更高质量代码，具备非英语语言推理能力。

（图片来自网络）

腾讯混元开源 Hunyuan-GameCraft，实现图像生成游戏视频

腾讯混元开源基于 HunyuanVideo 底模的 Hunyuan-GameCraft，可通过图片、文字及动作指令生成高清动态游戏视频，解决传统制作痛点，支持流畅动作控制，适配消费级硬件。

AI 新贵 Perplexity 报价收购谷歌 Chrome

Perplexity 以 345 亿美元现金报价收购谷歌 Chrome，拟应对谷歌反垄断问题，承诺保持 Chromium 开源、追加 30 亿美元投资且不更改用户默认设置，虽财务实力有限，但野心显著。