【AI行业今天热点】腾讯混元发布多模态理解模型 Large-Vision;B站测试 AI 视频创作工具 “花生 AI”

腾讯混元发布多模态理解模型 Large-Vision

腾讯混元发布多模态理解模型 Large-Vision,采用 MoE 架构,激活参数 52B,支持任意分辨率图像、视频和 3D 空间输入且无需预处理,提升多语言场景理解能力,为 AI 视觉服务提供技术支持。

 

B站测试 AI 视频创作工具 “花生 AI”

B站测试 “花生 AI” 视频创作工具,支持文案或音频 3 分钟生成视频,提供智能匹配素材与模板两种方式。其自研大语言模型具备多语言实时翻译能力,准确度达 90%。


阿里 1688 “诚信通 AI 版” 会员定于 10 月全面上线

阿里 1688 将于 2025 年 10 月推出 “诚信通 AI 版” 会员,新商家须开通,现有基础版过渡期后下架,同步升级免费 AI 数字员工功能。


图片 1.png


(图片来自网络)


昆仑万维开源「Skywork UniPic 2.0」模型

昆仑万维开源「Skywork UniPic 2.0」统一多模态模型,支持文本和图像输入,实现生图与编辑一体化。该模型基于 SD3.5-Medium 架构,2B 参数指标超更大参数量模型,引入强化学习提升复杂指令理解与图像生成一致性。


字节跳动开源基于 Qwen 3 32B 的 M3-Agent-Control 模型

字节跳动开源基于 Qwen 3 32B 训练的 M3-Agent-Control 模型,含 328 亿参数,采用 BF16 张量类型,响应迅速,致力于推动智能技术开放普及。


DeepSeek-R2 模型 8 月发布计划遭官方否认

DeepSeek-R2 模型 8 月发布消息被官方否认,此前传言不实。团队仍在优化其性能,CEO 对模型能力不满,该模型预计能生成更高质量代码,具备非英语语言推理能力。


wps_doc_0.jpeg


(图片来自网络)


腾讯混元开源 Hunyuan-GameCraft,实现图像生成游戏视频

腾讯混元开源基于 HunyuanVideo 底模的 Hunyuan-GameCraft,可通过图片、文字及动作指令生成高清动态游戏视频,解决传统制作痛点,支持流畅动作控制,适配消费级硬件。


AI 新贵 Perplexity 报价收购谷歌 Chrome

Perplexity 以 345 亿美元现金报价收购谷歌 Chrome,拟应对谷歌反垄断问题,承诺保持 Chromium 开源、追加 30 亿美元投资且不更改用户默认设置,虽财务实力有限,但野心显著。

Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号

×
PC客服 移动客服