苹果发布适配版 SlowFast-LLaVA 模型,长视频理解性能突出
苹果研究团队推出适配版 SlowFast-LLaVA 模型,创新性采用双流架构,成功解决传统逐帧处理模式下的信息冗余与上下文窗口溢出问题。在长视频分析任务中,该模型表现优异,其中 10 亿参数版本在 LongVideoBench 基准测试中斩获 56.6 分,性能超越部分更大参数规模的模型。此外,该模型基于公开数据集训练且已开源,为 AI 社区在长视频处理领域提供了全新思路。
阿里开源跨平台 GUI 代理框架 Mobile-Agent 3
X-PLUG 团队正式发布跨平台多代理框架 Mobile-Agent-v3,该框架以 GUI-Owl 为基础开发,具备强大的规划、进度管理、反思及记忆能力。同时,其异常处理机制经过优化,即便在干扰环境中也能保持高效操作。目前,团队已同步提供技术报告、演示视频及代码库,为开发者探索该框架的应用潜力提供便利支持。
钉钉十周年发布 8.0 版本,推出 AI 办公形态钉钉 ONE
在成立十周年之际,钉钉发布 8.0 版本,并同步推出下一代 AI 办公应用形态 “钉钉 ONE”。该产品通过自然语言对话实现人与 AI 的高效交互,可大幅简化复杂工作流程、降低用户使用门槛。同时,钉钉公布了企业组织数、付费组织数及 AI 应用数量等核心数据,直观彰显其在办公协同领域的市场地位与用户认可度。
AI 小游戏 Draw A Fish 全球走红,简笔画秒变活鱼
AI 小游戏 Draw A Fish 凭借极简操作设计与丰富社交互动机制,在全球范围内迅速走红,吸引百万网友参与。用户无需注册,只需绘制简笔画,AI 便能快速将其转化为动态虚拟小鱼,带来独特的创作体验。此外,游戏的社交互动机制有效激发全球玩家的创作热情,形成了活跃的创意展示空间,充分展现出 AI 技术与人类创造力结合的独特魅力。
(图片来源于网络)
微信测试 AI 播客功能,双人对话播报新闻
微信正处于 “AI 播客” 功能的测试阶段,该功能以权威媒体与地方政府提供的快讯内容为基础,借助 AI 技术将文本转化为自然流畅的双人对话式新闻播报,为用户打造沉浸式资讯体验,革新传统新闻消费方式。据了解,该功能未来或进一步扩展至长文朗读、聊天记录回顾等更多场景。
克发布健康大模型技术报告,公开 AI “主任医师” 细节
夸克健康大模型成为国内首个通过中国 12 门核心学科主任医师笔试评测的大模型,在复杂医学推理任务中展现出突出能力。为提升模型准确性与推理水平,研发团队采用三类高质量医疗数据进行训练;同时引入强化学习阶段,进一步优化模型输出质量与合规性。目前,夸克已发布技术报告,详细公开该 AI “主任医师” 的相关技术细节。
苹果拟为 Siri 搭载谷歌 Gemini 大模型,强化 AI 能力
苹果正积极探索与谷歌的合作,计划为 2026 年发布的升级版 Siri 引入定制版 Gemini 大模型,以此弥补当前 Siri 在功能上的不足,显著提升其 AI 交互能力。这一举措既反映出苹果在 AI 领域面临的竞争压力,也有望为用户带来更智能、高效的语音助手体验,或将对整个 AI 助手市场格局产生深远影响。
AI 学习工具豆包 “相关视频” 推荐功能引争议
AI 学习工具豆包因内置 “相关视频” 推荐功能引发社会争议,多位家长反馈,该功能无法关闭,容易导致青少年的学习场景被短视频内容侵占;且部分用户尝试关闭后,设置仍无法保留,用户体验欠佳。此次争议也凸显出 AI 产品开发者需在商业利益与用户核心需求之间寻求平衡的重要伦理挑战。