18818713530

智谱发布0.9B 轻量级 GLM-OCR:性能登顶;OpenAI 旗舰模型重大更新

智谱发布0.9B 轻量级 GLM-OCR:性能登顶,千次处理仅需0.1元


智谱发布的GLM-OCR模型以0.9B参数规模实现了跨级性能突破,在多项权威基准测试中登顶,解决了复杂文档解析中的真实业务痛点。其在文本识别、数学公式推导、复杂表格解析和关键信息抽取方面表现优异,同时具备高效的推理速度和低成本优势,适用于多种高难度文档处理场景。


简评GLM-OCR 在0.9B参数下实现SOTA性能,超越多个权威基准测试。 针对复杂文档场景进行优化,支持表格、结构化提取、手写体等高难度任务。成本极低,API价格仅为传统方案的1/10,处理千张A4扫描件仅需0.5元。


OpenAI 旗舰模型重大更新:GPT-5.2 系列推理速度提升 40%,价格保持不变


OpenAI宣布其最新旗舰AI模型GPT-5.2和GPT-5.2-Codex的推理速度提升了40%,这一改进源于对推理堆栈的优化,同时保持了相同的模型架构和权重。此次更新降低了延迟,提高了响应速度,适用于所有API使用范围,开发者无需做任何调整。性能提升的同时,价格保持不变,为用户提供了更高的成本效益。


简评:GPT-5.2和GPT-5.2-Codex推理速度提升40%,优化了推理堆栈以降低延迟。保持相同的模型架构和权重,底层能力和训练数据未变化,开发者无需调整。性能提升的同时价格保持不变,为用户提供了更高的成本效益。


Gemini 用户量突破 7.5 亿:谷歌财报亮眼,紧咬 ChatGPT 不放

谷歌母公司 Alphabet 发布了 2025 年第四季度财报,其中 AI 业务表现亮眼。Gemini 的月活跃用户数已突破 7.5 亿,展现出惊人的增长势头。同时,谷歌推出了低价订阅方案 Google AI Plus,并推出了自研芯片 Ironwood,推动全年营收首次突破 4000 亿美元大关,标志着公司全面转型为“AI 优先”的企业实体。

简评:Gemini 用户量飙升至 7.5 亿,展现强劲增长势头。谷歌推出低价订阅方案 Google AI Plus,吸引价格敏感用户。自研芯片 Ironwood 和 Gemini 3 推动 Alphabet 年营收突破 4000 亿美元。


支付宝首次上线AI眼镜扫福

支付宝在2026年春节推出的AI眼镜扫福功能,该功能通过无手机操作和智能交互,提升了用户体验,并扩展了集福的范围和奖励内容。

简评:无手机操作:用户只需佩戴兼容的AI眼镜,目光注视任何地方的“福”字,眼镜即可自动识别。智能交互:配合简单的语音指令,眼镜将自动完成扫码逻辑并将福卡发放至用户的支付宝账户。玩法升级:识别范围更广,除了传统的“福”字,创意“马”字、各类热门游戏角色等均被纳入集福范畴。

全球首创“主体参考”:可灵AI3.0正式发布,15秒长视频开启AI导演时代

可灵AI 3.0的发布标志着AI视频创作进入了一个全新的时代,通过多模态输入输出的一体化,重新定义了AI视频的创作工作流,让每个人都能成为导演。

简评:全球首创主体参考功能,精准锁定主角、道具或场景特征。智能分镜与超长生成,实现电影感叙事。支持多语言及方言,实现口型、神态与音色完美同步。

Copyright © 2024 友益典文化 版权所有

粤ICP备2024271549号