张显达 zxd blog
2025年9月21日人工智能观察:多模态推理突破、AI芯片新架构与开源模型治理 2025年9月21日人工智能观察:多模态推理突破、AI芯片新架构与开源模型治理
今日速览 Meta发布Llama 4 Multimodal,支持视频理解与长时间序列推理,在视频问答基准测试中超越GPT-4V 20%(VentureBeat,2025-09-20)。 英特尔推出Gaudi 3 AI加速器,采用新型混合架构
2025-09-21
2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准 2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准
今日速览 DeepMind发布Gemini Ultra 2.5,首次实现单一模型在视觉、听觉与触觉输入间的无缝推理,在机器人操作任务上取得突破性进展(VentureBeat,2025-09-19)。 AMD推出新一代MI350 AI加速器,
2025-09-20
2025年9月19日人工智能观察:芯片、平台与代理三线补位 2025年9月19日人工智能观察:芯片、平台与代理三线补位
今日速览 华为在 Connect 大会上发布 SuperPoD Interconnect,可串联 1.5 万张 Ascend GPU,对标 Nvidia NVLink,以集群化弥补单卡性能差距(TechCrunch,2025-09-18)。
2025-09-19
2025年9月18日人工智能观察:多智能体生态重构 2025年9月18日人工智能观察:多智能体生态重构
焦点速览 Kaggle 与 Google DeepMind 联合发布 Kaggle Game Arena,以策略类游戏持续评测模型推理质量,为复杂决策型 AI 提供常态化赛道(InfoQ,2025-09-16)。 LinkedIn 将现有消
2025-09-18
提示注入与越狱防护 提示注入与越狱防护
1. 威胁模型 提示注入:用户输入/上下文中的恶意指令劫持系统目标。 越狱:诱
2025-09-12
RAG 压缩与多文档组装 RAG 压缩与多文档组装
1. 片段压缩策略 语义压缩/提炼摘要;关键句抽取;去冗余合并。 图表/代码块
2025-09-12
智能体设计与多工具编排 智能体设计与多工具编排
智能体(Agent)是在给定目标下,能规划、调用工具、观测反馈并自我纠正的系统。本文聚焦工程中的可落地方案。 核心循环:计划—执行—反馈
2025-09-12
大模型评测与安全治理入门 大模型评测与安全治理入门
评测是保障交付质量的第一道防线;安全治理是保障可控与合规的最后一道防线。两者共同构成生产级 AI 应用的“护城河”。 评测维度
2025-09-12
LLM 函数调用最佳实践 LLM 函数调用最佳实践
1. 工具协议设计 输入/输出 Schema、错误模型与幂等性;示例优先。 安
2025-09-12
企业级 RAG 蓝图:架构、实践与治理 企业级 RAG 蓝图:架构、实践与治理
1. 目标与边界 面向企业知识与流程的问答/助手,强调可追溯、可治理、可回归与低运维成本。
2025-09-12
15 / 16