张显达 zxd blog
2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准 2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准
今日速览 DeepMind发布Gemini Ultra 2.5,首次实现单一模型在视觉、听觉与触觉输入间的无缝推理,在机器人操作任务上取得突破性进展(VentureBeat,2025-09-19)。 AMD推出新一代MI350 AI加速器,
2025-09-20
2025年9月19日人工智能观察:芯片、平台与代理三线补位 2025年9月19日人工智能观察:芯片、平台与代理三线补位
今日速览 华为在 Connect 大会上发布 SuperPoD Interconnect,可串联 1.5 万张 Ascend GPU,对标 Nvidia NVLink,以集群化弥补单卡性能差距(TechCrunch,2025-09-18)。
2025-09-19
2025年9月18日人工智能观察:多智能体生态重构 2025年9月18日人工智能观察:多智能体生态重构
焦点速览 Kaggle 与 Google DeepMind 联合发布 Kaggle Game Arena,以策略类游戏持续评测模型推理质量,为复杂决策型 AI 提供常态化赛道(InfoQ,2025-09-16)。 LinkedIn 将现有消
2025-09-18
RAG 实战入门:从零搭建检索增强生成 RAG 实战入门:从零搭建检索增强生成
RAG(Retrieval-Augmented Generation) 将“外部知识检索”与“生成式模型”结合,兼顾准确性与可追溯性,适用于企业知识库问答、报表问答、复杂检索答疑等场景。 一、
2025-09-12
RAG 压缩与多文档组装 RAG 压缩与多文档组装
1. 片段压缩策略 语义压缩/提炼摘要;关键句抽取;去冗余合并。 图表/代码块
2025-09-12
提示注入与越狱防护 提示注入与越狱防护
1. 威胁模型 提示注入:用户输入/上下文中的恶意指令劫持系统目标。 越狱:诱
2025-09-12
LLM 函数调用最佳实践 LLM 函数调用最佳实践
1. 工具协议设计 输入/输出 Schema、错误模型与幂等性;示例优先。 安
2025-09-12
大模型评测与安全治理入门 大模型评测与安全治理入门
评测是保障交付质量的第一道防线;安全治理是保障可控与合规的最后一道防线。两者共同构成生产级 AI 应用的“护城河”。 评测维度
2025-09-12
企业级 RAG 蓝图:架构、实践与治理 企业级 RAG 蓝图:架构、实践与治理
1. 目标与边界 面向企业知识与流程的问答/助手,强调可追溯、可治理、可回归与低运维成本。
2025-09-12
智能体设计与多工具编排 智能体设计与多工具编排
智能体(Agent)是在给定目标下,能规划、调用工具、观测反馈并自我纠正的系统。本文聚焦工程中的可落地方案。 核心循环:计划—执行—反馈
2025-09-12
17 / 18