张显达 zxd blog
Claude Sonnet 4.5与Claude Code 2.0:自主编码时代的生产力范式 Claude Sonnet 4.5与Claude Code 2.0:自主编码时代的生产力范式
双重发布:模型与工具的协同升级Anthropic于9月29日同时发布Claude Sonnet 4.5模型与Claude Code终端体验的2.0版本。官方公告称,Sonnet 4.5是“迄今最强的编码模型”,在OSWorld真实电脑操作基
2025-09-30
华为昇腾910C扩产:国产AI算力的战略再加速 华为昇腾910C扩产:国产AI算力的战略再加速
背景速览:AI算力竞争进入量产阶段全球AI基础设施的竞争已从模型能力转向算力部署速度。随着大模型在工业、金融与公共服务中的落地加速,推理场景对本地算力的需求迅速攀升。根据中国信通院最新测算,2025年国内AI推理算力需求同比增速超过55%,
2025-09-30
多模态基础模型:打破感知边界的认知革命 多模态基础模型:打破感知边界的认知革命
引言:感知的融合与认知的飞跃人类感知世界的方式本质上是多模态的——我们同时通过视觉、听觉、触觉等多种感官通道获取信息,并在大脑中无缝整合这些信息以形成对世界的统一理解。而在人工智能发展的历程中,多模态感知与理解一直是通向真正智能系统的关键挑
2025-09-29
生成式AI的可解释性:打开黑盒的新方法 生成式AI的可解释性:打开黑盒的新方法
引言:AI透明度的迫切需求随着生成式AI在各行各业的广泛应用,其”黑盒”特性引发了越来越多的关注和担忧。当一个AI系统生成内容、做出决策或提供建议时,用户和监管者越来越需要了解”为什么”和”如何”。本文将深入探讨生成式AI可解释性的最新技术
2025-09-26
多模态推理:AI理解世界的新范式 多模态推理:AI理解世界的新范式
引言:多模态AI的突破性进展在人工智能发展的历程中,2025年标志着多模态推理能力的重大突破。传统AI系统往往专注于单一模态(如文本或图像),而今天的多模态系统能够同时理解、关联并推理跨越视觉、语言、音频等多种感知维度的信息。本文将深入探讨
2025-09-25
多模态推理的认知架构:从视觉-语言模型到统一认知框架 多模态推理的认知架构:从视觉-语言模型到统一认知框架
多模态推理的理论基础多模态推理是人工智能领域的前沿挑战,涉及如何整合不同感知通道的信息并进行高阶认知处理。传统的深度学习方法在单模态任务上取得了显著成功,但在跨模态推理上仍存在明显短板。本文从认知科学和计算神经科学的角度,探讨多模态推理的理
2025-09-24
大模型推理优化的系统性方法:从量化到硬件加速的全栈视角 大模型推理优化的系统性方法:从量化到硬件加速的全栈视角
大模型推理优化的理论基础随着大型语言模型(LLM)规模的不断扩大,推理优化已成为AI落地的关键挑战。从理论角度看,推理优化涉及计算复杂度、内存访问模式和硬件利用率三个核心维度的权衡。 计算复杂度分析Transformer架构的计算复杂度主要
2025-09-23
多模态大模型对认知科学理论的挑战:符号接地问题的新视角 多模态大模型对认知科学理论的挑战:符号接地问题的新视角
理论冲突点 感知-概念鸿沟:GPT-5V在图像描述任务中表现出类似儿童的「过度泛化」现象 具身认知缺失:机器人实验显示纯视觉训练模型在物理交互中的系统性偏差 意识幻觉:ChatGPT-5的元认知能力引发哲学争议 实验发现MIT认知科学实验
2025-09-22
2025年9月21日人工智能观察:多模态推理突破、AI芯片新架构与开源模型治理 2025年9月21日人工智能观察:多模态推理突破、AI芯片新架构与开源模型治理
今日速览 Meta发布Llama 4 Multimodal,支持视频理解与长时间序列推理,在视频问答基准测试中超越GPT-4V 20%(VentureBeat,2025-09-20)。 英特尔推出Gaudi 3 AI加速器,采用新型混合架构
2025-09-21
2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准 2025年9月20日人工智能观察:多模态大模型突破、AI芯片竞争与开源模型新标准
今日速览 DeepMind发布Gemini Ultra 2.5,首次实现单一模型在视觉、听觉与触觉输入间的无缝推理,在机器人操作任务上取得突破性进展(VentureBeat,2025-09-19)。 AMD推出新一代MI350 AI加速器,
2025-09-20
2 / 4