在 AI 驱动的数据应用场景中,企业越来越需要一套同时支撑实时消费、历史沉淀与多引擎复用的数据底座。Kafka、Iceberg 开放表格式与对象存储的组合,正成为流数据入湖的重要方向。但传统依赖 Flink、Spark 等外部 ETL 作业的方式,也带来了链路长、系统边界多、运维复杂等问题。本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
此前已有不少文章围绕 Agent 自进化这个主题展开过讨论,内容涵盖了 Hermes Agent 等自进化框架,以及 Skill 自进化等具体技术方向。而最近,AI 领域又出现一个新的概念,叫做 Loop(循环)或者叫 Loop Engineering(中文翻译一般叫“循环工程”)。因此,本文将重点聊聊这个话题,尽量系统化地介绍一下 Loop 与 Loop Engineering 究竟是什么,以及它们背后有哪些思考。
本文介绍 vivo 线下门店「大头贴」拍照合成打印一体化桌面应用软件的技术方案。该项目基于 Tauri 2.0 + Rust + Vue 3 构建,实现了手机实时投屏、智能拍照、Live Photo 处理、模板合成、视频生成、跨平台打印等核心能力,为门店用户提供沉浸式拍照体验。
本文提出"面向Skills编程"范式——将领域知识、工作流、约束规则封装为可版本化的Skills单元,让LLM在确定性框架内生成代码,实现从"人写代码"到"人沉淀Skills,AI写代码"的研发范式升级。以企业购客户对接场景为实战验证,通过项目评估、技术方案、代码生产的研发SOP构建,实现商品域端到端交付周期缩短65%,代码一次生成成功率达90%。
本文将拆解大模型中几个核心操作(RMSNorm、Softmax、Causal Mask、Sampling)背后的数学与 Infra 优化逻辑。看完你会发现,Infra 优化,本质上就是在用数学上的等价变换,或者对精度的适度妥协,去换取更高的硬件利用率和极致的推理速度。PS: 当然最核心的操作肯定是矩阵乘法,这个放到下一篇吧 《AI Infra入门:从矩阵乘法到FlashAttentionV4》~其他的还有RoPE和残差连接没有提及~
Harness Pilot通过将项目规范显式化、版本化并集成到Git工作流,从根本上解决了AI Agent因无法感知隐性规则而导致的协作不可靠问题。其核心在于从依赖AI“自觉”的事后检查,转变为依靠自动化脚本在编码前进行强制预验证的范式,从而确保AI Agent在既定的架构和质量约束内可靠、高效地协作,并将项目知识沉淀为可复用的资产。