在AI时代天猫技术质量同学在质量保障方面也不断探索AI在测试全流程提效的落地方案,传统测试工作链条拆解为“需求解析 → 用例生成 → 数据构造 → 执行验证 → 对比校验”五大核心阶段,而我们的目标是通过AI+自然语言驱动,实现全流程自动化、可溯化、可管理化。而最AI参与到测试中来,最主要的目标就是提效,目前几个月的实践下来发现在用例生成、测试数据构造和交易链路数据执行的过程中提效明显,下面来给大家简单介绍一下AI参与在测试流程中的实践方案。
本文介绍在C3级代码仓库中落地LLM代码评审的Agent实践。针对C3仓库禁用闭源模型的安全要求,基于Qwen3-Coder、RAG、Iflow实现,通过百炼Embedding构建知识索引,RAG知识库与生产代码同仓管理,文档与代码共生命周期保障一致性,AI辅助人工代码评审。在CI流水线监听代码修改自动触发AI评审,LLM进行代码解释、逻辑分析和识别并发缺陷、资源泄漏、边界错误、性能瓶颈及规范问题。以块存储C/C++百万行大库为例,已累计执行上千次评审,并部署至存储统一代码门禁平台,支持平台接入所有仓库。 实践表明,AI可有效发现传统CR易忽略的逻辑风险,已数十次成功拦截高危缺陷,显著提升评审效率与质量。当前持续优化准确性、误报率、采纳率,增强上下文感知,探索修复建议生成。该实践可复用于各类代码门禁平台或AI辅助编程工具。
本文介绍了一种面向天猫行业中后台前端研发的AI智能体(Agent)系统设计,旨在通过垂直化、多智能体协同和以需求为中心的架构,实现从产品需求文档(PRD)到代码交付的自动化研发流程。文章分析了当前AI辅助编码的提效瓶颈,提出将AI介入点前移至需求阶段,并构建了包含需求分析、任务拆解、代码生成与部署等子Agent的Multi-Agent体系。系统结合ReAct模式与“人在环路”机制保障准确性,采用本地化MCP服务和GraphRAG知识图谱提升安全性和上下文理解能力,同时引入视觉优先的多模态UI测试框架。最终目标是让开发者从重复性工作中解放,专注于高价值创新,推动研发模式由“工具辅助”向“需求驱动”的范式变革。
首先需要说明一下,标题中智造特指联调中的造数,是的,就是联调造数这么一个特定的场景下,我们采用了多个agent协同完成。联调造数是一个非常典型的AI应用场景,其背后是用户丰富的语言表达、复杂的业务场景、精准的指令执行。最初的时候,我们采用的是单agent模式,随着工具的不断接入和场景的不断深入,才逐步地演变成多agent模式(意图识别、工具引擎、推理执行等)。我会结合实际场景分别介绍两种方案,前者可以满足较为简单的造数场景,后者用以应对复杂的场景。