前言
在看多了所谓 AI 研发提效的 case 以后,我最近对 AI 在业务场景中的落地产生了浓厚的兴趣,AI 能够如何解决业务问题,给业务带来增量价值,这非常考验业务观察力和技术思考力,毕竟发展才是硬道理。笔者注意到 Shopify 刚好有这方面的应用案例,落地场景也是笔者熟悉且很接地气的电商领域,整理出来以供分享交流。
问题背景
Shopify 的商品分类系统每天需要处理数千万次商品归类,在商业世界瞬息万变,新产品不断涌现的当下,Shopify 需要在维护其庞大(10,000+ 类别和 2,000+ 属性)的分类体系下,确保体系自身的可扩展性以服务好商家和消费者,该商品分类系统面临着以下三个问题:
规模问题,每种新型产品、新兴技术类别以及季节性趋势都可能需要更新商品分类体系,而传统的人工维护分类的方式则无法跟上这种变化节奏。新产品的涌现不仅代表着新的分类需要,还意味着需要引入全新的属性集合,以智能家居设备或远程办公设备为例。智能家居设备需要定义连接类型、电源需求和兼容性等新的规格属性。
专业知识问题,高效的分类体系设计需要深厚的领域专业知识。举例来说,需要理解不同类型吉他拾音器之间的细微差别、工业设备的分类层级,或是护肤产品所需的恰当属性,都需要在数十个垂直领域具备专业知识。而 Shopify 的商品分类团队无法在商家销售的每一个产品类别中都保持专业水准,这种不一致或结构不佳的分类体系会直接影响商家的商业成功,具体表现为商品可发现性降低、搜索结果不理想,以及顾客筛选项无效等。
一致性问题,随着分类体系的自然增长,不一致性问题也会逐渐显现,表现在相似的概念在不同类别中被以不同方式表示,同时还存在命名规范上的不一致(比如说不同类别下的材质属性命名不一致,有的叫面料,有的叫材质),以及商家和客户之间在产品分类上的差异。这些不一致性随着时间的推移而累积,导致商家在商品上架时感到困惑,也让消费者在筛选和比较产品时感到沮丧。更关键的是,这种不一致性会劣化分类系统的准确度。
Shopify 的解法思路
Shopify 的分类体系管理方法经历了从最初的手动管理流程到 AI 驱动的转型突破,使其能够随着现代商业的复杂性而扩展。
传统分类体系管理
传统的分类体系在更新分类时遵循一种熟悉的模式:领域专家进行产品数据分析,识别差距或不一致之处并提出修改建议,并通过细致的人工审查流程来进行变更保障。这种方法虽然确保了分类的高质量,但很明显它也带来了资源瓶颈,有限的专家资源与长流程的高耗时势必难以跟上商业快速发展的变化节奏。
这种分类方式本质上也是一个被动的过程,只有在商家开始上架那些不完全符合现有结构的产品之后,平台侧才会意识到需要增加新的类别或属性,而此时已经算是后知后觉,平台侧已经错失了为商家和客户提供更好体验的机会。
基于智能体的突破
先进大语言模型的出现为彻底重构分类管理体系提供了机会。Shopify 的想法是在保持人工整理所提供的质量和领域知识的基础上,让 AI 来提供所需的可扩展性和一致性。
其中的关键在于认识到,算法侧可以通过结合不同维度的分析以获得更全面的系统洞察,比如分析分类体系本身的逻辑结构以及识别类别层级之间的空缺或缺失的属性关系等。举例来说,假设我们的服装类目下有上衣,下装和外套等分类,当智能体自动分析这个结构时就可能会发现一些逻辑上的漏洞,服装类目下还应该有内衣,睡衣,运动服等,否则商家在上架商品时就不得不硬塞到现有类别中,这会导致用户在商品搜索时系统也无法精准匹配,从而影响导购效率。
此外,系统还可以通过真实的商品数据来理解商家事实上如何描述他们的产品,以及哪些商品属性是比较关键的购买决策因子。
Agent 技术设计
Shopify 的 AI 智能体系统遵循三个基本原则:专业化分析、智能协调和质量保障。Shopify 并不仅仅只是简单的将 AI 应用于商品分类的体系管理,而是利用专业化的 AI 智能体对分类体系进行持续的演进迭代,而非静态构建。每个组件都解决了其在扩展分类体系管理过程中遇到的特定挑战,同时保持了平台所需的专业性和一致性,包括:
- 真实商品数据分析: 系统整合了来自平台上的真实商家商品数据,确保 AI 提出的更改能够真实反映商家描述和分类其产品的方式。这使得分类体系的决策可以基于真实的商业实践,而非纯粹的理论组织原则。
- 多智能体专业化: Shopify 采用了多个专业化的智能体,分别专注于结构一致性和商品洞察,并进行智能合成。这种多维度结合能够发现单一方法无法识别出的优化手段。
- 复杂的等价发现: 系统能够检测复杂的等价关系,某特定类目可能等同于通过属性值过滤后的更宽泛类目。这意味着商家可以根据其业务需求最佳地组织他们的商品目录,而平台系统则能理解其底层的产品关系。这么说可能有点抽象,举例来说,假设有商家 A 和商家 B。商家 A 主要销售手机配件且倾向于为热门商品创建较为具体的分类,以方便管理和用户搜索。针对手机壳产品就分别设置了 iphone 手机壳,三星手机壳已经华为手机壳等三个子类目,且不同品牌手机壳下还按照手机型号添加了更加细致的子类目,比如 iphone 15 pro max 手机壳。而商家 B 销售的商品种类更加广泛,其更倾向于使用较为宽泛的商品类目,然后通过属性来细化商品。其设置的商品类目中手机壳产品下并没有更多子目录,只有相关的商品属性,比如品牌(Apple, 三星,华为),型号(iphone 15 pro max),材质(硅胶,皮革)等。AI 智能体通过等价检测能力,可以智能理解这两种看似不同的分类方式实际指向的是同一类商品,商家可以根据自己的业务特点灵活的管理和设置类目,而无论商家如何分类,平台都能向消费者展示所有相关的“iPhone 15 Pro Max 手机壳”,从而提高商品的可发现性,优化搜索结果,并最终提升客户体验和商家销售额。
系统架构流程图
整个智能分类系统的执行流程如下图所示:
智能体与分类体系的交互
为了让 AI 智能体有效地分析和改进分类体系,Shopify d单独实现了一个评测系统,允许智能体搜索相关类别、检查层级关系,并验证智能体提出的更改是否可能与现有元素冲突。
这一评测系统使智能体能够进行上下文分析,不仅可以理解孤立的类别或属性,还可以理解它们如何融入更广泛的分类体系结构。例如,一个分析吉他相关类别的智能体可以探索整个乐器层级结构,检查不同乐器类型之间的相关属性,并识别有助于做出更好结构决策的模式。
多阶段分析 pipeline
这套系统是一个多阶段分析的组合,通过专业化的智能体结合了不同类型的专业知识,每个智能体都针对特定类型的洞察进行了优化。
- 结构分析智能体: 检查分类体系本身的逻辑一致性和完整性。该智能体识别类别层级中的空白、命名约定中的不一致,以及更好地组织相关概念的机会。它纯粹基于分类体系结构运行,确保逻辑连贯性和组织原则的一致性。
- 商品数据分析智能体: 整合真实的商家数据,检查商家实际描述商品和定义分类的方式。该智能体分析商品标题、描述和商家定义的类别中的模式,以识别商家对其商品的认知与我们的分类体系表示方式之间的差距。
- 智能合成智能体: 融合来自两种方法的洞察,解决冲突并消除冗余。当结构分析提出一种改进,而商品分析提出另一种改进时,这个合成过程会确定最佳的前进路径,通常会结合两者的洞察。
- 等价检测智能体: 解决了商业中的一个基本挑战:如何在保持商家灵活性的同时,实现智能化的系统行为。这个自主智能体识别当不同分类方法表示相同产品集时的情况,为理解商家组织偏好下产品关系的系统奠定了基础,等价检测的价值前序已有例子介绍。
自动化质量保障
最后一个阶段通过专业化的 AI 评估智能体进行自动化质量保障。这些评估智能体会应用领域专业知识和分类体系设计原则以及先进的推理能力评估前序 agent 提交的更改,在人工审查之前过滤和完善建议。
针对不同的变更类型,如添加新属性、创建类目层级或修改现有结构,需要不同类型的评估。Shopify 的评审系统会对每种更改类型使用专门的评估标准,确保技术要求、业务规则和领域专业知识得到正确应用。
领域特定评估员为不同的产品垂直领域提供专业知识。例如,专注于电子产品的评估员理解该行业特定的技术要求和常见模式,而专注于乐器的评估员则应用与该领域相关的不同专业知识。
结果与影响
从人工分类体系到 AI 驱动的演进,使 Shopify 能够在保持分类体系质量的同时,同时也具备高度的可扩展性可以灵活应对日益增长的商业复杂性,其获得的收益是多方面的,包括:
效率提升
AI 智能体系统可以并行分析整个分类体系,识别出过去需要数周人工分析才能发现的改进机会。人工分类体系专家每天仅能分析几个类别,而该系统能够全面评估数百个类别,同时检查结构一致性以及与真实产品数据的一致性。
这种效率提升对于新兴产品类别尤其有价值。当新型产品平台侧普及时,系统可以迅速识别分类体系中的空白并提出全面的解决方案,而不是随着时间累积再去被动修补技术债务。
质量改进
多智能体方法提升了分类体系演进的一致性和全面性。通过将结构分析与真实商品数据相结合,我们识别出任何单一方法都无法发现的改进。结构分析确保了逻辑一致性和正确的层级组织,而商品数据分析则确保了类别和属性反映了商家实际描述和区分其商品的方式。
自动化质量保障层可以在人工审查之前就发现潜在问题,并确保领域特定专业知识在不同产品垂直领域中得到一致应用。这也减少了从初始提案到最终实施通常所需的迭代周期。
智能体可以快速识别真实的商家需求,提出解决方案,并获得复杂的评估。所有的这些协同工作都会系统性地优化分类体系。
以系统处理手机配件为例:假设商品分析智能体发现商家经常宣传充电器、手机壳和钱包等配件的“ MagSafe 支持”特性,该智能体会建议添加一个“ MagSafe 兼容”的布尔型属性,以帮助客户筛选出支持 MagSafe 的产品。专业的电子产品评审员可以评估这一提案,在验证没有重复属性存在后,确认该布尔类型是合适的,尽管是品牌特定,但 MagSafe 代表一个合法的技术标准,类似于蓝牙或 Qi 充电。评审员以 93% 的置信度批准了该属性,并指出它将“改善客户对支持 MagSafe 的充电器、手机壳、钱包等的筛选”。
分类体系开发规模化
最重要的是,该智能系统在根本上改变了 Shopify 进行分类体系开发的方式。系统可以主动识别和解决分类体系中的空白,而不是由特定商家需求或平台限制触发的被动改进,从而在它们影响商家和客户体验之前加以处理。
系统处理和推理整个分类体系结构的能力使得全面的改进成为可能,这些改进考虑了跨类别关系并保持了全局一致性。这种整体方法避免了在孤立地解决分类体系问题时经常出现的碎片化问题。
为了验证这种系统性方法,Shopify 将 AI 驱动的分类体系演进方法专门应用于“电子产品 > 通信 > 电话”领域,并将其与我们以前的手动扩展方法进行了比较,效果如下图所示:

未来展望
AI 能力的持续进步会进一步增强我们的分类体系演进系统,并与我们的产品分类管道建立更紧密的集成,包括:
智能体能力的提升
增强的推理能力可以对商品关系有更细致的理解,也可以更好地检测细微的不一致性,以及更精妙地综合来自不同分析方法的冲突洞察。
此外,AI 专业评审员的领域专业知识也有可能得到进一步扩张,使其能够以更高的精确度和理解力处理日益复杂的商品类别和新兴的商业趋势。
国际化支持
随着 Shopify 全球业务范围的不断扩大,当前的分类系统还需要更好地支持国际商业,这包括理解商品分类和属性相关性在不同市场和文化中可能存在的差异,以及如何在保持一致性的同时允许区域定制。
更深度的集成到分类系统
分类模式和商家反馈可以为分类体系的演进提供数据,而分类体系的改进则可以立即提升分类准确性和商家的接受率。
Shopify 设想的未来是,这些系统之间可以无缝协作,分类体系的演进由真实的分类表现所驱动,而分类则受益于不断优化的分类结构,从而形成正向循环。
总结
Shopify 的商品分类体系经历了从手动、被动流程到 AI 驱动、主动改进系统的根本性转变。通过结合多种类型的分析、自动化质量保障和人类专业知识,该智能分类管理系统能够随着现代商业的复杂性而扩展,同时保持我们的商家和客户所依赖的质量和一致性。
这项工作也展示了 AI 智能体如何在复杂、知识密集型领域增强人类专业知识。AI 智能系统并非要完全取代人类判断,而是可以放大团队能力,使员工能够专注于高层次的战略决策,而 AI 则负责支撑有效分类体系管理的全面分析和质量保障。
在笔者看来,这是一个非常好的 AI 在业务中落地并切实解决业务痛点的应用案例。
参考
若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏
扫描二维码,分享此文章