• 精选
  • 会员

智能导购?你只看到了阿里知识图谱冰山一角

2018年11月5日  来源:新零售技术解读 作者: 提供人:hahahao010999@1......

在刚刚结束的2017第四届世界互联网大会上,评选出了年度18项代表性的领先科技成果,阿里云ET大脑就是其中之一。众所周知,融合了先进的大数据、人工智能技术的阿里云ET大脑已经在智慧城市、智慧交通等众多领域得到了应用和推广。但你知不知道,阿里巴巴还有一个智慧的“大脑”,是你每天都离不开的。它就是智能消费导购与商品管控背后的“商品大脑”—— 阿里巴巴商品知识图谱。

就让我们一同走近阿里巴巴商品知识图谱,看看它神秘的面纱背后,到底有哪些闪亮的“黑科技”。

智能导购?你只看到了阿里知识图谱冰山一角

人工智能应用的“基础设施”

阿里巴巴商品知识图谱已经广泛应用于搜索、前端导购、平台治理、智能问答、品牌商运营等核心和创新业务,但是对于普通消费者来说,感触最深的还是它让网上购物的体验更佳。举例来说,网上导购就是让消费者更容易找到他们想要的东西。当买家在搜索栏中输入“我要一条漂亮的真丝丝巾”,阿里巴巴商品知识图谱就会通过语法词法分析提取出语义的要点,如 “一”、“漂亮”、“真丝”、“丝巾”等关键词,并据此帮买家实时搜索到适合的商品。随着大数据、人工智能等技术的快速进步,阿里巴巴商品知识图谱也变得越来越聪明,可以通过实时学习构建出场景,当你输入“去东北滑雪要买什么”时,搜索结果中会出现与滑雪相关的各类商品信息。

智能导购?你只看到了阿里知识图谱冰山一角

什么是知识图谱?它是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互关系。简而言之,知识图谱就是机器大脑中的知识库,也是人工智能应用的基础设施。

在创造了“双11”一个又一个销售奇迹之后,可想而知,阿里巴巴的商品库有多么庞大,来自于淘宝、天猫、1688、AliExpress等多个市场的数据,品牌商、行业运营、治理运营、消费者、国家机构、物流商等多种角色参与其中。让电商大数据更好地服务消费者是阿里巴巴首先要解决的问题。

阿里巴巴选择以知识图谱的理念重构电商核心数据,通过知识表示技术实现商品数据的标准化, 通过命名实体识别和实体链指技术与内外部数据之间的深度互联,通过逻辑推理校验图谱数据质量,进一步补全图谱关系。

阿里巴巴商品知识图谱的强大具体表现在哪些方面?它承载着商品标准化这一基础性、根源性的工作,通过知识表示来规范对商品数据的描述。正因为如此,我们才能知道哪些商品是同样一件东西,产品卖到了哪些市场,单品的销量可以被精确统计……

阿里巴巴商品知识图谱以商品、 标准产品、 标准品牌、 标准条码、标准分类为核心,利用实体识别、实体链指和语义分析技术,整合关联了诸如舆情、百科、国家行业标准等9大类一级本体,包含百亿级别的三元组,形成了巨大的知识网。基于这个巨大的知识网络,消费者的购物体验得到持续改善,消费者判断的成本也逐步降低。

概括说,阿里巴巴商品知识图谱综合利用前沿的NLP、语义推理和深度学习等技术,打造了全网商品智能服务体系,服务阿里巴巴生态中的各个角色。

也正因为如此,在11月7日举行的2017中国大数据技术大会(BDTC)上,阿里商品知识图谱荣获“TOP10大数据应用最佳实践奖”,赢得了市场和用户的充分肯定。

智能导购?你只看到了阿里知识图谱冰山一角

阿里巴巴业务平台商品知识图谱负责人张伟(左七)代表团队接受颁奖

知识图谱背后的“黑科技”

你可能每天都会到淘宝或天猫上逛逛,但可能从未留意过“后台”到底是什么能让你的购物体验变得更加顺畅、轻松。阿里巴巴知识图谱每天的拦截量达到千万级别,全量智能审核次数达到亿级别,最大限度地保护了知识产权,以及消费者权益。

阿里巴巴商品知识图谱的一个核心功能是“平台治理”,它是保证阿里巴巴商业生态安全、可靠运行的基本保障。举例来说,阿里巴巴商品知识图谱被用于阿里电商平台的管控。过去,电商通常只能通过人工巡检对商品发布进行审核,而现在面对海量的商品发布量,人工巡检模式捉襟见肘。形象地说,阿里巴巴商品知识图谱就像拉起了一张过滤网,通过大数据分析、人工智能等技术,筛查出不良信息,阻止其进入阿里巴巴生态。

阿里巴巴商品知识图谱能够实现如此高效的智能识别,其背后是否也有“黑科技”助阵?答案是肯定的。这里主要介绍一下阿里巴巴商品知识图谱是如何实现推理的。

阿里巴巴的业务知识/规则、管控知识/规则、国家行业规则错综复杂。针对这种情况,阿里巴巴设计了一套框架做知识表示和推理,并按照不同场景,将推理分为上下位和等价推理、不一致性推理、知识发现推理、本体概念推理等。

所谓上下位和等价推理,就是在检索父类时,通过上下位推理把子类的对象召回,同时利用等价推理(实体的同义词、变异词、同款模型等),扩大召回。一个例子,比如需要拦截“产地为某核污染区域的食品”,推理引擎翻译为“找到产地为该区域且属性项与产地同义、属性值是该区域下位实体的食品,以及与命中的食品是同款的食品”。

另外,不一致推理是指在与问题卖家对弈的过程中,需要对商品标题、属性、图片、商品资质、卖家资质中的品牌、材质、成分等基础信息做一致性校验。比如,标题中的品牌是Nike,而属性或者吊牌中显示的品牌是Nake,这些标称不一致的商品即被推理引擎判断为有问题的商品。

在推理引擎的背后,其实是把自然语言通过语义解析(Semantic Parsing)转换为逻辑表达式(Logical Form)。语义解析采用了结合神经网络和符号逻辑执行的方式。而逻辑表达式又会触发后续的逻辑推理和图推理。

智能导购?你只看到了阿里知识图谱冰山一角

推理引擎背后的技术框架

伴随着阿里巴巴商品知识图谱的建设,阿里巴巴电商平台的管控已从过去的“巡检”模式升级为发布端实时逐一检查。阿里巴巴商品知识图谱的推理引擎技术满足了智能化、自学习、毫秒级响应、可解释等更高的技术要求。

三年,阿里巴巴知识图谱到底做了什么?

提到知识图谱,很多人可能会首先想到谷歌、百度。他们确实起步比较早。不过,阿里巴巴仅用三年时间,就成功打造出国内最顶尖的电商域知识图谱。阿里巴巴是以应用促创新的典型代表。正是因为有了阿里巴巴庞大而复杂的商业生态,正是出于让用户拥有更好体验的不懈追求,才让阿里巴巴在知识图谱,甚至更广义的人工智能领域不断取得突破。未来,阿里巴巴还将继续深化与学界专家的合作,共同培育和打造开放的知识图谱社区。

阿里巴巴商品知识图谱在今年的杭州云栖大会上一亮相就博得了满堂彩。借此机会,阿里巴巴广邀全球技术领域的专家与学界大咖,共同研讨知识图谱领域的现状与远景,加深交流与互动。阿里巴巴早就与苏州大学国家杰出青年基金获得者张民教授及其团队建立了合作,研究知识图谱领域里涉及的文本处理前沿技术,此外还与浙江大学陈华钧教授的团队建立了合作,主攻知识图谱领域里知识表示与推理前沿技术方向。阿里巴巴商品知识图谱团队还与国际上的专业组织频繁交流与合作,全面开展数据合作。

让人感到兴奋的是,人工智能领域的顶级会议之一——2018年国际人工智能协会年会(AAAI)将在美国新奥尔良举行,阿里巴巴有多篇论文入选,其中就包括阿里巴巴业务平台事业部与苏州大学知识图谱联合项目的两篇论文。论文主要关注知识图谱构建过程中文本挖掘核心技术的创新。

仅用三年时间,阿里巴巴就积累并形成了一个巨大的知识图谱和海量的标准数据,通过与高校的联合研发,引入前沿的自然语言处理、知识表示和逻辑推理技术等,形成了完整的知识图谱技术平台,打造了全网商品智能服务体系,稳定支撑线上的全球消费者和卖家。知识图谱已经成了阿里“新零售”和国际化发展的智能引擎。

智能导购 / 知识图谱

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000