“两栖动物”京东
京东技术人员过了个不一样的春节。
1月5日,中央广播电视总台宣布京东成为2022年春晚独家互动合作伙伴,从腊月二十二(1月24日)至元宵节(2月15日),京东发出总计15亿元的红包与实物。
此为京东首次抢占春晚这个流量制高点,从微信到支付宝,再到百度、快手、抖音等,头部科技公司曾轮流登场,现在轮到京东了。
这也是在刀尖上秀技术肌肉。技术团队只有19天时间用于综合备战,经过7轮压测,最终在不增加服务器的情况下,京东云经受住了春晚史上最长的红包互动和最复杂应用场景的严酷考验,
在上一篇关于京东的研究中(见《双十一落幕,新型实体企业登场》一文),我们从数智化供应链角度进行剖析,本文继续以京东为样本,从更细颗粒度解析新型实体企业的技术特点。
自2019年12月之后,京东就没有CTO了,取而代之的是集团技术委员会。集团CTO角色,对大型科技公司而言并非标配。阿里与百度一直都有CTO,腾讯在2014年张志东离职后,CTO处于空缺状态, Netflix虽以工程师文化著称,也没有 CTO 。
京东集团没有CTO ,有更为独特的原因,与它新型实体企业的属性密切相关:它是技术上的两栖动物,不只要解决数字世界的商业难题,还要解决物理世界的商业难题,而且要链接数字世界与物理世界,随着它规模变化,这种技术场景下复杂度也会呈现指数级增长。
在2017年2月年会上,刘强东喊出“下一个二十年,京东只有技术!技术!技术!”,此为京东全面向技术转型的标志。
5年之后,可以验证这仅是一个口号,还是真正的技术信仰。截止2021年9月30日,京东运营着近1000万自营商品SKU、数十万商家,服务超5.5亿消费者,拥有超过40座“亚洲一号”大型智能化物流园、1300个不同层次的仓库,在全国25座城市投用近400辆智能快递车,还有1.5万多家京东家电专卖店覆盖全国超60万个行政村,远在西藏林芝、阿里地区的农牧民同样可以实现当天下单次日达。它还将技术能力向外赋能,京东云为1500多家大型企业、超152万家中小微企业提供产业数字化升级服务。
要支撑如此庞大的商业生态体系,背后只能是AI、云计算、大数据、物联网、区块链等技术,到2021年9月30日,自2017年以来,它已在技术上累计投入已近750亿元,为国内技术上投入最多的科技公司之一。
经过调研与访谈,我们发现京东作为“两栖动物”有五个关键技术特征:腾挪,计算资源能够敏捷高效的调度;一体,线上与线下的动作要无缝、流畅、实时的匹配在一起;落地,不追求技术的炫酷,一定要与产品和场景深度结合;弹性,随着业务的多元化,前端的敏捷灵活要建立在稳定的底座基础之上。
以下为本文核心要点:
1.京东春晚项目背后涉及的资源快速释放与就位,堪比实体建设中的“三元桥换桥”。这不仅是京东云的胜利,也体现了中国云厂商的技术领先性与业务成熟度,犹如变形金刚,能够根据“战场”不同,快速变身。
2.数字化与传统线上化的差别在于,后者只是把 Excel翻到线下去,没有回馈,而数字化最终一定会回馈到作业过程,形成闭环。
3.京东技术之“实”,“实”在要与产品及场景相结合。这种求实的风格体现在京东技术的每个环节,即不一定选择最先进的,而是选择最合适的,性能满足的前提下成本最低。
4.建设中台是一门艺术,中台不是一个筐,什么都能往里装。京东中台的目标是更聚焦,更稳定和更可扩展,由此更方便更高效更快捷的去支持新业务场景 。
5.新型实体企业对京东而言,不是一个炫酷的概念,一路摸索过来,背后都是血泪汗。当自己的品类与规模没有达一定层级时,它自己也很难预测会遇到什么样的坑。
6.2017年前后拐点已至,靠加人力,加服务器、或者兄弟们艰苦奋斗,都不足以解决问题,必须重新审视“技术”的含义,来构建起全新的数字化核心竞争力。
7.对技术团队的管理,与物流配送客服等业务的管理风格不太一样,京东在业务上是两栖的,在文化和机制上也需要两栖来与之配合。
1
腾挪 资源的迅速切换
除夕晚上10点06分,春晚进行时,家住贵州省毕节市的李女士就收到了京东快递送来的互动奖品,这是春晚互动活动实物好礼第一单。
对李女士来说,只是窝在沙发上参与了一个红包+好物的“拼手气”环节,但对京东春晚项目团队而言,涉及到交易链路近百个核心子系统协同,以及在春晚流量洪峰冲击下,登录、参与活动、查看奖品、红包核销等各个与用户息息相关的环节。
京东混合云研发总监,云舰产品负责人樊建刚透露,春晚场景开始前,京东云需要调度上千万核资源用于春晚。春晚中,主持人将口播7次红包互动,伴随每次口播,业务场景将会从京东APP的购物场景到红包互动再到购物切换,京东云要根据场景变化完成资源调度。春晚结束后,京东云还需调度资源支持日常业务的常态运营。共计十多次资源调度,要求高效、精准,实现对上千万核资源的超大规模瞬时切换。
电商购物节与春晚红包都已经是大家熟悉的场景,可当两种场景叠加,复杂程度就会指数级倍增。
曹鹏是京东集团技术委员会现任主席,他告诉我,内部预测相比双十一或618,系统面临的流量冲击要高5——6倍。从交易而言,发红包比大促要简单,后者涉及各种游戏规则、优惠条件判定、地域限制、会员等级等,不过从流量洪峰看,购物节流量毕竟由几大电商分食,而春晚是全国流量都压在一家平台。七轮口播意味着七次潮涌式超大峰值,可参照数据是,2021年全球有约12.72亿人观看春晚,期间累计产生红包互动达700多亿次,并且在数十秒内,有数十亿人次(累计)参与互动点击,形成亿级的QPS流量洪峰,相比友商春晚抢红包,京东挑战也不一样,除了红包还可以发各种优惠券,有一元、一分购买的实物券,满减券,无门槛京券等等,它们需要支持高并发分发,分发完以后,红包要实时让用户可以看得到,可以实时在系统上使用与购物。
要解决规模如此巨大的网络互动,过去方式主要是单纯堆叠计算资源,也就是加服务器。不过由于疫情原因,有钱也买不到足够服务器,而且春晚又是一个独立项目,为单个项目投入大量硬件成本,显然并不合适。
京东云研发团队经过充分论证和评估,选择了一条以技术能力深挖服务器算力潜能的创新之路,在不增加服务器的情况下,通过敏捷高效的资源腾挪调度,实现服务器能效利用最大化。这是业内首次在不增加服务器资源的情况下保障春晚互动。京东集团副总裁、京东零售云总裁颜伟鹏是春晚技术备战总指挥,他最初接到这个任务后也是一愣,1月初第一周活动才定下来,留给系统开发的时间太仓促了。有同事和他说:Paul(颜伟鹏的英文名) 肯定搞不定吧,怎么办?还有人劝他,别接这个事了,技术上不可能。颜心一横:先接了再说。
他的底气之一来自于“泰山系统”,这是保障京东零售全链路安全的市场体系,过去两年来持续打造。该系统已高效支持了过去四次6·18与双十一大促,取得了零事故的成绩。这次京东启动此系统支持春晚的项目,就是因为看中其支持高可用,不会宕机,再者有弹性能力做资源调配,还可以支持体系外协同多部门,多技术板块协同能力,在买不到更多服务器前提下,还能够去调度,通过各种机器灵活扩缩容,额外调度150多万核机器资源来支持春晚大促,等于一下把整个QPS(每秒查询率)提升到了千万级。
京东云还有一套混合云操作系统云舰,其所有底层业务、服务承载和算力资源,都以云舰为底座,提供业务场景与资源切换的技术保障。云舰的作用,在于消除底层各类软件基础设施差异,将所有可供调配资源聚合在统一资源池内,然后通过阿基米德智能调度系统,来实现资源需求的即时响应。
即使有泰山镇宅,云舰护航,阿基米德扮演上帝之手,实战中依然无法保证做到零差错,为此技术团队模拟抢红包的用户真实使用场景,启动七轮高保真全链路压测。
所谓压测,是基于实际业务场景与系统环境,模拟海量用户请求和数据,对各种场景做测试与验证,以便发现瓶颈从而调优。根据京东云基础设施研发部高级总监,春晚项目IDC基础保障负责人常亮介绍,压测是模拟春晚高并发前提下,系统会怎么去反应,每个压测都有“剧本”,要模拟机房断电、服务器崩溃、硬盘故障和网络中断等各种令工程机心跳加速的故障,以锤炼团队协作应变、快速响应能力。
若没经过压测,就意味着不知道能否扛得住春晚的压力。只是时间太紧张了,七轮压测意味着隔一天要做一次,每次写完代码就要测,而压测时根本睡不了觉。
颜伟鹏回忆起自己最担心的第一次压测,只有50%通过率,因为每个压测都有剧本,第一次压测剧本写得不全,因为代码还没写完,只有50%通过了,这是京东史上最低通过率压测,双十一、618第一次压测通过率都在70%以上。最初看到结果之后,兄弟们压力很大,颜鼓励大家,双十一、618剧本已跑了好多遍,现在这个剧本是新剧本,第一次压出来通过率太高就说明剧本没写对。
其实颜自己心里也挺紧张,不过他明白,打仗时还是要有士气,如果泄气了,仗就打不赢了。之后每一轮压测,剧本越来越复杂,通过率却越来越高,到了第七轮,剧本相比第一轮复杂了10倍,但通过率最后达到了100%。
2月10日,京东对外公布了央视春晚红包互动成绩单。数据显示,春晚期间,全球华人参与京东APP红包累计互动量达691亿次,当天晚上,伴随着7次红包口令,京东云在日常网购场景与红包互动场景有多达16次资源精确腾挪,并在“常态模式-春晚模式-常态模式”两次涉及超过1000万核资源等级的场景中无缝切换。
这背后涉及资源的快速释放与就位,堪比实体建设中的“三元桥换桥”。2015年11月13日23点,北京三元桥更换“桥面”工程正式启动。仅仅一夜时间,三元桥桥面就要全部更换,旧桥面切割运走,新桥面完全就位,仅仅24个小时,后续工程及沥青路面恢复就要完成。整个换桥过程耗时43个小时,新桥梁与预定位置误差控制在9毫米之内。
京东云在此役中凭借全面容器化的优势,保证了春晚当天“换桥”过程中,“桥墩”可以快速在当天那一时刻半小时或者更短时间内,进行下线重新快速进行上线,然后再通过京东云调度,从资源池中调取资源快速切换到需要应用的池子里,在运转结束后快速下线。
此种全面调度腾挪在全球领先,也是中国云计算行业的首个案例。这不仅是京东云的胜利,也体现了中国云厂商的技术领先性与业务成熟度,犹如变形金刚,能够根据“战场”不同,快速变身。
2
一体 数字化的真谛
这也是一场全程破壁虚与实的春晚,把线上线下场景彻底结合。
虚与实的结合,如同一场春晚。节目的呈现,需要演员、灯光、舞美、导演、策划、脚本、转播等多方位的配合;让更多电视机前、手机屏幕前的观众看到,则需要转播技术、通信信号、网络等多方面的基础建设。
在《双十一落幕,新型实体企业登场》一文中,我曾以一台电暖器的客户购买旅程为例,演示了交易背后的供应链技术,现在我们假设你在春晚的活动中抢购了一台电暖器,看看在京东物流三位一体供应链技术体系下,它的物流经历。
智能物流履约过程,会分为几大环节。首先,在春晚活动中抢购了一台电暖气,后面你在APP上就能看到拣货复核打包出库的物流路径显示。然而,就在你下单抢购之前,在超95%日均单量预测准确率的大数据保障下,京东物流就已经根据15亿红包和实物,以及年货节的实际情况进行了智能预测,提示商家提前将你想要购买的电暖气存储在离你最近的仓库了。在你下单的时候,你购买的电暖气就会从这里以最快的速度分拣打包出库。这种科学合理的供应链管理,能够实现商家的全国库存合理分布、降低跨区履约、提升订单配送时效。
当你的电暖气出完库后,这个快递包裹就会交给分拣中心,分拣完后才能出物流园区。京东目前有1000万个SKU(最小存货单位),你发出订单,订单里有电暖器,可能还有一台iPhone13和几本书。这几种商品入库时应该放到什么样的位置,都会影响出库的效率。像iPhone13由于是爆款,通常会放在离打包台比较近的储位,这就是到商品布局。如何布局最优涉及大量参数,与品类、当地消费数据、物流数据都有关系。
“我们要结合这几类的数据把它放在一起,最终算出一个最优库存布局。在拣货的时候,任务单应该怎么去算,是10个订单算1个任务单,还是20个订单算1个单?拿到拣货任务单之后,又会涉及拣货路径规划,仓库内部有很多巷道,按不同品类去摆放,拣货人员先去哪个巷道再去哪个巷道最优最快,都需要运筹”。京东物流智能供应链平台创新业务负责人者文明告诉我。
拣货完成后就需要进行物流运输。那么如何以最快的速度将你订购的电暖气送到手上,这个时候就离不开京东物流的LBS地图基础技术服务。在订单履约过程中,需要根据你的地址信息将订单信息分配给最近的配送站点,定位越准,那么配送路径越短,履约速度当然也就越快。当然,当你打开京东APP后,你会看到系统推荐的附近相关商品,这也是基于京东物流的地图基础技术服务。为了应对春晚期间前所未有的流量冲击,京东物流对地图的地理编码服务和解析能力做了针对性优化。其中,地理编码服务准确率从91%优化提升至95%,解析四级服务从97.83%提升至98.54%,为应对瞬间高并发大流量冲击,优化缓存方案,通过多级缓存,提前预热,同时优化索引结构来大幅缩短查询响应时间,做到99%流量毫秒级响应,并通过提供多样化准确可靠的LBS相关服务,保障了年货节尤其是春晚期间用户流畅的使用体验。
正是在上述三位一体供应链技术体系的保障下,你所订购的电暖器才会第一时间送到你的手上。正如京东集团副总裁何田教授所说,“京东物流三位一体供应链技术体系即京东物流软件、硬件及系统集成的三位一体供应链物流技术,在长期技术投入和创新驱动下,目前已形成了覆盖园区、仓储、分拣、运输、配送等供应链各关键环节的技术产品及解决方案,以提升预测、决策和执行能力,帮助更多客户全面优化供应链网络,实现更快速的物流体验、更准确地分拣派发,以及更稳定的供应链物流保障。”
因此,你会看到,一件商品从下订单开始,一直到你手上,实际上是了横跨了物理世界和数字世界的,而将物理世界和数字世界的能力组合起来,便体现出了京东物流的核心竞争力,也是京东物流在一体化供应链上以十年为周期的内功淬炼的体现,三位一体供应链技术体系也自然而然地成为行业所追赶的技术目标。
3
求实 技术落地到产品与场景
接下来我们再看京东怎样应用最新最酷的技术,如人工智能。
你还是买一台电暖器,遇到售后难题。你态度有些急,表达也不礼貌,翻来覆去几次才说清楚自己想要什么,可屏幕对面的客服小姐姐始终耐心解答,温柔客气,最终解决了问题。此刻你为自己刚才的态度有点内疚,同时也有一点好奇:为什么这位客服素质如此高?
你所不知道的是,这位客服小姐姐是一个AI,而且在交流过程中客服曾切换成真人,后来又切换回AI,而你对此毫无觉察,更没有发生信息的中断或遗漏。
这是京东集团副总裁、京东科技智能客服产品部负责人何晓冬博士的成果之一。何晓冬原为美国微软雷德蒙德研究院主任研究员及深度学习技术中心负责人,是人工智能领域世界级的顶尖科学家之一。他在自然语言处理、语音识别、信息检索与推荐这三个核心技术领域都颇有建树。2018年加盟京东后,他所做的就是将人工智能技术落地到具体而复杂的业务场景。
(京东集团副总裁何晓冬对项目进行前期部署)
智能客服就是最重要的场景之一,例如,语音技术要融合进交互产品,并不是只强调单独识别语音正确率,更需要关心在交互时,一些微妙的体验能否像真人之间进行。就像打断这种情况,许多做语音识别的大厂可能都没有花很多心思去研究,但在客服场景中,打断常见且处理不好还特别影响体验。
按照传统的方法处理打断,是检测到另一方说话,人工智能就停下来等你说完,你不说了再接过来。后来发现这样还不够,如很多老年人咨询问题, “呃”了半天就没说出一句话。这就意味着不能只从声学情况去做检测,还要考虑到语义是否完备,需要联合语音与语义进行研究。语音是一个信号问题,语义是一个意图问题。何晓冬团队基于此提出了新的语音语义联合建模方式,应用于客服电话,上线后对用户体验提升特别明显。
再如,前文所假设的真人客服与智能客服切换情况,需要人工和机器之间不停的交互。需要较高权限来决策时,如你要退了这个电暖器,或者说你意图很复杂,如自己也没想好是退还是换,此刻就会无缝转给人工。转时还会把之前交流的情况生成摘要,这样人工就知道聊到哪了,可以接着进行处理。关键问题解决后,常规问题可以继续由机器接手,此刻再转回去,机器来处理填表做工单,跟踪物流等事情。
甚至当服务结束了,用户已经下线满意离开,还有很多工作要做。如算法会检测整个对话中是否有一些语气没有洞察,应该对哪些情况有预警,还会进行质检,看客服小姐姐是不是脾气不好,说了一些不该说的话。甚至还可以进一步把知识和技巧总结出来,看对下次是否有用。
这仅是在售后中的应用,人工智能还可以从后台走向前台,进入售前咨询。这对技术是更大挑战,因为售后还是被动式服务,换而言之,是要等着别人来找你。用户遇到了问题肯定会来找,哪怕解决不了,他也会很同你交流。但售前就不一样了,你想买电暖器,客服两句话说不好你可能就走了。
如此意味要从简单的意图理解,或者说认知智能,进入决策智能的层面。也就是说,每一句话并非只是回答问题,还希望能够对用户决策产生影响。你要买电暖器,有对流式、石英管式、电热膜式、充油式四种可以选择,每一种都有不同的优缺点,在此背景下,智能客服需要作出判断:是直接推荐一款电暖器,还是多问几句?多问两句的好处是,可以更清楚知道用户意图,是想买升温快的还是对流强的,是想买寿命长的还是安全性高的?缺点是有可能把客户问跑了。
何晓冬认为,AI需要学会怎么做金牌导购,从大量数据中学习导购语言技巧和对话策略,以优化全局的购物体验结果为模型学习的目标。“所以,我们在看待人机对话技术的时候,不止是看到语音识别和意图识别,而是以具体任务为导向,构建具有从感知智能到认知智能再到决策智能的一个融合系统”。
京东在互联网头部玩家中是最为重视客服的公司,智能客服目标不是取代人工客服,而是希望整体效率提升同时,客户体验不下降。何晓冬每天都能在实战中看到机器变得更聪明,他自豪的说,你看一下我们的客服系统,其实是超出大多数学术界的想象力”。
这在实验室中是体会不到的,实验室更偏重基础科学,在未知领域产生新发现,而在实战中则可以突破商业化壁垒。
京东技术之实,实在要与产品及场景相结合。这种求实的风格体现在京东技术的每个环节,即不一定选择最先进的,而是选择最合适的,性能满足的前提下成本最低。
如在智能物流园,搬运机器人就采用了最新5G技术, 因为5G优势之一是低时延,搬运机器人的定位与导航要靠在线实时计算,需要依赖大量算法算力,传统搬运机器人在机器人单体上去做计算,因此单体的成本高,耗电大,采用5G之后,可以把算法上移到边缘侧,多台搬运机器人算法,用一台边缘服务器就把搞定了,15毫秒之内指令就可以传回单体。如此单体机器人就会成本更低,耗电也最低。
但园区内有的场景就不适合用5G,不是从技术上用了无法提高效率,而是从成本上用了就是浪费。如托盘的数字化,每个园区有六、七十万个托盘,用传统模式很难管,不知道托盘在哪,用了几个,坏了几个,是不是跑到别的园区去了。这个难题也可以通过给托盘加上5G模块解决,可成本账就算不过来,更适合用成本更低的射频识别技术。
“在京东,我经常说技术的同学要谦虚的去理解业务的语言,理解产品本身的语言”何晓冬认为,技术当然很在意是否受到尊重,但不能靠强制性的让别人尊重你,“如果产品同学让你忽悠好几次了,每次都说我的方案最牛,最先进,但一次不好用,两次不好用,第三次人家肯定不想听你说了”。
4
弹性:前端的敏捷来自更聚焦,更稳定和更可扩展的中台
如果你对所购的电暖器不满意,希望退换货,如上一节所示,会通过在线聊天、电话找到客服,客服进行接待,并将问题记录下来,最终京东官方会给出一个解决方案,可能是换货、退货或赔付;如果客户是从京东第三方商家买到的产品,那么京东还需要与商家执行仲裁。
当你发起了一项售后需求后,京东会调用很多部门,包括物流、仓储、维修等,才能在最快时间内拿出令你满意的解决方案,前台的敏捷反应,交易链路的精细化运营,都离不开中台。
2017年刘强东提出“技术、技术、技术”之后,同年7月,京东召开了中期战略会,确定两项组织变革:一,将之前的六大业务系统升级为群结构,向在线零售基础设施转向。第二,开始正式构建中台。
2017年前后,阿里、腾讯、百度、美团、滴滴等大型互联网公司都提出要大力发展中台,形成了一股中台热。
京东并不是为了跟风,而是要通过中台解决自己发展中积累的问题。
何谓中台?跳出专业表述,我们可以将中台视为一个资源整合与能力沉淀的平台,对不同的部门进行总协调和支持。
京东早期的应用结构都是单体应用,要求非常简单粗暴,一堆代码放上去能跑就可以了。
当业务开始快速增长,就出现了解耦与微服务化,需要将集群部署在多个不同数据中心,统一进行服务治理,包括建立自动部署体系、统一的日志体系、统一的监控体系等基本运维设施。
京东零售技术与数据中心交易服务研发部负责人尚鑫认为,2017年变革之前,京东体系之内有很多创新业务,如拍拍,最初在体系内孵化,之后随着业务迭代,开始拆分独立。
业务发展快,技术进展也快,在2015年—2016年之间,京东出现了一个技术闭环潮。研发人员有一个特点:自己写代码开发的系统用着才放心,别人的不愿意用,所以难免出现重复造轮子;另外,虽然各个系统产生的数据岁已经汇聚到大数据平台,但产品不同,因而数据计算逻辑和口径也不同,导致难以合并分析;特别当“部门墙”太厚时,还会导致信息不透明和传递失真。如说一个事情的时候,不同部门之间语言可能都不一样,关于价格就有多个定义,有前面的销售价,后台系统设定的基础成本价,还有促销后的折扣价,如果语言不统一,很可能开完会后在执行中发现全不是一回事。
确定中台战略后,京东开始做烟囱整合,将原有能力抽象为商品组件、库存组件、交易组件、订单组件、B端组件在内共几百个组件。同时,还从中台派驻专家级产品经理到业务部门,将业务动向快速传达给技术团队,中台也将反馈及时传达给业务部门,形成良性互动。
2019年初,时任京东商城CEO的徐雷曾放言,“大船必须要有龙骨,大中台将是京东商城永不停歇的超级引擎。因此,建设包含供应链、技术、营销、客服、基础平台业务等在内的大中台,是由我牵头的必赢之战!”
京东有商品中台、库存中台、促销中台、价格中台等大大小小十五个中台,提供的是业务通用能力,这些中台需要对语言框架、业务身份等形成统一,目前深度整合还在继续,包括全渠道底层能力都要进入中台。
建设中台是一门艺术,中台不是一个筐,什么都能往里装。
每家公司基因不同,对中台需求也有差别。以电商为例,表面上中台都要解决高性能、高并发下对成本和效率的要求,可相对而言,阿里的烟囱问题更明显,很多业务是分散着长出来的,如B2B事业群、 淘宝、阿里健康、文娱、菜鸟等,再加之它做了大量收购,导致烟囱壁更厚。阿里的中台主要就是为了打通,最初把大量的内容都放在中台。
京东的业务最初由基于零售的大集中系统中长出,后来前端网站、促销引擎,供应链管理系统等都来自于此,相对而言耦合更紧。
曹鹏介绍这就导致另一个问题,想开一个新的类目,如想做个国际站,就需要经过很多部门的同意,因为系统牵一发动全身。当京东发展到多元化集团结构时,如果整体系统还是大集中式的,就难以支撑。
所以京东搭建中台的重要理念是做分层,把系统之间共性的和差异的内容分开,那些有共性的,如交易、优惠券、 Sku等抽出来放到中台里,而差异化较大还是拆开,便于灵活的去做业务。
2020 年底,阿里提出要拆掉大中台,一时业内哗然,有人解读为中台不吃香了。但此拆非彼拆,阿里中台曾经历过先薄再厚,现在集团CEO张勇再次提出“中台要变薄”,是因为太厚的中台无法为创新式业务提供敏捷快速的资源支撑,需要将庞大的共享中台事业部重新打散,下沉到业务端,让中台有清晰的功能边界,只做那些底层的、抽象的、通用的能力,同时将中台碎片化,拆解为一个个独立的业务域中台。
京东的中台则经历过先厚再薄,如今建立稳固而厚重的中台,依然是其组织进化的技术基础。曹鹏认为,京东中台的目标是更聚焦,更稳定和更可扩展,由此更方便更高效更快捷的去支持新业务场景。
5
自己摸索出的两栖式生存
由此可以看出京东作为新型实体企业的技术特点,它的两栖动物式生存缺乏参照系,必须自己摸索游泳与奔跑的技巧。
刘强东从创业之初就特别在意三件事:技术、物流和客服。他曾双手沾泥,给网站写过代码,去送快递,还做过4年客服。这也是京东早期的一个缩影,大部分难题要靠人力、精神与增加设备完成。如今三者统一于技术,京东发展到今天的体量,也必须以技术为支点,才能撬动各业务线。
曹鹏判断,新型实体企业的技术方向与纯互联网公司差别很大。新型实体企业,需要考虑的不止是线上,还包括大量线下。线下的环境特别复杂,而且人的动作不可预测性,每一个细节处理不妥,都会影响最终履约效率。
与国内电商平台公司相比,它也有自己的独特性。平台公司很注重卖家生态繁荣,大量技术力量会用来支撑此方面业务场景,京东还要连接后端的物流与仓储。尚鑫举了一个例子,库存在平台电商中,模型没有那么复杂,电暖器从3000台变成2000台,库存在商家那里,平台通过大数据和云服务,及时更新调整就可以了,即使大流量高并发情况下,对系统确实也会造成很大压力,但总体还是能够在线上解决。
但京东不一样,电暖器从3000台变成2000台,意味着来了一个SKU之后,京东要通过大量算法规则去找最合适的库房,一个订单内又可能包含多个SKU,不同SKU柜子可能都不一样,资源关系与搭配关系也不一样,京东要考虑整单用什么样的策略,不能让一个订单分到很多库房,同时还要考虑到成本,由此来定位出最恰当的库房去进行扣减。
除了自营外,它还有大量第三方业务,哪些品类适合第三方商家来经营,哪些适合做自营的,做库存分配或定位时又要多一层选择。
相比美国最发达的电商亚马逊,其品类还不到400万SKU,而且消费者结构、所覆盖的服务面积、以及对履约时效的需求,中美差异很大。与国内的物流公司相比,如顺丰和三通一达,京东也是异类。物流公司优势在于端到端配送,把一个包裹从A点送到B点,侧重于分拣、运输与配送,主要解决效率问题。而京东物流要提供仓配一体服务,即要为品牌商提供仓储服务,还要提供运输与配送服务,前端还接着交易,链路更加完整。
每种模式下都产生过成就斐然,堪称典范的公司,这无所谓优劣,只是各自基因和对行业终局的判断不同。刘强东曾提出消费品行业的 “十节甘蔗”理论,即创意、设计、研发、制造、定价、营销、交易、仓储、配送、售后。之前京东在后五节发力,每一节啃下来都很费牙口,如今也在尝试从后五节进入前五节,就意味着京东离不开苦活累活。
新型实体企业对京东而言,不是一个炫酷的概念,一路摸索过来,背后都是血泪汗。当自己的品类与规模没有达一定层级时,它自己也很难预测会遇到什么样的坑。
6
两栖能力的养成
我们可以简略回顾这种两栖能力的形成,以及为何在2017年喊出“技术技术技术”。
最早的京东网站是2003年从外部购买的一套ASP在线商城软件,彼时业务量不大,勉强还能支撑。
2007年曹鹏加入京东,研发和运维加起来不到二十人。他加盟的原因很简单:中关村的小公司一年内死90%,老刘的企业能活五六年,而且能让一批员工一直跟着,人应该还不坏。不过那时真看不到什么远大前程,曹鹏听说当当的研发就有100多人,还挺纳闷:要这么多人干嘛,不就是做个网站嘛?
但他到来后的第二年,京东就面临第一次技术大升级。2008年7月,时任京东副总裁的李大学带了一群技术人员,在北京通州郊区一栋别墅,开始了3个月的封闭开发。早上8点爬起来干活,晚上干困了为止,每天除了吃饭上厕所就是敲键盘。
2008年10月,全新改版的京东网站上线,之后支撑京东商场运营了3年。自2008年,京东正式自建物流,先从WMS(仓库管理系统)开始,又做了后来经过多次升级的青龙物流配送系统,这样一环接一环的沿着供应链摸索。
2010年京东进军图书市场,几次大促销,系统压力超出其最大容量,为了支撑订单的爆炸式增长,主交易系统的架构升级刻不容缓,于是又开启了一次大改造运动。这被内部比喻为“在高速行驶的赛车上更换轮胎”,因为必须要解决系统的平滑迁移。经历过这一段的技术人员,都感叹其中艰辛非语言可以描述。大家最期待的事情就是中午一起去公司附近的小店吃热气腾腾的烤鱼,但一条鱼从服务员端上来到变成一堆鱼骨不超过五分钟,因为要赶着回去干活,服务员后来都见怪不怪。
2011年到2012年,京东老系统不断拆分,新服务也如雨后春笋冒出,系统之间交互与依赖关系变得异常复杂,如何管理与监控这样一个高度分散的系统环境,再次迫在眉睫。京东在此阶段衍生了SFT框架,解决了服务治理的问题。
到2013初,为了提升用户体验,京东启动了另一个影响更为深远的项目“SOP合并下单”,即把自营商品与第三方商家商品放在一起下单,同时告诉用户订单由几个包裹组成及配送情况,这牵扯到几乎所有主要系统。
京东新型实体企业的属性此时逐渐呈现,线上和线下的系统分别都有标杆企业,但把线上与线下打通,它只能自己交学费。2012年开始京东在上海嘉定筹建亚洲一号库, 2014年10月正式投入使用,最初找了全球做仓储管理系统最成熟的供应商外包,但测试系统一上线就瘫痪了,原来过去其做的系统,最多才管理4000多个SKU,每天出库1500单。当时京东的SKU已经达到两百万左右,每个库房每天都要出几万单,这个量传统的架构根本顶不住。更不用说,仓储系统还要和前端销售打通,能够实时穿透后面的库存。
没办法,京东只能自己做,曹鹏等有经验的研发人员都抽调过去,在亚洲一号库房里待了两周。他们到达当天看一下原来的架构,发现虽然是传统仓储管理系统中最好的,但根本支撑不了互联网的流量,于是按照互联网逻辑做了架构升级。
2014年6月京东在纳斯达克上市,之后加速狂奔。从创业以来,它没停过三件事:持续降本增效,提升客户体验,提高履约效率,但到了2017年初,它也面临一系列内忧外患。靠加人力,兄弟们艰苦奋斗,或加几千台服务器都不足以解决问题,必须重新审视“技术”的含义,来构建起全新的核心竞争力。
当所有的事情乘上数百万级的SKU和数亿用户时,如果纯靠业务去驱动,能做的事情可能就已经接近极限。早期物流仓该选择在一个城市什么地方是最好的,站点覆盖哪几个小区最好,拿一张地图,用肉眼能基本看个八、九不离十,但业务规模上来之后,参数多了,影响因子也变多了,就要算出一个模型。
技术革命背后也是组织革命。当时电商平台都在讲千人千面,京东在内部推进时还有一定阻力。过去商品定什么价格,在哪个位置,是采销的权力,可以用此和供应商去谈判,但如果千人千面,采销会有一些意见,刘强东经常要调和这种冲突,如大家对搜索排序,前端展示,促销页面设计等的不同看法,几次下来,刘强东就在内部多次说“我们要靠技术驱动”。
种种机缘显示,2017年前后拐点已至,京东必须要依托数字化,把硬件的物理信息传递到数字世界,在数字世界中用各种方法去做优化计算,之后再把最优的结果反馈给物理世界,来形成全新的闭环。
7
技术的本质
自提出“技术技术技术”以来,除了对业务产生的可见推动之外,京东还产生了三个变化,即对外开放输出能力;对未来技术提前布局;对内形成了新的技术文化与机制。
2021年2月以来,山西大同市民对12345市民服务热线有了全新体验。4月10日23时,邓女士拨通热线,反映所居住的教场街福兴园小区内夜间有人挖树坑,声音扰民,智能语音接待机器人不仅识别出邓女士焦虑的情绪并进行安抚,同时将通话转至正在值班的人工坐席。话务员接听电话前,已经看到智能系统在屏幕上的情绪提示以及相应工单。沟通后,立即将工单转派至平城区古城街道,社区工作人员迅速联系,解决了噪音扰民。
这正是京东人工智能在政务领域实践之一,2021京东智能客服系统言犀携手大同,打造了新一代市民服务热线。上线后即可提供7*24小时全天候服务,日均呼入总量增加31.7%、呼入电话通起率达100%、日均有效诉求提高33.6%,办结率达97.9%。
何晓冬告诉我,在人工智能的加持下,大同的市民热线不但“懂方言”还能“辨情绪”,可以提供“高情商、个性化、全链路的服务”。
自2017年之后,京东开始主动且成系统输出自己的技术能力。
2021年1月,京东数科、京东云与AI进一步整合,统一为京东科技集团。这意味着,整个京东集团技术积累都可以通过京东科技集团以京东云为技术品牌对外输出。
京东云能力输出的典型特征是懂产业,它的技术演进不是在实验室里研究出来的,而是在战场上打出来,在复杂业务场景中淬炼出来。凭借深度行业Know-how,已经有一系列从中小企业到大型企业,包括政务领域的服务案例。
2020年10月,京东首次系统阐释了面向未来十年的新一代基础设施——京东数智化社会供应链,即用数智化技术连接和优化社会生产、流通、服务各个环节,降低社会成本、提高社会效率。
如前文所述,京东技术典型特征之一是“求实”,不追求炫酷,但这并不意味着其对技术的看法是功利的。
它对未来科学的探索沉淀在不同业务板块,还有X研究部与Y业务部这样的“特种部队”。另外,它设立了“京东探索研究院”。这个新机构成立于2020年11月底,2021年3月,人工智能和信息科学领域的国际顶尖学者陶大程教授出任院长。
京东探索研究院目前将研究方向锁定为“可信人工智能”、“超级深度学习”、“量子机器学习”三大领域,可以看出这是从基础理论层面入手。按照陶的描述,面向泛人工智能领域,将可信人工智能作为三到五年的研究方向,将超级深度学习作为五到十年的研究方向,而将量子机器学习作为十到十五年的研究方向,互为承接、循序渐进。
曹鹏认为,京东对未来技术的态度很明确,首先对重大技术趋势不能缺位,以京东的体量,无法承受缺位带来的风险,否则很有可能在浪潮中被甩掉。
第二,依然要尽可能去寻找技术与业务场景的结合,研究的成果,并不是仅变成学术论文,而是要从更长的时间维度助力产业数智化发展。
技术文化与技术机制的变化是无形的,却关系到京东的基座。
大厂都面临一个难题,即技术资源的协调和规划。京东定位为新型实体企业,这道题目的求解难度更是加倍。
相比于CTO,技术委员会更像是虚职,它的主要功能之一就是定整个集团的技术战略,包括技术框架,在大方向上面保证协同一致,以及重大战役时的协调等。如这次春节抢红包活动,是否需要在集团层面用统一资源去打这场仗等 。
京东近年来不断分拆子公司,像京东物流、京东健康已独立上市。日常大家更关注于解决具体问题,如白条业务能否做好,物流成本怎样降低等,对于一些前瞻性技术,要养很多年才产生收益,放在子公司大家觉得成本太高,这种情况下就可以把最贵的基础算法之类的拿出来,放进联合项目组。
京东当前有近2万名技术人员,如何让这个高人才密度的团体,能有更大的积极性和能动性去支撑业务向前发展,如何靠文化来吸引人才,靠机制来用好人才,技术贡献度怎么衡量,怎么去判断一项技术的价值,这都是技术委员会,乃至集团最高决策层每天思考的事。对技术团队的管理,与物流配送客服等业务的管理风格不太一样,京东在业务上是两栖的,在文化和机制上也需要两栖来与之配合。
有人说2017年之后,技术在京东话语权更强了。此表述并不完全准确,要看如何理解“话语权”。“话语权”并不是地位高低的变化,而是技术和业务之间的连接更加紧密,大家都能到“河对岸去”思考问题,技术团队可以理解整体的经营理念,也有了经营意识,不会出现整体技术大量扩张,却和集团目标相背离的情况。
尚鑫是2007年就来京东的老员工,他认为自己之所以能够在公司待14年之久,是因为每天都面临新挑战,每天都就有成长和收获。
他讲了个故事,之前业务发展太快,对技术形成了很大压力。那时京东总部还在北辰,他和几个采销在一个小区,大家每天一起上班都是尚鑫开车,尚鑫说为什么要我开,大家笑骂只有你一个是研发,你的系统某次又抖动了影响了业务,尚鑫就以一敌三,回骂那是因为这个系统你们不会用,现在还得通过我的系统去卖货,说明我们是很有价值的,大家就互怼一路。
现在大家“玩的时候就不再聊这种事了,之前是业务在虐我,被业务逼着走,甚至说看不起,觉得‘我们都跑这么快了,你们还老跟不上’,现在已经能够和业务并肩了,见面大家都很客气,因为他们觉得离不开技术了,有个什么需求需要大家一块去往前跑。”他大笑着说“我的梦想是有一天能虐他们,那想想也挺爽的”。
这种在不确定性中成长的感受,2018年刚加入京东的何晓冬博士也有。他之所以离开微软加入京东,因为他意识到智能交互时代的特点,是通过人工智能等技术让机器能够具有场景化知识,此阶段存在大量机遇与挑战,人机交互的对话本质是博弈与决策,语言只是一种表现形式,这只能在复杂场景中磨练。
京东的客户服务恰好是足够深的业务场景,每天都有数万次的对话发生,数据是活的,而且不是闲聊,要解决具体问题。
“如果你不做具体的产品,可能碰不到这些问题,如果不从整体交互这个角度来看的话,有些问题可能也不会觉得很重要”。他感觉每天都不一样。
战斗是最佳的成长方式,经过春晚一役,颜伟鹏认为“收获了团队很大的成长”,一下子要在短时间内开发出满足高并发的需求,他当时给大家提出的要求是,不管多难,必须搞定,没有借口,搞不定的就是我们没本事。倒逼下来,把大家很多潜能都发挥出来了。
发表评论
登录 | 注册