来源/联商专栏
撰文/周宏明
2023年6月1日,备受瞩目的孩子王KidsGPT上线。此前,孩子王在接受机构调研时表示,KidsGPT是基于开源大模型自主研发的,充分发挥公司数字化技术的优势,结合其多年在母婴童垂直领域沉淀的庞大优质知识库自主训练研发的AI 程序,是孩子王的“智能育儿顾问”。
于是,在过去近一个月的时间里,CUO(首席用户官)体验小组通过与KidsGPT智能顾问多番对话,以用户视角进行深度体验,并通过多个维度对孩子王KidsGPT进行用户体验评估。
01 KidsGPT功能测试
所谓GPT,全称是Generative Pre-Trained Transformer,即生成式预训练Transformer模型,是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型,其基础功能是文字生成和图片生成。
于是CUO(首席用户官)体验小组根据知识覆盖范围、准确性、人工干预能力、响应速度维度,结合情感识别、个性化服务、用户体验共七个维度,向孩子王智能顾问提出相应的问题,以测试KidsGPT的文字生成能力,其各项得分如下:
知识覆盖范围维度:回复内容虽然在各搜索平台上也能查询到,但相较之下其知识库更为垂直,定向育儿;
准确性维度:回复内容虽然较少初现“答非所问”的情况,但缺乏针对性,更像“套话”,用户需要从回复的内容里人工筛选具有实质性建议、可参考的内容;
人工干预能力维度:面对售后和人工服务的需求,暂时还不能智能转接;
响应速度维度:基本在提出问题后都能秒回,但仍存在延迟3~5天回复的偶发情况;
情感识别维度:不论用户是表扬还是抱怨,其回复停留在客套层面,并不能与用户情感共鸣;
个性化服务维度:其回复具有一定的参考和指导意义,但偏向大众化,距离“个性化”还有一定的距离;
用户体验维度:这是得分最低的一项,无论是线下门店的指引还是产品的升级体验等等,KidsGPT均无法满足。
仅以文字生成能力评估KidsGPT,不能说是“智障”,但也绝不是“智能”,更接近“及格”的状态。值得一提的是,CUO(首席用户官)体验小组并不认为其是基于自身用户数据库而建立的,因为从智能顾问回复的内容来看,更像是依托搜索平台或者其他通用型知识库,并不能看到有孩子王相关性的内容,比如无法连接到孩子王的线下门店、无法推荐孩子王现有的产品。同样的,因为KidsGPT无法与孩子王的产品和线下门店联动,用户线上体验和线下体验是脱轨的,自然无法进行商业转化。
在图片生成能力方面,CUO(首席用户官)体验小组采用的是准确性、质量、创造性、连贯性和实用性共五个维度,其各项得分如下:
常常出现“答非所问”的情况,甚至在根据实际照片生成虚拟图片的情况下都会失误,比如把男宝宝照片生成女宝宝的图片,或者把小孩子照片生成为大人图片;
质量维度:其所生成的图片仅限虚拟图片,在色彩上较为融合,但噪点模糊,分辨率低;
创造性维度:如果是一些简单的指令,则能够生成一些较为美观的图片;
连贯性维度:能理解连贯和流程的语义,但不能生成对应的流程图;
实用性维度:不具备观赏性和实用性,基本不具备使用场景。
仅以图片生成能力评估KidsGPT,比起生成图片,更接近“找图”。孩子王KidsGPT面对用户提出的需求,过于“答非所问”,只有在一些简单指令的情况下能够“找到”一些符合的图片,给用户一种”智能“的错觉。同样的,KidsGPT在图片方面也不能与孩子王自身的品牌、商品或者内容产生联动。就目前来看,孩子王对KidsGPT的图片生成功能更多的是运用在与用户的互动交流上,比如设置社区话题#趣画童年,或者生成宝宝专属AI漫画头像,引导用户上传真实照片,基于KidsGPT生成虚拟图后发布在社区进行互动。
02 CUO总结
CUO(首席用户官)体验小组对于品牌企业推出GPT是非常鼓励的,只是这种鼓励有限定条件:其数据库必须基于品牌企业自身的数据库。只有围绕企业自身的数据库,才能够与其他套壳模型差异化,更好地服务自有用户。也只有基于企业自身的数据库,才能在模型训练的过程中,定向投喂品牌自身的文化、内容、门店、商品数据等等,帮助GPT与品牌联动,真正做到商业智能化,提升用户体验。
从舆论层面来讲,孩子王作为首次推出GPT的非互联网企业,这个噱头确实在短期内影响了品牌的股价。但站在CUO视角,纵观KidsGPT的文字生成和图片生成能力的得分情况,严格意义上来说,这并不是一款已经合格的产品,过早面世反而会影响用户对品牌正面的印象,热度一过,并不能吸引用户长期使用。
在心理学上存在一种社会知觉效应,称为第一印象效应或首因效应,指人们在接触某一人/事物时,第一感觉和印象非常重要,因为它们会直接影响到对后面人/事物的判断。这种印象一旦形成,后续很难扭转。比如对于一个初次见面就引起自身反感的人,即使由于各种原因难以避免与之接触,人们也会对之很冷淡,甚至会在心理上和实际行为中与之产生对抗状态。所以在企业完成GPT训练后,也不能一下子推出市场,而是需要由内至外扩大测试范围。首先需要进行内部测试,从员工到店长测试一轮后,再往外部延伸测试范围,比如让大C体验和反馈,最后才是面向所有消费者推送。避免第一印象效应让用户产生不好体验的印象,那么后续可能要花费更为高昂的成本才能改变其在用户心中的形象。
不可否认的是,孩子王KidsGPT也只是处于推出初期,甚至在整个GTP行业,大部分企业都仍处于摸索阶段,期待看到其后续的优化,以进一步提高用户体验和产品价值。