首页 > 财商 » 正文

百度数字人直播,引发行业Deepseek时刻

来源:无  

头图来源:百度

在刚刚过去的 6 月 15 日,罗永浩数字人在百度电商平台完成了首次亮相。这场直播吸引了超 1300 万人次围观,最终 GMV 突破 5500 万元,部分 3C 数码、食品等核心品类商品带货量更是超过了罗永浩 5 月份真人直播带货数据 ,创下数字人直播带货的新纪录。

6月15日下午,当“罗永浩”和“朱萧木”的身影准时出现在百度电商直播间时,瞬间吸引了大量用户的关注。

从画面来看,数字人罗永浩的外形和真人几乎一模一样,说话时的习惯性动作,如喜欢捋袖子、拿水杯喝水、扶眼镜等,也都被惟妙惟肖地复刻出来。

一同出镜的搭档朱萧木数字人同样如此,两人在直播间里一唱一和、一捧一逗,时不时开个玩笑活跃气氛,配合十分默契。

百度优选提供的数据显示,这场时长近 7 小时的数字人直播,开播仅 26 分钟,GMV 就超过了罗永浩真人直播 1 小时的带货金额。累计观看人次超 1300 万,最终 GMV 突破 5500 万元,这样的成绩远超预期,也让业界对数字人直播有了新的认识。

直播结束后,罗永浩本人也在微博上发文表示:“看着两个数字人在镜头前眉来眼去,讲着和我一样风格的段子,有种恍如现实的奇妙感觉。”

图片来源:微博

据了解,为了打造罗永浩数字人,百度团队投入了大量精力。通过对罗永浩过往直播数据、语言风格、肢体动作等多方面的分析和学习,利用先进的 AI 算法和模型,对数字人进行了高度还原和优化。在直播过程中,AI 调用知识库 1.3 万次,实时生成 9.7 万字产品讲解内容,双数字人搭档做出超 8300 个动作。

从商业角度来看,罗永浩数字人直播的成功,验证了 “AI 主播 + 真人 IP” 混合模式的商业可行性。这种模式不仅能够充分发挥真人 IP 的品牌影响力和粉丝基础,还能借助 AI 技术的优势,实现降本增效,提升直播的效率和质量。对于品牌方而言,数字人直播的性价比和可复制性极具吸引力;对平台方来说,它或许是打破头部主播垄断、重构流量分配规则的关键。

超头数字人横空出世

1300万观看人次、5500万元GMV的成绩,罗永浩数字人直播首秀刷新了行业对数字人带货的认知。

以往的数字人直播,大多以单个数字人为主,互动性和真实感相对有限。

而此次罗永浩数字人直播,打造了双数字人互动直播间,同时上线了罗永浩和朱萧木的数字人形象。

在直播过程中,两位数字人配合自然、接梗流畅,抢话也十分自然。比如在介绍某款产品时,老罗数字人拿起商品,朱萧木数字人会自然而然转头、接话讲解;当老罗讲解 “跑偏” 时,朱萧木也能及时 “打断” 并引导回主题,整体节奏丝滑自然,观感比许多真人直播间还要强。

可以看到在这款吹吸一体机的产品介绍环节,罗永浩一边介绍产品一边自然把产品拿在手里摆弄,时不时还扶一下眼镜,旁边的朱萧木接话也很随意,如果不是事先知道这是一场数字人直播,恐怕真的难以分辨。

这种高密度、高拟真的对话流畅性,改变了大众对 “数字人带货只是预录稿件” 的印象,做到了 “像真人一样带货”。

百度副总裁、百度电商总经理平晓黎称,今年上半年百度在做好准备工作后与罗永浩合作,5 月 23 日罗永浩进行真人直播,6 月 15 日进行数字人直播,单独针对数字人直播准备了将近三周,期间做了很多细节打磨以满足罗永浩的高要求 。

百度副总裁、百度电商总经理平晓黎|图片来源:百度

预期方面,原本预计数字人直播 GMV 与真人持平或略低,实际超过真人场,突破 5500 万元;人均观摩时长也高于真人场。比如数字人开播半小时的 GMV 超过上一场真人开播一小时的情况 。

具体来说,这场直播里,用户观播时长超 30%,订单量较真人直播高出 150%,下单用户较真人主播多 230% 。部分 3C 数码、食品等核心品类商品带货量超过罗永浩 5 月真人直播同期水平。

内容突破:文心 4.5T 驱动的 “懂创作、有个性” 脚本

在15日的直播中,在介绍 “虫小将” 除虫喷雾时,罗永浩笑称:“你买了这个以后看到蟑螂就不怕了,甚至有点期待它出现,好让你试试这喷雾有多神。” 朱萧木立刻接话打断:“罗老师,你这心理有点危险。” 罗永浩也随即接回话题,「行,那不在意这些细节」并接着再次介绍产品功效。

这种巧妙的互动和幽默的表达,逗笑观众的同时,也提升了产品的吸引力和销售转化率。

传统数字人直播往往存在内容单调、缺乏个性的问题,而此次罗永浩数字人直播在内容方面实现了突破。这得益于文心 4.5T 的升级,通过深度训练,数字人做到了 “懂创作”,带货时塑品专业度更高,并且可以 “有个性”,甚至能 “玩梗”,为数字人注入了灵魂。

直播背后由 AI 驱动生成的产品讲解剧本总字数高达 9.7 万字,这些剧本充分展现了罗永浩的个人特色,具备典型的罗氏幽默风格。在直播过程中,数字人能够根据不同商品的特点和观众的反馈,灵活调整讲解内容和方式,实现了真正意义上的个性化直播。

关于“罗氏幽默”的打造,百度集团副总裁吴甜在采访中谈到这一点确实是这次罗永浩数字人直播中的一项关键难点。

她谈到,幽默大致可以分为两类:浅层幽默和深层幽默。浅层幽默,如调侃、语气词、语言习惯等,主要通过对罗永浩过往直播内容的语料挖掘和风格模仿来还原,技术上相对可控。而深层幽默则更具挑战性,往往涉及社会热点、文化语境和个性化表达,对模型的理解力和实时应变能力要求更高。

在6月15日的直播中,已经可以看到数字人具备一定的“接梗”能力,能巧妙回应热点话题,初步展现出个性化风格。但整体而言,这仍属于探索的早期阶段,未来还有较大的提升空间。

在设计上,幽默效果与内容可控性之间的平衡尤为重要。尤其涉及真实人物IP,必须避免言辞失当所引发的风险。因此,本次数字人在文本生成策略上相对稳妥,优先保障风格一致性与舆情安全。随着模型能力的演进,数字人在表达自由度和个性张力方面,预计还将呈现更丰富的可能性。

在内容生成方面,百度基于文心大模型 4.5 Turbo,结合直播场景和商品信息,可以生成高质量的直播剧本。

模型能够理解商品的核心卖点和用户需求,运用丰富的语言表达和逻辑推理能力,为数字人撰写生动、有趣且富有说服力的台词。同时,通过对罗永浩过往直播数据的学习,模型能够精准模仿他的语言风格和表达方式,让数字人在直播中展现出与真人高度一致的个性魅力。

关于幻觉问题,吴甜在采访中提到百度有通过知识增强、检索增强技术让大模型降低幻觉、遵从事实,在直播间剧本生成上增加内容规划和深度思考提升可控性,而且每次直播前都会进行试播审核 。

视觉呈现上,罗永浩数字人直播实现了业内首个多模态高度融合的数字人应用场景,做到了动作、表情、语调等贴合话术,且稳定可控。数字人不仅拥有丰富自然的动作表情和语调节奏,还能做出 “拿水喝”等高度贴近人类的行为动作,整个直播时长更是超过 6 小时,实现了高拟真、高稳定性的长时交互。

为了实现这一突破,百度结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互、高精度长时间一致性保持等难点。通过对大量视频数据的学习和分析,模型能够准确捕捉人物的动作、表情、姿态等特征,并将这些特征与语音、文本等信息进行深度融合,从而实现对数字人的精准驱动和控制。

平晓黎透露,这场直播是百度高说服力数字人3.0技术的首次规模化应用,“数字人已从‘形似’进化为‘神似’,成为具备思考决策能力的超级智能体”。

四大技术突破:文心大模型如何重塑直播基因

百度集团副总裁吴甜总结了罗永浩此次数字人直播的落地,所依赖的四大核心突破:

在体验层面,业界首个双数字人互动直播间通过视觉大模型与语音大模型的协同,实现了“打断说、同时说”的自然交互,甚至还原了真人直播中“眉眼传情”的微表情配合;内容层面,基于文心4.5T升级的“大师级剧本模式”,使数字人不仅能专业讲品,更能实时融入“苏超”等热点梗,塑品专业度提升40%;视觉层面,多模态融合技术攻克了7小时超长直播的动作一致性难题,数字人手势、表情与话术的贴合度达到92%;效果层面,AI大脑通过多智能体调度实现“主动邀评”“实时抽奖”等20余种互动玩法,直播间互动量达到真人场3倍。

技术细节上,百度采用“离在线统一”方案解决实时互动时延问题,通过流式生成技术将响应速度压缩。针对罗永浩独特的口音与语调,团队通过对话上下文编码器优化了双人语音合成。

图片来源:百度

吴甜强调,这些技术突破并非单点创新,而是文心大模型、视觉大模型、语音大模型的协同进化,“就像电影导演与演员的配合,剧本驱动多模态协同,最终呈现超拟真效果”。

据百度电商商业业务部及数字人创新业务部负责人吴晨霞介绍,此次罗永浩数字人直播的实现,依托慧播星全新升级的版本,覆盖剧本编排、动作捕捉、声音合成、脚本执行、问答和互动等多维度技术提升。

图片来源:百度

在此基础上,慧播星借助先进的内容创作能力,自动生成高光片段,精准复刻罗永浩的幽默风格,使数字人在直播中能够灵活接梗、互动,提升表现力。技术上,本次还实现了行业首创的双数字人同步剧本,保证两位数字人主播的默契配合,打破传统单一数字人直播模式。

作为首个支持「AI大脑」多智能体协调调度的系统,慧播星现在已经能够实现灵活场控和多玩法直播,显著提升用户转化效率。

罗永浩数字人的成功首秀,标志着慧播星在数字人直播技术上的一次重要升级,同时也是百度电商“双计划”落地的起点。

平晓黎在百度AI day上正式发布“梦蝶计划”与“繁星计划”:前者通过流量与预算扶持,目标半年内实现百度优选超头主播数字人数量倍增;后者则投入1亿元补贴,计划新增10万慧播星数字人,帮助中小商家实现“千元级开播”。数据显示,百度数字人直播已使商家成本降低80%,中小商家纯数字人直播GMV年同比增长116%。

百度的技术路径显示,数字人已从“降本工具”进化为“增效引擎”——在教育、保健品等品类,数字人因知识储备优势使转化率提升31%;在旅游、3C等需要深度讲解的场景,数字人讲品透彻度显著优于真人。平晓黎透露,百度已启动多语言数字人技术研发,未来将通过“欧美化形象+本地化话术”助力国货出海。

这场直播更深层的意义,在于重新定义了电商直播的生产关系。当数字人能以“24小时待机”“千人千面互动”“跨语言服务”等优势渗透各商业场景,其颠覆的或许不仅是主播职业形态,更是从内容生产到用户运营的全链路重构。

百度百度智能电商罗永浩
小糊涂仙宣布启用飞书,赋能管理与服务创新
五十万级销冠问界M9再进化!以OTA升级,实现5大核心体验进阶