TikTok 近期宣布停止测试一项旨在为视频自动生成文字摘要的实验性人工智能功能,并将该工具的研发重心转向特定领域。这项已在美国等市场小范围测试数月的“人工智能概览(AI Overviews)”功能,原计划利用 TikTok 自研或第三方多模态模型为用户提供视频背景信息及产品推荐。
然而,在实际应用中,该功能展现出的严重“幻觉”引发了广泛关注:其将头部创作者 Charli D'Amelio 的出镜视频识别为“配料不同的蓝莓集合”,将训狗教程误读为“折纸艺术”,甚至将夏奇拉的宣传短片描述为“移动的蓝色形状”。
面对算法理解能力的显著偏差,TikTok 发言人证实已根据反馈暂停相关测试,并明确未来该功能将聚焦于识别视频中的具体产品,而非尝试概览复杂的视频全文。这一动作反映出当前生成式 AI 在处理动态视觉信息时,依然面临逻辑关联断裂与语义识别错误的技术瓶颈。
此次事件被行业视为继谷歌“胶水披萨”后的又一典型 AI 幻觉案例。尽管近期数据表明谷歌等大厂的 AI 概览准确率已有所提升,但 TikTok 的受挫再次警示,在短视频这种高密度、非结构化的内容生态中,多模态大模型的泛化能力仍不足以支撑高可靠性的自动化叙事。短期内,行业正从追求“全能描述”转向“垂直应用”,通过缩小认知边界来提升 AI 工具的实用价值与商业确定性。
via AI新闻资讯 (author: AI Base)