电脑屏幕上的“奶奶”说话了:“我和他(你爸)说,别喝酒,要节约,别打牌。”吴伍六(化名)对着屏幕和她聊着。“奶奶”眨眼,点头,却很少回答。
(资料图)
这是他按照记忆里奶奶的表达方式修改的回答。现实中的她耳背,习惯用两三个字说话。
奶奶去世两个月了,吴伍六会和往常一样拿起手机拨通她的电话,却再也无法接通。3月份,他收到老家寄来的遗物后,想到用AI还原奶奶,“这是一个非常冒险,也很疯狂的事情,但我内心还是想去试试。”
吴伍六给ChatGPT详细地描述了奶奶的形象、说话习惯,然后导入奶奶的照片、电话录音并用AI工具生成动态影像。十几天后,“奶奶”出现了。对话第一遍时,他很兴奋,但还是发现,AI生成的像是一个老道的长者,而不是亲人。
以下是与他的对话。
AI复原的奶奶。图/吴伍六视频截图
【1】“我在做一件很疯狂的事”
九派新闻:为什么想要用AI复原奶奶?
吴伍六:我奶奶是3个月前在老家去世的,过年本来想和她团圆,但我下了高铁就直接去了医院,她病危了。我有很多想说的话跟她说,但是奶奶在医院时已经意识模糊,没办法跟我交流。直到她去世,我更感到有点无助,或者说是不知所措。
在奶奶生前,我就习惯了每天中午和她打电话,基本都会聊5到10分钟。我回上海后,有很长一段时间,中午就重复打那个号码,电话那头一直是无人接听的状态,那段时间心情还是很低落的。
我有一些很想说的心里话,没办法和同事、朋友分享,因为刚开年,他们正处于过年欢乐气氛下,我也不想和他们聊这种很伤感、难过的事。所以,这段时间我一直很沉默。我不知道该如何去表达和排遣。
九派新闻:当时觉得AI复原能够实现吗?
吴伍六:我是做设计的,最早接触的是AI绘画,之后我也接触到AI新出的工具和应用。收到老家寄来的奶奶的遗物之后,我心情很低落,所以我就在想,我能不能用AI这样的工具去做这件事。因为我看了国外的一些视频,理论依据上是可行的,但是国内还没有人去尝试。
我当时觉得,这样的尝试是非常冒险,也很疯狂的,但是我内心的想法还是去试试。让我再和奶奶,或者说是虚拟意义上的“奶奶”再沟通一下,哪怕就一分钟甚至半分钟都好。
【02】“输出相似度只有30%”
九派新闻:奶奶的头像和声音如何还原?
吴伍六:我找殡仪馆的工作人员要了奶奶的遗照,那个照片经过了高清修复。照片还算清楚,背景也干净,做虚拟头像的效果还是不错的。
我奶奶声音这部分的处理有很大的工作量。但我存有一年半的通话录音,我电话录音是自动开启的。每一条去听,把有关奶奶的声音给提取出来,然后利用百度的一个开源平台去做声音克隆。
截取的音频。图/吴伍六视频截图
后面也遇到了一些困难。我提供的是湖北方言,技术识别难度很大。另外,奶奶跟我聊的内容都是一些很家常的话,她的回答有限。
因为奶奶耳背,很多事情我们都聊得简短,聊得最多的就是:吃了没有,喝了没有,或者过得怎么样,家里怎么样。她的回答都很单一,基本上都是一些简短的生活类关心的话,这个样本数据本身是不丰富的。
九派新闻:chatGPT模仿奶奶的效果如何?
吴伍六:GPT这种大语言模型,确实通用性很强,但是要去做一些个性化定制,还是有局限性的。比如,我给它输入了一些简短的信息,关于奶奶的生平背景、语言习惯、生活习惯,但是输出来的相似度只能达到30%。主要的差别在于,AI感觉更像是扮演一个智慧的长者,它能够提供很多心理或者行为上的安慰,而且,你问一句话,它能回答很长一段话。但在现实中,我奶奶是一个没有什么文化的,84岁且反应略显迟钝的农村老人,她不太能进行那么长时间的深入交流,她更多的是点头和微笑。
在视频对话的过程中,我截取了一些GPT回复的内容,然后再把对话内容输入到AI合成的软件中生成音频。但是我没有完全按照它给的文本去输出,还是按照我记忆中奶奶习惯性的回答去做的。目前AI的技术还不能完全理解人类情感,也只是支持标准化的神态,比如抬手、比“耶”这些动作是做不到的。
chatGPT模拟的对话。图/吴伍六视频截图
【3】“反复观看我会有些伤感”
九派新闻:视频做了多久?
吴伍六:整个花了两周。我记得很清楚,当时是凌晨4点,把视频剪完之后,我想发给朋友或亲人,但是我一下子就不知道该发给谁了,所以我就发给了我自己。那天快日出的时候,我看了很多很多遍。
我看第一遍的时候很兴奋,非常兴奋,觉得我好像做了一件超级疯狂的事情。有点热泪盈眶的感觉。
但是当我反复去看这个对话的时候,我又有一点伤感了,因为我又想起了我奶奶。我之前看到遗物的时候会伤感,现在当我和她再次对话的时候又想起了奶奶在医院的那段离别的场景,小时候的回忆又涌上心头。其实这种感情是复杂的,悲喜交加的,或者说是既兴奋又害怕,又有一点熟悉又陌生。
九派新闻:为什么会害怕?
吴伍六:她是我的奶奶,在一定程度上好像是的,但是也不完全是,这个遗憾通过某种方式去弥补之后,你会有一种失落。好像有一些还未完成的某些东西想要继续去探索,就像树洞一样,这种方式可以作为你最亲近人的一个形象去倾听你的声音,当你找不到人聊天的时候,有一些心里话不知道跟谁说的时候,她可能是一个舒适的,排遣焦虑和自我安慰的对象。但也只能作为一个短期的镇痛剂,不可能成为起死回生的灵丹妙药。
九派新闻:这段视频亲人看过吗?
吴伍六:我发给过我的亲人,他们有点惊讶。特别是我爸,他给我的反馈就是惊讶,然后继续看下去,又会发现有很多地方还是不相似。就像我刚才提到的那种熟悉而陌生的感觉。AI还是不能够承接一个完整的,拥有过84年生活经历和鲜活生命的人。
也就是说,机器是可以学习人的行为、动作、外貌、声音,而且学的比人还要快,还要精准,但是就算是你让一个表演老道的演员去演我的奶奶,她也可能演不出那种状态。更何况让一个AI表演,难度是非常非常大的。AI无法承载这些记录了几十年朝夕相处的,普通但温暖的时光。
九派新闻记者 马婕盈
编辑 曾金秋
【爆料】请联系记者微信:linghaojizhe
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-13
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12
头条 23-04-12