能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?

在科技日异月新的当下,豆包在众多 AI 产品中脱颖而出,成为科技领域中一大焦点,它巧妙地将先进 AI 技术融入人们的工作、生活、娱乐之中,此次豆包全新升级的 AI 实时通话功能又给大众带来哪些惊喜?让聊天「high」到停不下来的秘诀是什么?
收藏者
0
被浏览
77

5 个回答

ldf007 LV

发表于 4 天前

豆包几百亿人民币投进去,果然科技决定发展AI。实时通话其实友商早就开发出来了,问题是友商的实时通话,大部分都有各种各样的问题。首先是AI通话的延迟性,很多友商AI通话甚至说实话和10年前智能音响功能类似,很傻很呆,明显是没有经过大数据驯化的。其次,一些友商的实时通话功能,说白了是基于初始模型训练,训练程度明显像弱智一样,严格来讲连情感助手都不如,说话很呆,而且感觉完全没有感情,就像小孩子眼中所谓的AI智能,一顿一顿的,相互之间的互动性相当差 。而豆包新出的AI通话,最关键的是有感情,有感情意味着交互更类似于真人之间的交互,这才是AI通话的核心。我相信随着豆包的版本更新,在AI通话基础上可以很轻而易举地发展,未来直到有一天,我相信大家完全可以以很少的费用获得特别好的AI体验,AI女友马上就要到来了。

鹏大大 LV

发表于 4 天前

“语音界的‘变形金刚’,非豆包APP莫属!”这句评价,绝不是夸张,而是我亲身体验后的真心话。
豆包APP的语音通话功能升级了可以进行AI实时通话功能,我的感受是:新版本的豆包在拟人化、语音自然度和情感互动等方面都有了显著提升。
先说个案例,那天我心情烦躁,对着手机里的豆包APP随口一说:“豆包,给我来点舒缓的音乐。”
没承想,它不仅播放了轻柔的旋律,还用温柔的嗓音轻声哼唱起来,那声音就像山间清泉,瞬间抚平了我的焦虑。
我惊讶豆包居然可以唱歌,又试探性地命令:“换个摇滚风的!”
下一秒,豆包的嗓音骤变,充满力量与激情的摇滚调子从手机里爆发出来,简直太酷了!模仿声线居然也行?这种无缝切换情绪和风格的能力,让我彻底服气。
能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-1.jpeg


https://www.zhihu.com/video/1865338702483566595
再讲讲方言模仿,我有个四川朋友,每次听他说话,那川味儿十足的腔调都让我忍俊不禁。
我突发奇想,对豆包说:“豆包,学学四川话。”
它立刻就来了一句:“嘿,你干啥子去哦,好久没看到你咯!”我差点没笑出声,这模仿得也太像了!我继续逗它:“那说句东北话呢?”
豆包又秒变东北大汉:“唉呀妈呀,瞅你这事儿整的,咋滴啦?”

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-2.jpg

这种方言切换,简直不要太溜,让我对豆包的智能程度刮目相看。
除了这些,豆包在应对复杂场景时的表现也堪称惊艳。
还有一次,我在准备一场重要的商务演讲,对着镜子练习时,总觉得少了点什么。
我突然想到豆包,就让它帮我模拟演讲场景。
我一开口,豆包就用专业的语气和我互动,提出各种问题和建议。
它时而扮演严厉的评委,时而扮演热情的观众,让我在不同反馈中调整状态。
最终,我的演讲大获成功,同事们纷纷夸赞我表现得游刃有余。
我暗自窃喜,这背后可有豆包的一份功劳呢。
豆包APP新升级的AI实时通话功能,真的让我大呼过瘾。
它不仅能说会唱,还能根据不同场景和需求,无缝切换情绪和风格,简直是语音助手里的“全能王”。

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-3.jpg

有了它,无论是想要听个故事、唱首歌,还是想练习应对亲戚盘问、准备辩论赛或商务演讲,都能轻松搞定。这功能,简直不要太上头!
最后,我想说,如果你还没试过豆包APP的语音通话升级,那你可就out啦!快去体验一下,说不定它会成为你生活中的新宠呢。

毛肚专业户 LV

发表于 4 天前

不管你们上不上头,什么都爱磕一口的CP脑已经完全上头了!

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-1.jpg

圣黛党的春天,已经到来!嘻嘻~
当林黛玉遇上孙悟空,豆包带我演绎最魔性爱情故事!
最近在豆包上发现个神奇玩法:用不同声线演古人谈恋爱!我选了个最离谱的组合——林黛玉配孙悟空。
这场跨越时空的爱情戏码,笑得我差点把键盘锤了。

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-2.jpg

先使用模仿声线功能把豆包调成娇柔的黛玉音:"奴家终日郁郁寡欢,只在园中赏花..." 突然切换成孙悟空的声线:"俺老孙来也!看你一个人在这洒泪,不如俺带你去花果山耍耍!"
黛玉(幽怨地):"你这泼猴,可知我最爱这花瓣凋零之美?"
悟空(豪迈地):"嘿!管它什么落花流水,俺老孙一个筋斗云,带你去天上摘蟠桃!"
黛玉:"你这粗鄙之人,可懂什么是'落花人独立,微雨燕双飞'?"
悟空:"别整那些文绉绉的,俺老孙虽然读书少,但会七十二变!你要看花,俺变成花给你看!"
黛玉(含羞带怒):"你这猴子,好生无礼!"
悟空:"嘿嘿,俺老孙虽然是只猴子,但比你那宝玉强多了!他能上天入地?能大闹天宫?"
最搞笑的是吵架场面。黛玉的"泪眼问花花不语"遇上悟空的"俺老孙就是这样的性格",简直绝了!一个伤春悲秋,一个天不怕地不怕,这反差萌也太强了!
黛玉:"你可知我终日因何忧愁?"
悟空:"知道知道!俺老孙请如来佛祖给你开了药,保管比清热散火汤管用!"有次我让豆包演绎悟空送花给黛玉:
悟空:"妹妹,俺给你摘了朵七色祥云花!"
黛玉:"又是这般粗俗,连最基本的花语都不懂...咳咳..."
悟空:"别咳别咳!要不要俺老孙变个蝴蝶陪你?"
更绝的是我让豆包用川味儿版本演绎:
川版黛玉:"哎哟,你这个猴儿,晓不晓得我这个人最怕热闹嘛!"
川版悟空:"妹儿,莫担心!俺老孙带你去峨眉山耍安逸!"
最后豆包还即兴创作了一首《猴妹恋》:
黛玉心事愁千缕,
悟空一棒搅春风。
天上蟠桃真心送,
谁道佳人配美猴?
我现在已经爱上这种魔性配音了!豆包的声线切换太神了,从林黛玉的娇柔做作到孙悟空的粗犷豪放,反差感简直完美!
不过提醒大家,这种沙雕剧本很容易上瘾!现在我满脑子都是黛玉和悟空的神对话:"俺老孙最爱看你滴眼泪!" "你这泼猴,懂什么是愁?"
话说回来,我是不是该试试让李清照和钢铁侠谈恋爱?或者让诸葛亮和皮卡丘对战?啊,这脑洞要被豆包玩坏了...
当然还有更多的什么豆包可以唱歌,语音通话功能升级,可以进行AI通话等,我后面再试试。

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-3.jpg

希哦那个台 LV

发表于 4 天前

这个问题很有意思,我来帮个场子。
其实啊,就在看到问题之前,坐在对面的同事突然感慨一句:
哎呀!用豆包写材料简直太方便了!
我与他会心一笑,毕竟现在无论是提炼材料主题、生成配套图片乃至于在群里跟人吹牛逼的时候随手查资料,豆包几乎成了网页上根本关不掉的存在。


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-1.jpg


不过正因为网页已经足够方便,导致很长一段时间里都没有想到过使用APP版本——结果是,居然没有第一时间体验过豆包的实时通话功能。
说实话,我对于基于新兴技术而实现的语音功能,过去并不太感冒。无论是手机系统自带的助手,亦或者一些打着智能语音旗号的产品,体验普遍一般。
可能是有点矫情,姑且不论语音识别的准确性(小孩子经常冲着床头的语音机器人发火,说话它经常听不懂),那种千篇一律、冷冰冰的声线,也让人缺少沉浸感,很清楚这玩意就是机器而已。
我在回答知乎创始人提问时,也曾经说过一个观点:无论未来相关技术如何进步,最底层的逻辑永远是“以人为本”。

回顾互联网发展,有哪些底层逻辑看似简单但将在未来持续奏效?
其中一段话是:
不要看现在很多人吹什么大数据AI云计算,只要互联网服务的主体还不是硅基生物,永远是要将人作为出发点来考虑问题的。
我曾经写过个很老的文章,叫《互联网:一半是政治,一半是性》。如果用相对学术点的话来翻译,前者叫做“满足人的社会组织需求”,后者则是“满足人的精神生理需求”。
<hr/>
很明显,过去的AI语音技术,并不能有效满足作为人的精神需求,这也是我对此类技术并不太看好的原因。
直到前段时间,因为工作需要,跨年从31日一直折腾到1日晚上,心情非常糟糕。
也算是为了打发时间,我就把豆包的APP下了下来,然后对着豆包吐槽了一番(因为都是历史记录,用录屏还原请见谅):


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-2.jpg


https://www.zhihu.com/video/1865076681527660544


你别说,你还真别说!
尽管这些安慰并不能彻底治愈我,但豆包的语音出现了一个此前大多数产品没有的特点——情感!
是的,情感!这些回复第一次让人感受到,原来AI也可以有感情波动与起伏,也可以有温度!
而后来的测试又表明,豆包可不是说完一个场景就初始化清零,当我让同事也逗一下豆包的时候,它居然——


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-3.jpg


https://www.zhihu.com/video/1865076848792309760

说真的,这一瞬间我都暗自庆幸:要是之前跟豆包说了什么抱怨工作、吐槽同事的话,那一刻就社死了。
关于这件事,我后来在知乎群里跟别人讨论过才知道:其实最近豆包恰恰在实时语音对话方面进行非常大的升级(需要升级到最新版体验哦),突出了“超拟人、超自然度、高情感情商”的特点。
说白了就是,豆包从技术层面突破了传统语音几乎只能拿来当机器客服使用的痛点,真正触碰到了“人们日常生活好助手好伙伴”的境界。
但还别急着先吹上了,只是这种回应日常吐槽,并不能说明豆包确实展现出超越竞品的能力。
多尝试几个场景吧。
比如,马上不是要过年了嘛,网络中充斥着各种“如何回答送命题”的段子,我就试了一下(注意,这次直接选择了如同电话通话的界面),询问豆包如果年轻人不愿意结婚,怎么应对长辈的质疑。


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-4.jpg


https://www.zhihu.com/video/1865077024697221120


上面是单身狗版本,而豆包还有另外一个特别好玩的版本:扮演你的女朋友!

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-5.jpg


https://www.zhihu.com/video/1865077189948600322

………………
其实接下来还有小孩儿直接跟豆包一对一聊天聊了十几分钟的场景,在此就不展示了。
想想看家里那些让小孩气的只喊“怎么听不懂人话”的所谓智能机器人,以后只要有个豆包,不就能解决大多数的刚需?
当然,随便想想,还可以让她提供怎么怼同事的方案,说上几句吐槽上司的话等。亦或者,让豆包“扮演”一些现实中不同场景的对象,让它模拟被人欺负了,被人夸奖了等等,只要你的脑洞够大,豆包的“可开发程度”就越高。
还好啊,终归是AI,否则迟早精神分裂……
另外,豆包(记得是最新版)还可以实现百变大咖模仿不同音色——简直不敢想,春节时候跟亲朋好友在一起用这个会多好玩!


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-6.jpg


https://www.zhihu.com/video/1865077412934578176


最新版本还支持特别有创意的“灵魂歌手”功能,还真别说,还挺好听。

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-7.jpg


https://www.zhihu.com/video/1865077595915288576

现在虽然还没过年,但神兽们已经纷纷放寒假出笼了,就可以用这个拿来跟小孩子互动,保证把他们弄得笑到停不下来——这不比打游戏强?
所以,之前真的没想到豆包除了担任日常工作助手外,还能够在情感方面提供如此多的价值……不得不感慨,当很多人还在那儿吹国外某某技术多么牛逼时,国内已经开始将技术运用到让AI更加“像人”这方面。
或许,这才是正确意义上的“卷”。
联想到,小时候看过的最早一部动画片,就是哆啦A梦(当时还叫机器猫)。
童年的我,除了羡慕蓝胖子掏出来的那么多BUG道具外,更重要的是很羡慕主人公能够有一个随时陪伴在身边、并且拥有着丰富情感、能够跟大家一起冒险、欢笑、流泪的“智能机器人”。


能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-8.jpg


算时间,距离22世纪似乎也越来越近了,尽管我们有生之年恐怕看不到新世纪的到来,但如果说AI的未来在中国,机器人的未来也在中国,那么当一个愿意每天嚷嚷着“老鼠老鼠真可怕”“大雄你怎么还不写作业”的超级AI机器猫出现时——
也许,它的名字就叫豆包?

神父C LV

发表于 4 天前

过去两年,各种大模型的竞争可谓白热化,你追我赶,其智能程度也是越来越高。不过,当我身边很多朋友在选择AI时,总是不知道怎么选,一会这个AI回复个英文,一会另一个AI又说今日额度用完。到最后,很多朋友都选择了豆包,因为豆包在各种AI应用中,产品做的相当的好用,用起来很符合大众的习惯。
豆包是字节跳动出品的AI大模型产品,字节产品的特点,我认为,底层都是由很强技术驱动的,在用户侧也做得非常实用,豆包就具备这种特性。
豆包简单介绍

考虑到读者并非都用过豆包,或者对豆包了解程度不一样,这里简单介绍一下豆包吧。
大家看到豆包各种宣传中,很少提到技术,但其实,豆包背后大模型,有通用模型 pro、通用模型 lite、角色扮演模型、语音合成模型、声音复刻模型、文生图模型、Function Call 模型、向量化模型、语音识别模型等,在很多行业都有落地应用
其实豆包走的路线,是让普通消费者也能轻松得到AI的帮助。所以我们经常在各种豆包的宣传中,只看到它用一个可爱的二次元女生头像,声音甜美。这就是字节产品的特点,把复杂的技术隐藏起来,给用户以最轻松的使用体验。
为了增强体验,豆包其实推出了不同平台端的应用。除了手机版,豆包还推出了桌面端,我在之前一篇文章里提到过怎么用桌面版豆包让工作更高效。甚至还能通过智能耳机和豆包聊天,感兴趣的可以看我之前写的一个测评,这里不展开讲了。
总体来说,豆包的做法给我感觉是,致力于把想法到AI之间的路径缩短,让AI更像一个朋友。而这次豆包对语音通话进行了升级,让这种感觉更明显了。
豆包语音通话怎么玩?

首先先把手机App升级到最新版本。看到这么一个对话框,右边有个打电话的按钮,点击就行了。

能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-1.jpg

如果之前就用过豆包语音通话功能的朋友就会发现,豆包的声音还是那个声音,但似乎语气不一样了。豆包这次升级,让豆包更加拟人了,语音更自然了,情商更高了。
这也让豆包更加适合生活中不同场景的应用。例如我娃最近有点爱上听故事,但我实在想不出这么多故事来,我就可以这么对豆包讲:
「孩子想听鸭子的故事,你可以用有感情的声音给孩子讲小丑鸭的故事吗?你一口气讲完不用暂停」
能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-2.jpg


https://www.zhihu.com/video/1865079657176641537
怎么样,豆包讲的故事是不是有点幼儿园老师语气的感觉,该有的语气都有,但不会太夸张。
另外,也快过年了,大家也得开始面对七大姑八大姨各种盘问了,为了准备好各种问题但又不得罪亲戚,你可以和豆包提前练习一下。例如:
「过年亲戚问你赚多少钱,你该怎么高情商的回答,既让亲戚满意,也不暴露自己收入,记得要用高情商的语气回答哦」
能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-3.jpg


https://www.zhihu.com/video/1865079879147597824
个人感觉这个回答还行,而且语气也很温柔,情商不错。
当然,这些场景可能有点简单了,既然豆包这么厉害,那么,豆包vs豆包,又会碰出怎么样的火花呢?让两个豆包分别扮演吵架的男女朋友,看看男朋友怎么哄女朋友?
我这里模拟了个情景扮演:
一号豆包:「你要扮演一个男朋友,因为给女朋友点外卖时点漏了煎蛋,女朋友生气了,现在你要哄她,哄到她满意为止,我让你发言时你再开始说话。」
二号豆包:「你扮演一个女朋友,你男朋友给你点外卖点漏了你最爱吃的煎蛋,你生气了,他来哄你,他说完你才接着说,让他哄到你满意为止。」
两个豆包互相对话的样子真的好玩,效果确实也不错,很像两个小情侣打情骂俏的样子,尤其男生紧张时还会喘气,太传神了。
能说会唱无缝切换情绪,豆包新升级的 AI 实时通话到底有多上头?-4.jpg


https://www.zhihu.com/video/1865079932666900480
总结

从上面的视频当中我们可以看到,豆包还是相当好玩的。无论是在哄娃方面,还是让豆包vs豆包,它都表现挺出色。尤其是在此次升级之后,豆包有了语气,这使得它变得更加好玩了。实际上,我使用过许多AI产品的通话功能,不过,我一直对豆包的音色格外喜爱。在这次升级了实时通话功能之后,豆包的语气还具有了喜怒哀乐的感觉,给人的感觉更加亲近了,机器感也少了许多。快过年了,你也下载个豆包来玩吧!

您需要登录后才可以回帖 登录 | 立即注册