當(dāng)AI深刻介入人類生活、重構(gòu)鏈接方式,社交場(chǎng)景究竟需要怎樣的底層能力創(chuàng)新帶來交互體驗(yàn)的提升?
近日,社交平臺(tái)Soul App自研端到端全雙工語音通話大模型全面升級(jí)。此次升級(jí)重新定義“全雙工”交互范式,新模型摒棄了傳統(tǒng)語音交互中依賴的 VAD(話音活性檢測(cè))機(jī)制與延遲控制邏輯,打破行業(yè)中普遍存在的“輪次對(duì)話”模式,賦予 AI 自主決策對(duì)話節(jié)奏的能力。AI可實(shí)現(xiàn)主動(dòng)打破沉默、適時(shí)打斷用戶、邊聽邊說、時(shí)間語義感知、并行發(fā)言討論等。同時(shí),模型具備多維度感知(包括時(shí)間感知、環(huán)境感知、事件感知等),口語化表達(dá)(如語氣詞、結(jié)巴、明顯情緒起伏)、音色復(fù)刻等能力,讓AI更具“真人感”,支持打造更沉浸、類現(xiàn)實(shí)交互的語音互動(dòng)新體驗(yàn)。
Soul新升級(jí)的端到端全雙工通話大模型即將開啟站內(nèi)內(nèi)測(cè),后續(xù)將陸續(xù)落地于虛擬人實(shí)時(shí)通話、AI匹配等1V1互動(dòng)場(chǎng)景。同時(shí),Soul AI團(tuán)隊(duì)正探索將該能力應(yīng)用于多人互動(dòng)場(chǎng)景,讓AI能在多人對(duì)話中,精準(zhǔn)把握說話時(shí)機(jī),適時(shí)加入交流、延展話題,推動(dòng)多元關(guān)系網(wǎng)絡(luò)的構(gòu)建。
Soul App CTO陶明表示,社交是情緒價(jià)值和信息價(jià)值交換的雙向關(guān)系,Soul始終致力于以創(chuàng)新的技術(shù)和產(chǎn)品方案為用戶提供更智能、更沉浸、更優(yōu)質(zhì)的交互體驗(yàn),讓天下沒有孤獨(dú)的人。
全雙工語音實(shí)時(shí)通話,重新定義AI社交陪伴場(chǎng)景的語音交互
此次Soul技術(shù)升級(jí)重點(diǎn)聚焦在全雙工實(shí)時(shí)語音通話能力在陪伴場(chǎng)景的交互突破。自新一輪人工智能浪潮興起,AI對(duì)話、AI陪伴類產(chǎn)品率先迎來爆發(fā),也成為了大眾接觸AI的首選應(yīng)用品類。但此前受限于技術(shù)發(fā)展,人機(jī)對(duì)話普遍存在“一問一答”的機(jī)械式互動(dòng)現(xiàn)象,即“用戶提問——AI輸出”依次進(jìn)行,過程中,延遲、打斷等均將影響交互的沉浸感。
2024年,Soul推出自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動(dòng)打斷、超真實(shí)聲音表達(dá)和情緒感知理解能力等特點(diǎn),能夠直接理解豐富的聲音世界,支持超擬人化的多風(fēng)格語言。為進(jìn)一步實(shí)現(xiàn)更接近生活日常的交互對(duì)話和“類真人”的情感陪伴體驗(yàn),近日,Soul再次升級(jí)模型,具體來看,升級(jí)后AI能力特點(diǎn)包括:
一、全雙工語音交互,AI具備自主決策反應(yīng)能力
新模型支持響應(yīng)(Response)、傾聽(Listen)與打斷(Interrupt)流式預(yù)測(cè),AI自主決定發(fā)言時(shí)機(jī),實(shí)現(xiàn)完全端到端的全雙工交互——AI 與用戶可以同時(shí)說話(如辯論、吵架、合唱)、適宜打斷用戶/被用戶打斷、AI主動(dòng)打破沉默發(fā)起話題。
當(dāng)AI擁有自主決策反應(yīng)能力,在邊聽邊說中,掌握互動(dòng)時(shí)機(jī)、互動(dòng)內(nèi)容的“主動(dòng)性”,將極大提升人機(jī)對(duì)話的自然度,并且在較長(zhǎng)時(shí)間、多輪對(duì)話的交互中,實(shí)現(xiàn)沉浸的類真實(shí)交互體驗(yàn)。
二、日常表達(dá)口語化和情感化,情緒更鮮明的人機(jī)交互
讓AI更具“真人感”,這包括在情緒表達(dá)、發(fā)音特點(diǎn)、對(duì)話內(nèi)容等多維度的綜合指標(biāo)提升,更加接近現(xiàn)實(shí)日常表達(dá)。例如,情緒表達(dá)方面,除了具備笑、哭、生氣等情緒特色外,新模型的聲音情緒起伏更加明顯,并能結(jié)合對(duì)話推進(jìn)實(shí)現(xiàn)同步變化。在發(fā)音特點(diǎn)上,具備語氣詞、結(jié)巴、常用口頭禪、咳嗽等日常語音元素。此外,AI對(duì)話的內(nèi)容更加口語化、社交化,而非書面語言。
三、時(shí)間、事件、環(huán)境感知能力,互動(dòng)更具沉浸感
Soul的新模型基于純自回歸模型架構(gòu),統(tǒng)一文本和音頻生成(Unified Model),充分利用大語言模型強(qiáng)大的學(xué)習(xí)能力,讓AI發(fā)言深度整合人設(shè)、時(shí)間、環(huán)境及上下文對(duì)話等信息。這意味著,具備感知、理解能力的AI能夠更好塑造“數(shù)字人格”,形成豐富的AI故事線,讓人機(jī)交互真正成為“情感與信息的雙向交流”。
值得一提的是,目前,Soul AI團(tuán)隊(duì)正探索全雙工語音通話模型在多人場(chǎng)景的擴(kuò)展,例如在多人語音對(duì)話中,AI憑借自主決策能力,判斷說話時(shí)機(jī),有效組織話題討論與延伸,融入真實(shí)關(guān)系生態(tài)。
讓AI融入社交關(guān)系網(wǎng)絡(luò),提供情緒價(jià)值和信息價(jià)值
2025年,伴隨著AI在大眾層面的滲透率進(jìn)一步提升以及技術(shù)能力的持續(xù)躍進(jìn),“AI應(yīng)用爆發(fā)”成為行業(yè)共識(shí)。在眾多垂類應(yīng)用場(chǎng)景,“社交”因具備極高流量?jī)r(jià)值、網(wǎng)絡(luò)效應(yīng)和交互入口等特點(diǎn),被視為誕生AI時(shí)代“Killer App”重要領(lǐng)域之一。
作為較早思考將AI應(yīng)用于社交的互聯(lián)網(wǎng)平臺(tái),Soul App自2016年上線后便積極擁抱AI,重塑關(guān)系的發(fā)現(xiàn)、建立、沉淀環(huán)節(jié),幫助用戶在無壓力的社交環(huán)境中,自在表達(dá),基于興趣構(gòu)建多元社交關(guān)系網(wǎng)絡(luò)。
2020年,Soul啟動(dòng)系統(tǒng)的AIGC技術(shù)研發(fā)工作,并在智能對(duì)話、語音、3D虛擬人等方面擁有前沿積累。自2023年推出自研語言大模型Soul X后,Soul還陸續(xù)上線了語音生成大模型、語音通話大模型、音樂生成大模型等大模型能力。2024年,Soul AI大模型能力已整體升級(jí)為多模態(tài)端到端大模型,支持文字對(duì)話、語音通話、多語種、多模態(tài)理解、真實(shí)擬人等特性。
在扎實(shí)的AI底層能力長(zhǎng)期積累基礎(chǔ)上,Soul團(tuán)隊(duì)基于深耕社交領(lǐng)域的深刻洞察,快速推動(dòng)技術(shù)在應(yīng)用層的落地,并圍繞用戶實(shí)際體驗(yàn)反饋總結(jié)優(yōu)化方向。在發(fā)展過程中,Soul快速明確自身AI布局路線,即“AI幫助用戶交朋友”(AI輔助社交)和“AI與用戶交朋友”(人機(jī)互動(dòng)),在不同方向,已分別推出了AI虛擬人情感化陪伴體系“AI伴侶”、AI聊天輔助體系等功能,并受到了用戶的熱烈歡迎與積極反饋。
其中,人機(jī)互動(dòng)的迭代方向便是讓AI實(shí)現(xiàn)類真人能力,在交互中為用戶帶來情緒價(jià)值和信息價(jià)值。
根據(jù)Soul旗下Just So Soul研究院在今年3月發(fā)布的《2025 Z世代AI使用報(bào)告》(樣本數(shù)3680份),近四成年輕人每天使用AI產(chǎn)品獲得情感陪伴,此外,71.1%的年輕人表示愿意和AI做朋友,建立情感鏈接,對(duì)比該研究院在去年發(fā)布《2024 Z世代AIGC態(tài)度報(bào)告》(樣本數(shù)3457份),當(dāng)時(shí)選擇愿意和AI做朋友的年輕人比例為32.8%。
從數(shù)據(jù)的增長(zhǎng)中可以看到,AI的技術(shù)發(fā)展與應(yīng)用普及正在重新塑造年輕一代對(duì)社交關(guān)系的認(rèn)知,在這個(gè)變化過程中,也對(duì)AI能力提出了新要求。根據(jù)Soul面向“AI伴侶”活躍使用用戶的專項(xiàng)調(diào)研顯示,關(guān)于人機(jī)互動(dòng)體驗(yàn)提升需求方向,約六成受訪者表示“希望AI表現(xiàn)更接近真人”。
此次,全雙工語音通話大模型的升級(jí),極大提升了AI的互動(dòng)能力,讓人機(jī)交互具備在場(chǎng)感和情感溫度,將推動(dòng)AI社交進(jìn)入全新階段。
作為以真實(shí)的人與人社交為底色的平臺(tái),通過持續(xù)對(duì)新技術(shù)的探索和堅(jiān)定投入,Soul致力于構(gòu)建AI Being和Human Being共存的社交社區(qū),讓AI作為社交關(guān)系網(wǎng)絡(luò)的重要組成,豐富用戶的情感支撐體系,增強(qiáng)多元情感體驗(yàn),最終提升個(gè)體的幸福感和歸屬感。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )