中國版GPT-4o來了!沒等來OpenAI的“Her”,訊飛星火版“Her”搶先到來,打造國內(nèi)首個(gè)全新中文交互模式,并將在8月底率先全民開放使用。這意味著國內(nèi)首個(gè)對標(biāo)GPT-4o語音功能的產(chǎn)品正式到來。
8月19日,科大訊飛宣布星火語音大模型更新,正式推出星火極速超擬人交互,并將其能力落地在訊飛星火APP“小星暢聊”功能中。星火極速超擬人交互響應(yīng)速度更快,對話更加自然流暢,隨時(shí)打斷、插話之后還能秒回。有趣的是,星火極速超擬人交互還能感知你的情緒變化,并共情地回應(yīng)你的喜怒哀樂,在表達(dá)上更加自然、更具情感。
從官方展示效果來看,星火極速超擬人交互在響應(yīng)和打斷速度、情緒感知情感共鳴、語音可控表達(dá)、人設(shè)扮演四個(gè)方面實(shí)現(xiàn)突破,讓整體的交互體驗(yàn)更自然、更有趣,就像電影《Her》中展現(xiàn)的智能且人性化的聊天效果一樣。
在響應(yīng)速度上,星火極速超擬人交互支持極速響應(yīng)多輪交互,能夠在對話過程中生成高質(zhì)量的回答,并且響應(yīng)速度更快、與GPT-4o響應(yīng)時(shí)間相當(dāng),幾乎與人類正常聊天節(jié)奏一致,并且對話中允許用戶隨時(shí)打斷、插話,可謂實(shí)現(xiàn)了人機(jī)對話的“無縫銜接”。
在情緒感知情感共鳴上,星火極速超擬人交互可以在對話中感知到用戶的喜、怒、哀、樂、害怕、困惑等各類情緒,不僅能根據(jù)聲音的內(nèi)容來判斷,還能像朋友一樣用合適的情感回應(yīng)用戶。比如,用笑聲回應(yīng)開心,安慰悲傷情緒……此刻是不是有一種《Her》的既視感。同時(shí),星火極速超擬人交互還能識別用戶咳嗽、貓和狗的叫聲等,給出對應(yīng)的回復(fù)語。
相比以前語音交互中機(jī)器聲音無法調(diào)整的情況,現(xiàn)在只要語音發(fā)出指令,就可以控制超擬人在情感、風(fēng)格、方言、強(qiáng)度等表達(dá)方式上做出變化?!坝谜{(diào)侃的方式給我說個(gè)笑話”、“用東北話給外地朋友介紹下鍋包肉”、“說的更快一點(diǎn)”……
此外,星火極速超擬人交互還支持“角色扮演”,可以模仿不同的角色陪你聊天。比如,“模仿孫悟空的聲音來和小孩子對話”,超擬人便會(huì)模仿孫悟空的聲音和人設(shè)和小朋友聊天。
今年5月OpenAI驚艷亮相了GPT-4o,展示了堪比電影《Her》中的人機(jī)交互體驗(yàn),但遲遲沒有面向用戶開放,上個(gè)月底也只是選擇性地向一小部分Alpha測試參與者開放部分語音功能。
訊飛星火版Her的到來,可以說比OpenAI搶先一步落地,也代表國產(chǎn)大模型開始從追趕、對標(biāo)到進(jìn)行自主創(chuàng)新、走出差異化路線。
據(jù)科大訊飛透露,此次星火極速超擬人交互采用統(tǒng)一神經(jīng)網(wǎng)絡(luò)直接實(shí)現(xiàn)語音到語音端到端建模,對比傳統(tǒng)的語音轉(zhuǎn)文字、大模型生成回復(fù)文本、語音合成三步驟來說可謂“一氣呵成”,大幅縮短響應(yīng)時(shí)間的同時(shí),也提升了交互擬人度和流暢度。
同時(shí),結(jié)合訊飛多維度的語音屬性解耦表征訓(xùn)練準(zhǔn)則,將內(nèi)容、音色、情感、語言、風(fēng)格都信息進(jìn)行解耦訓(xùn)練,使得星火極速超擬人交互能夠更加靈活控制各類元素,還能根據(jù)需求便捷定制,讓系統(tǒng)快速落地應(yīng)用。
正是基于以上技術(shù)創(chuàng)新,8月底星火極速超擬人交互將率先全民開放使用??拼笥嶏w表示,基于全新端到端框架創(chuàng)新基礎(chǔ)上,星火極速超擬人交互目前主要開放語音模態(tài),未來會(huì)持續(xù)在交互上創(chuàng)新突破,不僅會(huì)帶來更多更實(shí)用、豐富的功能,也會(huì)拓展到更多模態(tài)。
在2023年科大訊飛全球1024開發(fā)者節(jié)上,華為科技有限公司副董事長、輪值董事長徐直軍曾表示,“華為公司在全球所有使用的智能終端的語音技術(shù),都是來自于科大訊飛,而且不僅僅是中文”。這一波語音能力的革新,多輪交互、語義理解、指令跟隨、邏輯推理、情感共鳴……代表了智能語音交互領(lǐng)域的一大階躍。全新的星火超擬人交互模式達(dá)到了類人級別的極速響應(yīng)和聰明、實(shí)用、流暢、自然的非凡表現(xiàn),這一技術(shù)的應(yīng)用和普及還隱藏著巨大的可能性——語音市場在這個(gè)時(shí)代將被重寫,語音交互帶動(dòng)萬物互聯(lián)的第六次產(chǎn)業(yè)浪潮有望出現(xiàn)一次井噴。
該項(xiàng)技術(shù)突破,將會(huì)極大地促進(jìn)智能語音技術(shù)進(jìn)一步應(yīng)用于智能手機(jī)、智能汽車、智能家電以及智能家居等各類消費(fèi)級產(chǎn)品當(dāng)中,并且隨著全球化進(jìn)程的加深,對多語種、多方言的需求也會(huì)持續(xù)增加。據(jù)國際數(shù)據(jù)公司IDC分析,預(yù)計(jì)到2030年,全球智能語音服務(wù)市場規(guī)模將達(dá)約731.6 億美元,復(fù)合增長率27%??拼笥嶏w憑借上述技術(shù)突破有望收獲新一輪產(chǎn)業(yè)紅利。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 中國解鎖千里眼技術(shù) 讓美科學(xué)家集體破防
- ICCV 2025|CreateAI成果亮眼,2篇論文被錄用
- 美國外鏈蘋果稅清零,歐盟低至12%,我們還交30%嗎?
- DeepSeek、豆包向左,盤古大模型向右
- 根技術(shù)生態(tài),為何需要云上繁榮?
- 一邊高管出走,一邊沖刺IPO:榮耀在焦慮中尋求突圍
- 天道好輪回,AI時(shí)代PC端應(yīng)用開發(fā)重回C位
- 別動(dòng)不動(dòng)就“微信公眾號要死了”
- 再創(chuàng)全球最輕新紀(jì)錄 vivo X Fold5旗艦折疊新品正式發(fā)布
- 首屆魔搭開發(fā)者大會(huì)舉辦,已服務(wù)全球超1600萬開發(fā)者
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。