谷歌近日宣布,旗下人工智能助手Gemini Live將推出一系列新功能,旨在提升用戶與AI的實(shí)時(shí)交互體驗(yàn)。這些功能計(jì)劃于8月28日隨全新Pixel 10系列手機(jī)首發(fā),并逐步擴(kuò)展至其他安卓設(shè)備和iOS平臺(tái)。其中,屏幕內(nèi)容高亮顯示和語音角色模仿功能尤為引人關(guān)注,展現(xiàn)了谷歌在AI助手領(lǐng)域的持續(xù)創(chuàng)新。
首先,Gemini Live新增的屏幕內(nèi)容高亮功能允許用戶在共享攝像頭畫面時(shí),由AI助手直接在屏幕上突出顯示特定物品。例如,當(dāng)用戶需要在一堆工具中快速識(shí)別合適的工具時(shí),只需將手機(jī)攝像頭對(duì)準(zhǔn)目標(biāo)區(qū)域,Gemini Live便會(huì)自動(dòng)圈出正確選項(xiàng)。這一功能基于計(jì)算機(jī)視覺技術(shù),能夠?qū)崟r(shí)分析圖像內(nèi)容,并結(jié)合上下文提供精準(zhǔn)建議。谷歌表示,該技術(shù)不僅提升了日常任務(wù)的效率,還為視覺輔助應(yīng)用提供了新的可能性。
與此同時(shí),谷歌還為Gemini Live引入了先進(jìn)的音頻模型,顯著改善了語音交互的自然度和表現(xiàn)力。新模型能夠更準(zhǔn)確地捕捉人類語音的語調(diào)、節(jié)奏和音高變化,使AI助手的回應(yīng)更加貼合對(duì)話情境。例如,當(dāng)用戶討論壓力較大的話題時(shí),Gemini會(huì)自動(dòng)調(diào)整為更平靜的語調(diào),以提供更舒適的交流體驗(yàn)。此外,用戶還可以根據(jù)需要調(diào)整語速,或要求AI以特定角色或歷史人物的口音講述故事,從而營造更具沉浸感的敘事效果。
除了視覺和語音功能的升級(jí),Gemini Live還進(jìn)一步擴(kuò)展了與第三方應(yīng)用的整合能力。用戶可以在與AI對(duì)話的過程中直接調(diào)用消息、電話或時(shí)鐘等應(yīng)用執(zhí)行任務(wù)。例如,在規(guī)劃路線時(shí),若用戶意識(shí)到可能遲到,可以中斷當(dāng)前對(duì)話并指令Gemini代為發(fā)送短信通知聯(lián)系人。這種無縫切換和多任務(wù)處理能力體現(xiàn)了谷歌在AI生態(tài)整合方面的深入布局。
從技術(shù)層面看,這些新功能依賴于谷歌在機(jī)器學(xué)習(xí)、自然語言處理和計(jì)算機(jī)視覺領(lǐng)域的積累。屏幕高亮功能結(jié)合了實(shí)時(shí)圖像識(shí)別與語義理解,而語音模型則采用了更先進(jìn)的聲學(xué)建模和情感分析算法。谷歌強(qiáng)調(diào),這些改進(jìn)不僅提升了用戶體驗(yàn),也為未來AI助手的發(fā)展方向提供了重要參考。
總體而言,Gemini Live的更新展示了谷歌在AI助手個(gè)性化與實(shí)用化方面的努力。通過增強(qiáng)視覺交互、語音表現(xiàn)力以及應(yīng)用整合,谷歌旨在使AI助手更加貼近用戶需求,成為日常生活中更高效的伙伴。隨著Pixel 10系列的推出,這些功能將率先與用戶見面,并逐步覆蓋更廣泛的設(shè)備平臺(tái)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )