科大訊飛開放平臺研發總監劉可為在會上發表了題為“多模態+大模型,構建人形機器人新交互”的主題演講。他表示,科大訊飛機器人超腦平臺是以訊飛超腦2030技術為底座,面向物理世界、虛擬世界和元宇宙,以AI能力星云、多模態交互、大模型、模型訓練、資產生成和軟硬件接入為核心的機器人開發平臺,幫助開發者快速搭建多場景適配、具有深厚知識底蘊以及擅長自我進化的實體機器人和虛擬數字人產品。
隨著大模型技術的發展,以具身智能為代表的人形機器人成為發展的新趨勢。面對功能更多樣、任務更專業、交互更自然、決策更智能的挑戰,訊飛機器人超腦平臺從終端多模態交互和大模型理解決策兩個方面出發,構建人形機器人的新交互。首先,通過視聽融合的感知交互,實現了包含開啟交互、交互保持、切換交互權和結束交互在內的機器人交互新范式。其次,基于大模型的機器人交互大腦,實現了控制級指令、官方技能、核心業務功能、快速知識問答、閑聊陪伴的多交互場景的統一。最后,開放了虛擬人驅動協議,滿足不同數字人的接入需求。訊飛機器人超腦平臺的愿景是,利用AI推動機器人產業的發展,讓機器人走進千家萬戶。
在活動現場,科大訊飛所展示的機器人超腦平臺多模態人機交互系統吸引了眾多參觀者的目光。該系統解決了機器人在嘈雜環境下聽、說、理解和思考的難題,展示了科大訊飛先進的多模態算法。借助這套系統,機器人不僅能實現語音識別、自然語言處理等基礎功能,還具備人像識別、唇形識別等多種感知能力。更令人稱贊的是,這套系統能夠在人流密集、環境嘈雜的服務場景中精準捕捉到用戶的聲音,并運用訊飛星火認知大模型深入分析客戶的自然語言語義,精確理解用戶意圖。
同時,訊飛擬人的語音技術使得機器人回復語言更具人性化,能夠與用戶進行更加親切自然的交流。目前,科大訊飛的多模態交互系統已被廣泛應用于數字人一體機、商用及家用服務機器人等多種設備中,其在智能家居、智慧零售、教育等領域的賦能作用尤為突出。
本屆大會不僅是一次技術的展示,更是對人形機器人產業發展趨勢的深度剖析。與會專家圍繞新一輪科技革命和產業變革、人形機器人新潮流、機器人技術研發、創新型產學研平臺建設等話題進行了深入討論,搭建了交流合作的平臺,推動了人形機器人產業的創新發展,也為在場的每一位觀眾提供了一個思考未來智能交互可能的窗口。隨著人工智能技術的不斷進步,科大訊飛正以其創新的多模態人機交互系統描繪一個智能機器人走進千家萬戶的未來圖景。