綜合外媒報導,機器人與人類溝通時的「僵硬感」迎來技術瓶頸突破,哥倫比亞大學(Columbia University)工程團隊於 1 月 15 日發表重大進展,開發出一款能透過「觀察」影像自學唇部運動的擬真機器人。這款由該校「創意機器實驗室」研發、名為「Emo」的機器人,臉部裝載了 26 組微型馬達並覆蓋柔性矽膠皮膚,研究團隊於最新一期《科學機器人》(Science Robotics)期刊指出,該機器人首先透過「照鏡子」觀察自身馬達牽動表情的關聯,隨後再觀看數小時 YouTube 影片模仿人類說話與唱歌的嘴型。
這種「視覺對應動作(VLA)」模型讓機器人能將音訊直接轉化為自然的唇部動作,甚至能配合節奏演唱 AI 生成的數位專輯。實驗室主任利普森(Hod Lipson)指出,隨著經濟學家預測未來十年全球將出現 10 億台人形機器人,賦予機器人自然且具備情緒深度的社交反饋,將是人類能否接受機器人進入家庭與醫療照護體系的關鍵。


