單“手”夾起一支滴管,伸入量杯A中吸取少許液體,再平穩(wěn)移向量杯B,精準(zhǔn)滴入……眼前這臺(tái)名為智澄TR4的人形機(jī)器人,正在展示移液操作。
看似簡(jiǎn)單的動(dòng)作,背后卻隱藏著復(fù)雜的技術(shù)挑戰(zhàn)。比如在松開(kāi)滴管膠頭的那一刻,力度太小,液體無(wú)法順利滴落;力度稍大,滴管又可能滑落杯中。
而完成這套動(dòng)作,TR4靠的僅僅是一雙“眼睛”。它通過(guò)實(shí)時(shí)感知環(huán)境,并結(jié)合自適應(yīng)算法,自主調(diào)整抓取力度與動(dòng)作軌跡。
這是技術(shù)出身的胡魯輝的“得意之作”。從西雅圖到杭州,從Meta首席工程負(fù)責(zé)人、華為云計(jì)算大數(shù)據(jù)首席架構(gòu)師兼CTO到京東零售首席科學(xué)家兼技術(shù)副總裁、永輝云計(jì)算聯(lián)合創(chuàng)始人兼CTO……胡魯輝的職業(yè)生涯始終穿行于技術(shù)與創(chuàng)新的前沿。
這一次,他創(chuàng)辦“智澄AI”,投身于通用人形機(jī)器人的探索,選擇了一條更艱難、也更接近智能本質(zhì)的道路:要讓機(jī)器人不僅“思考”像人,更“行動(dòng)”像人。
讓機(jī)器人走出“洞穴”
古希臘哲學(xué)家柏拉圖在《理想國(guó)》中曾提出一個(gè)著名的洞穴之喻:一群從未離開(kāi)過(guò)山洞的人,堅(jiān)信火把投射在洞壁上的那些影子,就是真實(shí)世界的全部。直到有一天,其中一人走出山洞,看到了太陽(yáng)……
這恰如眼下的人工智能。它通過(guò)人類提供的二手信息來(lái)理解世界,卻從未直接感受過(guò)物理現(xiàn)實(shí)。
胡魯輝和團(tuán)隊(duì)正在做的,就是讓人工智能直接感知、理解物理世界,并與之交互,從而逐步接近通用人工智能。從寒武紀(jì)三葉蟲(chóng)的復(fù)眼,到人類大腦的視覺(jué)皮層,生物進(jìn)化用了整整5.4億年才構(gòu)建起這種理解現(xiàn)實(shí)世界的能力。
他將這一方向稱為“物理智能”,并在2024年4月北京生成式AI大會(huì)上首次提出這一概念:物理智能可以實(shí)時(shí)感知物理世界的動(dòng)態(tài),構(gòu)建出可交互的“世界模型”,從而解決傳統(tǒng)機(jī)器人依賴預(yù)設(shè)規(guī)則、泛化能力弱與智能化水平不足等問(wèn)題,最終實(shí)現(xiàn)跨任務(wù)、跨環(huán)境、跨本體的自主決策與高效執(zhí)行。
有意思的是,僅一個(gè)月后,“AI教母”李飛飛公開(kāi)了新的創(chuàng)業(yè)方向——空間智能;6月,英偉達(dá)創(chuàng)始人黃仁勛在演講中直言,“下一波浪潮將是物理AI”……就在大模型和生成式AI在數(shù)字世界高歌猛進(jìn)之時(shí),行業(yè)先驅(qū)者已經(jīng)預(yù)見(jiàn)到下一場(chǎng)變革的來(lái)臨。
構(gòu)建理解物理世界的“大腦”
“AI 1.0時(shí)代始于2012年,杰弗里·辛頓團(tuán)隊(duì)提出的深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet,引發(fā)深度學(xué)習(xí)領(lǐng)域革命,AlphaGo的出現(xiàn),更讓大眾見(jiàn)識(shí)到人工智能的潛力。這一階段的AI技術(shù),多應(yīng)用于智慧零售等垂類領(lǐng)域。如今的AI 2.0,從2017年的Transformer架構(gòu)起步,爆發(fā)于2022年底的ChatGPT,核心目標(biāo)是通用性和泛化能力!
正是在3年前,胡魯輝萌生讓AI理解物理世界的想法:“最終目標(biāo)是實(shí)現(xiàn)通用人工智能,而機(jī)器人是現(xiàn)實(shí)中的載體,完成AI從感知到行動(dòng)的完整閉環(huán)!
現(xiàn)實(shí)世界充滿未知與變動(dòng)。端在手中的牛奶可能突然灑了,廚房地板因水漬變得濕滑……如果機(jī)器人只會(huì)機(jī)械執(zhí)行預(yù)設(shè)指令,將難以應(yīng)對(duì)多變的環(huán)境。
智澄AI為機(jī)器人打造了理解物理世界的“大腦”,一個(gè)深度融合物理規(guī)律認(rèn)知與跨模態(tài)感知能力的統(tǒng)一智能框架。自研的物理智能模型,通過(guò)三層架構(gòu)實(shí)現(xiàn)突破:
感知層整合激光雷達(dá)、觸覺(jué)傳感器、IMU等多源數(shù)據(jù),構(gòu)建實(shí)時(shí)動(dòng)態(tài)的物理場(chǎng)域模型,讓機(jī)器人擁有像人一樣的感知力、形變與運(yùn)動(dòng)。
認(rèn)知層將數(shù)萬(wàn)條物理定律(如牛頓力學(xué)、材料特性等),編碼為可計(jì)算知識(shí)圖譜,賦予機(jī)器理解物理法則的常識(shí)。
執(zhí)行層則依托“世界模型”,預(yù)測(cè)并生成適應(yīng)各類場(chǎng)景的動(dòng)作策略。“比如我們的抓取系統(tǒng),無(wú)需預(yù)先輸入物體參數(shù),僅憑視覺(jué)和觸覺(jué)反饋動(dòng)態(tài)調(diào)整力度,就能穩(wěn)定操作玻璃杯、塑料袋等多種物品!
當(dāng)智能中樞具備強(qiáng)大的自適應(yīng)能力,末端執(zhí)行器不再需要為每個(gè)場(chǎng)景專門(mén)定制。這種底層革新,使得機(jī)器人硬件標(biāo)準(zhǔn)化成為可能。
<愛(ài)上你,愛(ài)上新江南網(wǎng):hzgou.cn 歡迎您!>聲明:
本文僅代表作者個(gè)人觀點(diǎn),與江南網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容,江南網(wǎng)號(hào)系信息發(fā)布平臺(tái),江南網(wǎng)僅提供信息存儲(chǔ)空間服務(wù)。如有侵權(quán)請(qǐng)出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
點(diǎn)擊排行