記者 金靜馨 攝
杭港大廈四樓,幾十雙眼睛正緊盯著屏幕——畫面中,機(jī)器人在千變?nèi)f化的客廳里流暢穿行,精準(zhǔn)繞開散落的玩具與錯落的椅腳。
“用多大力氣可以打開一個柜子?”“撿起一個玩具,從哪個角度可以放進(jìn)筐里?”群核科技的空間智能平臺SpatialVerse資深技術(shù)專家趙慶說,這些我們?nèi)粘?雌饋砥狡綗o奇的操作,對機(jī)器人而言,卻是一件難事。每一個動作背后,都涉及復(fù)雜的感知、判斷與執(zhí)行過程。
6月19日下午,浙江省科協(xié)“走進(jìn)”系列科普活動,走進(jìn)了被譽(yù)為“杭州六小龍”之一的群核科技,帶著公眾掀開人工智能最神秘的訓(xùn)練幕布。
為機(jī)器人打造“數(shù)字道場”
訓(xùn)練效果可以實現(xiàn)“爆炸性”增長
從53秒減少至1.2秒——這是“酷家樂”處理一張典型2K圖像GPU渲染的最新速度。
作為全球最大的空間設(shè)計平臺,群核科技旗下的“酷家樂”是一場效率革命的發(fā)起者。以前,家居設(shè)計行業(yè)的出圖環(huán)節(jié)一直是效率瓶頸。“酷家樂”依托強(qiáng)大的GPU集群和自主研發(fā)的云端實時渲染引擎,將原本動輒數(shù)小時的渲染任務(wù)壓縮至幾秒鐘完成,“過去設(shè)計師需要數(shù)天完成的渲染圖,如今一杯咖啡未涼,方案已躍然眼前”。
3.62億個3D模型及空間設(shè)計元素,是“酷家樂”積累下來的數(shù)據(jù)。這些多場景的室內(nèi)空間數(shù)據(jù),不僅構(gòu)建起一個龐大的數(shù)字世界,更為群核科技從“空間設(shè)計平臺”邁向“空間智能賽道”提供了堅實支撐。在這里,每一幀渲染不僅是畫面的生成,更是未來空間的智慧預(yù)演。
“目前的人形機(jī)器人在運動控制和小腦技術(shù)方面已經(jīng)取得了長足進(jìn)展,”趙慶娓娓道來,“但真正讓它們‘聰明’起來的是數(shù)據(jù)!薄皺C(jī)器人要像人一樣思考、決策,就需要海量可交互的三維數(shù)據(jù)作為‘訓(xùn)練場’,這就像人類的學(xué)習(xí)過程,沒有足夠的練習(xí)和反饋,就無法真正理解世界!壁w慶告訴大家,目前可交互的三維數(shù)據(jù)是突破人形機(jī)器人發(fā)展的瓶頸之一。
早在2018年,群核科技就和帝國理工學(xué)院、南加州大學(xué)展開了一項極具前瞻性的科研合作——發(fā)布當(dāng)時全球最大的室內(nèi)場景認(rèn)知深度學(xué)習(xí)數(shù)據(jù)集InteriorNet。他們“腦洞大開”,把原本展示給業(yè)主的三維虛擬環(huán)境提供給機(jī)器人“學(xué)習(xí)”,讓機(jī)器人在虛擬空間里觀察、理解,然后做出決策。通過這種方式,探索怎么讓機(jī)器人更好地適應(yīng)現(xiàn)實世界里那些復(fù)雜的環(huán)境。
看過《黑客帝國》的朋友,肯定對墨菲斯給尼奧搭建的“數(shù)字道場”印象深刻。在那個虛擬空間里,尼奧不管經(jīng)歷什么,都只是數(shù)據(jù)在變化,等他訓(xùn)練完,回到現(xiàn)實世界就能大顯身手。
現(xiàn)在,群核科技干的事兒就和這差不多,他們也在為具身智能、AIGC(人工智能生成內(nèi)容)等打造“數(shù)字道場”,幫助AI走進(jìn)真實的物理世界,推動空間智能的發(fā)展!拔覀冇萌汉丝萍计脚_積累的海量可交互三維數(shù)據(jù)和先進(jìn)的渲染技術(shù),給機(jī)器人搭建了很多高逼真、強(qiáng)交互的仿真環(huán)境!壁w慶一邊說著,一邊指向屏幕,“在這些虛擬環(huán)境里,機(jī)器人可以模擬現(xiàn)實世界里的復(fù)雜場景,一遍又一遍地訓(xùn)練。”
就拿最常見的掃地機(jī)器人來說,不同家庭的環(huán)境差別可太大了。家具怎么擺、房間干不干凈、光線亮不亮,這些都會影響掃地機(jī)器人的清掃任務(wù)。有了群核空間智能平臺(SpatialVerse)打造的海量仿真訓(xùn)練環(huán)境,掃地機(jī)器人可以在虛擬空間里進(jìn)行億萬次訓(xùn)練,模擬各種不同的家庭環(huán)境和清掃任務(wù)。而且,在數(shù)字世界中,時間是被壓縮的,“天上一天,人間一年”,在真實世界走一段10公里的路程可能需要半天,但在數(shù)字世界只需要幾秒。這讓實驗和訓(xùn)練的速度大幅提升,訓(xùn)練效果就像坐了火箭一樣飛速提升。
從造夢到落地
空間智能讓機(jī)器人更“智能”
“AI設(shè)計師會完全取代人類設(shè)計師嗎?”“未來機(jī)器人可以幫我寫作業(yè)嗎?”隨著趙慶的分享接近尾聲,現(xiàn)場的大小朋友們紛紛舉手,迫不及待地拋出他們的問題。
趙慶笑著回答:“其實我們?nèi)祟愖钤绨l(fā)明機(jī)器人,就是因為‘懶’。我們想讓機(jī)器人幫我們工作,所以有了工業(yè)機(jī)器人;現(xiàn)在,我們想讓機(jī)器人幫我們做家務(wù),所以越來越多的家庭服務(wù)機(jī)器人正在出現(xiàn)。當(dāng)然未來機(jī)器人一定會有幫我們完成作業(yè)的能力。但學(xué)習(xí)這件事,是屬于自己的成長旅程,是不能、也不該由機(jī)器人來代替的!
在談到未來機(jī)器人的應(yīng)用和發(fā)展,一位觀眾說:“我還指望機(jī)器人幫我養(yǎng)老呢!壁w慶向大家透露:“我們現(xiàn)在合作的一些企業(yè),已經(jīng)在部署機(jī)器人到醫(yī)院、養(yǎng)老院等,用于日常護(hù)理、陪伴、環(huán)境監(jiān)測等任務(wù)。相信在不久的將來,機(jī)器人會成為我們生活中溫暖而可靠的‘銀發(fā)助手’!
分享結(jié)束后,大家又興致勃勃地參觀了群核科技的展廳。一進(jìn)入展廳,一塊巨大的數(shù)據(jù)大屏便映入眼簾,屏幕上不斷跳動的數(shù)字仿佛是整個平臺的“心跳”:今日發(fā)起渲染任務(wù)1809397次,這個數(shù)字還在不斷增長,而全球用戶任務(wù)也如潮水般涌動……
趙慶告訴大家,這背后正是群核科技兩大核心技術(shù)引擎——啟真(渲染)引擎和矩陣(CAD)引擎的協(xié)同發(fā)力!叭绻f我們是在為AI打造一個理解世界的‘眼睛’,那么啟真引擎就是這個‘眼睛’的核心。”比如在當(dāng)下火熱的跨境電商領(lǐng)域,基于此引擎的酷家樂棚拍解決方案,就深受出海賣家青睞。而如果說啟真引擎負(fù)責(zé)“造夢”,那矩陣引擎則負(fù)責(zé)“落地”。作為群核自研的CAD建模引擎,矩陣引擎能夠?qū)臻g進(jìn)行高精度、結(jié)構(gòu)化的描述,是AI真正理解物理世界的基礎(chǔ)能力之一。通過矩陣引擎,AI不僅能識別一張桌子的形狀,還能理解它是用來吃飯的、還是工作用的;不僅能知道一間屋子的長寬高,還能判斷哪里適合放沙發(fā)、哪里該留通道。這種結(jié)構(gòu)化的能力,正是讓AI從“看得見”走向“看得懂”的關(guān)鍵一步。
<愛上你,愛上新江南網(wǎng):hzgou.cn www.xjnnet.net,hzgou.cn歡迎您!>聲明:
本文僅代表作者個人觀點,與新江南網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容,新江南網(wǎng)號系信息發(fā)布平臺,新江南網(wǎng)僅提供信息存儲空間服務(wù)。如有侵權(quán)請出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
點擊排行