8月27日,全球智能機器人引領(lǐng)者極智嘉 (Geek+,股票代碼:2590.HK)正式發(fā)布全新通用機械臂操作技術(shù)方案及全球首個專為倉儲場景打造的具身智能基座模型 Geek+ Brain,旨在攻克倉儲自動化中的長久難題——超大規(guī)模商品 SKU的精準揀選與高效適應(yīng)。
Geek+ Brain為極智嘉通用倉儲機器人提供“超級大腦”。而首個通用機械臂操作技術(shù)方案則聚焦揀選場景,通過新一代具身智能技術(shù)首次系統(tǒng)性地解決了海量商品形態(tài)、材質(zhì)差異帶來的機械臂抓取難題,實現(xiàn)了全品類、全場景、高適應(yīng)性的自動揀貨,為行業(yè)帶來革命性的應(yīng)用技術(shù)。
此次發(fā)布標志著極智嘉的技術(shù)版圖從移動機器人領(lǐng)域延伸至機械臂智能應(yīng)用,展現(xiàn)出強大的產(chǎn)品技術(shù)研發(fā)和業(yè)務(wù)拓展能力,并將進一步釋放其在倉儲智能化市場需求中的巨大發(fā)展?jié)摿Α?/span>
通用機械臂操作技術(shù)方案
解決超大規(guī)模商品揀取難題
在倉庫超大規(guī)模揀貨場景中,“貨物多樣性、環(huán)境動態(tài)性”一直使其成為是最難被機器人完全替代的環(huán)節(jié)之一。
倉儲揀貨的核心是“精準抓取不同貨物”,倉儲貨物形態(tài)與材質(zhì)適配難,重量和易損性差異極大等痛點,直接導(dǎo)致傳統(tǒng)機械臂的抓取通用性不足:涵蓋“硬(紙箱、盒子等)、軟(袋裝零食、衣物等)、脆(玻璃制品、化妝品)、散(零件、生鮮)”等多種類型,需要采用不同抓取邏輯。
同時,倉儲場景中貨物遮擋、堆疊無序等環(huán)境變化,會導(dǎo)致感知精度不足,視覺識別與定位出現(xiàn)誤差:“相似外觀混淆”(物品難以被識別分隔)、“貨物遮擋”(堆疊時下層貨物被遮擋)等問題,要求更高的感知泛化能力。
極智嘉的首個通用機械臂操作技術(shù)方案,專為解決這一難題而來。它通過多目相機捕捉高精度 3D環(huán)境信息,結(jié)合系統(tǒng)訂單信息,通過 Geek+ Brain模型完成智能揀選工作:精準分割物品并識別材質(zhì)特征,推理生成完整 3D信息和空間定位,進而判斷最優(yōu)抓取點,智能決策末端執(zhí)行器的吸盤選擇和機械臂運動軌跡,穩(wěn)穩(wěn)完成智能擺放。
圖1機械臂揀選工作流程圖
亮點1:基于統(tǒng)一協(xié)同的多任務(wù)感知模型
深度融合 2D語義與 3D幾何網(wǎng)絡(luò),大幅提升了透明或反光等復(fù)雜材質(zhì)物體的深度估計精度,以及外觀相似物體的分割準確性。同時實現(xiàn)檢測、分割、深度估計等多任務(wù),降低推理延遲。
圖2多任務(wù)感知模型
亮點2:基于仿真增強的完整三維形狀預(yù)測
構(gòu)建了包含完整三維幾何信息的物體仿真數(shù)據(jù),支持遮擋區(qū)域補全、完整三維估計、堆疊推理,將“視覺識別”擴展為“空間理解”,使機器人具備更接近人類的空間推理能力,不僅“看得見”,還能“想得出”,有效提升了多物體抓取中的穩(wěn)定性與安全性,減少抓取時因缺少完整 3D信息造成的滑落或碰撞。
圖3完整三維形狀預(yù)測
亮點3:多維度感知
基于多維度感知技術(shù),實現(xiàn)對柔性物品、易碎品及復(fù)合材質(zhì)的高精度識別。系統(tǒng)不僅能精準區(qū)分軟硬材質(zhì),識別布料等難吸附材料,還可通過條碼區(qū)域檢測主動規(guī)避關(guān)鍵信息區(qū)域,避免遮擋或損傷,顯著提升抓取的安全性與成功率,相較傳統(tǒng)方案,在復(fù)雜多變的應(yīng)用場景中展現(xiàn)出更強的適應(yīng)性與運行穩(wěn)定性。
圖4基于多維度感知技術(shù)實現(xiàn)高精度識別
亮點4:基于強化學(xué)習(xí)的通用抓取策略
無需數(shù)據(jù)標注,直接面向任務(wù)的學(xué)習(xí)與優(yōu)化。結(jié)合多維度感知理解,優(yōu)化物品抓取點判斷與末端執(zhí)行器控制策略,支持根據(jù)物品特性自由選擇吸盤組合,提升抓取成功率與穩(wěn)定性。
圖5優(yōu)化物品抓取點判斷與末端執(zhí)行器控制策略
極智嘉通用機械臂貨品揀取技術(shù)可實現(xiàn)四大客戶價值:
Model-free:即插即用,快速部署
依托 Geek+ Brain海量真實數(shù)據(jù)預(yù)訓(xùn)練的通用模型,基本實現(xiàn) Model-free,即插即用, 48小時快速部署。新入 SKU也無需額外訓(xùn)練,極大簡化了上線流程。
99.99%+準確率:精準識別,穩(wěn)定抓取
基于對貨品物理屬性全面的語義理解和空間感知能力,在開放環(huán)境中未知海量貨品的識別準確率極高,搭配 Double Pick雙重校驗技術(shù)和掃碼模塊可達更高準確率,漏揀、錯揀與返工率極低,作業(yè)節(jié)拍穩(wěn)定可預(yù)期,精準高效。
百毫秒級別推理:效率翻倍,全天作業(yè)
通過輕量化模型與剪枝優(yōu)化,實現(xiàn)百毫秒級別高效率、低延遲快速推理,多環(huán)節(jié)順暢銜接,逐單揀選綜合效率穩(wěn)定達到行業(yè)平均人效 2倍以上,且能 7*24小時不間斷作業(yè),讓倉儲作業(yè)效率倍增。
本地化模型:數(shù)據(jù)安全,自主掌握
模型采用本地化部署模式,所有業(yè)務(wù)數(shù)據(jù)均存儲于客戶自有服務(wù)器,不與外部網(wǎng)絡(luò)交互。從數(shù)據(jù)采集、處理到模型運算,全程處于客戶自主管控范圍,徹底規(guī)避數(shù)據(jù)泄露、隱私風(fēng)險,為業(yè)務(wù)安全保駕護航。
圖6通用機械臂貨品揀取技術(shù)的四大客戶價值
Geek+ Brain:面向倉儲場景的具身智能基座模型
極智嘉的具身智能基座模型 Geek+ Brain采用“感知-策略”兩段式分層架構(gòu),由 Perception Model(感知模型)與 Policy Model(策略模型)兩個核心層組成。
感知模型:聚焦空間智能,環(huán)境理解能力,整合 2D/3D感知,專注于環(huán)境與物體信息的精準建模。
策略模型:基于感知模型的環(huán)境理解,自動生成合理、高效和可執(zhí)行的操作策略。
圖7 Geek+ Brain分層架構(gòu):Perception Model + Policy Model
分層架構(gòu)保證了“數(shù)據(jù)到?jīng)Q策”路徑的高效閉環(huán)與系統(tǒng)擴展性。其分層設(shè)計提升了可解釋性,支持逐層定位與優(yōu)化,極大提高研發(fā)和運維效率。該架構(gòu)具備高度靈活性,可分階段積累數(shù)據(jù)、按需替換模塊,并與硬件解耦,支持多樣化末端執(zhí)行器。同時,分層實現(xiàn)輕量化部署和模塊級更新,在保障系統(tǒng)穩(wěn)定性和精度的同時,顯著降低算力成本,更契合工業(yè)和倉儲場景對于可靠與高效要求。
構(gòu)建強大數(shù)據(jù)金字塔
Geek+ Brain使用基于千萬量級公開數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型,再經(jīng)過仿真數(shù)據(jù)與數(shù)年積累的行業(yè)數(shù)據(jù)進行模型后訓(xùn)練,最終得到可實時處理 2D/3D圖像陣列的高性能視覺抓取模型。同時, Geek+ Brain構(gòu)建數(shù)據(jù)生產(chǎn)、模型訓(xùn)練、評測、部署四大核心平臺,提供完整的數(shù)據(jù)閉環(huán)支撐。
圖8數(shù)據(jù)金字塔模型
圖9 Geek+ Brain四大核心平臺
邁向通用倉儲機器人
7月30日,極智嘉宣布成立具身智能子公司,聚焦機械手揀貨、通用機器人等具身智能技術(shù)和業(yè)務(wù),目標直指物流、制造等B2B場景。
極智嘉創(chuàng)始人兼 CEO鄭勇表示:“‘通用倉儲機器人’是子公司的首個戰(zhàn)略方向。極智嘉將秉承‘場景驅(qū)動’理念,以倉儲場景的真實痛點作為技術(shù)演進的突破點,確保每一步突破都能產(chǎn)生可量化的商業(yè)價值?!?/span>
因此,極智嘉選擇由點及面地逐步實現(xiàn)"通用倉儲機器人"戰(zhàn)略構(gòu)想:
1.單點突破期 (當(dāng)前):以貨品揀取場景作為首站,解決業(yè)界難題,實現(xiàn)真無人揀選
2.場景通用期:拓展至搬運、打包等環(huán)節(jié),向通用性演進
3.生態(tài)共建期:基于 Geek+ Brain構(gòu)建模型生態(tài),促使模型資源不斷豐富、生態(tài)逐漸壯大,致力于成為全球倉儲具身智能生態(tài)主導(dǎo)者
在當(dāng)前的具身智能領(lǐng)域中,倉儲物流場景憑借其龐大的市場規(guī)模、明確的作業(yè)流程與迫切的智能化需求,成為最適合技術(shù)落地、商業(yè)化價值最高的核心賽道之一。然而,倉儲環(huán)境對技術(shù)的可靠性、準確性及效率提出極高要求。
極智嘉在倉儲領(lǐng)域的深厚場景認知、數(shù)據(jù)積累、全球客戶資源和業(yè)務(wù)網(wǎng)絡(luò),為公司發(fā)展“通用倉儲機器人”帶來得天獨厚優(yōu)勢。
作為公司邁向“通用倉儲機器人”的關(guān)鍵一步,通用機械臂操作技術(shù)方案和 Geek+ Brain這兩項技術(shù)成果標志著極智嘉在具身智能領(lǐng)域從技術(shù)架構(gòu)到應(yīng)用閉環(huán)的關(guān)鍵突破,也為“真無人、全智能”倉儲時代的到來提供了具身智能技術(shù)基石。
(審核編輯: 朝言)
分享