8月27日,全球智能機器人引領者極智嘉 (Geek+,股票代碼:2590.HK)正式發(fā)布全新通用機械臂操作技術方案及全球首個專為倉儲場景打造的具身智能基座模型 Geek+ Brain,旨在攻克倉儲自動化中的長久難題——超大規(guī)模商品 SKU的精準揀選與高效適應。
Geek+ Brain為極智嘉通用倉儲機器人提供“超級大腦”。而首個通用機械臂操作技術方案則聚焦揀選場景,通過新一代具身智能技術首次系統(tǒng)性地解決了海量商品形態(tài)、材質(zhì)差異帶來的機械臂抓取難題,實現(xiàn)了全品類、全場景、高適應性的自動揀貨,為行業(yè)帶來革命性的應用技術。
此次發(fā)布標志著極智嘉的技術版圖從移動機器人領域延伸至機械臂智能應用,展現(xiàn)出強大的產(chǎn)品技術研發(fā)和業(yè)務拓展能力,并將進一步釋放其在倉儲智能化市場需求中的巨大發(fā)展?jié)摿Α?/span>
通用機械臂操作技術方案
解決超大規(guī)模商品揀取難題
在倉庫超大規(guī)模揀貨場景中,“貨物多樣性、環(huán)境動態(tài)性”一直使其成為是最難被機器人完全替代的環(huán)節(jié)之一。
倉儲揀貨的核心是“精準抓取不同貨物”,倉儲貨物形態(tài)與材質(zhì)適配難,重量和易損性差異極大等痛點,直接導致傳統(tǒng)機械臂的抓取通用性不足:涵蓋“硬(紙箱、盒子等)、軟(袋裝零食、衣物等)、脆(玻璃制品、化妝品)、散(零件、生鮮)”等多種類型,需要采用不同抓取邏輯。
同時,倉儲場景中貨物遮擋、堆疊無序等環(huán)境變化,會導致感知精度不足,視覺識別與定位出現(xiàn)誤差:“相似外觀混淆”(物品難以被識別分隔)、“貨物遮擋”(堆疊時下層貨物被遮擋)等問題,要求更高的感知泛化能力。
極智嘉的首個通用機械臂操作技術方案,專為解決這一難題而來。它通過多目相機捕捉高精度 3D環(huán)境信息,結合系統(tǒng)訂單信息,通過 Geek+ Brain模型完成智能揀選工作:精準分割物品并識別材質(zhì)特征,推理生成完整 3D信息和空間定位,進而判斷最優(yōu)抓取點,智能決策末端執(zhí)行器的吸盤選擇和機械臂運動軌跡,穩(wěn)穩(wěn)完成智能擺放。
圖1機械臂揀選工作流程圖
亮點1:基于統(tǒng)一協(xié)同的多任務感知模型
深度融合 2D語義與 3D幾何網(wǎng)絡,大幅提升了透明或反光等復雜材質(zhì)物體的深度估計精度,以及外觀相似物體的分割準確性。同時實現(xiàn)檢測、分割、深度估計等多任務,降低推理延遲。
圖2多任務感知模型
亮點2:基于仿真增強的完整三維形狀預測
構建了包含完整三維幾何信息的物體仿真數(shù)據(jù),支持遮擋區(qū)域補全、完整三維估計、堆疊推理,將“視覺識別”擴展為“空間理解”,使機器人具備更接近人類的空間推理能力,不僅“看得見”,還能“想得出”,有效提升了多物體抓取中的穩(wěn)定性與安全性,減少抓取時因缺少完整 3D信息造成的滑落或碰撞。
圖3完整三維形狀預測
亮點3:多維度感知
基于多維度感知技術,實現(xiàn)對柔性物品、易碎品及復合材質(zhì)的高精度識別。系統(tǒng)不僅能精準區(qū)分軟硬材質(zhì),識別布料等難吸附材料,還可通過條碼區(qū)域檢測主動規(guī)避關鍵信息區(qū)域,避免遮擋或損傷,顯著提升抓取的安全性與成功率,相較傳統(tǒng)方案,在復雜多變的應用場景中展現(xiàn)出更強的適應性與運行穩(wěn)定性。
圖4基于多維度感知技術實現(xiàn)高精度識別
亮點4:基于強化學習的通用抓取策略
無需數(shù)據(jù)標注,直接面向任務的學習與優(yōu)化。結合多維度感知理解,優(yōu)化物品抓取點判斷與末端執(zhí)行器控制策略,支持根據(jù)物品特性自由選擇吸盤組合,提升抓取成功率與穩(wěn)定性。
圖5優(yōu)化物品抓取點判斷與末端執(zhí)行器控制策略
極智嘉通用機械臂貨品揀取技術可實現(xiàn)四大客戶價值:
Model-free:即插即用,快速部署
依托 Geek+ Brain海量真實數(shù)據(jù)預訓練的通用模型,基本實現(xiàn) Model-free,即插即用, 48小時快速部署。新入 SKU也無需額外訓練,極大簡化了上線流程。
99.99%+準確率:精準識別,穩(wěn)定抓取
基于對貨品物理屬性全面的語義理解和空間感知能力,在開放環(huán)境中未知海量貨品的識別準確率極高,搭配 Double Pick雙重校驗技術和掃碼模塊可達更高準確率,漏揀、錯揀與返工率極低,作業(yè)節(jié)拍穩(wěn)定可預期,精準高效。
百毫秒級別推理:效率翻倍,全天作業(yè)
通過輕量化模型與剪枝優(yōu)化,實現(xiàn)百毫秒級別高效率、低延遲快速推理,多環(huán)節(jié)順暢銜接,逐單揀選綜合效率穩(wěn)定達到行業(yè)平均人效 2倍以上,且能 7*24小時不間斷作業(yè),讓倉儲作業(yè)效率倍增。
本地化模型:數(shù)據(jù)安全,自主掌握
模型采用本地化部署模式,所有業(yè)務數(shù)據(jù)均存儲于客戶自有服務器,不與外部網(wǎng)絡交互。從數(shù)據(jù)采集、處理到模型運算,全程處于客戶自主管控范圍,徹底規(guī)避數(shù)據(jù)泄露、隱私風險,為業(yè)務安全保駕護航。
圖6通用機械臂貨品揀取技術的四大客戶價值
Geek+ Brain:面向倉儲場景的具身智能基座模型
極智嘉的具身智能基座模型 Geek+ Brain采用“感知-策略”兩段式分層架構,由 Perception Model(感知模型)與 Policy Model(策略模型)兩個核心層組成。
感知模型:聚焦空間智能,環(huán)境理解能力,整合 2D/3D感知,專注于環(huán)境與物體信息的精準建模。
策略模型:基于感知模型的環(huán)境理解,自動生成合理、高效和可執(zhí)行的操作策略。
圖7 Geek+ Brain分層架構:Perception Model + Policy Model
分層架構保證了“數(shù)據(jù)到?jīng)Q策”路徑的高效閉環(huán)與系統(tǒng)擴展性。其分層設計提升了可解釋性,支持逐層定位與優(yōu)化,極大提高研發(fā)和運維效率。該架構具備高度靈活性,可分階段積累數(shù)據(jù)、按需替換模塊,并與硬件解耦,支持多樣化末端執(zhí)行器。同時,分層實現(xiàn)輕量化部署和模塊級更新,在保障系統(tǒng)穩(wěn)定性和精度的同時,顯著降低算力成本,更契合工業(yè)和倉儲場景對于可靠與高效要求。
構建強大數(shù)據(jù)金字塔
Geek+ Brain使用基于千萬量級公開數(shù)據(jù)集訓練的預訓練模型,再經(jīng)過仿真數(shù)據(jù)與數(shù)年積累的行業(yè)數(shù)據(jù)進行模型后訓練,最終得到可實時處理 2D/3D圖像陣列的高性能視覺抓取模型。同時, Geek+ Brain構建數(shù)據(jù)生產(chǎn)、模型訓練、評測、部署四大核心平臺,提供完整的數(shù)據(jù)閉環(huán)支撐。
圖8數(shù)據(jù)金字塔模型
圖9 Geek+ Brain四大核心平臺
邁向通用倉儲機器人
7月30日,極智嘉宣布成立具身智能子公司,聚焦機械手揀貨、通用機器人等具身智能技術和業(yè)務,目標直指物流、制造等B2B場景。
極智嘉創(chuàng)始人兼 CEO鄭勇表示:“‘通用倉儲機器人’是子公司的首個戰(zhàn)略方向。極智嘉將秉承‘場景驅(qū)動’理念,以倉儲場景的真實痛點作為技術演進的突破點,確保每一步突破都能產(chǎn)生可量化的商業(yè)價值?!?/span>
因此,極智嘉選擇由點及面地逐步實現(xiàn)"通用倉儲機器人"戰(zhàn)略構想:
1.單點突破期 (當前):以貨品揀取場景作為首站,解決業(yè)界難題,實現(xiàn)真無人揀選
2.場景通用期:拓展至搬運、打包等環(huán)節(jié),向通用性演進
3.生態(tài)共建期:基于 Geek+ Brain構建模型生態(tài),促使模型資源不斷豐富、生態(tài)逐漸壯大,致力于成為全球倉儲具身智能生態(tài)主導者
在當前的具身智能領域中,倉儲物流場景憑借其龐大的市場規(guī)模、明確的作業(yè)流程與迫切的智能化需求,成為最適合技術落地、商業(yè)化價值最高的核心賽道之一。然而,倉儲環(huán)境對技術的可靠性、準確性及效率提出極高要求。
極智嘉在倉儲領域的深厚場景認知、數(shù)據(jù)積累、全球客戶資源和業(yè)務網(wǎng)絡,為公司發(fā)展“通用倉儲機器人”帶來得天獨厚優(yōu)勢。
作為公司邁向“通用倉儲機器人”的關鍵一步,通用機械臂操作技術方案和 Geek+ Brain這兩項技術成果標志著極智嘉在具身智能領域從技術架構到應用閉環(huán)的關鍵突破,也為“真無人、全智能”倉儲時代的到來提供了具身智能技術基石。
(審核編輯: 朝言)
分享