日前,人工智能“隊”云從科技在跨鏡追蹤技術(reid)上取得重大突破。同時在market-1501、cuhk03、dukemtmc-reid三個數(shù)據(jù)集上從悉尼科技大學、南洋理工、中科院自動化所、清華大學等多家高校、企業(yè)與研究機構脫穎而出,刷新了世界記錄。
其中高在market-1501上的*命中率(rank-1 accuracy)達到96.6%,打破了之前阿里idst在2018年1月創(chuàng)造的世界紀錄,讓跨鏡追蹤技術(reid)在準確率上達到商用水平,人工智能即將從“刷臉”跨到“識人”的新紀元。
*命中率達96.6% 云從科技跨鏡追蹤(reid)技術刷新三項世界紀錄
算法 同時刷新三項紀錄
跨鏡追蹤技術(person re-identification,簡稱 reid)是現(xiàn)在計算機視覺研究的熱門方向,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。
簡單來說,它可以無需人臉,只用看穿著、體態(tài)、發(fā)型就“認出”你。
該技術可以作為人臉識別技術的重要補充,可以對無法獲取清晰拍攝人臉的行人進行跨攝像頭連續(xù)跟蹤,增強數(shù)據(jù)的時空連續(xù)性。該技術可以廣泛應用于視頻監(jiān)控、智能安保、智能商業(yè)等領域。
market-1501、cuhk03、dukemtmc-reid是當前衡量reid技術的主流的數(shù)據(jù)集。*命中率(rank-1 accuracy)、平均精度均值(mean average precision,map)是衡量reid技術水平的核心指標。
*命中率達96.6% 云從科技跨鏡追蹤(reid)技術刷新三項世界紀錄
*命中率達96.6% 云從科技跨鏡追蹤(reid)技術刷新三項世界紀錄
云從科技在這三個數(shù)據(jù)集中都刷新了業(yè)內好的水平,在market-1501數(shù)據(jù)集的rank-1 accuracy達到驚人的95.7%,使用re-ranking 技術后更是達到96.6%。map是更加全面衡量reid算法效果的指標,它要求將檢索圖片與被檢索圖片都匹配正確,而不止*命中。云從科技此次將market-1501的map指標將現(xiàn)在好的水平提高了近5%,達到86.9%,使用re-ranking技術之后更是達到了94.2 %。能夠獲得如此大幅度的突破,充分說明云從科技reid的研究成果的價值,該成果必然能夠推動reid技術的大幅進步,也使得reid加速實際應用。
為什么我們需要跨鏡追蹤(reid)技術?
人臉識別技術經過進幾年的發(fā)展,已較為成熟,在眾多的場景與產品中都已有應用,但人臉識別技術只用到了人的臉部信息,而沒有利用人體其它信息,例如衣著、姿態(tài)、行為等,另外在應用時必須要能抓拍到人臉,這在很多場景下無法滿足,例如低頭、背影、模糊身形、帽子遮擋等等。
而跨鏡追蹤(reid)技術正好能夠彌補人臉識別技術不足,跨鏡追蹤(reid)技術能夠根據(jù)行人的穿著、體態(tài)、發(fā)型等信息認知行人。這將人工智能的認知水平提高到一個新的階段,現(xiàn)在跨鏡追蹤(reid)已成為人工智能領域的重要研究方向。
但現(xiàn)有的研究成果還不是很成熟,離實際商用的要求還有一定距離。而云從科技的跨鏡追蹤(reid)技術獲得了重大突破,將現(xiàn)有的技術水平提高到一個新的階段,這將大大推動業(yè)界技術研究與應用落地的進度,也將大大推動人工智能由“刷臉”跨進全面“識人”的新紀元。
跨鏡追蹤(reid)技術有哪些難點?
跨鏡追蹤(reid)技術與人臉識別技術類似,存在較多的困難點需要克服,例如光線、遮擋、圖片模糊等客觀因素。另外,行人的穿著多樣,同一人穿不同的衣服,不同的人穿相似的衣服等等也對跨鏡追蹤(reid)技術提出更高的要求。
行人的姿態(tài)多變導致人臉上廣泛使用的對齊技術也在跨鏡追蹤(reid)失效。行人的數(shù)據(jù)獲取難度遠遠大于人臉識別數(shù)據(jù)獲取難度,而行人的信息復雜程度又遠遠大于人臉,這兩個因素疊加在一起使得跨鏡追蹤(reid)的算法研究變得更加困難,也更加重要。通過算法的有效設計,降低對數(shù)據(jù)依賴來實現(xiàn)跨鏡追蹤(reid)效果的突破是現(xiàn)在業(yè)內的共識。
本次云從提出通過融合行人的全局信息以及具有辨識力的多粒度局部信息的思路,為解決reid問題提供了一個非常不錯的思路。云從科技本次提出的方案有幾大優(yōu)勢(1)結構精巧:該方案實現(xiàn)了端到端的直接學習,并沒有增加額外的訓練流程;(2)多粒度:融合了行人的整體信息與有區(qū)分度的多粒度細節(jié)信息;(3)關注細節(jié):模型真正懂得什么是人,模型會把注意力放在膝蓋,衣服商標等能夠顯著區(qū)分行人的一些核心信息上。
“刷臉”是計算機視覺領域重要的應用,而“識人”將促使計算機視覺行業(yè)進入新的發(fā)展階段。云從科技在“識人”方向的眾多細分領域已經有深入的研究,例如行人檢測、行人結構化信息提取、人體關鍵點檢測、姿態(tài)估計、行為動作識別等。技術的落地會讓大家能夠更快地體會到“識人”的人工智能對智能安防、人機互動、自動駕駛、智能商業(yè)、家居生活等各方面的幫助與提升。