人民網北京12月29日電 (記者 申孟哲)美國東部時間12月10日,素有“計算機視覺奧林匹克”之稱的ImageNet結果揭曉。此次比賽有微軟、三星、高通、騰訊、UIUC等業界和學界巨頭參與,三支華人科學家團隊則囊括了所有冠軍。來自國內的商湯科技(SenseTime),更是成為首個在此項賽事中奪魁的中國企業。《紐約時報》對這項賽事結果第一時間進行了報道。
首奪世界冠軍的中國企業
在計算機視覺領域,ImageNet堪稱發展風向標,在學界和業界都有著深遠影響。
中國企業此次奪魁的“視頻物體檢測”比賽,是今年ImageNet的新增比賽任務,需要在運動的連續視頻中檢測物體位置、同時識別物體類別,堪稱此次比賽中難度最大的領域。一旦該技術成熟,在無人機、交通、安防、電影、動畫等領域都將迎來巨大的應用空間。
這項賽事中奪冠的團隊,由香港中文大學歐陽萬里教授和商湯科技主任研究員閆俊杰領銜,在檢測數量、檢測準確率兩項指標上都獲得了世界第一,其中檢測準確率更是超過60%。要知道,在四年前的首屆ImageNet上,冠軍對于靜態圖片物體的檢測準確率也僅為8%。
這并非香港中文大學在此項賽事上首次一鳴驚人。該校的多媒體實驗室由湯曉鷗教授創立,是最早應用深度學習進行計算機視覺研究的華人團隊。在去年的ImageNet上,該實驗室團隊就曾獲得世界第二名,僅次于谷歌;同樣是在去年,在另一項世界級人工智能競賽LFW(大規模人臉識別競賽)上,該實驗室曾力壓FaceBook奪得冠軍,使得人工智能在該領域的識別能力首次超越真人,引爆科技界,并直接催生了之后該項技術的大規模商用浪潮。
領跑視覺技術的華人科學家
ImageNet由斯坦福、卡耐基梅隆、北卡羅萊納、密歇根等一流名校發起。現在,它正在迎來華人科學家“包圓兒”的時代。
比如,在圖像中物體定位、檢測比賽中獲得多項冠軍的微軟研究院團隊,就是由4位中國科學家組成。該團隊研究員何愷明博士,同樣畢業于香港中文大學多媒體實驗室,2009年,他就成為首獲計算機視覺領域三大國際會議之一CVPR“最佳論文獎”的中國學者。
而在圖像中物體定位等任務中取得世界第一的,同樣是由華人科學家率領的團隊——悉尼科技大學陶大程教授、鄧健康博士、和南京信息工程大學劉青山教授領銜此團隊。值得一提的是,2015年獲頒澳大利亞科學最高榮譽尤里卡獎的陶大程,也出身于港中大多媒體實驗室。
在計算機視覺這項“燒錢”又存在重重技術困難的領域,歷屆ImageNet中,都體現出巨大的技術壁壘。自2010年創辦以來,ImageNet 的參賽者中,不乏人工智能巨頭,包括谷歌、百度、微軟、高通、IBM、NEC、Adobe、三星、INRIA、牛津大學、伯克利大學等;而冠軍,則大多由谷歌,微軟、NEC等工業界巨頭,以及多倫多大學、東京大學等名校獲得。
縱覽此次奪冠的所有團隊,無一例外地,都吸納了大量的知名教授、優秀博士生。
打通學界與工業界
在ImageNet中,每隔一段時間,就會增加一項學術和工業界公認的最難的任務。例如,2013年新增的圖像中的物體檢測任務,需要同時標出圖像中所有物體位置并識別,是當時人工智能的研究熱點。而今年新增的“視頻中通用物體檢測”,則是首次引入的視頻任務,除了難度更高之外,其對于工業界的實用價值也更強,更好地反映了市場的需求。
2012年至今,隨著人工智能突破性新技術—深度學習方法不斷進步,計算機視覺技術也進入了黃金發展期。作為最“燒腦”的行業之一,人工智能也的確需要這樣的合作。
商湯科技CEO徐立表示,深度學習給人工智能領域帶來了巨大變革,傳統工業界和科技界都需要有儲備和準備應對這場變革。
“利用深度模型在競賽中學習得到的特征可以被廣泛應用;由 ImageNet 訓練得到的深度學習模型,將會是推動人工智能在視覺領域發展的強大引擎。我們希望用持續積累的原創力量推動這場變革,幫助更多的企業,尤其是中國企業把現有產品與科技前沿的成果有地融合,讓中國的消費者更早享受到科技進步的改變。”徐立說。
陶大程則十分看好學術界與工業界的合作前景:“我們這支參賽隊伍由悉尼科技大學、南京信息工程大學聯合組成,并獲得了AMAX的硬件支持。大公司的優勢在于硬件、人力資源方面的整合能力,學術界則能夠提供很多創新的想法。港中文多媒體實驗室和商湯科技的聯手奪冠,也是很成功的范例。大家合作研究技術與產品,這不僅僅是某一個實驗室、某一家公司的事情,而是整個人工智能界的必由之路。