【頭部財(cái)經(jīng)】阿里旗下達(dá)摩院近日與大連理工大學(xué)合作,共同推出了一款名為HQTrack的AI框架,用于實(shí)現(xiàn)視頻中任意目標(biāo)的高質(zhì)量跟蹤。該框架由視頻多目標(biāo)分割器(VMOS)和掩模優(yōu)化器(MR)組成,采用了開源框架DeAOT和HQ-SAM,并進(jìn)行了改進(jìn),實(shí)現(xiàn)了視頻中目標(biāo)的精確分割。

研究團(tuán)隊(duì)采用Intern-T作為特征提取器,以提高框架對(duì)不同類型物體的辨識(shí)能力,并引入了門控傳播模塊(GPM),以便在復(fù)雜環(huán)境中對(duì)微小物體進(jìn)行感知,生成高質(zhì)量的即時(shí)目標(biāo)遮罩。在VOTS2023競賽中,HQTrack以0.615的質(zhì)量得分獲得第二名,研究團(tuán)隊(duì)表示,該AI框架可應(yīng)用于人臉識(shí)別、智能駕駛、監(jiān)控追蹤等領(lǐng)域,并有望在未來的商業(yè)應(yīng)用中實(shí)際應(yīng)用。
該項(xiàng)目已在GitHub上開放,用戶可以通過該網(wǎng)站訪問并了解更多信息。HQTrack的核心功能包括多目標(biāo)追蹤、目標(biāo)分割、高質(zhì)量輸出和簡單易用的接口。通過HQTrack框架,用戶可以在復(fù)雜場(chǎng)景下同時(shí)追蹤多個(gè)目標(biāo)對(duì)象,并準(zhǔn)確地分割視頻中的目標(biāo),并生成高質(zhì)量及準(zhǔn)確的目標(biāo)遮罩。此外,HQTrack提供了簡潔的接口和使用指南,使用戶能夠輕松使用和集成該工具。
HQTrack的推出將為視頻處理、人工智能應(yīng)用等領(lǐng)域帶來更加高效和準(zhǔn)確的目標(biāo)跟蹤能力。阿里達(dá)摩院與大連理工大學(xué)的合作為AI技術(shù)的發(fā)展提供了新的創(chuàng)新方向,也展示了阿里在人工智能領(lǐng)域的領(lǐng)先實(shí)力。





京公網(wǎng)安備 11011402013531號(hào)