Meta發布新AI模型Segment,Anything,,可檢測圖像中物體[Meta]?
4月6日 消息:Meta在人工智能方面有很大的野心,但卻一直追不上OpenAI、微軟甚至是谷歌的步伐?,F在,這家公司發布了最新AI模型,可從圖像中識別單個物體。
當地時間周三,Meta發布了其新的基于 AI 的 Segment Anything Model (SAM) ,該模型具有識別和分離圖像和視頻中的特定對象的功能。
目前,市面上已經有不少工具具備從圖像中刪除不需要的物體的功能,并且使用人工智能模型來查找和替換照片中的物體。從Segment Anything Model演示的測試中,Meta的產品更進了一步。比如,通過使用SAM,用戶可以通過點擊物體或輸入文字提示選中編輯的物體。在測試演示中,輸入“貓”這個詞后,該工具在一張照片中的幾只貓周圍繪制了方框。
更讓人意外的是,Meta開源了SAM模型,并進一步提供了其10億掩碼數據集的完整細節,該公司聲稱這是“有史以來最大的分段數據集”。這個SA-1B是一個語義分割數據集,它對圖像中的每個像素進行分類,從而更容易對照片進行風格化或刪除對象。根據Meta的說法,該系統本身在1100萬張圖像上進行訓練,平均每張圖像有100個掩碼。
根據Meta關于SAM的研究論文指出,數據集使用了“來自與攝影師直接合作的提供商”的圖像,但并沒有具體說明是哪個提供商。系統訓練的一些圖像包括人臉和車牌等等。
SAM可以用于AR或VR功能,通過用戶的注視來識別物體,這對Meta的AR耳機和眼鏡的發展來說非常重要。
據了解,Meta已經在內部使用與SAM類似的技術,用于標記照片、審核違禁內容以及確定向Facebook和Instagram用戶推薦哪些帖子等。公司表示,SAM的發布將擴大對這類技術的應用。
Segment Anything Model 網址:https://segment-anything.com/