中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > AI框架最新資訊  > 正文

    FC-CLIP徹底改變?nèi)胺指睿航y(tǒng)一的單級AI 框架

    2023-09-27 14:11 · 稿源:站長之家

    要點(diǎn):

    1、全景分割將語義分割和實(shí)例分割相結(jié)合,對圖像進(jìn)行精細(xì)分割標(biāo)注,但受限于數(shù)據(jù)集標(biāo)注成本。

    2、FC-CLIP通過凍結(jié)卷積CLIPbackbone實(shí)現(xiàn)掩碼生成和CLIP文本對齊分類的單階段統(tǒng)一,突破閉詞匯限制。

    3、FC-CLIP設(shè)計(jì)簡單高效,參數(shù)和計(jì)算量都大大減少,性能顯著提升,可擴(kuò)展到開放詞匯場景。

    站長之家(ChinaZ.com)9月27日 消息:全景分割是將圖像分割成有意義的部分或區(qū)域的基礎(chǔ)計(jì)算機(jī)視覺任務(wù),對各種應(yīng)用如醫(yī)學(xué)圖像分析和自動(dòng)駕駛具有關(guān)鍵作用。全景分割將語義分割的對每個(gè)像素進(jìn)行對象分類,和實(shí)例分割的對同類不同實(shí)例進(jìn)行區(qū)分相結(jié)合,目標(biāo)是為每個(gè)實(shí)例生成不重疊的掩碼并賦予類別標(biāo)簽。

    多年來,研究者不斷提升全景分割模型性能,重點(diǎn)關(guān)注全景質(zhì)量指標(biāo)。但是基于閉詞匯的限制嚴(yán)重制約了這些模型的實(shí)際應(yīng)用,因?yàn)閿?shù)據(jù)集細(xì)顆粒度標(biāo)注的高成本限制了語義類別數(shù)目。這成為全景分割應(yīng)用的關(guān)鍵難題。

    image.png

    項(xiàng)目地址:https://github.com/bytedance/fc-clip

    計(jì)算機(jī)視覺社區(qū)探索開放詞匯分割來克服閉詞匯的限制。這種范式利用單詞的文本嵌入作為類別標(biāo)簽嵌入,大大增強(qiáng)了模型處理更廣泛類別的能力。CLIP等多模態(tài)預(yù)訓(xùn)練模型利用其從海量互聯(lián)網(wǎng)數(shù)據(jù)中學(xué)習(xí)對齊圖像文本特征表示的能力,在開放詞匯分割中顯示出巨大潛力。

    近期的兩階段方法如SimBaseline和OVSeg改編了CLIP進(jìn)行開放詞匯分割,但固有的低效和分割與分類不一致的問題仍然存在。提出單階段統(tǒng)一框架FC-CLIP正是為解決這一關(guān)鍵問題。

    image.png

    FC-CLIP在共享的凍結(jié)卷積CLIP backbone上無縫集成了掩碼生成和CLIP分類。這種設(shè)計(jì)基于以下核心思路:

    凍結(jié)的CLIP backbone保留了預(yù)訓(xùn)練的圖像文本對齊,支持開放詞匯分類。

    添加輕量級解碼器后,CLIP backbone可作為強(qiáng)大的掩碼生成器。

    卷積CLIP在輸入尺寸放大時(shí)泛化能力提升,適合密集預(yù)測任務(wù)。

    單一凍結(jié)卷積CLIP backbone帶來極簡但高效的設(shè)計(jì)。相較先前方法,F(xiàn)C-CLIP參數(shù)和計(jì)算量大幅減少,訓(xùn)練時(shí)間也更短,實(shí)用性強(qiáng)。在多個(gè)數(shù)據(jù)集上,F(xiàn)C-CLIP都顯著提升了狀態(tài)轉(zhuǎn)換水平。

    FC-CLIP開創(chuàng)性的單階段框架統(tǒng)一了掩碼生成和文本匹配分類,具有巨大的潛力推動(dòng)全景分割向開放詞匯場景擴(kuò)展,實(shí)現(xiàn)真正的圖像理解和交互。這項(xiàng)突破性工作為端到端的單階段全景分割方法提供了范例,值得進(jìn)一步改進(jìn)和擴(kuò)展。

    舉報(bào)

    • 相關(guān)推薦
    • 再獲權(quán)威認(rèn)可!數(shù)勢科技上榜IDC中國AI Agent應(yīng)用市場全景圖報(bào)告

      近日,國際數(shù)據(jù)公司(IDC)發(fā)布的《IDC Market Glance:中國AI Agent應(yīng)用市場概覽,1Q25》(Doc#CHC53057625, 2025 年 3 月)研究報(bào)告中,數(shù)勢科技憑借在企業(yè)級智能體應(yīng)用領(lǐng)域的技術(shù)突破,成功入圍"數(shù)據(jù)分析"細(xì)分領(lǐng)域代表廠商,成為該賽道智能化轉(zhuǎn)型的標(biāo)桿企業(yè)。數(shù)勢科技首發(fā)企業(yè)級決策分析智能體平臺SwiftAgent數(shù)勢科技SwiftAgent 作為基于DeepSeek及行業(yè)先進(jìn)大模型構(gòu)建的企業(yè)級智能決策分?

    • 比其它平臺晚了幾年!Apple Music Windows版本終于有了杜比全景

      近日,蘋果在AppleMusicforWindows10/11版本中添加了杜比全景聲支持,讓W(xué)indows用戶也能享受到沉浸式的音樂體驗(yàn)。此前AppleMusic的其他版本,如iOS版、iPadOS版、Mac版、AppleTV版和Android版都已經(jīng)在2021年之后陸續(xù)支持杜比全景聲,但Windows用戶一直未能享受到這一功能。需要注意的是,AppleMusic沒有免費(fèi)版,用戶需要訂閱后才能收聽。

    • MCP協(xié)議和Function Calling 、 AI Agents的區(qū)別是什么?MCP優(yōu)勢有哪些

      MCP、FunctionCalling和AIAgents是三種重要的技術(shù)手段,它們在實(shí)現(xiàn)AI模型與外部系統(tǒng)交互方面各有特點(diǎn)。本文將詳細(xì)對比這三種技術(shù),并深入探討MCP的多項(xiàng)顯著優(yōu)勢。隨著MCP技術(shù)的不斷發(fā)展,我們有理由相信,它將在未來的AI領(lǐng)域發(fā)揮越來越重要的作用。

    • 美團(tuán)回應(yīng)腦癱女騎手文差評多:所有差評免責(zé)

      近日,杭州一位腦癱女騎手文景的勵(lì)志故事在網(wǎng)絡(luò)引發(fā)熱議。這位7年如一日堅(jiān)持送外賣的母親,用摔壞6輛電動(dòng)車的代價(jià),為家庭撐起一片天。盡管因語言障礙常被顧客誤解,甚至被部分網(wǎng)友戲稱為“差評最多騎手”,但她始終以日均10小時(shí)的工作強(qiáng)度

    • 網(wǎng)首發(fā)!首個(gè)AI投顧方向的盈米MCP Server發(fā)布

      4月8日,盈米基金發(fā)布業(yè)內(nèi)首個(gè)財(cái)富管理MCPServer,旨在將基金等相關(guān)數(shù)據(jù)和服務(wù)通過標(biāo)準(zhǔn)化的MCP協(xié)議進(jìn)行全新封裝,以此打通AI大模型獲取金融領(lǐng)域數(shù)據(jù)與服務(wù)的橋梁,為后續(xù)在DeepSeek、豆包、通義千問等AI大模型的基礎(chǔ)上構(gòu)建專業(yè)、可靠的金融領(lǐng)域垂直AI應(yīng)用奠定基礎(chǔ)。盈米基金本次行業(yè)首發(fā),標(biāo)志著財(cái)富管理行業(yè)垂直領(lǐng)域與AI大模型的深度融合進(jìn)入了全新階段。先已全面開放內(nèi)測,歡迎大家申請?jiān)囉皿w驗(yàn)。

    • eBay 與 Checkout.com 達(dá)成球支付收戰(zhàn)略合作

      此次合作將升級拓展 eBay 的全球支付平臺功能,優(yōu)化消費(fèi)者購物體驗(yàn)并提升運(yùn)營效率。美國圣何塞與英國倫敦— 2025 年 4 月 16 日 — 全球電商領(lǐng)軍企業(yè) eBay 今日宣布與國際領(lǐng)先數(shù)字支付平臺 Checkout.com 達(dá)成戰(zhàn)略合作伙伴關(guān)系。通過此次合作,eBay 將進(jìn)一步擴(kuò)展其全球支付平臺能力,為消費(fèi)者提供更流暢的交易體驗(yàn),同時(shí)實(shí)現(xiàn)降本增效。作為全球最大的電商平臺之一,eBay 平臺目?

    • MCP server資源網(wǎng)站去哪找?如何在Cline中配置MCP工具?

      隨著人工智能技術(shù)的快速發(fā)展,MCP服務(wù)已成為提升開發(fā)效率和AI能力的重要工具。Cline作為一個(gè)強(qiáng)大的AI編程助手,支持多種MCP服務(wù),幫助開發(fā)者更高效地完成任務(wù)。通過以上步驟,你可以在Cline中成功使用MCP服務(wù),提升開發(fā)效率和AI能力。

    • 谷歌搜索棄用國別頂級域名后綴!統(tǒng)一為google.com

      快科技4月16日消息,谷歌宣布將在未來幾個(gè)月內(nèi)逐步將所有搜索用戶重定向至主域名google.com,將不再使用國家代碼頂級域名(ccTLD)。無論用戶使用哪個(gè)國家的域名訪問谷歌搜索,如英國的google.co.uk或巴西的google.com.br,最終都將被重定向至google.com。谷歌表示,這一決定旨在簡化用戶體驗(yàn),并確保所有用戶都能獲得一致的搜索結(jié)果。此前谷歌之所以采用國別頂級域名的后綴,主要是可以實(shí)現(xiàn)搜索結(jié)果的本地化,例如當(dāng)用戶訪問的是google.com.uk,則側(cè)重于提供來自與英國有關(guān)的搜索結(jié)果。自2017年以來,谷歌已經(jīng)根據(jù)用戶的地理位置自動(dòng)調(diào)整

    • 百度Create AI開發(fā)者大會:李彥宏發(fā)布兩大新模型、多款熱門AI應(yīng)用、開發(fā)者面擁抱MCP

      4月25日,百度在武漢舉辦Create 2025開發(fā)者大會。李彥宏發(fā)布文心大模型4.5 Turbo和深度思考模型X1 Turbo,性能提升同時(shí)價(jià)格大幅下降。大會推出全球首個(gè)電商交易MCP平臺,并發(fā)布數(shù)字人、智能體心響APP等多款A(yù)I應(yīng)用。百度宣布未來5年培養(yǎng)1000萬AI人才,并點(diǎn)亮國內(nèi)首個(gè)三萬卡集群。同時(shí)啟動(dòng)第三屆"文心杯"創(chuàng)業(yè)大賽,最高獎(jiǎng)金達(dá)7000萬元。大會還包含6大分會場、40節(jié)AI公開課及5000平互動(dòng)展區(qū),全面展示百度AI生態(tài)布局。

    • Llama 4五大疑點(diǎn)曝光,逐層扒皮,AI進(jìn)步停滯,NYU教授稱Scaling徹底結(jié)束

      令人失望的Llama4,只是前奏已。接下來我們恐將看到——全球局勢的改變,將徹底阻止AI進(jìn)步!最近,一位AICEO做出長視頻,逐級對Llama4身上的六大疑點(diǎn)進(jìn)行了扒皮。GaryMarcus正在尋找對開發(fā)更可靠替代方法有興趣的投資者。

    熱文

    • 3 天
    • 7天