中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > ToG最新資訊  > 正文

    IDEA提出ToG思維圖譜 大模型性能提升214%!

    2023-11-27 14:16 · 稿源:站長(zhǎng)之家

    要點(diǎn):

    • 由IDEA研究院、微軟亞洲研究院、香港科技大學(xué)等研究團(tuán)隊(duì)推出的Think-on-Graph技術(shù),通過(guò)大模型與知識(shí)圖譜的深度融合,實(shí)現(xiàn)在多個(gè)基準(zhǔn)數(shù)據(jù)集上的性能提升,引領(lǐng)深度推理領(lǐng)域。

    • 在解決大模型在金融、法律、醫(yī)療等領(lǐng)域幻覺(jué)問(wèn)題的挑戰(zhàn)中,Think-on-Graph通過(guò)緊耦合的方式將大模型(LLM)作為“跑腿”,與知識(shí)圖譜(KG)相互協(xié)作,提供更條理清晰、可追溯的推理鏈條。

    • Think-on-Graph借鑒了Transformer的beam-search算法思路,通過(guò)搜索剪枝和推理決策兩個(gè)任務(wù)的迭代過(guò)程,有效提升了大模型推理的可解釋性,同時(shí)在多個(gè)任務(wù)上刷新性能榜單。

    站長(zhǎng)之家(ChinaZ.com)11月27日 消息:近期,由IDEA研究院、微軟亞洲研究院、香港科技大學(xué)等多方研究團(tuán)隊(duì)合作推出的Think-on-Graph技術(shù),在深度推理領(lǐng)域掀起了一場(chǎng)革新。這一技術(shù)通過(guò)緊耦合大模型(LLM)與知識(shí)圖譜(KG),成功彌補(bǔ)了大模型在金融、法律、醫(yī)療等領(lǐng)域幻覺(jué)問(wèn)題上的能力短板。Think-on-Graph被證明在多個(gè)基準(zhǔn)數(shù)據(jù)集上實(shí)現(xiàn)了巨大的性能提升,刷新了相關(guān)領(lǐng)域的性能榜單。

    為了解決大模型在幻覺(jué)問(wèn)題上的挑戰(zhàn),Think-on-Graph采用了緊耦合的新范式,將大模型作為“跑腿”與知識(shí)圖譜相互協(xié)作。這一方法不僅使推理過(guò)程更加清晰有序,還提供了可追溯的推理鏈條。通過(guò)一個(gè)具體的例子,對(duì)比了傳統(tǒng)大模型在推理問(wèn)題上的表現(xiàn)與Think-on-Graph的方式,突顯了其在邏輯分析和推理透明度方面的優(yōu)勢(shì)。

    image.png

    論文地址:https://arxiv.org/pdf/2307.07697.pdf

    代碼鏈接:https://github.com/IDEA-FinAI/ToG

    Think-on-Graph的緊耦合范式不僅提高了大模型推理的效率,還在可解釋性上有所突破。采用了Transformer的beam-search算法思路,實(shí)現(xiàn)了搜索剪枝和推理決策的迭代過(guò)程,有效提升了大模型推理的可解釋性。此外,通過(guò)人工反饋和大模型的推理能力,Think-on-Graph還能夠發(fā)現(xiàn)并修正知識(shí)圖譜中的錯(cuò)誤信息,彌補(bǔ)了大模型訓(xùn)練時(shí)間長(zhǎng)、知識(shí)更新慢的缺點(diǎn)。

    最終,在四類(lèi)知識(shí)密集型任務(wù)的共9個(gè)數(shù)據(jù)集上,Think-on-Graph不僅刷新了7個(gè)性能榜單,而且在Zeroshot-RE數(shù)據(jù)集上的表現(xiàn)更是顯著超過(guò)了傳統(tǒng)大模型。這一研究成果為深度推理領(lǐng)域的發(fā)展帶來(lái)了新的思路和方法,為實(shí)現(xiàn)大模型在各領(lǐng)域應(yīng)用中更可靠、可解釋的推理能力提供了有力支持。

    舉報(bào)

    • 相關(guān)推薦
    • 142頁(yè)長(zhǎng)文揭秘DeepSeek-R1「思維大腦」,開(kāi)啟全新「思維鏈學(xué)」研究

      DeepSeek-R1是一款開(kāi)創(chuàng)性的大型推理模型(LRM),其研究揭示了AI推理能力的質(zhì)變。該模型通過(guò)多階段訓(xùn)練流程,將推理過(guò)程內(nèi)嵌于模型本身,實(shí)現(xiàn)了從"提示驅(qū)動(dòng)"到"內(nèi)生推理"的模式轉(zhuǎn)變。研究團(tuán)隊(duì)通過(guò)142頁(yè)報(bào)告詳細(xì)分析了R1的思維鏈,發(fā)現(xiàn)其推理過(guò)程具有高度結(jié)構(gòu)化特征,包含問(wèn)題定義、綻放周期、重構(gòu)周期和最終決策四個(gè)階段。模型展現(xiàn)出類(lèi)人推理能力,能通過(guò)分

    • 攻克“癌癥之王”難題!我國(guó)專(zhuān)家成功繪制全球首份“多組學(xué)全景圖譜

      中國(guó)醫(yī)學(xué)專(zhuān)家歷經(jīng)五年研究,成功繪制出全球首張無(wú)功能性胰腺神經(jīng)內(nèi)分泌瘤多組學(xué)全景圖譜。基于該圖譜,專(zhuān)家們創(chuàng)新性提出針對(duì)這種沉默腫瘤”的分子分型框架、預(yù)后模型及靶向-免疫治療新策略,為臨床精準(zhǔn)診療提供了重要參考。更具臨床應(yīng)用價(jià)值的是,研究團(tuán)隊(duì)發(fā)現(xiàn)相關(guān)蛋白在患者血漿中的濃度與腫瘤進(jìn)展顯著相關(guān),這一突破性發(fā)現(xiàn)或?qū)⑼苿?dòng)診療模式從傳統(tǒng)的有創(chuàng)組織活檢”向無(wú)創(chuàng)血液檢測(cè)”轉(zhuǎn)變。

    • IDEA大獎(jiǎng)?wù)J證!中興小興看看SC50家用攝像頭攜安全設(shè)計(jì)巧思于4.17預(yù)售

      隨著智能家居的普及化,各種設(shè)備也慢慢滲透到生活中,智能家用攝像頭也從“可選配置”升級(jí)為“生活剛需”。然攝像頭同樣存在隱私憂慮、操作失控、外觀單調(diào)等痛點(diǎn),如何彌補(bǔ)這些體驗(yàn)落差?其將于4月17日10點(diǎn)開(kāi)啟全渠道預(yù)約,4月21日10點(diǎn)于京東平臺(tái)開(kāi)售,14點(diǎn)全平臺(tái)開(kāi)售,感興趣的用戶(hù)可即時(shí)關(guān)注。

    • 合合信息發(fā)布“大模型加速器 2.0”,助力大模型跨越“幻覺(jué)”障礙

      近日,上海合合信息科技股份有限公司(簡(jiǎn)稱(chēng)“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,憑借其多維度升級(jí),為降低大模型“幻覺(jué)”風(fēng)險(xiǎn)、推動(dòng)大模型精準(zhǔn)應(yīng)用提供了強(qiáng)大助力。訓(xùn)練數(shù)據(jù)是影響大模型“認(rèn)知能力”的關(guān)鍵,合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù),從數(shù)據(jù)源頭入手,對(duì)復(fù)雜文檔的版式、布局和元素進(jìn)行精準(zhǔn)解析及結(jié)構(gòu)化處理,

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開(kāi)源

      被寄予厚望的美國(guó)Meta公司的最新開(kāi)源大模型Llama4發(fā)布不到2天時(shí)間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實(shí)際效果差、開(kāi)源條件多部署門(mén)檻高是偽開(kāi)源等。大模型評(píng)測(cè)平臺(tái)LMArena親自下場(chǎng)發(fā)文,打臉Meta提供給平臺(tái)的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開(kāi)放之間搖擺,恐將在AI競(jìng)賽中進(jìn)一步失去開(kāi)發(fā)者支持。

    • 阿丘科技李嘉悅:大模型驅(qū)動(dòng)的AI檢測(cè)范式變革——大模型、小模型、智能體的協(xié)同進(jìn)化

      3月28日,由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機(jī)器視覺(jué)展在上海新國(guó)際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機(jī)器視覺(jué)及工業(yè)應(yīng)用研討會(huì)現(xiàn)場(chǎng),圍繞“大模型驅(qū)動(dòng)的AI檢測(cè)范式變革:大模型、小模型與智能體的協(xié)同進(jìn)化”的主題,發(fā)表了精彩演講。”今年,在這個(gè)快速變化的時(shí)代,我要補(bǔ)充一句:“AI工業(yè)視覺(jué)的格局正在加速變革,不會(huì)用大模型的將會(huì)被善用大模型的人淘汰。

    • AI革新了電子商務(wù)營(yíng)銷(xiāo):認(rèn)識(shí)AID Lab的PhotoG

      在當(dāng)今快速發(fā)展的消費(fèi)格局中,全球生活方式市場(chǎng)前所未有地蓬勃發(fā)展。在Z時(shí)代重視個(gè)性化體驗(yàn)的消費(fèi)者的推動(dòng)下,從家居裝飾到日常必需品的行業(yè)正在經(jīng)歷前所未有的繁榮。通過(guò)提高創(chuàng)意效率和實(shí)現(xiàn)卓越的消費(fèi)者體驗(yàn),PhotoG有望重新定義技術(shù)、設(shè)計(jì)和商業(yè)之間的交叉點(diǎn)。

    • 百度研發(fā)出廣告推薦新系統(tǒng):大模型加持、轉(zhuǎn)化率提升3.6%

      近日,百度團(tuán)隊(duì)在arXiv上發(fā)表論文,介紹了一種名為COBRA的新算法框架,被應(yīng)用于提升生成式模型在廣告推薦系統(tǒng)中的使用效果。根據(jù)論文介紹,工程師將COBRA框架應(yīng)用于真實(shí)環(huán)境中的A/B測(cè)試,結(jié)果顯示轉(zhuǎn)化率提升了3.6%,平均每用戶(hù)收入增加了4.15%。實(shí)測(cè)效果表明,COBRA框架在利用公開(kāi)數(shù)據(jù)集和工業(yè)數(shù)據(jù)集進(jìn)行離線和在線評(píng)估后,均優(yōu)于目前業(yè)內(nèi)最先進(jìn)的方法。

    • 提升大模型自動(dòng)修Bug能力 豆包正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集

      今日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布,正式開(kāi)源首個(gè)多語(yǔ)言類(lèi)SWE數(shù)據(jù)集Multi-SWE-bench,可用于評(píng)估和提升大模型自動(dòng)修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語(yǔ)言,是真正面向全棧工程”的評(píng)測(cè)基準(zhǔn)。相比于以往聚焦Python的單語(yǔ)言任務(wù),Multi-SWE-bench更貼近現(xiàn)實(shí)中的多語(yǔ)言開(kāi)發(fā)場(chǎng)景,也更能反映當(dāng)前模型在自動(dòng)化軟件工程”方向上的實(shí)際能力邊界。

    • 摩爾線程Linux顯卡驅(qū)動(dòng)v3.0.0發(fā)布:支持Wayland GPU渲染性能提升

      快科技5月1日消息,日前,摩爾線程發(fā)布Linux驅(qū)動(dòng)程序v3.0.0,全面支持MTT S80和MTT X300顯卡。作為v2.7.0RC4之后的重大升級(jí)版本,本次更新實(shí)現(xiàn)了多項(xiàng)關(guān)鍵技術(shù)突破。在架構(gòu)層面,升級(jí)底層任務(wù)調(diào)度系統(tǒng),優(yōu)化內(nèi)存管理并增強(qiáng)異常處理,使系統(tǒng)穩(wěn)定性與負(fù)載運(yùn)行效率均顯著提升。同時(shí),新增Wayland協(xié)議支持,將OpenGL升級(jí)至4.2版本,并擴(kuò)展了內(nèi)核版本支持范圍。升級(jí)后的驅(qū)動(dòng)架構(gòu)在底層功能實(shí)現(xiàn)了多項(xiàng)突破:任務(wù)調(diào)度優(yōu)化GPU的任務(wù)調(diào)度由驅(qū)動(dòng)和固件協(xié)同完成,驅(qū)動(dòng)負(fù)責(zé)管理任務(wù)隊(duì)列、上下文切換和資源分配。v3.0.0版本在內(nèi)核驅(qū)動(dòng)層面的優(yōu)化包括:低