中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > ChatGPT最新資訊  > 正文

    OpenAI 的 ChatGPT 通過新的放射學(xué)委員會考試:病患更喜歡 AI 的回答 更具同情心

    2023-05-18 17:25 · 稿源:站長之家

    站長之家(ChinaZ.com) 5月18日消息: OpenAIChatGPT 正在通過醫(yī)學(xué)考試,兩項最新研究表明,這一次 ChatGPT 在放射學(xué)考試中取得了及格分?jǐn)?shù)。

    OpenAI,ChatGPT,人工智能,AI

    研究人員將 ChatGPT 的 GPT-3.5 版本和 GPT-4 版本評估了放射學(xué)考試的 150 個問題。他們發(fā)現(xiàn),在兩個版本中,AI 的聊天機(jī)器人從 69.3% 的接近及格的分?jǐn)?shù)提高到了 80.7%,在高級別思維問題中表現(xiàn)更為出色,特別是在描述影像發(fā)現(xiàn)和應(yīng)用醫(yī)學(xué)概念方面,GPT-4 版本的表現(xiàn)更好。

    這些問題是基于文本的選擇題,分為兩個大類(高級和低級),以評估技術(shù)在回答問題方面的具體優(yōu)勢和劣勢。這些問題被選中以匹配加拿大皇家學(xué)院和美國放射學(xué)委員會考試的風(fēng)格、內(nèi)容和難度。

    ChatGPT 在醫(yī)學(xué)考試中的應(yīng)用已經(jīng)成為一種常見現(xiàn)象。自 ChatGPT 在 2022 年 11 月 30 日發(fā)布以來,通過醫(yī)學(xué)認(rèn)證考試一直是 AI 開發(fā)人員的長期目標(biāo),尤其是谷歌的醫(yī)學(xué)重點大語言模型(LLM)Med-PaLM。

    自當(dāng)月以來,參與 AI 測試使用于醫(yī)學(xué)認(rèn)證的研究已成為一種常見實踐,特別是通過 ChatGPT 的性能來提升在醫(yī)學(xué)領(lǐng)域的應(yīng)用。醫(yī)學(xué)認(rèn)證考試成為了 AI 開發(fā)的一個長期目標(biāo)。

    在 2022 年 12 月,研究人員展示了 Med-PaLM 在美國醫(yī)療許可考試(USMLE)上獲得了 67.6% 的準(zhǔn)確率,這是及格分?jǐn)?shù)的普遍門檻,這是 AI 在醫(yī)學(xué)上功能的一個重大里程碑,類似于人工智能在多年中與國際象棋大師的競爭。

    此外,ChatGPT 最近還接受了評估其回答患者問題的能力。在與真實醫(yī)生回答的比較中,經(jīng)過盲評估的評價者在 75% 以上的時間內(nèi)更喜歡 ChatGPT 的回答。與醫(yī)生的回答相比,該 AI 聊天機(jī)器人的回答也被評為更具有同情心。

    總的來說,現(xiàn)在 AI 模型在醫(yī)學(xué)上能做什么和不能做什么的努力是一個設(shè)定基準(zhǔn)的過程。Bhayana 表示,目前的重點是確定 ChatGPT 和其他 AI 模型可以在醫(yī)學(xué)上如何使用,但他警告說,由于這些技術(shù)往往會「幻覺」或說謊(通常非常自信),因此應(yīng)用是有限制的。然而,他希望技術(shù)能夠不斷改進(jìn),以實現(xiàn)在醫(yī)學(xué)上更廣泛的應(yīng)用。

    目標(biāo)是了解醫(yī)生可以信任這些工具的程度,然后開始著手改進(jìn)和優(yōu)化這些模型,以適用于特定的臨床用途。目前,生成式 AI 已經(jīng)表明在某些用途上是高效的,例如聽寫和轉(zhuǎn)錄,但 Bhayana 認(rèn)為,在醫(yī)學(xué)上醫(yī)生將能夠信任這些工具,需要更多時間和更新。

    他表示:「隨著這些工具的出現(xiàn),重點在于了解它們的性能,尋找它們的應(yīng)用,并確保人們知道它們的優(yōu)點和限制,以便醫(yī)生與技術(shù)共同發(fā)展。」

    舉報

    • 相關(guān)推薦