OpenAI开源HealthBench，60个国家合力开发5000段真实对话

导航：首页>> 快讯>> OpenAI开源HealthBench，60个国家合力开发5000段真实对话

OpenAI开源HealthBench，60个国家合力开发5000段真实对话

来源: jinse 123天前

金色财经报道，OpenAI开源了一个专门面向医疗大模型的测试评估集——HealthBench。与以往测试集不同的是，该测试集的5000段核心测试对话，全部由来自60个国家/地区的26个专业262名医生打造，极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试，而不是简单的答题或选择题模式。根据测试数据显示，大模型在医疗保健领域的表现有了显著提升。例如，从之前的GPT-3.5Turbo的16%到GPT-4o的32%，再到o3的60%，整体性能有了显著进步。尤其是小型模型的进步更为突出，GPT-4.1nano不仅在性能上超越了GPT-4o，而且成本降低了25倍。

利好

利空

最新文章

顶部信号已现，市场趋势或迎反转？原文作者：arndxt原文编译：Saoirse，Foresight News 编者按：市场正处于微妙的转折点。作者认为，在利率高企的背景下，资产却持续上涨，这种诡异的平衡即将被打破。作者特别指...

1小时前

复盘美联储降息周期比特币、股市、黄金将何去何从 “先休息，等美联储决议后再操作”，这几天，投资社群中不乏观望的情绪。北京时间 9 月 18 日凌晨 2 点，美联储将公布最新利率决议。自去年 9 月降息以来，这已经是第 5 次议息会议了。市场预期会再...

2小时前

2小时前

拆解 Gemini 的「续命式」IPO 与投资价值 TL;DR由 Winklevoss 兄弟创办、主打合规安全的加密货币交易所 Gemini，于近日正式登陆纳斯达克（代码：GEMI），成为继 Coinbase、Bullish 之后全美第三家上市的加密货...

2小时前

金色Web3.0日报 | 美联储将于9月会议启动降息进程 DeFi数据1.DeFi代币总市值：1710.67亿美元DeFi总市值数据来源：coingecko2.过去24小时去中心化交易所的交易量116.89美元过去24小时去中心化交易所的交易量数据来源：...

2小时前

推荐阅读

贝莱德再出手：继比特币后，想把传统ETF也搬上链原文作者：BitpushNews继成功推出比特币现货 ETF 后，全球资产管理巨头贝莱德（BlackRock）再次把视线投向了区块链。据 Bloomberg 报道，贝莱德正在探索将与真实世界资产（...

3天前

上市首日涨超 24%，“RWA 第一股” Figure 成功登陆纳斯达克作为基于区块链技术的贷款机构，Figure的上市标志着传统金融与加密经济融合的进一步深化。 ...

3天前

Pendle 收益策略全景解读：Pulse的AgentFi新范式作者：0xjacobzhao毫无疑问，Pendle 是本轮 Crypto 周期里最成功的 DeFi 协议之一。在众多协议因流动性枯竭和叙事退潮而陷入停滞时，Pendle 凭借独特的收益率拆分与交易机...

3天前

Uniswap链上投票研究：关于权力、冷漠与演进的启示作者：Chao 来源：X，@chaowxyz它本应是去中心化的理想乡，数据却揭示了一个由1%控制的数字寡头政治。我们回顾了过去四年Uniswap的全部链上投票，揭开了 Uniswap 治理乌托邦背后...

3天前

马云的朋友圈又热闹起来了作者：温世君2015年3月18日，法国巴黎，马云在爱丽舍宫与法国时任总统弗朗索瓦·奥朗德会面时挥手致意。图片来源：视觉中国“我是养鸡养猪的。马云和虞锋，他们是会下金蛋的鸡。”15年前，在云锋基金成立酒...

4天前

最新资讯查看更多>

交易所
币种

排名	交易所	24h成交额
1	Binance	¥1,527.57 亿
2	Bybit	¥576.23 亿
3	Coinbase Exchange	¥71.57 亿
4	OKX	¥519.71 亿
5	Upbit	¥77.13 亿
6	Kraken	¥43.20 亿
7	Bitget	¥494.79 亿
8	Raydium	¥11.50 亿
9	Bitfinex	¥6.09 亿
10	Uniswap v2	¥3.72 亿
查看更多

排名	币种	24h成交额
1	Bitcoin	¥636.04 亿
2	Ethereum	¥339.12 亿
3	Tether USDt	¥1,126.13 亿
4	XRP	¥61.09 亿
5	BNB	¥24.51 亿
6	Solana	¥62.64 亿
7	USDC	¥149.52 亿
8	TRON	¥8.10 亿
9	Dogecoin	¥20.58 亿
10	Cardano	¥11.11 亿
查看更多