我们经常在一些对比 AI 性能的测试中,看到宣称基础模型在自然语言理解、推理或编程任务等性能超人类的相关报道。 但你有没有想过,这些结果真的可信吗? 在近期的一项研究中,美国哈佛大学研究员魏来(Kevin Wei)与合作者指出,目前人类基准测试(Human Baselines)的严谨性和透明度存在一系列严重问题,这直接关系着相关测试中关于 AI 性能的结论是否“立得住”的问题。 为此,研究人员对基 ...
“统计大讲堂”由中国人民大学统计学院与应用统计科学研究中心联合主办,旨在搭建学界与业界的交流平台,促进统计理论与实践的深度融合,推动统计学科研创新,服务国家经济社会发展。作为统计学院人才培养体系的核心组成部分,“统计大讲堂”通过系列学术讲座、专题研讨等形式,为统计学子提供前沿知识传授与学术思维训练,营造开放包容的学术氛围,以培养具有国际视野、创新能力和实践精神的复合型统计人才。 返回搜狐,查看更多 ...
2023年12月12日,美国波士顿——今日,《新英格兰医学杂志》出版方NEJM集团宣布推出NEJM旗下最新期刊NEJM AI。这是一份关注医学领域人工智能(AI)和机器学习最新研究和应用的同行评议月刊,除论著外,该刊还将发表综述、政策观点和教育材料,供临床医师 ...
LAS VEGAS, the United States, Jan. 10 (Xinhua) -- The just-concluded 2026 Consumer Electronics Show (CES), the world's largest event of its kind, saw global cross-industry collaboration and more ...
JERUSALEM, Jan. 12 (Xinhua) -- Israeli researchers said on Monday they have developed an artificial intelligence (AI) system that detects fish hunger by analyzing the sounds they make while eating, of ...