不止是英国,中国香港也在人工智能方面全部布局。作为亚洲国际化科创枢纽,香港也正在借政策东风全力打造 AI 人才高地。特区政府豪掷 10 亿港币成立人工智能研发院,推出 30 亿港币 AI 资助计划,从科研支持、产业落地到人才培养形成全链条扶持。
正如前文所述,许冰提到这项工作的灵感源于 Andrej Karpathy 的播客。当时他并不完全认同 Karpathy 关于「AI 编程」的某些激进观点,于是决定和首席工程师 Terry Chen 一起,用最硬核的系统开发来测试智能体的极限。
点击上方“Deephub Imba”,关注公众号,好文章不错过 !大语言模型发展到今天,写提示词不仅是个体力活,还是一个技术活。提示词的措辞稍微改一下,性能波动 20-50% 是常有的事。那能不能让 LLM 自己改进提示词呢?本文主要讲的就是这个,一个处理复杂推理任务的 Agent,经过几轮自动迭代,准确率从 34% 飙到 97%相对提升 ...
一半攥在大模型手里,以一周一迭代、一月一颠覆的速度卷出了新高度:LMArena.ai 数据显示,自 2023 年年中起,SOTA(当前最优模型)的迭代周期被压缩至 35 天,短短 5 个月就可能跌出 Top5,7 个月后连 Top10 的门槛都摸不到。
令人惊叹的是,johnnytshi在短短30分钟内,就把整个CUDA后端移植到了AMD ROCm上,而且中间没用任何翻译层。 为AMD GPU实现了完整的ROCm后端,从而在RDNA 3.5及其他AMD架构上支持基于注意力机制的现代国际象棋网络。
2025年初,DeepSeek的走红让更多人明白,不仅仅是模型本身,训练和推理过程中工程上的优化同样重要。元旦假期看了朱亦博老师的一篇帖子,很受启发,2025年过去了,我想应该尝试来把亦博老师总结的25年AI ...