3 月 15 日,由百度智能云联合 vLLM 社区、红帽共同主办的“vLLM-Kunlun:大模型推理工程化实践分享”Meetup 在百度科技园楼圆满落幕。本次活动汇聚了来自百度智能云、vLLM 社区等 9 位技术专家,围绕国产芯片与 vLLM 框架的适配,从架构设计、性能优化、生态落地三大维度展开深度分享,全面展现了百度智能云在国产大模型推理领域的技术积累与生态布局。 百度百舸拥抱开源生态,打造 ...
在大模型(LLM)研发进入深水区的 2026 年,行业共识正经历从“模型中心(Model-Centric)”向“数据中心(Data-Centric)”的深刻演进。随着 Scaling Law 进入平台期,开发者发现:单纯堆砌 Token ...
英伟达在加州圣何塞举办的GTC 2026大会上,公布了其全新88 核 Vera数据中心 CPU 的更多细节,宣称性能较标准 CPU 提升高达 50%。这一提升得益于其Olympus 内核实现 1.5 倍 IPC(每时钟周期指令数)增长,以及创新的高带宽设计—— 英伟达称其拥有当前市场最快的单线程性能。该公司同时发布了全新Vera CPU 机架架构,在单一机架内集成 256 颗液冷 CPU,面向以 ...
AI初创企业TinyCorp近日宣布突破技术瓶颈,成功开发出适配Apple Silicon芯片的eGPU扩展方案。该方案通过定制化硬件模块与软件驱动的协同设计,首次实现了将英伟达RTX 5060显卡与M系列芯片Mac ...
随着人工智能技术从理论走向大规模产业应用,掌握AI大模型算法与微调技术已成为进入高薪技术领域的“金钥匙”。行业数据显示,到2026年,中国核心人工智能人才缺口预计将超过200万,其中精通大模型开发与调优的工程师尤为紧缺。面对这一历史性机遇,许多有志于 ...
经过一年的努力,FlashAttention-4 终于正式上线了。 近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。 FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示,在 Blackwell GPU 上,即使瓶颈截然不同,注意力机制的执行速度现在也几乎与矩阵乘法一样快了! 当前,Tensor Core 的速度现在非常快,以至于注意 ...
青岛新闻网3月4日讯(记者 任俊峰)对于OPC创业者而言,真实可落地的产业场景是技术变现的“最后一公里”。当前,青岛市正全力打造北方OPC先行示范城,青岛高新区正式发布OPC场景开放清单(第一批),旨在通过开放企业真实场景与资源需求,搭建技术创新与产业应用的桥梁,吸引更多具备技术实力与创新活力的OPC团队、开发者和生态伙伴集聚高新,共享数字经济新机遇。 青岛高新区位于青岛市地理几何中心,拥有得天独 ...
2026 开年已两个月,Agent 依然是全球最引人注目的 AI 赛道之一。OpenClaw(原 Clawbot)掀起的那波 Agent 热潮至今仍在发酵,甚至让「一人公司」概念第一次真正有了落地的可能性。 就在近日,OpenClaw 超越了 React、Linux,成为 GitHub 上 Star 量最多的非资源/教程类开源软件项目。 从 Browser Agent 到 Coding Agent ...
英伟达 Triton 推理服务器,被安全研究机构 Wiz Research 曝光了一组高危漏洞链。 这组漏洞可以被组合利用,实现远程代码执行(RCE),攻击者可以读取或篡改共享内存中的数据,操纵模型输出,控制整个推理后端的行为。 可能造成的后果包括模型被盗、数据泄露 ...
PyTorch 是一个基于 Python 的开源深度学习框架,因其动态计算图(Dynamic Computation Graph)和 GPU 加速能力而广受欢迎。以下是 PyTorch 的核心用法指南,涵盖张量操作、模型构建、训练流程等关键内容。 1. 基础:张量(Tensor)操作 张量是 PyTorch 的核心数据结构,类似 ...
PyTorch公开2024 H2发展路线图,增透明度。 【导读】最近,PyTorch团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。 如果你在AI领域用Python开发,想必PyTorch一定是你的老朋友之一。2017年,Meta AI发布了这个机器 ...
谷歌的Python团队,被曝解散! 谷歌员工、CPython核心开发者Thomas Wouters在社交媒体爆料,Python团队中的所有职位都将被取消。 Thomas介绍,谷歌为团队的员工提供了“替代职位”,但需要去万里之外做和原来一样的工作。 一名自称是团队员工的网友zem也怀念起了在 ...