OpenAI研发高效推理方案：模型运行成本降低50%

admin • 2天前 • AI科技

快科技7月1日消息，据The Information，知情人士透露，OpenAI工程师本月早些时候向团队内部表示，依托多项全新研发的优化技术，已成功找到一套可将模型推理成本削减一半以上的方案。

在将该技术应用于无免费或付费账户的访客ChatGPT使用场景后，所需英伟达GPU数量一度被压缩至仅数百个，效率提升显著。

此前有消息称，OpenAI与博通联合研发的ASIC芯片项目——代号“墨西哥胡椒”。

该芯片完全针对大模型推理从零开始设计，当专用芯片摆脱通用GPU架构的束缚后，硬件突破带来的不再是温和升级，而是实质性的重构，推理成本最高可直接降低一半。

随着头部AI厂商掌握自主算力源头，对英伟达GPU的依赖逐步减少，通用硬件的产能与定价权将不再构成制约，也意味着整个AI生态话语权正在发生转移。

原创文章，作者：admin，如若转载，请注明出处：http://www.kandianxun.com/ai/98669.html

赞 (0)

0

华为用户别错过！7月服务日本周开启：手机贴膜免费、维修免人工费

华为用户别错过！7月服务日本周开启：手机贴膜免费、维修免人工费

上一篇 2天前

严重依赖美国引警惕日本要砸1500亿日元打造本土星链

严重依赖美国引警惕日本要砸1500亿日元打造本土星链

下一篇 2天前

AI科技

马斯克：年底将出现比人类更聪明的AI 能源是AI最大限制因素

快科技1月23日消息，特斯拉CEO埃隆·马斯克在瑞士达沃斯世界经济论坛上，围绕AI发展、技术商业化等议题发表了一系列观点，并披露了特斯拉人形机器人的落地时间表。马斯克表示，目前已…

2026年1月23日
AI科技

软银计划收购Marvell与Arm合并打造AI新巨头

快科技11月7日消息，据媒体报道，知情人士透露，软银集团今年早些时候曾就收购美国芯片设计公司Marvell进行探索，意图将其与旗下半导体IP巨头Arm合并，以打造一家在AI数据中心…

2025年11月7日
AI科技

未来三年，软件工程师或将转型为AI代码审核员

在一档播客节目中，Anthropic 的首席产品官迈克・克里格（Mike Kreiger）分享了他对未来软件开发趋势的见解。他指出，随着人工智能在编程领域的不断进步，软件开发者的角…

2025年3月7日
AI科技

雷军爆料小米AI眼镜功能：自带小爱同学看到啥都能直接问

快科技6月25日消息，小米AI眼镜已经官宣，将在明晚发布。雷军发文称，这是面向下一个时代的个人智能设备、随身的AI入口，带来非常多前所未有的体验。他还提前曝光了新品的功能，内置…

2025年6月25日
AI科技

万众期待的OpenAI首款硬件：竟然只是个小键盘

快科技6月30日消息，万众都在期待OpenAI联手Jony Ive打造的新一代AI终端，结果官方宣布的首款硬件却出乎所有人意料：一款与客制化外设品牌Work Louder联名打造的…

2天前
AI科技

AI新用法！俄罗斯首次启用人工智能技术进行宇航员选拔

快科技2月5日消息，据媒体报道，俄罗斯国家航天集团已启动新一轮宇航员选拔工作，并将首次引入人工智能技术辅助筛选。此前，俄罗斯已在公职人员选拔领域测试人工智能的应用，并计划在203…

2026年2月5日
AI科技

换AI不用从零开始了谷歌Gemini支持一键记忆导入

快科技3月27日消息，谷歌旗下AI助手Gemini正式上线记忆导入功能，用户可将其他AI助理的对话记忆与个人偏好快速迁移，告别更换平台时需要重新培养AI习惯的烦恼。此次更新的核心…

2026年3月27日
AI科技

美国悍然宣布：全球任何地方使用华为AI芯片都违法！

快科技5月14日消息，美国商务部工业和安全局(BIS)官方宣布，撤销拜登政府的《人工智能扩散规则》(Intelligence Diffusion Rule)，同时采取新的措施，加强…

2025年5月14日
AI科技

地表最强AI芯片NVIDIA GB300震撼发布！联想等下半年就发售

快科技3月19日消息，在NVIDIA年度开发者大会上，黄仁勋向全球推出最强AI芯片GB300。 GB300基于NVIDIA Blackwell Ultra架构，提升了训练和测试时扩…

2025年3月19日
AI科技

消息称软银计划融资 160 亿美元加码人工智能投资

据《路透社》报道，有消息人士透露，软银集团首席执行官孙正义（Masayoshi Son）计划借款160亿美元用于人工智能(AI)投资。此消息源于《信息》技术新闻网站，报道中提到公司…

2025年3月3日

发表回复