英特尔发布Project Battlematrix推理工作站软件更新
英特尔发布Project Battlematrix(战斗阵列)推理工作站软件更新,英特并计划在第三季度末发布功能更全面的推理强化版LLM Scaler。
今年5月,工作英特尔发布了代号为Project Battlematrix(战斗阵列)的站软推理工作站。推理工作站具有广阔的英特发展前景,主要表现在:一是推理安全部署,数据可在本地进行处理;二是工作易于设置,将所有软件置于容器中,站软提供一站式解决方案;三是英特易扩展,可灵活配置不同数量的推理显卡;四是在成本效益上具有显著优势。Project Battlematrix推理工作站最多可支持八块英特尔锐炫 Pro B60 24GB GPU,工作提供高达192GB的站软VRAM,运行高达1500亿参数的英特中等规模且精度高的AI模型。
英特尔采用容器化方案来帮助客户解决软件部署的复杂性问题。在容器内部,工作对大语言模型进行了大量的优化,包括Linux软件栈的支持、验证以及分阶段的软件发布。基于全新的推理优化软件栈,Project Battlematrix还能够简化英特尔锐炫Pro B系列GPU的部署,加速英特尔GPU和AI战略的落实。
全新的软件栈在设计时充分考虑了易用性和行业标准,是专为Linux环境构建的容器化解决方案。经过优化,该方案能够借助多GPU扩展和PCIe P2P数据传输,带来卓越的推理性能。与此同时,该方案还具备企业级的可靠性和可管理性,如ECC、SRIOV、遥测和远程固件更新等。
LLM Scaler容器1.0版本对于前期客户支持至关重要,英特尔进行了以下更新:
vLLM:
·针对长输入长度(>4K)的TPOP性能优化:在32B KPI模型上,40K序列长度的性能提升高达1.8倍;在70B KPI模型上,40K序列长度的性能提升高达4.2倍
·与上一版本相比,8B-32B KPI模型的输出吞吐量性能优化约10%
·逐层在线量化,减少所需的GPU内存
·支持vLLM中的PP(流水线并行)(实验性)
·支持torch.compile(实验性)
·推测解码(实验性)
·支持嵌入和重排序模型
·增强的多模态模型支持
·最大长度自动检测
·数据并行支持
OneCCL基准测试工具支持
XPU Manager:
·GPU功耗
·GPU固件更新
·GPU诊断
·GPU内存带宽
英特尔表示此版本将按照5月初发布时公开的时间表顺利交付,并计划在第三季度末发布功能更全面的强化版LLM Scaler,同时积极争取在第四季度发布完整版本。
(责任编辑:休闲)
-
财政部发布公告,全文如下:关于在全国范围实施个人养老金个人所得税优惠政策的公告财政部 税务总局公告2024年第21号根据《人力资源社会保障部 财政部 国家税务总局 金融监管总局 中国证监会关于全面实施 ...[详细]
-
内蒙古能源局数据显示,上半年,全区煤炭产量6.4亿吨,其中约60%运往东北、华北、华东等主要煤炭消费地区。今年,内蒙古聚焦高标准建设蒙西、蒙东煤炭供应保障基地,对安全高效煤矿产能核增实行“ ...[详细]
-
客厅装修的前期准备工作有哪些?在客厅装修之前,需要先确定装修风格和色彩搭配,选择家具和装饰品的款式和材质。还需考虑客厅的布局和功能分区,以及电路布置和照明设计。同时,要做好预算规划和选购建材的准备工作 ...[详细]
-
中国消费者报上海讯(记者 刘浩)近日,上海市消费者权益保护委员会发布《上海、北京、深圳青少年教育培训消费调查报告》,调查发现,78.4%的家庭在最近一年中有过教育培训消费,65.8%的家庭表示遇到过非 ...[详细]
-
中国玩家将英特尔酷睿i9-14900KF处理器超频至9.13GHz的新世界纪录!中国超频玩家wytiwx近日成功将英特尔酷睿i9-14900KF处理器超频至9130.33MHz,刷新了该处理器的世界纪 ...[详细]
-
富邦美品家具隶属于宁波富邦家具集团)有限公司,公司创建于1952年,坐落于宁波经济技术开发区,是一家大型家具企业,以“富邦美品”家具品牌雄居中、美市场。公司是中国500强企业& ...[详细]
-
尽管韩国便利店密度超过日本,不过平均单店销售额只有日本的四分之一。根据《韩联社》报道,南韩便利店的密度已经超过日本。截止去年底,韩国便利店数量达 3.4 万家,韩国总人口为 5125 万,因此平均每 ...[详细]
-
记者: 孔阿龙 杨梦宇 江铜 杨柳 邓鹏卫 ...[详细]
-
2017年3月16日,阜沙国贸酒店内举行着万众瞩目的盛大峰会,广东乐铃电器2017经销商峰会荟聚了乐铃全国各地经销商,就“同道合势 智富共赢”主题商榷新战略,为2017全面启动 ...[详细]
-
10月20日米兰消息:萨内蒂从不浪费在场上场下支持国际米兰的机会。“批评?这是可以预见的。我们七年来不断胜利,他们只是等着第一波困难出现,就向我们发起攻击。这是比赛的一部分。我们现在不看积 ...[详细]