再放大招!NVIDIA联手微软助力AI应用开发
在今年的 Microsoft Ignite 大会上,NVIDIA 与微软联合推出多个工具,帮助 Windows 开发者在 RTX AI PC 上快速构建和优化 AI 赋能的应用,使本地 AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的 RTX GPU 加速 AI 智能体、应用助手和数字人等应用的复杂 AI 工作流。
Microsoft Ignite是由Microsoft主办的面向IT决策者、IT 专业人员、企业开发人员的顶级技术大会。今年的大会地址选在了芝加哥,不仅有微软的大咖介绍最新的技术,同时也会联合合作伙伴,对最新的技术路线、概念方向进行吹风。
而在今年的 Microsoft Ignite 大会上,NVIDIA 与微软联合推出了多个工具,旨在帮助 Windows 开发者在 RTX AI PC 上快速构建和优化 AI 应用,使本地 AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的 RTX GPU 加速 AI 智能体、应用助手和数字人等应用的复杂 AI 工作流。
RTX AI PC 通过多模态小语言模型为数字人赋能
NVIDIA ACE 是一套数字人技术,可以让智能体、助手和虚拟形象栩栩如生。为了深度理解信息,以更强的情境感知能力做出响应,数字人必须能够像人一样在视觉上感知世界。
NVIDIA 在 SIGGRAPH 2024 中曾向外界介绍了交互式数字人 James。James 将 NVIDIA NIM 微服务、NVIDIA ACE 和 ElevenLabs 数字人技术相结合,可提供自然的沉浸式交互体验。
提升数字人交互的真实感,需要能够感知和理解周围环境更细微差别的技术。为此,NVIDIA 开发了多模态小语言模型,可同时处理文本和图像信息,在角色扮演方面表现出色,并针对响应速度进行了优化。
NVIDIA 即将推出的 Nemovision-4B-Instruct 模型利用最新的 NVIDIA VILA 和 NVIDIA NeMo 框架进行蒸馏、剪枝和量化,使其体积小到足以在 RTX GPU 上以开发者所需的精度运行。该模型使数字人能够理解现实世界和屏幕上的视觉图像,以做出相关的响应。多模态作为智能体工作流的基础,让我们得以窥见未来,届时数字人只需极少的用户辅助,即可进行推理并采取行动。
NVIDIA 还推出了 Mistral NeMo Minitron 128k Instruct 系列模型,这是一套专为优化的高效数字人交互而设计的长上下文小语言模型。这一系列模型提供 8B、4B 和 2B 参数版本的灵活选项,以平衡在 RTX AI PC 上运行的速度、显存用量和模型精度。模型单次推理可以处理大量数据,无需进行数据分割和重组。这些模型提供 GGUF 格式,为低功耗设备的效率进行优化,并与多种编程语言兼容。
利用面向 Windows 的 NVIDIA TensorRT Model Optimizer 加速生成式 AI
将模型引入 PC 环境时,开发者面临着有限的显存和计算资源,这为本地运行 AI 提出了挑战。开发者希望模型可以被更多人使用,同时精度损失最小。
Microsoft Ignite 大会上,NVIDIA 公布了 NVIDIA TensorRT Model Optimizer (ModelOpt) 的更新,为 Windows 开发者提供了针对 ONNX Runtime 部署的模型优化方案。借助最新更新,TensorRT ModelOpt 可将模型优化为 ONNX 格式,以便使用 CUDA、TensorRT 和 DirectML 等 GPU 运行后端在 ONNX 运行时环境中部署模型。
最新更新使模型可优化为 ONNX 检查点,以便通过 CUDA、TensorRT 和 DirectML 等执行提供商在 ONNX 运行时环境中部署模型,从而提高整个 PC 生态系统的精度和吞吐量。在部署时,与 FP16 模型相比,这些模型可将显存占用减少 2.6 倍。这可提高吞吐量,同时精度损失降到最低,使其能够在更多的 PC 上运行。
RTX AI PC 赋能 AI 应用开发者
生成式 AI 赋能的 PC 正在推动游戏、内容创作、生产力和程序开发更进一步。目前,超过 600 款 Windows 应用和游戏已在全球超过 1 亿台 GeForce RTX AI PC 上本地运行 AI,提供快速、可靠的低延迟体验。
众所周知,GeForce 显卡除了能加速游戏图形运算,还能助力 AI 应用开发者以更高的效率进行开发。历经多年经营的 CUDA 生态圈,营造了高效的 AI 应用开发环境。全球众多开发者选择 RTX AI PC 作为开发平台,直接推动了 AI 应用的快速发展。
索泰(ZOTAC)作为 NVIDIA 全球核心合作伙伴,17年来专注 GeForce RTX 系列显卡研发,为广大游戏爱好者、专业开发者及创意工作者提供了强大的 RTX AI 加速体验。
尤其是搭载 Ada Lovelace 架构 GPU 的索泰 GeForce RTX 40 系显卡,受到了全球众多专业开发者的青睐。RTX 40 系显卡核心内嵌第四代 Tensor Core,拥有强大的 AI 运算能力,赋能专门针对 CUDA 架构优化的高性能计算和并行任务。
携手你的索泰 RTX 显卡,感受“称心又称手”的 AI 应用开发体验,尽情畅想“万物AI”的未来。
本文出处:快科技
本文链接:http://www.tiefuzhen.com/game/202411/149147.html
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
盗贼pve天赋 盗贼三系天赋
首先**,本天赋使用范围如下:3、纯PVE玩家,想PVP?买双天赋去吧4、主手慢速拳套副手快速匕首的DZ(参考PPM实测,这个方案比较折中而且可 [详细] -
天天向上天佑 天佑上天天向上节目是哪一期
1、天佑在《天天向上》的出场是在20180202期。2、这一期节目中,天佑作为嘉宾参与了录制,与主持人和观众分享了他的音乐创作经历和心路历程 [详细] -
获取北地香料 的方法 wlk (获取北地香料的途径)
购买部落玩家可在城中找NPC米森希购买,联盟玩家可在城中找NPC德里克奥斯购买,达拉然城每日烹饪任务北地香料可通过完成达拉然城的每日烹饪任务获得,联...[详细] -
周星驰御用配音!著名配音演员石班瑜去世:享年66岁
快科技9月18日消息,据看电影官微消息,著名配音演员石班瑜于2024年9月17日上午去世,享年66岁。石班瑜原名石仁茂,绰号石斑鱼,1958年3月9 [详细] -
击破谣言!实测iPhone 16全系可用微信
快科技9月19日消息,iPhone 16系列评测解禁,经博主凰家评测测试,iPhone 16系列4款机型全系可用微信,击破了之前的谣言。此前在9月2日, [详细] -
口袋妖怪 口袋妖怪全流程图文攻略 (口袋妖怪口袋暴龙5.0最终版进化图鉴)
总览口袋妖怪和珍珠各有其之处,但从整体游戏体验和玩家反馈来看,口袋妖怪相对更为,优势对比故事情节和角色塑造口袋妖怪在故事情节和角色塑造上更为出...[详细] -
领主之塔 塔达林高阶领主
在DNF游戏里,领主之塔是一个非常好的活动副本,可以兑换到很多有用的史诗装备。那么有很多的玩家们还不清楚dnf领主之塔位置在哪?所以下面 [详细] -
饥饿游戏3 饥饿游戏3完整剧情
1、背景:在第75届饥饿游戏*后,女主凯特尼斯用弓箭射穿人工穹顶,利用电力场破坏游戏场。被前来救援的十三区飞机接走,同时被接走的贡品还 [详细] -
口袋妖怪红宝石神兽 口袋妖怪红宝石神兽有哪些
关于口袋妖怪红宝石神兽分布图,口袋妖怪红宝石神兽这个很多人还不知道,今天来为大家解答以上的问题,现在让我们一起来看看吧!1、口袋妖 [详细] -
可以先跟随游戏内引导进行游戏 进入游戏后 (跟着旅游团可以中途离开吗)
进入时间领主之塔只有在以下时间段开放,周六周日下午4,10~4,40周六周日晚间10,10~10,40每天有3张门票,强韧获取方式领主之塔内的怪物可以爆出强韧碎...[详细]