英伟达AI Foundry为全球企业打造专属Llama 31生成式AI模型

来源：硬AI

企业可以定制自己的“超级模型”，演习出符合自己特定需求的天生式AI运用程序了？

美东韶光7月23日周二，英伟达宣告推出全新做事，即英伟达AI Foundry和NVIDIA NIM™推理微做事。

此前Meta发布最大开源AI模型Llama 3.1，同时英伟达AI Foundry将为环球企业供应Llama 3.1模型的定制服务，英伟达与Meta联手以增强环球企业的天生式AI能力。

英伟达AI Foundry为全球企业打造专属Llama 31生成式AI模型

核心做事与功能

1）英伟达AI Foundry

企业和国家可以利用Llama 3.1模型及英伟达的软件、打算能力和专业知识，为其特定行业创建定制的“超级模型”。
这些模型可以利用企业的专有数据以及从Llama 3.1 405B和英伟达Nemotron™褒奖模型天生的合成数据进行演习。

2）英伟达NIM推理微做事

适用于Llama 3.1模型的NIM推理微做事现已可下载，能够显著提升模型的推理效率，比不该用NIM时提高2.5倍。
企业可以将Llama 3.1 NIM微做事与英伟达NeMo Retriever NIM微做事结合利用，创建最前辈的检索管道，用于AI助手和数字人类化身等运用。

这些做事是靠英伟达DGX™Cloud AI平台支持的，该平台是英伟达与环球领先的公共云做事商互助开拓的，能给企业供应非常强大的打算资源，还能根据AI需求增长按需扩展规模。

Llama 3.1是Meta公司公开供应的一系列天生式AI模型。
这些模型是开放源代码的，可以被企业和开拓者用来构建前辈的天生式AI运用。
Llama 3.1模型包括80亿、700亿和4050亿参数规模，经由超过16000个英伟达H100 Tensor Core GPU的演习，优化后适用于数据中央、云端及本地设备。

而且企业可以将Llama 3.1 NIM微做事与全新的英伟达NeMo Retriever NIM微做事配对，还可助力企业可以构建最前辈的检索管道，用于各种AI运用处景，如AI副驾驶、智能助手和数字人类头像等。

通过结合Llama 3.1 NIM微做事和英伟达NeMo Retriever NIM微做事，企业可以显著提升Llama 3.1模型在生产环境中的支配和利用效率。

知足企业和国家的AI需求

当前，许多企业和国家希望定制大型措辞模型，以构建具备领域特定知识和本地化特点的天生式AI运用。
例如，医疗公司须要AI模型理解医学术语和医疗实践，而金融公司则须要AI模型具备金融领域的专业知识。

现在医疗保健、能源、金融做事、零售、交通和电信等领域的公司已开始利用英伟达NIM微做事支持Llama。
首批利用Llama 3.1的新NIM微做事的公司包括阿美石油公司（Aramco）、美国电话电报公司（AT&T）和优步（Uber）。

英伟达创始人兼首席实行官黄仁勋表示：

“Meta公开的Llama 3.1模型对付环球企业采取天生式AI是一个关键时候。
Llama 3.1为每个企业和行业开启了大门，能让它们做出最前辈的天生式AI运用。
英伟达AI Foundry全面领悟了Llama 3.1，随时能帮企业构建和支配定制的Llama超级模型。
”

Meta创始人兼首席实行官扎克伯格表示：

“新的Llama 3.1模型是开源AI迈出的极其主要的一步。
借助英伟达AI Foundry，公司可以轻松创建和定制人们想要的最前辈的AI做事，还能通过英伟达NIM进行支配。
我很高兴能把这个交到大家手中。
”

早期采取者的成功案例

环球专业做事公司埃森哲（Accenture）率先采取NVIDIA AI Foundry，利用其AI Refinery™框架构建定制的Llama 3.1模型，既供自己利用，也为客户供应做事。
埃森哲董事长兼首席实行官Julie Sweet表示：

“天生式AI正在改变各个行业，企业渴望支配由定制模型驱动的运用程序。
借助英伟达AI Foundry，我们可以帮助客户快速创建和支配定制的Llama 3.1模型，推动变革性AI运用。
”

英伟达AI Foundry供应全方位做事支持

1）端到端做事与互助伙伴

英伟达AI Foundry是一个综合性做事平台，它通过整合英伟达的技能资源和开放社区的力量，为企业供应快速构建AI模型的能力。

企业利用这个做事，可以选择或定制Llama 3.1模型，并利用英伟达NeMo平台以及顶尖的Nemotron-4 340B模型（该模型在Hugging Face RewardBench上排名第一）来开拓自己的AI模型。

开拓完成后，企业可以进一步创建NIM推理微做事，这使得他们能够在各种云平台和硬件系统上支配和运行这些AI模型，以支持其业务运营。

企业在创建自定义模型后，可以利用英伟达NIM推理微做事，在其首选的云平台和英伟达A认证系统上支配和运行这些AI模型。
英伟达供应专家支持和互助伙伴生态系统，帮助企业加速AI模型从开拓到实际支配的全体过程。

2）英伟达Nemotron支持高等模型定制

须要额外演习数据的企业可以结合利用Llama 3.1 405B和Nemotron-4 340B天生合成数据，提高特定领域模型的准确性。
拥有自身演习数据的客户，可以通过英伟达NeMo对Llama 3.1模型进行领域自适应预演习（DAPT），进一步提高模型准确性。

英伟达和Meta的互助供应了一种方法，让开发者能够创建更小、更高效的Llama 3.1模型，这些模型可以支配在多种设备上，包括AI事情站和条记本电脑。

3）提升检索准确性的NeMo Retriever微做事

利用全新英伟达NeMo Retriever NIM推理微做事进行检索增强天生（RAG），组织可以在生产中支配定制的Llama超级模型时提高相应准确性。
这一微做事为开放和商业文本问答供应最高的检索准确性。

4）广泛的企业生态系统支持

英伟达NIM互助伙伴可以在其AI办理方案中集成新的微做事，为超过500万开拓职员和19000家初创企业供应天生性AI增强功能。
英伟达AI Enterprise供应对Llama 3.1 NIM和NeMo Retriever NIM微做事的生产支持。
英伟达开拓者操持的成员很快将能免费访问NIM微做事，以便在他们喜好的根本举动步伐上进行研究、开拓和测试。

本文来自华尔街见闻，欢迎下载APP查看更多

每期AI知识网

英伟达AI Foundry为全球企业打造专属Llama 31生成式AI模型

炸裂三只羊卢总录音AI合成大年夜揭秘它就是SVC声音克隆技能

QQ水之呼吸,介绍社交软件中的绿色生态圈