来源:硬AI
企业可以定制自己的“超级模型”,演习出符合自己特定需求的天生式AI运用程序了?
美东韶光7月23日周二,英伟达宣告推出全新做事,即英伟达AI Foundry和NVIDIA NIM™推理微做事。
此前Meta发布最大开源AI模型Llama 3.1,同时英伟达AI Foundry将为环球企业供应Llama 3.1模型的定制服务,英伟达与Meta联手以增强环球企业的天生式AI能力。
核心做事与功能
1)英伟达AI Foundry
企业和国家可以利用Llama 3.1模型及英伟达的软件、打算能力和专业知识,为其特定行业创建定制的“超级模型”。这些模型可以利用企业的专有数据以及从Llama 3.1 405B和英伟达Nemotron™褒奖模型天生的合成数据进行演习。
2)英伟达NIM推理微做事
适用于Llama 3.1模型的NIM推理微做事现已可下载,能够显著提升模型的推理效率,比不该用NIM时提高2.5倍。企业可以将Llama 3.1 NIM微做事与英伟达NeMo Retriever NIM微做事结合利用,创建最前辈的检索管道,用于AI助手和数字人类化身等运用。
这些做事是靠英伟达DGX™Cloud AI平台支持的,该平台是英伟达与环球领先的公共云做事商互助开拓的,能给企业供应非常强大的打算资源,还能根据AI需求增长按需扩展规模。
Llama 3.1是Meta公司公开供应的一系列天生式AI模型。这些模型是开放源代码的,可以被企业和开拓者用来构建前辈的天生式AI运用。Llama 3.1模型包括80亿、700亿和4050亿参数规模,经由超过16000个英伟达H100 Tensor Core GPU的演习,优化后适用于数据中央、云端及本地设备。
而且企业可以将Llama 3.1 NIM微做事与全新的英伟达NeMo Retriever NIM微做事配对,还可助力企业可以构建最前辈的检索管道,用于各种AI运用处景,如AI副驾驶、智能助手和数字人类头像等。
通过结合Llama 3.1 NIM微做事和英伟达NeMo Retriever NIM微做事,企业可以显著提升Llama 3.1模型在生产环境中的支配和利用效率。
知足企业和国家的AI需求
当前,许多企业和国家希望定制大型措辞模型,以构建具备领域特定知识和本地化特点的天生式AI运用。例如,医疗公司须要AI模型理解医学术语和医疗实践,而金融公司则须要AI模型具备金融领域的专业知识。
现在医疗保健、能源、金融做事、零售、交通和电信等领域的公司已开始利用英伟达NIM微做事支持Llama。首批利用Llama 3.1的新NIM微做事的公司包括阿美石油公司(Aramco)、美国电话电报公司(AT&T)和优步(Uber)。
英伟达创始人兼首席实行官黄仁勋表示:
“Meta公开的Llama 3.1模型对付环球企业采取天生式AI是一个关键时候。Llama 3.1为每个企业和行业开启了大门,能让它们做出最前辈的天生式AI运用。英伟达AI Foundry全面领悟了Llama 3.1,随时能帮企业构建和支配定制的Llama超级模型。”
Meta创始人兼首席实行官扎克伯格表示:
“新的Llama 3.1模型是开源AI迈出的极其主要的一步。借助英伟达AI Foundry,公司可以轻松创建和定制人们想要的最前辈的AI做事,还能通过英伟达NIM进行支配。我很高兴能把这个交到大家手中。”
早期采取者的成功案例
环球专业做事公司埃森哲(Accenture)率先采取NVIDIA AI Foundry,利用其AI Refinery™框架构建定制的Llama 3.1模型,既供自己利用,也为客户供应做事。埃森哲董事长兼首席实行官Julie Sweet表示:
“天生式AI正在改变各个行业,企业渴望支配由定制模型驱动的运用程序。借助英伟达AI Foundry,我们可以帮助客户快速创建和支配定制的Llama 3.1模型,推动变革性AI运用。”
英伟达AI Foundry供应全方位做事支持
1)端到端做事与互助伙伴
英伟达AI Foundry是一个综合性做事平台,它通过整合英伟达的技能资源和开放社区的力量,为企业供应快速构建AI模型的能力。
企业利用这个做事,可以选择或定制Llama 3.1模型,并利用英伟达NeMo平台以及顶尖的Nemotron-4 340B模型(该模型在Hugging Face RewardBench上排名第一)来开拓自己的AI模型。
开拓完成后,企业可以进一步创建NIM推理微做事,这使得他们能够在各种云平台和硬件系统上支配和运行这些AI模型,以支持其业务运营。
企业在创建自定义模型后,可以利用英伟达NIM推理微做事,在其首选的云平台和英伟达A认证系统上支配和运行这些AI模型。英伟达供应专家支持和互助伙伴生态系统,帮助企业加速AI模型从开拓到实际支配的全体过程。
2)英伟达Nemotron支持高等模型定制
须要额外演习数据的企业可以结合利用Llama 3.1 405B和Nemotron-4 340B天生合成数据,提高特定领域模型的准确性。拥有自身演习数据的客户,可以通过英伟达NeMo对Llama 3.1模型进行领域自适应预演习(DAPT),进一步提高模型准确性。
英伟达和Meta的互助供应了一种方法,让开发者能够创建更小、更高效的Llama 3.1模型,这些模型可以支配在多种设备上,包括AI事情站和条记本电脑。
3)提升检索准确性的NeMo Retriever微做事
利用全新英伟达NeMo Retriever NIM推理微做事进行检索增强天生(RAG),组织可以在生产中支配定制的Llama超级模型时提高相应准确性。这一微做事为开放和商业文本问答供应最高的检索准确性。
4)广泛的企业生态系统支持
英伟达NIM互助伙伴可以在其AI办理方案中集成新的微做事,为超过500万开拓职员和19000家初创企业供应天生性AI增强功能。英伟达AI Enterprise供应对Llama 3.1 NIM和NeMo Retriever NIM微做事的生产支持。英伟达开拓者操持的成员很快将能免费访问NIM微做事,以便在他们喜好的根本举动步伐上进行研究、开拓和测试。
本文来自华尔街见闻,欢迎下载APP查看更多