作者 | Liam Crilly
编译 | 言征
从GitHub Copilot到Microsoft Office Copilot再到ChatGPT等,AI已经以光速从“总有一天我们会到达那里”转变为“你的AI计策是什么?”
因此,组织正在迅速接管AI——创造增强的终极用户体验、降落的运营本钱和竞争上风。环绕AI流程和事情流程构建的全新运用程序正在呈现。像大多数新的运用程序和做事一样,AI做事,如OpenAI或各种云供应商供应的做事,是通过API供应和消费的。
那么在AI运用跟大模型之间怎么交互呢?这里便是AI网关的用武之地。
AI网关是专门构建的系统,用于管理、保护和不雅观察激增的AI流量和运用需求。因此,它们正迅速成为一个主要的产品种别。那么什么是AI网关呢?大概你还真的须要一个!
AI网关是一种专门的设备或办理方案,旨在管理和简化运用程序和AI模型之间的交互,特殊是在大型措辞模型(LLM)和其他AI做事的背景下。网关充当AI流量的中央掌握点,为运用程序访问各种AI后端和模型供应统一的接口。AI网关还许可运营和安全团队管理关键领域,如安全、管理、可不雅观察性和本钱管理。
大多数AI网关包括以下几组功能:
1.安全性和合规性AI安全既是最主要的,也是最主要的。AI运用程序可能用于处理客户数据或其他形式的个人身份信息,并且常常暴露在有代价的专有公司数据中。越来越多的第三方AI机器人试图在未经授权的情形下对公开的数据进行演习。
网关处理身份验证和零信赖,充当AI做事和API访问的看门人。
面对这些和其他风险,AI网关正在成为一种新型防火墙。AI网关管理AI做事的消费者和供应者的安全凭据。
网关处理身份验证和零信赖,充当AI做事和API访问的看门人。它还供应了一个授权层,以确保只有经由批准的用户才能访问特定的做事,或者根据定义的策略批准利用做事。策略可能会根据地理位置、业务部门、角色、根本举动步伐供应商或根本举动步伐类型来限定利用。
对付特定的AI提示管理,AI网关可以实现提示安全、验证和模板天生。这通过将功能整合在一个掌握平面中简化了即时管理,该掌握平面可以在不须要更新本地开拓环境或不同模型系统或AI运用程序的情形下进行管理。这对付负任务和合规的AI利用至关主要,由于它可以防止开拓职员环绕受限定的主题构建AI集成或在提示中设置缺点的高下文。
此外,AI网关被用作AI数据的防火墙或数字丢失保护系统。一个功能完好的AI网关可以防止模型中毒、模型盗窃和其他对AI系统的新生网络安全威胁。
2.负载平衡和集中花费管理你可能须要一个AI负载均衡器,纵然你还没有。AI运用程序可能具有高度的数据密集性和打算依赖性。不管理AI运用程序的流量可能意味着非常昂贵的GPU闲置着,等待资源不敷的上游部分完成事情。对付面向消费者的产品来说,AI运用程序的延迟是一个杀手——你让某人等待谈天机器人相应的韶光越长,他们向左或向右滑动的可能性就越大。
然后是消费问题。如今,大多数组织都在利用多种AI模型即做事产品。这些大多是通过云供应商或其他第三方做事供应的。AI网关为管理组织内不同团队和运用程序的AI消费供应了一个集中的平台。这种集中化对付保持对AI流量的掌握以及确保AI以合规和负任务的办法利用至关主要。
AI网关为管理不同团队和运用程序的AI消费供应了一个集中的平台。
通过供应统一的掌握平面和负载均衡器,AI网关使组织能够管理所有AI花费和可不雅观测性网络。在AI中,消费是不同的,由于它因此代币而不是交易或数据量来衡量的。
然而,令牌的大略丈量是禁绝确的:某些类型的查询须要更多的令牌来运行作业,并且同一提示所需的令牌数量可能会随着韶光的推移而变革。换言之,假设您的标准运用程序为同一要求返回了可变数量的数据。这是AI细微差别的核心——消费可能更难预测和掌握。
3.简化开拓职员事情流如今,开拓者和平台运营团队面临着一系列令人眼花缭乱的AI集成和API可供选择。云供应商可以通过其API简化消费,但AI网关的设计许可轻松管理AIAPI和单个集成管理点。
AI网关支持多种AI做事,并供应单个API接口,开拓职员可以利用该接口访问他们须要的任何AI模型。端点可能许可开拓职员访问OpenAI供应的各种模型,但也可以访问Hugging Face上包含的数千个更风雅调度的开源模型和工具。AI网关可以自动启用须要访问AI做事的团队。
是的,AI的蔓延是一件事,你不肯望你的开拓者扰乱它。
这个统一的API端点简化了开拓事情流程并加快了集成过程。这反过来又使开拓职员能够专注于构建AI运用程序,而不是管理繁芜的集成。
正如开拓职员希望在开拓软件时有一系列框架和开源模块可供选择一样,AI开拓职员也越来越希望有广泛的模型和AI做事可供选择,以便更快、更适当地定制运用程序。是的,AI的蔓延是一件事,你不肯望你的开拓者扰乱它。
4.本钱优化、监控和可不雅观测性AI网关许可组织从其AI利用中学习,以管理和降落本钱。网关可以深入理解每个模型的花费配额,从而实现高效的资源分配和本钱掌握。这种透明度许可用户有效地管理他们的AI资源利用情形,确保最佳利用率并防止摧残浪费蹂躏(例如为闲置的GPU付费)。
更前辈的AI网关可以通过将高下文运用于每个作业,将精确类型的AI打算作业勾引到最经济的根本举动步伐。例如,须要大规模和吞吐量的最关键的作业可能被定向到容量最高的GPU集群,而更大略的推理作业可以被定向到更靠近终极用户但功能较弱的GPU。
优化硬币的另一壁是可不雅观察性和监控性。AI网关从一个地方管理AI的可不雅观察性,乃至可以将数据发送给第三方日志/度量网络器。这使得捕获天生的全体AI流量更加随意马虎,以进一步确保数据合规性并识别利用中的任何非常情形。个中一些与安全性重叠,但大部分是AI特有的,由于AI的消费模式不同,旗子暗记问题的非常也不同。
例如,AI在生产中对运用程序的推理可能看起来与正常的运用程序流量相似,但AI模型演习和调度看起来非常溘然,有大量的流量和依赖的打算事情,须要密切监控,以确保GPU不会摧残浪费蹂躏在低效的数据管道中等待。
二、为AI的狂野西部带来秩序更令人困惑的是,许多点产品关注的是更全面的AI网关寻求办理的一两个问题。一些供应商还将API网关包装成一些特定于AI的功能,并将其命名为AI网关。
有一些开源项目供应了上面谈论的一些功能。例如,许多机器学习操作平台和做事为开拓团队的AI消费创建了统一的API端点。
将许多不同的产品捆绑在一起以得到所有功能终极将成为一个难以战胜的麻烦,而且会更加昂贵。正如API管理集中在API网关上一样,AI管理也将表现出对综合AI网关的偏见。
最好的将为每一个打仗到这种强大的新技能范式的人供应一种有效的办法来驯服AI“狂野的西部”。
得当的AI网关将为企业采取AI铺平道路,并使支配这项强大的新技能在任何规模上都更加常规、安全和经济。
想理解更多AIGC的内容,请访问:
51CTO AI.x社区
https://www.51cto.com/aigc/
来源: 51CTO技能栈