架构讲解:
大模型层:用于对接公有云或私有化部署的基础大模型,以及Embedding向量化模型。国内外商业或开源基础大模型还在持续快代,每个季度都会有能力更强、效果更好的大模型或新版本出来,如DeepSeek R1在2025年春节的火爆。平台默认支持公有云接口和私有化部署2种模型服务集成方式,内置60多种常见模型适配器,可以分钟级切换效果更好的基础大模型。
网关服务层:LLM Gateway 屏蔽不同 LLM 模型之间的差异,为上层应用提供业界标准的OpenAI 协议 API 接口(如chat completion、embedding、FunctionCall等),并提供权限、审计、监控、配额限流等管理能力。
资源管理层:LLM 资源管理提供了 AI 场景建设过程中用到的各种通用资源、工具的支持。包括Prompt 管理、知识库管理、工具管理、AI Agent 管理等。这样各个运维SaaS可以把提示词模板、运维知识文档,以及Agent插件托管到平台上,降低智能运维场景的开发成本,并能在一体化运维体系内打通复用,如通过多Agent协同,完成智能可观测场景的告警智能分析、根因定位、智能处置推荐等。
LLMOps 开发框架:LLM Agent Framework ,是一个 LLM 智能 Agent 应用开发框架,提供单 Agent 智能代理与基于 Graph 编排的多 Agent 智能协同能力,使用 Graph 组合 Agent, Chain, Retriever 等各类子组件,编排业务流程,解决复杂多变的业务问题,同时最大程度保留可复用性。运维智能体作为整个嘉为蓝鲸一体化运维体系的一部分,与一体化运维系统之间通过功能调用、数据和知识接入,形成有机互动,实现更为丰富的场景化应用。
LLM Agent Framework ,是一个 LLM 智能 Agent 应用开发框架,提供单 Agent 智能代理与基于 Graph 编排的多 Agent 智能协同能力,使用 Graph 组合 Agent, Chain, Retriever 等各类子组件,编排业务流程,解决复杂多变的业务问题,同时最大程度保留可复用性。
基于蓝鲸API网关扩展的MCP Server,可以统一蓝鲸体系下MCP Server的发布规范,集中管控,同时支持各开源/私有大模型对蓝鲸MCP Server的集成对接;与API网关集成,可以低成本接入运维工具接口,复用API Gateway权限、限流、熔断等能力;与蓝鲸权限体系融合,解决MCP协议本身无安全与认证的问题。
工具(Tools)功能在当前版本,主要是支持场景问答对接蓝鲸产品或第三方系统的API,从第三方接口获取数据知识后总结回复。核心流程是“新建工具”、“对话绑定工具”、“工具调用(FunctionCall)”、“大模型总结回复”等步骤。
支持根据知识类型创建多个不同层级的知识库,支持文件上传、手工录入、网页知识等多种形式录入知识,并使用 RAG 技术进行向量化处理,可在聊天过程中指定回复引用特定的知识库。
支持 60+ 模型接入框架,包括私有化部署和托管接入方式,同时通过LLM Gateway屏蔽不同LLM模型之间的差异,为上层应用提供业界标准的OpenAI协议的API,并提供权限、审计、监控、配额限流等管理能力。
联系我们查看资料,或申请DEMO演示,可以帮助您更加快速地了解该产品。
申请演示