热门搜索 企业动态 新闻中心 成功案例 社区 Prometheus交流区

弃国外开源,创自主开源 Perseus:乐维的底层技术抉择与智能体战略

在IT运维监控领域,开源工具曾被视为降本提效的最优解,Prometheus、Zabbix 等凭借免费、生态丰富的优势占据大量市场份额。然而,乐维却选择放弃成熟的开源采集方案,历经 5 年迭代自研 Perseus 采集平台。这一决策并非对开源的否定,而是基于企业级运维场景的技术痛点、业务需求与长期战略的深度权衡,核心在于为客户提供更适配、更高效、更可控的采集底座。

PART 01开源采集的 “隐性陷阱”:企业落地的核心痛点

乐维在服务14000 + 客户的过程中发现,开源采集看似 “免费易用”,实则在企业级生产环境中存在难以规避的技术短板,这些短板往往成为制约运维效率的核心瓶颈。

01架构与调优的 “高成本壁垒”

开源采集工具多为社区驱动设计,架构初衷适配中小规模场景,难以直接支撑企业级大规模部署。以 Prometheus 为例,其单机存储与联邦集群模式在处理百万级指标时,需投入大量人力进行存储分片、远程读写适配器配置,调优成本极高。这种 “免费工具 + 高额人力调优” 的模式,本质上是将隐性成本转嫁给企业,尤其对技术资源有限的中小企业极不友好。02资产与 Agent 管理的 “人工依赖困境”

开源采集工具的资产发现与 Agent 管理能力存在天然缺陷。Prometheus 依赖手动配置文件或第三方插件实现资产纳管,面对动态扩容的云环境、数千台设备的传统机房,手动配置效率极低且易出错。这种 “人工主导” 的管理模式,与企业追求的自动化、智能化运维目标背道而驰。

03全技术栈兼容的 “生态割裂问题”

随着信创、云原生、物联网技术的普及,企业 IT 架构呈现 “传统 + 云 + 信创” 混合形态,而开源采集工具难以实现全场景覆盖。Prometheus 对信创环境的国产 CPU、操作系统适配滞后,对小众网络设备、物联网终端的采集支持不足;Zabbix 虽覆盖范围较广,但对云原生容器、微服务的监控需额外集成 Sidecar、APM 工具,形成多工具数据孤岛。更关键的是,开源工具的指标体系缺乏统一标准,不同工具采集的数据在时间戳、指标命名、颗粒度上存在差异,无法实现跨平台关联分析,阻碍了全栈运维的落地。

04告警与业务联动的 “能力短板”

告警收敛与业务拓扑自动发现是企业运维的核心需求,而开源采集工具在此方面存在明显不足。Prometheus、Zabbix 的告警规则仅支持单指标阈值判断,缺乏多指标关联、异常趋势预测能力,易引发海量冗余告警,告警收敛率不足;同时,两者均无法自动生成业务拓扑,难以实现 “资源 – 应用 – 业务” 的全链路关联,导致故障发生时无法快速定位影响范围,无法支撑业务连续性保障。

05开源环境变化的 “不可控风险”

开源工具的核心优势依赖于社区维护与协议稳定,但开源环境的动态变化往往带来不可预判的风险。如开源协议变更可能导致部分企业级功能被限制、商用授权成本增加,原本依赖其搭建的采集体系被迫面临升级改造、协议适配等额外投入,不仅打乱了企业运维规划,还可能因协议兼容问题出现采集中断、数据丢失等风险。

PART 02 Perseus 的技术破局:以自研重构采集核心能力

Perseus 的核心逻辑,是针对开源采集的四大痛点,构建 “自主可控、全栈兼容、智能高效” 的采集底座,并非闭门造车,而是在吸收开源生态优势的基础上,实现技术能力的升级与重构。

01轻量化架构:降低企业调优成本

Perseus 支持多种分布式部署架构,专注大规模性数据采集调优,无需复杂配置即可支撑百万级指标采集。针对存储瓶颈,引入时序数据存储引擎,支持数据分级存储、自动压缩;针对跨地域多数据中心,实现多节点自动负载均衡、故障自动转移,企业无需专业团队即可完成架构优化,大幅降低调优成本。

02智能资产与 Agent 管理:实现自动化运维

Perseus 内置 “资产智发现” 引擎,支持输入 IP 网段及凭证即可一键发现资产,自动识别设备型号、系统版本、硬件配置等基因信息,完成自动纳管;Agent 管理方面,实现批量安装、卸载、升级的全自动化,支持灰度升级与回滚机制,同时提供离线安装包与 Proxy 代理方案,适配复杂网络环境,彻底摆脱人工依赖。

03全技术栈覆盖:打破生态割裂

Perseus 构建了 “全协议、全场景” 的采集能力,覆盖 500 + 厂商、8000 + 设备型号,包括传统 IT 基础设施、公有云、私有云、容器、物联网及信创环境。针对信创场景,提前完成与国产 CPU、操作系统、数据库的适配测试;同时向下兼容 Prometheus、Zabbix等开源数据源,实现存量监控体系的平滑迁移,既解决生态兼容问题,又保护企业现有投资。

04全业务链消费:消除数据孤岛

Perseus采集平台作为底层的数据采集管理中枢,其丰富的数据接口可供多种上层应用调用数据并进行向上消费,包括监控、网管、流量、CMDB、ITSM,甚至第三方的日志、APM、可观测平台、AiOps算法平台等。

例如,通过调用Perseus生成(自采或转化后)的数据,监控平台可生成成丰富的可视化图表。

PART 03全链路智能,更具核心价值

乐维的核心战略,从来不是“做一个更优秀的采集工具”,而是以Perseus为基础,打造Lerwee运维智能体——一款深度融合DeepSeek/Qwen等前沿大模型,具备自主感知、推理、决策能力的“运维贾维斯”,覆盖“数据采集-资产纳管-智能分析-故障处置-业务洞察”全链路,Perseus只是其底层支撑,上层的智能功能才是乐维的核心竞争力,更具技术突破性与场景价值。

Lerwee运维智能体采用“感知层、记忆层、规划层、行动层、大脑层”五大层级架构,结合 OpenClaw 执行能力,打造运维智能体的“专项能力包”,通过插件化方式赋予智能体系统级操作能力,实现“发现-监控-解构-分析-决策-行动”的全流程自动化运维。

01五层架构:构建运维智能体的 “数字神经网络”

Lerwee 运维智能体的五层架构并非简单的功能堆叠,而是一套从 “数据采集” 到 “决策执行” 的完整智能闭环,各层级各司其职、协同运转:

  • 感知层:以乐维监控 + 乐维生态(日志、APM、eBPE 等) 为核心,依托 Perseus 采集管家兼容的数十种协议,实现全栈 IT 资源的实时感知。不仅覆盖机房环境、服务器、网络设备、数据库、中间件等传统资源,更能对接物联网、容器、开源框架等新型业态,精准采集指标、日志、告警等全维度数据,为上层智能提供统一、标准的数据底座。
  • 记忆层:以知识图谱、历史案例、时序数据库、图数据库、向量数据库为核心,构建运维智能体的 “长期记忆”。它汇聚企业过往运维经验、故障案例、配置规范等数据,支持长期学习与经验复用,让智能体在分析决策时能精准调用历史经验,避免重复踩坑,提升决策的准确性与可靠性。
  • 规划层:以乐维 CMDB为核心,负责全域资产建模与复杂场景解构。通过成熟模型体系构建全量资产图谱,梳理资产属性、关联关系与分类体系,支撑机房视图、业务资源查询、合规性检查等核心能力;同时协同多智能体完成高阶任务规划,为故障处置、资源优化提供清晰的行动路径。
  • 行动层:以乐维网管(安全合规)、乐维自动化(全栈调度)、乐维 ITSM(运维规范) 为核心,是智能体的落地执行层。依托海量脚本库与可视化 Ansible 操作能力,实现配置备份、IP 管理、自动化流程编排、服务请求管理等全场景执行,将规划层的决策转化为实际操作,完成故障自愈、资源调度等任务。
  • 大脑层:以 Lerwee AI(融合 DeepSeek/Qwen 大模型) 为核心,搭载 RAG 检索增强、CoT 思维链、Prompt 提示词等技术,是智能体的 “决策大脑”。它整合感知层数据、记忆层经验、规划层方案,实现系统分析与决策,支撑智能告警分析、根因定位、业务洞察、自然人机交互等高阶能力,赋予智能体 “专家级思维”。

02那么,Lerwee运维智能体能给用户带来什么价值?

传统运维模式常面临资产底数不清、运行动态难感知、问题响应滞后等痛点,不仅拖累运维效率,更埋下业务中断风险。Lerwee运维智能体以统一底账、统一感知、统一响应为核心,构建起覆盖资产全生命周期、运行全场景、决策全链路的运维能力,帮助企业从被动救火转向主动管理,从经验驱动转向数据驱动,为业务稳定运行与持续优化筑牢根基。

(1)统一底账:全面清晰掌握 IT 资产全貌

Lerwee运维智能体通过应用、资源、机房、管理四大维度,为企业构建起完整的 IT 资产统一台账。无论是应用系统的数量、架构与依赖关系,还是中间件、数据库、服务器等各类资源的分布,乃至机房设备位置、资源维护责任归属,都能实现一目了然的可视化管理,彻底解决传统运维中资产不清、分布不明、责任模糊的痛点,让企业对自身 IT 家底做到心中有数。

(2)统一感知:实时洞察 IT 运行动态变化

围绕发布管理、变更控制、事件管理、维保管理、容量管理等核心场景, 实现了对 IT 环境全生命周期事件的统一感知。从应用版本发布、配置变动,到设备变更影响范围、资源告警事件,再到软硬件维保到期状态与容量使用趋势,都能被精准捕捉与追溯,让运维人员及时掌握系统异动,快速定位问题源头,避免因信息滞后导致的故障扩大。

(3)统一响应:智能驱动运维决策与优化

基于统一底账与感知数据,Lerwee运维智能体提供健康度分析、智能运维、容量分析、架构评估、隐患分析等智能化响应能力。既能通过资源关联关系压缩告警、定位根因,也能评估核心应用扩容需求、识别架构薄弱点,还能挖掘事件分布规律与潜在风险,为 IT 架构加固、资源优化配置提供数据支撑,实现从被动响应到主动预防的运维升级,全面提升运维效率与系统稳定性。

PART 04自研与开放共生:乐维的运维智能体战略

乐维放弃开源采集、自研Perseus,并非走向封闭,而是秉持“开放兼容、自主可控”的理念,构建与开源生态共生的技术体系,而这一切的核心,都是为了让Lerwee运维智能体的全链路能力更稳定、更适配企业需求。

此外,在 2026 产品 RoadMap 中,乐维将对发现引擎重构、拥抱 eBPF、AIGC 探索等方向进行重点布局,持续深化 AI 技术与运维场景的联动应用,充分释放智能运维价值。目前,乐维已发布全工具链的运维智能体Skill,并实现与 OpenClaw 的深度联动;同时,新一代智能交互产品LerweeClaw也即将上线,将进一步打通数据、工具与决策链路,为企业提供更高效、更智能的运维解决方案。

乐维社区已经开放Lerwee运维智能体免费版,欢迎下载体验!

The prev:

Related recommendations

Expand more!