一、资源指标
- CPU使用率
- 监控项: CPU总使用率、每核使用率、系统负载。
- 阈值设定:
- CPU使用率超过80%时进行预警。
- 持续超过90%则需紧急处理。
- 内存使用率
- 监控项: 总内存使用率、可用内存、交换区使用率。
- 阈值设定:
- 内存使用率超过70%时进行预警。
- 超过90%则需紧急处理。
- 磁盘使用率
- 监控项: 磁盘总使用率、每个分区的使用率、磁盘I/O。
- 阈值设定:
- 磁盘使用率超过80%时进行预警。
- 超过90%则需紧急处理。
- 网络带宽
- 监控项: 入站/出站带宽、错误包、丢包率。
- 阈值设定:
- 带宽使用率超过70%时进行预警。
- 超过90%则需紧急处理。
- 数据库性能
- 监控项: 查询响应时间、连接数、锁等待时间、慢查询数。
- 阈值设定:
- 响应时间超过500ms进行预警。
- 超过1秒则需紧急处理。
二、业务指标
- 用户转化率
- 监控项: 从访问者到注册用户的转化率,从注册用户到付费用户的转化率。
- 阈值设定: 转化率低于预期时进行预警。
- 用户留存率
- 监控项: 日活跃用户数(DAU)、周活跃用户数(WAU)、月活跃用户数(MAU)、留存率。
- 阈值设定: 留存率显著下降时进行预警。
- 用户满意度
- 监控项: 用户反馈评分、NPS(净推荐值)。
- 阈值设定: 满意度评分低于某一阈值(如7/10)时进行预警。
- 业务交易金额
- 监控项: 每日、每周、每月的交易总金额,单笔交易金额的平均值。
- 阈值设定: 交易金额低于预期时进行预警。
- 订单处理时间
- 监控项: 从下单到发货的平均时间,从发货到收货的平均时间。
- 阈值设定: 处理时间超过预期时进行预警。
- 库存周转率
- 监控项: 库存周转天数、库存积压率。
- 阈值设定: 周转天数超过预期时进行预警。
- 页面加载时间
- 监控项: 各关键页面的加载时间,页面的首次绘制时间(FCP)、最大内容绘制时间(LCP)。
- 阈值设定: 页面加载时间超过2秒进行预警,超过5秒则需紧急处理。
- 流量来源分析
- 监控项: 各渠道带来的流量(如SEO、SEM、社交媒体、直接访问等)。
- 阈值设定: 重要渠道的流量显著下降时进行预警。
- 购物车放弃率
- 监控项: 添加到购物车但未完成购买的比率。
- 阈值设定: 放弃率高于某一阈值时进行预警。
- 支付成功率
- 监控项: 支付请求的成功率。
- 阈值设定: 成功率低于95%时进行预警。
- 客服响应时间
- 监控项: 客服工单的平均响应时间、解决时间。
- 阈值设定: 响应时间超过预期(如1小时)时进行预警。
- 退款和退货率
- 监控项: 退款订单数、退货订单数及其占总订单的比率。
- 阈值设定: 退款和退货率高于某一阈值时进行预警。
设定阈值的原则
- 业务目标: 阈值设定应与公司的业务目标和KPI紧密结合。
- 客户体验: 注重客户体验的指标,如页面加载时间、客服响应时间等,设定严格的阈值。
- 行业标准: 参考行业内的最佳实践和标准,设定合理的阈值。
- 数据驱动: 基于历史数据和数据分析设定阈值,并根据数据变化动态调整。