转转B2C技术部主要负责商详、转转站式治理商列等BFF层核心页面业务,服务单接口甚至需要开线程池并行调用二十多个依赖服务,转转站式治理因此依赖的服务服务以及执行线程池的稳定性也就成为了B2C关注的重点。
那么站在技术视角看调用链路,转转站式治理会发现几个特点:
本文就针对如何快速定位常见问题,转转站式治理以及后续日志的服务进一步治理计划来进行讲解。
目前转转各个排查问题的转转站式治理工具是统一开放给公司的所有业务使用的,因此每次告警,都需借助统一的平台如服务治理平台、Grafana、Log日志平台等工具进行排查,不完全贴合B2C常见问题排查场景,比如上游调用异常、超时等问题。
B2C技术部告警定位问题会遇到如下几个问题:
线上内置告警无法一眼定位出问题,需要根据业务新增新的Promtheus PromQL展示调用服务超时、异常榜单。
发生紧急问题时,只能从收藏夹中选中公司各个公用平台,然后手动输入服务名称、时间范围、粘贴查询语句等,效率较低。
办公设备不在身边时,一旦发生告警,无法像在公司一样方便的打开各个平台进行问题定位。
上面提出了几个问题,那怎么进行监控治理呢。比如,怎么快速识别出问题的类型?怎么快捷跳转对应的平台?以及在户外如何进行问题定位呢?针对这些问题提出了如下解决方案。
总架构设计图如下
如图可拆分为四部分,执行步骤为:规范梳理及调整 -> 日志收集 -> 日志告警及定位 -> 告警感知
日志收集
public MethodVisitor visitMethod(int access, String name, String descriptor, String signature, String[] exceptions) { MethodVisitor methodVisitor = super.visitMethod(access, name, descriptor, signature, exceptions); if (STR_V.equals(descriptor) && infoLevel.contains(name)) { // 此处省略。。拦截日志处理逻辑---------- return new LogMethodInsnVisitor(methodVisitor, className, name); } else { return methodVisitor; } }
日志告警及定位
其中快捷跳转工具箱设计原理如下
告警感知
企业微信机器人告警
点击告警后跳转页面
总的来说,这里是从怎么快速定位异常入手,通过自定义Promtheus的PromQL来聚焦当前业务需关注的异常,另外实现了H5监控大盘页面,提升了在非工作日户外无办公设备问题定位的能力。
责任编辑:武晓燕 来源: 转转技术 转转B2C服务(责任编辑:探索)
华电国际(600027.SH)公布消息:拟购买蒙东能源45.15%股权及福源热电36.86%股权
Apple Watch Series 9最新消息 新的包装设计
碧桂园服务(06098.HK)公布:拟收购蓝光嘉宝服务(02606.HK)64.62%股权 明日复牌
11个月剩86% 用户抱怨iPhone 14 Pro电池尿崩
江山欧派(603208.SH)公布消息:公开发行可转债申请获审核通过