常见问题
本系列文档针对私有化部署中常见的重复出现问题整理。
配置项名、参数值与部署细节可能因私有化版本而异。本文中列出的配置示例仅供检索与定位使用,具体以您部署环境的配置文件与实施文档为准。
总体建议
上线前/接入时必须检查以下事项:
- 版本兼容:确认服务端版本与所用客户端 SDK 在兼容范围内。不要直接在生产环境使用高于服务端支持范围的最新 SDK。必要时先在测试环境验证。
- 基础依赖:确保 Kafka、Redis、数据库(MySQL/其它)、时间同步(NTP)、证书/License、网络(防火墙/端口/路由)均可用且稳定。
- 日志与监控:部署标准化日志采集与健康检查(Kafka consumer group 状态、Redis 内存/持久化、DB 连接数、应用服务异常)。建议提前与实施工程师确认关键配置项与数据落盘策略。
常见辅助检查项
为了便于定位故障,网易云信建议您同时查看以下服务,以便快速定位故障:
- Kafka:检查 topic 列表、consumer group 状态、lag、broker 连接数。
- Redis:检查 key 是否存在、内存使用、eviction 策略、持久化(RDB/AOF)是否正常。
- 数据库:确认写入时间戳/事务是否成功、慢查询、连接池耗尽。
- 服务端日志:应用服务、消费服务、网关、转发模块等按时间范围抓取关键日志。
- 客户端日志:包含客户端 SDK 初始化日志、登录流程、设备采集、媒体统计(如丢包、RTT、码率)等。
预防措施(给新私有化客户的建议)
- 接入前环境评估:核对 Kafka/Redis/数据库/网络/证书/License 能力并做容量规划。
- 接入测试:提供压测脚本验证并发、消息量、历史查询压力。
- 日志/报警:配置 Kafka consumer lag、Redis 内存报警、DB 慢查询报警、服务健康探针。
- 版本发布策略:建立客户端 SDK 与服务端兼容矩阵,升级需先在测试环境灰度验证。
最后更新于