服务器日志排查
一句话:服务运行出问题时,日志是最直接的排查线索——记录了程序运行过程中发生的事件、报错和关键信息。
它是什么
日志就是程序运行时留下的"记录",包括正常运行信息、警告、报错详情。线上出问题时,看日志通常比猜测更快找到问题根源,尤其是用户反馈"出错了"但没有更多细节的时候。
适合干什么
- 线上服务出现异常但不清楚具体原因
- 需要复盘某次故障发生的时间线
不适合干什么
- 本地开发环境的简单调试(直接看终端输出或用调试工具更直接)
普通人怎么用
根据部署方式找到日志位置:用Docker部署的用 docker compose logs -f 服务名 查看;用Vercel等平台的去控制台的日志/Logs标签页看;确认问题发生的大概时间,重点看那个时间点前后的日志。
进阶用户怎么用
生产环境建议用结构化日志(如JSON格式)方便后续检索分析,并接入专门的日志收集/告警系统,而不是只能登录服务器手动翻日志;给关键操作加上有意义的日志级别(info/warn/error)区分严重程度。
常见误区
- 以为日志就是报错信息,实际日志也包含大量正常运行的记录,排查时要学会过滤噪音找到关键信息
- 线上服务完全没有日志记录,出问题时两眼一抹黑,无从下手排查
和相似工具的区别
- 和本地开发调试的区别:本地可以直接用调试器单步跟踪,线上环境通常没有这个条件,日志是排查线上问题最主要的手段
入门步骤
- 确认问题大概发生的时间
- 找到对应服务的日志位置
- 搜索该时间段前后的错误/警告信息