查看: 40|回复: 0

IT 运维核心工具-速查表 + 命令模板 + 实战案例

[复制链接]

11

主题

0

回帖

69

积分

管理员

积分
69
发表于 2025-12-30 14:20:26 | 显示全部楼层 |阅读模式

一、基础运维核心工具【★★★】(每天必用,所有场景通用)

✔️ 远程连接 / 文件传输(无替代)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# MobaXterm/FinalShell 核心:SSH免密配置(生产必配,避免每次输密码)ssh-keygen [color=var(--code-parameter_v3)]-t rsa  [color=var(--code-doc_v3)]# 本地生成密钥,一路回车ssh-copy-id root@192.168.1.100  [color=var(--code-doc_v3)]# 推送公钥到目标服务器,输一次密码永久免密[color=var(--code-doc_v3)]# 快速传文件(应急首选)rz  [color=var(--code-doc_v3)]# Linux收本地文件(小文件,配置/脚本)sz 文件名  [color=var(--code-doc_v3)]# Linux传文件到本地[color=var(--code-function_v3)]scp 本地文件 root@192.168.1.100:/data/  [color=var(--code-doc_v3)]# 本地→远程传文件[color=var(--code-function_v3)]rsync [color=var(--code-parameter_v3)]-avz /data/ root@192.168.1.100:/data/  [color=var(--code-doc_v3)]# 增量同步文件(备份/部署必用,断点续传)




✔️ 会话保持【★★★】(防远程任务中断,生产必用)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]screen [color=var(--code-parameter_v3)]-S kafka_deploy  [color=var(--code-doc_v3)]# 创建会话,命名为kafka部署[color=var(--code-function_v3)]screen [color=var(--code-parameter_v3)]-r kafka_deploy  [color=var(--code-doc_v3)]# 重新连接会话[color=var(--code-function_v3)]screen [color=var(--code-parameter_v3)]-ls  [color=var(--code-doc_v3)]# 查看所有会话ctrl+a+d  [color=var(--code-doc_v3)]# 临时断开会话,任务后台运行tmux new [color=var(--code-parameter_v3)]-s mysql_backup  [color=var(--code-doc_v3)]# tmux创建会话(分屏功能更强,推荐)




✔️ Linux 系统核心排障命令【★★★| 应急】(服务器卡顿 / 负载高必输,按优先级排序)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]htop  [color=var(--code-doc_v3)]# 替代top,可视化CPU/内存/进程负载,看哪个进程占资源(必装)[color=var(--code-function_v3)]df [color=var(--code-parameter_v3)]-h  [color=var(--code-doc_v3)]# 查看磁盘使用率,排查磁盘满【应急TOP1】[color=var(--code-function_v3)]du [color=var(--code-parameter_v3)]-sh /data/*  [color=var(--code-doc_v3)]# 定位哪个目录/文件占满磁盘【应急TOP1】[color=var(--code-function_v3)]free [color=var(--code-parameter_v3)]-h  [color=var(--code-doc_v3)]# 查看内存+swap使用,区分物理内存/缓存,排查内存泄漏iostat [color=var(--code-parameter_v3)]-x [color=var(--code-number_v3)]1  [color=var(--code-doc_v3)]# 查看磁盘IO利用率,%util>90%=IO瓶颈【磁盘慢必查】[color=var(--code-function_v3)]vmstat [color=var(--code-number_v3)]1  [color=var(--code-doc_v3)]# 查看CPU上下文切换/内存交换,排查系统卡顿根源ss [color=var(--code-parameter_v3)]-tanlp  [color=var(--code-doc_v3)]# 替代netstat,查看端口占用+进程PID【端口被占必查】iftop [color=var(--code-parameter_v3)]-i eth0  [color=var(--code-doc_v3)]# 实时监控网卡流量,定位带宽被谁占【网络慢必查】




✔️ 日志快速排查【★★★| 应急】(80% 故障靠这组命令解决)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]tail [color=var(--code-parameter_v3)]-f /var/log/messages  [color=var(--code-doc_v3)]# 实时滚动查看日志【最常用】[color=var(--code-function_v3)]tail [color=var(--code-parameter_v3)]-1000f /data/app.log  [color=var(--code-doc_v3)]# 实时看最后1000行,避免日志刷屏[color=var(--code-function_v3)]grep [color=var(--code-parameter_v3)]-n [color=var(--code-parameter_v3)]"ERROR\|WARN" /data/app.log  [color=var(--code-doc_v3)]# 过滤报错日志,带行号[color=var(--code-function_v3)]grep [color=var(--code-parameter_v3)]-A5 [color=var(--code-parameter_v3)]-B5 [color=var(--code-parameter_v3)]"超时" /data/app.log  [color=var(--code-doc_v3)]# 查关键词+前后5行内容(看报错上下文)[color=var(--code-function_v3)]awk [color=var(--code-parameter_v3)]'{print $1,$5}' /data/access.log  [color=var(--code-doc_v3)]# 提取日志指定列(比如IP+接口)[color=var(--code-function_v3)]sed [color=var(--code-parameter_v3)]-i [color=var(--code-parameter_v3)]'s/old_str/new_str/g' /data/config.conf  [color=var(--code-doc_v3)]# 批量替换配置文件内容[color=var(--code-function_v3)]logrotate [color=var(--code-parameter_v3)]-d /etc/logrotate.d/nginx  [color=var(--code-doc_v3)]# 测试日志切割配置(生产必配,防磁盘撑爆)





二、容器 & 云原生运维工具【★★★】(Docker+K8s,你的核心场景,高薪必备)

✔️ Docker 核心命令【★★★】(生产高频,无废话,必会)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]docker [color=var(--code-function_v3)]ps [color=var(--code-parameter_v3)]-a  [color=var(--code-doc_v3)]# 查看所有容器(运行+停止)[color=var(--code-function_v3)]docker logs [color=var(--code-parameter_v3)]-f [color=var(--code-parameter_v3)]--tail [color=var(--code-number_v3)]200 容器ID  [color=var(--code-doc_v3)]# 实时看容器日志【应急】[color=var(--code-function_v3)]docker [color=var(--code-function_v3)]exec [color=var(--code-parameter_v3)]-it 容器ID /bin/bash  [color=var(--code-doc_v3)]# 进入容器交互终端【应急】[color=var(--code-function_v3)]docker restart 容器ID  [color=var(--code-doc_v3)]# 重启容器[color=var(--code-function_v3)]docker [color=var(--code-function_v3)]rm [color=var(--code-parameter_v3)]-f 容器ID  [color=var(--code-doc_v3)]# 强制删除容器[color=var(--code-function_v3)]docker images  [color=var(--code-doc_v3)]# 查看本地镜像[color=var(--code-function_v3)]docker rmi 镜像ID  [color=var(--code-doc_v3)]# 删除镜像[color=var(--code-function_v3)]docker [color=var(--code-function_v3)]cp 本地文件 容器ID:/data/  [color=var(--code-doc_v3)]# 本地→容器传文件[color=var(--code-function_v3)]docker-compose up [color=var(--code-parameter_v3)]-d  [color=var(--code-doc_v3)]# 一键启动docker-compose编排的服务(MySQL+Redis+Kafka)【★★★】[color=var(--code-function_v3)]docker-compose down  [color=var(--code-doc_v3)]# 停止并删除容器[color=var(--code-function_v3)]docker-compose restart kafka  [color=var(--code-doc_v3)]# 单独重启编排中的kafka服务




✔️ Docker 实战模板【模板】(docker-compose.yml 一键起 Kafka+ZK,可直接复制)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]yaml


[color=var(--code-header-icon-color)]






version[color=var(--code-text_v3)]: [color=var(--code-parameter_v3)]'3'services[color=var(--code-text_v3)]:  zookeeper[color=var(--code-text_v3)]:    image[color=var(--code-text_v3)]: wurstmeister/zookeeper[color=var(--code-text_v3)]:3.4.6    ports[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- [color=var(--code-parameter_v3)]"2181:2181"    restart[color=var(--code-text_v3)]: always  kafka[color=var(--code-text_v3)]:    image[color=var(--code-text_v3)]: wurstmeister/kafka[color=var(--code-text_v3)]:2.13[color=var(--code-text_v3)]-2.8.1    ports[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- [color=var(--code-parameter_v3)]"9092:9092"    environment[color=var(--code-text_v3)]:      KAFKA_BROKER_ID[color=var(--code-text_v3)]: [color=var(--code-number_v3)]1      KAFKA_ZOOKEEPER_CONNECT[color=var(--code-text_v3)]: zookeeper[color=var(--code-text_v3)]:[color=var(--code-number_v3)]2181      KAFKA_LISTENERS[color=var(--code-text_v3)]: PLAINTEXT[color=var(--code-text_v3)]://0.0.0.0[color=var(--code-text_v3)]:[color=var(--code-number_v3)]9092      KAFKA_ADVERTISED_LISTENERS[color=var(--code-text_v3)]: PLAINTEXT[color=var(--code-text_v3)]://本机IP[color=var(--code-text_v3)]:[color=var(--code-number_v3)]9092    restart[color=var(--code-text_v3)]: always    depends_on[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- zookeeper




✔️ K8s 核心命令【★★★】(kubectl 必会,高频操作全覆盖)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







kubectl get pods [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# 查看指定命名空间的podkubectl get svc [color=var(--code-parameter_v3)]-n mysql  [color=var(--code-doc_v3)]# 查看服务kubectl get nodes  [color=var(--code-doc_v3)]# 查看节点状态kubectl logs [color=var(--code-parameter_v3)]-f [color=var(--code-parameter_v3)]--tail [color=var(--code-number_v3)]200 pod名称 [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# 实时看pod日志【应急】kubectl [color=var(--code-function_v3)]exec [color=var(--code-parameter_v3)]-it pod名称 [color=var(--code-parameter_v3)]-n mysql -- /bin/bash  [color=var(--code-doc_v3)]# 进入podkubectl restart deployment 服务名 [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# 重启deployment(滚动重启,无停机)kubectl delete pod pod名称 [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# 删除pod(k8s会自动重建)kubectl apply [color=var(--code-parameter_v3)]-f xxx.yaml  [color=var(--code-doc_v3)]# 部署资源(yaml文件)kubectl delete [color=var(--code-parameter_v3)]-f xxx.yaml  [color=var(--code-doc_v3)]# 删除资源helm [color=var(--code-function_v3)]install kafka bitnami/kafka [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# helm一键部署kafka【★★★】helm list [color=var(--code-parameter_v3)]-n kafka  [color=var(--code-doc_v3)]# 查看helm部署的服务





三、中间件运维【★★★】(MySQL+Redis+Kafka+ZK,你的高频场景,排障 + 运维全覆盖)

✔️ MySQL 核心运维命令 + 实战工具【★★★| 应急 | 模板】(生产必用,排障 + 备份 + 优化)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# 基础连接mysql [color=var(--code-parameter_v3)]-uroot -p密码 [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-P3306  [color=var(--code-doc_v3)]# 远程连接MySQL[color=var(--code-doc_v3)]# 应急排障show processlist[color=var(--code-text_v3)];  [color=var(--code-doc_v3)]# 查看数据库连接,排查慢查询/锁等待【应急TOP1】show variables like [color=var(--code-parameter_v3)]'slow_query_log'[color=var(--code-text_v3)];  [color=var(--code-doc_v3)]# 查看慢查询日志是否开启show global status like [color=var(--code-parameter_v3)]'Threads_connected'[color=var(--code-text_v3)];  [color=var(--code-doc_v3)]# 查看连接数[color=var(--code-doc_v3)]# 慢查询分析【★★★】pt-query-digest /var/log/mysql/slow.log  [color=var(--code-doc_v3)]# 分析慢查询日志,定位慢SQL(必装percona-toolkit)[color=var(--code-doc_v3)]# 备份恢复【生产必配,模板可直接用】mysqldump [color=var(--code-parameter_v3)]-uroot -p密码 [color=var(--code-parameter_v3)]--databases 库名 --single-transaction [color=var(--code-variable_v3) !important]> /data/backup/库名_[color=var(--code-variable_v3)]$(date +%F).sql  [color=var(--code-doc_v3)]# 热备(无锁)xtrabackup [color=var(--code-parameter_v3)]--backup [color=var(--code-parameter_v3)]--user[color=var(--code-variable_v3) !important]=root [color=var(--code-parameter_v3)]--password[color=var(--code-variable_v3) !important]=密码 --target-dir[color=var(--code-variable_v3) !important]=/data/backup/mysql_full  [color=var(--code-doc_v3)]# 物理备份(速度快,推荐)[color=var(--code-doc_v3)]# 无锁改表【★★★】pt-online-schema-change [color=var(--code-parameter_v3)]--alter [color=var(--code-parameter_v3)]"add column age int" [color=var(--code-variable_v3)]D[color=var(--code-variable_v3) !important]=库名,t[color=var(--code-variable_v3) !important]=表名 [color=var(--code-parameter_v3)]--execute




✔️ Redis 核心运维命令【★★★| 应急】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







redis-cli [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-p6379 -a密码  [color=var(--code-doc_v3)]# 远程连接redis-cli [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-p6379 info  [color=var(--code-doc_v3)]# 查看Redis状态(内存/命中率/连接数)【应急】redis-cli [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-p6379 keys [color=var(--code-parameter_v3)]"*user*"  [color=var(--code-doc_v3)]# 模糊查key(生产慎用,大数据量会卡)redis-cli [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-p6379 flushdb  [color=var(--code-doc_v3)]# 清空当前库(测试环境用)redis-cli [color=var(--code-parameter_v3)]-h192.168.1.100 [color=var(--code-parameter_v3)]-p6379 bgsave  [color=var(--code-doc_v3)]# 手动触发持久化[color=var(--code-doc_v3)]# 排查缓存故障redis-cli info memory  [color=var(--code-doc_v3)]# 查看内存使用,排查内存溢出redis-cli info stats [color=var(--code-variable_v3) !important]| [color=var(--code-function_v3)]grep hit  [color=var(--code-doc_v3)]# 查看缓存命中率(低于90%需优化)




✔️ Kafka 核心运维命令【★★★| 应急】(你的重点,排障 + 运维全覆盖)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# 核心命令(kafka/bin目录下)./kafka-topics.sh --bootstrap-server [color=var(--code-number_v3)]192.168.1.100:9092 [color=var(--code-parameter_v3)]--list  [color=var(--code-doc_v3)]# 查看所有topic./kafka-topics.sh --bootstrap-server [color=var(--code-number_v3)]192.168.1.100:9092 [color=var(--code-parameter_v3)]--describe [color=var(--code-parameter_v3)]--topic test_topic  [color=var(--code-doc_v3)]# 查看topic详情(分区/副本)./kafka-consumer-groups.sh --bootstrap-server [color=var(--code-number_v3)]192.168.1.100:9092 [color=var(--code-parameter_v3)]--list  [color=var(--code-doc_v3)]# 查看消费组[color=var(--code-doc_v3)]# 排查消费堆积【应急TOP1,运维必查】./kafka-consumer-groups.sh --bootstrap-server [color=var(--code-number_v3)]192.168.1.100:9092 [color=var(--code-parameter_v3)]--describe [color=var(--code-parameter_v3)]--group test_group[color=var(--code-doc_v3)]# 手动创建topic./kafka-topics.sh --bootstrap-server [color=var(--code-number_v3)]192.168.1.100:9092 [color=var(--code-parameter_v3)]--create [color=var(--code-parameter_v3)]--topic test_topic [color=var(--code-parameter_v3)]--partitions [color=var(--code-number_v3)]3 --replication-factor [color=var(--code-number_v3)]2




✔️ Zookeeper 核心命令

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







zkCli.sh [color=var(--code-parameter_v3)]-server [color=var(--code-number_v3)]192.168.1.100:2181  [color=var(--code-doc_v3)]# 连接ZK[color=var(--code-function_v3)]ls /  [color=var(--code-doc_v3)]# 查看根节点[color=var(--code-function_v3)]ls /kafka/brokers/ids  [color=var(--code-doc_v3)]# 查看kafka的broker节点get /kafka/config/topics/test_topic  [color=var(--code-doc_v3)]# 查看topic配置





四、监控告警【★★★】(Prometheus+Grafana+Zabbix,生产必配,配置 + 核心命令)

[color=var(--md-box-body-color,var(--md-box-global-text-color))]核心原则:[color=var(--mdbox-blockquote-text-color,var(--md-box-global-text-color)) !important]Prometheus+Grafana 是云原生 / 容器首选,Zabbix 是传统物理机 / 虚拟机首选,两套组合的核心配置都是「采集指标→配置面板→告警规则」
✔️ Prometheus 核心配置(模板 + 常用 exporter)【模板】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]yaml


[color=var(--code-header-icon-color)]






[color=var(--code-doc_v3)]# prometheus.yml 核心配置(监控MySQL+Redis+K8s,可直接复制修改)global[color=var(--code-text_v3)]:  scrape_interval[color=var(--code-text_v3)]: 15s  [color=var(--code-doc_v3)]# 采集间隔scrape_configs[color=var(--code-text_v3)]:  [color=var(--code-text_v3)]- job_name[color=var(--code-text_v3)]: [color=var(--code-parameter_v3)]'node'  [color=var(--code-doc_v3)]# 监控服务器    static_configs[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- targets[color=var(--code-text_v3)]: [color=var(--code-text_v3)][[color=var(--code-parameter_v3)]'192.168.1.100:9100'  [color=var(--code-doc_v3)]# node_exporter端口  [color=var(--code-text_v3)]- job_name[color=var(--code-text_v3)]: [color=var(--code-parameter_v3)]'mysql'  [color=var(--code-doc_v3)]# 监控MySQL    static_configs[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- targets[color=var(--code-text_v3)]: [color=var(--code-text_v3)][[color=var(--code-parameter_v3)]'192.168.1.100:9104'  [color=var(--code-doc_v3)]# mysqld_exporter端口  [color=var(--code-text_v3)]- job_name[color=var(--code-text_v3)]: [color=var(--code-parameter_v3)]'redis'  [color=var(--code-doc_v3)]# 监控Redis    static_configs[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- targets[color=var(--code-text_v3)]: [color=var(--code-text_v3)][[color=var(--code-parameter_v3)]'192.168.1.100:9121'  [color=var(--code-doc_v3)]# redis_exporter端口  [color=var(--code-text_v3)]- job_name[color=var(--code-text_v3)]: [color=var(--code-parameter_v3)]'kafka'  [color=var(--code-doc_v3)]# 监控Kafka    static_configs[color=var(--code-text_v3)]:      [color=var(--code-text_v3)]- targets[color=var(--code-text_v3)]: [color=var(--code-text_v3)][[color=var(--code-parameter_v3)]'192.168.1.100:9308'  [color=var(--code-doc_v3)]# kafka_exporter端口




✔️ Grafana 核心操作【★★★】

  • 访问地址:http://IP:3000,默认账号密码:admin/admin
  • 核心:[color=var(--md-box-samantha-deep-text-color) !important]导入模板 ID → 不用自己画面板,直接用社区现成模板
    • 服务器监控模板 ID:1860(Node Exporter Full,最常用)
    • MySQL 监控模板 ID:7362
    • Redis 监控模板 ID:10175
    • Kafka 监控模板 ID:14282
  • 配置告警:对接钉钉 / 企业微信机器人,指标异常(比如 CPU>90%、MySQL 连接数 > 500)自动推送告警
✔️ Zabbix 核心操作

  • 访问地址:http://IP/zabbix,默认账号:Admin,密码:zabbix
  • 核心:[color=var(--md-box-samantha-deep-text-color) !important]链接模板 → 主机添加「Linux Server」「MySQL」模板,自动采集指标,不用手动配置

五、日志收集【★★★】(ELK/Loki,生产必配,核心配置 + 命令)

✔️ ELK 核心组件启动命令

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







systemctl start elasticsearch  [color=var(--code-doc_v3)]# 启动ESsystemctl start logstash       [color=var(--code-doc_v3)]# 启动日志采集systemctl start kibana         [color=var(--code-doc_v3)]# 启动可视化[color=var(--code-doc_v3)]# 访问Kibana:http://IP:5601 → 配置索引模式,即可检索日志




✔️ Loki 轻量日志方案(推荐中小厂,省资源,和 Prometheus 无缝对接)【★★★】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# 核心优势:比ELK省80%资源,配置简单kubectl apply [color=var(--code-parameter_v3)]-f loki.yaml [color=var(--code-parameter_v3)]-n monitoring  [color=var(--code-doc_v3)]# 部署Lokikubectl apply [color=var(--code-parameter_v3)]-f promtail.yaml [color=var(--code-parameter_v3)]-n monitoring  [color=var(--code-doc_v3)]# 部署日志采集器[color=var(--code-doc_v3)]# Grafana直接对接Loki,即可检索日志,不用额外配置Kibana




✔️ 日志检索高频语法(Kibana/Loki 通用,应急必用)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# 查指定关键词的报错ERROR AND 接口名:/api/user[color=var(--code-doc_v3)]# 查指定IP的日志source_ip:192.168.1.100[color=var(--code-doc_v3)]# 查指定时间段的日志@timestamp:[color=var(--code-text_v3)][[color=var(--code-number_v3)]2025-12-30T00:00:00Z TO [color=var(--code-number_v3)]2025-12-30T23:59:59Z





六、自动化运维【★★★】(Ansible+Jenkins+Shell 脚本,运维提效天花板,可复制模板)

✔️ Ansible 核心命令 + 实战 Playbook【★★★| 模板】(无客户端,批量操作首选,可直接复制)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-doc_v3)]# 基础命令(批量执行,应急首选)ansible all [color=var(--code-parameter_v3)]-i [color=var(--code-number_v3)]192.168.1.100,192.168.1.101 [color=var(--code-parameter_v3)]-m shell [color=var(--code-parameter_v3)]-a [color=var(--code-parameter_v3)]"systemctl restart kafka"  [color=var(--code-doc_v3)]# 批量重启kafkaansible all [color=var(--code-parameter_v3)]-i host_list [color=var(--code-parameter_v3)]-m yum [color=var(--code-parameter_v3)]-a [color=var(--code-parameter_v3)]"name=nginx state=installed"  [color=var(--code-doc_v3)]# 批量安装nginxansible all [color=var(--code-parameter_v3)]-i host_list [color=var(--code-parameter_v3)]-m copy [color=var(--code-parameter_v3)]-a [color=var(--code-parameter_v3)]"src=/data/config.conf dest=/etc/kafka/config.conf"  [color=var(--code-doc_v3)]# 批量同步配置文件




Ansible 实战模板【模板】(批量部署 Kafka,playbook.yml,可直接复制修改)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]yaml


[color=var(--code-header-icon-color)]






[color=var(--code-text_v3)]- hosts[color=var(--code-text_v3)]: kafka_nodes  [color=var(--code-doc_v3)]# 目标服务器组,在hosts文件定义  remote_user[color=var(--code-text_v3)]: root  tasks[color=var(--code-text_v3)]:    [color=var(--code-text_v3)]- name[color=var(--code-text_v3)]: 解压kafka安装包      unarchive[color=var(--code-text_v3)]: src=/data/kafka_2.13[color=var(--code-text_v3)]-2.8.1.tgz dest=/usr/local/    [color=var(--code-text_v3)]- name[color=var(--code-text_v3)]: 重命名目录      command[color=var(--code-text_v3)]: mv /usr/local/kafka_2.13[color=var(--code-text_v3)]-2.8.1 /usr/local/kafka    [color=var(--code-text_v3)]- name[color=var(--code-text_v3)]: 同步kafka配置文件      copy[color=var(--code-text_v3)]: src=/data/server.properties dest=/usr/local/kafka/config/server.properties    [color=var(--code-text_v3)]- name[color=var(--code-text_v3)]: 启动kafka服务      shell[color=var(--code-text_v3)]: cd /usr/local/kafka/bin [color=var(--code-variable_v3)]&& ./kafka[color=var(--code-text_v3)]-server[color=var(--code-text_v3)]-start.sh [color=var(--code-text_v3)]-daemon ../config/server.properties




✔️ Jenkins 核心操作(自动化部署流水线,运维 + 开发协作必备)

  • 访问地址:http://IP:8080,初始密码在 /var/lib/jenkins/secrets/initialAdminPassword
  • 核心流程:新建任务 → 配置源码地址(Git) → 配置构建步骤(打包 / 编译) → 配置部署步骤(Ansible 批量部署 / 拷贝到服务器) → 保存后「立即构建」,实现[color=var(--md-box-samantha-deep-text-color) !important]代码提交→自动打包→自动部署
✔️ Shell 脚本 实战模板【★★★| 模板】(3 个高频脚本,可直接复制粘贴使用,生产必用)

脚本 1:MySQL 自动备份脚本(mysql_backup.sh)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-variable_v3)]#!/bin/bash[color=var(--code-variable_v3)]BACKUP_DIR[color=var(--code-variable_v3) !important]=/data/backup/mysql[color=var(--code-variable_v3)]DATE[color=var(--code-variable_v3) !important]=[color=var(--code-variable_v3)]$(date +%F)[color=var(--code-variable_v3)]MYSQL_USER[color=var(--code-variable_v3) !important]=root[color=var(--code-variable_v3)]MYSQL_PASS[color=var(--code-variable_v3) !important]=你的密码mysqldump -u[color=var(--code-variable_v3)]$MYSQL_USER -p[color=var(--code-variable_v3)]$MYSQL_PASS [color=var(--code-parameter_v3)]--databases test_db --single-transaction [color=var(--code-variable_v3) !important]> [color=var(--code-variable_v3)]$BACKUP_DIR/test_db_[color=var(--code-variable_v3)]$DATE.sql[color=var(--code-doc_v3)]# 清理7天前的备份[color=var(--code-function_v3)]find [color=var(--code-variable_v3)]$BACKUP_DIR [color=var(--code-parameter_v3)]-name [color=var(--code-parameter_v3)]"*.sql" [color=var(--code-parameter_v3)]-mtime +7 [color=var(--code-parameter_v3)]-delete




脚本 2:服务器巡检脚本(server_check.sh,查 CPU / 内存 / 磁盘 / 端口,输出报表)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-variable_v3)]#!/bin/bash[color=var(--code-function_v3)]echo [color=var(--code-parameter_v3)]"=====服务器巡检报告 $(date +%F_%T)====="[color=var(--code-function_v3)]echo [color=var(--code-parameter_v3)]"CPU使用率: $(top -bn1 | grep "Cpu(s)" [color=var(--code-variable_v3) !important]| [color=var(--code-function_v3)]awk [color=var(--code-parameter_v3)]'{print $2}' [color=var(--code-variable_v3) !important]| [color=var(--code-function_v3)]cut -d. -f1[color=var(--code-text_v3)])%[color=var(--code-parameter_v3)]"echo "内存使用率: [color=var(--code-variable_v3)]$(free -h | grep Mem | awk '{print $3"/"$2}')[color=var(--code-parameter_v3)]"echo "磁盘使用率: [color=var(--code-variable_v3)]$(df -h / | grep / | awk '{print $5}')[color=var(--code-parameter_v3)]"echo "Kafka端口是否存活: [color=var(--code-variable_v3)]$(ss -tanlp | grep 9092 | wc -l)"




脚本 3:日志清理脚本(log_clean.sh,生产必配,防磁盘撑爆)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-variable_v3)]#!/bin/bash[color=var(--code-variable_v3)]LOG_DIR[color=var(--code-variable_v3) !important]=/var/log/kafka[color=var(--code-doc_v3)]# 清理7天前的日志,保留最新日志[color=var(--code-function_v3)]find [color=var(--code-variable_v3)]$LOG_DIR [color=var(--code-parameter_v3)]-name [color=var(--code-parameter_v3)]"*.log" [color=var(--code-parameter_v3)]-mtime +7 [color=var(--code-parameter_v3)]-delete[color=var(--code-doc_v3)]# 切割当前大日志[color=var(--code-function_v3)]logrotate [color=var(--code-parameter_v3)]-f /etc/logrotate.d/kafka




✔️ 定时任务 crontab【★★★】(所有自动化定时执行的基础,必配)

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]crontab [color=var(--code-parameter_v3)]-e  [color=var(--code-doc_v3)]# 编辑定时任务[color=var(--code-doc_v3)]# 示例1:每天凌晨2点执行MySQL备份脚本[color=var(--code-number_v3)]0 [color=var(--code-number_v3)]2 * * * /bin/bash /data/shell/mysql_backup.sh [color=var(--code-variable_v3) !important]> /data/backup/backup.log [color=var(--code-variable_v3) !important]2>[color=var(--code-variable_v3)]&1[color=var(--code-doc_v3)]# 示例2:每小时执行一次服务器巡检脚本[color=var(--code-number_v3)]0 */1 * * * /bin/bash /data/shell/server_check.sh [color=var(--code-variable_v3) !important]> /data/check/check.log [color=var(--code-variable_v3) !important]2>[color=var(--code-variable_v3)]&1[color=var(--code-doc_v3)]# 示例3:每天凌晨3点清理日志[color=var(--code-number_v3)]0 [color=var(--code-number_v3)]3 * * * /bin/bash /data/shell/log_clean.sh[color=var(--code-function_v3)]crontab [color=var(--code-parameter_v3)]-l  [color=var(--code-doc_v3)]# 查看所有定时任务





七、故障排查专项工具【应急 TOP】(按故障类型整理,查问题不用再翻命令,直接对号入座)

✔️ 服务器卡顿 / 负载高【应急】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







[color=var(--code-function_v3)]htop → 看进程CPU/内存占用 → 定位进程PIDiostat [color=var(--code-parameter_v3)]-x [color=var(--code-number_v3)]1 → 看磁盘IO,%util[color=var(--code-variable_v3) !important]>[color=var(--code-number_v3)]90%[color=var(--code-variable_v3) !important]=IO瓶颈[color=var(--code-function_v3)]vmstat [color=var(--code-number_v3)]1 → 看CPU上下文切换(cs),数值过大[color=var(--code-variable_v3) !important]=进程切换频繁




✔️ 端口不通 / 网络慢【应急】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







ss [color=var(--code-parameter_v3)]-tanlp [color=var(--code-variable_v3) !important]| [color=var(--code-function_v3)]grep 端口号 → 看端口是否监听[color=var(--code-function_v3)]ping IP → 看网络连通性telnet IP 端口号 → 看端口是否能访问tcpdump [color=var(--code-parameter_v3)]-i eth0 port [color=var(--code-number_v3)]3306 [color=var(--code-parameter_v3)]-w mysql.pcap → 抓包分析数据包是否正常




✔️ Java 服务卡顿 / 报错【应急】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







jps → 查看Java进程PIDjstack PID → 查看线程栈,排查死锁/线程阻塞【TOP1】jstat [color=var(--code-parameter_v3)]-gc PID [color=var(--code-number_v3)]1000 → 查看GC情况,排查内存泄漏jmap [color=var(--code-parameter_v3)]-dump:format[color=var(--code-variable_v3) !important]=b,file[color=var(--code-variable_v3) !important]=heap.hprof PID → 导出堆内存,分析内存溢出




✔️ 数据库慢 / 连接失败【应急】

[backcolor=var(--chat-bg-color,#fff)][color=var(--code-header-icon-color)][color=var(--code-header-text-color)]bash


[color=var(--code-header-icon-color)]运行







MySQL:show processlist → 查连接/锁等待;pt-query-digest → 查慢SQLRedis:redis-cli info → 查内存/连接数;redis-cli [color=var(--code-function_v3)]ping → 查连通性Kafka:kafka-consumer-groups.sh → 查消费堆积;zkCli.sh → 查zk节点是否正常





✅ 最后:运维必会工具优先级总结(精华版,面试必考)

[color=var(--md-box-body-color,var(--md-box-global-text-color))]不用贪多,吃透以下内容,足以应对 99% 的生产场景:

  • [color=var(--md-box-samantha-deep-text-color) !important]基础:Linux 核心命令、ssh 免密、rsync、screen、日志三剑客(grep/awk/sed)
  • [color=var(--md-box-samantha-deep-text-color) !important]容器:Docker/docker-compose 命令、kubectl 基础、helm 一键部署
  • [color=var(--md-box-samantha-deep-text-color) !important]中间件:MySQL 慢查询分析、Redis 状态查看、Kafka 消费堆积排查
  • [color=var(--md-box-samantha-deep-text-color) !important]监控:Prometheus 采集配置、Grafana 模板导入、告警规则配置
  • [color=var(--md-box-samantha-deep-text-color) !important]自动化:Ansible 批量命令、Shell 脚本模板、crontab 定时任务
  • [color=var(--md-box-samantha-deep-text-color) !important]排障:服务器资源排查、网络抓包、Java 进程分析、数据库连接排查
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2025 Discuz! Team.|蜀ICP备2025161238号-2

在本版发帖
关注公众号
QQ客服返回顶部
快速回复 返回顶部 返回列表