先提个醒,接下来讲的所有操作,如果你们公司有专门的测试环境集群,一定要先在测试环境练熟了再碰线上的核心业务机器,边缘测试的流量小,错了也好救,就像当年我师傅留我的那台一样。第一个必练的操作,肯定是远程安全登录Linux服务器,现在几乎所有公司都不会用root直接远程登了,多数是用普通用户加SSH密钥的方式,要是你们公司还在用密码登录,那劝你练完赶紧找机会提个安全加固的小 SSH密钥生成很简单,在你自己的本地电脑(不管是Windows还是Mac)的终端或者PowerShell里敲ssh-keygen -t ed25519 -C "你的姓名@你的公司缩写"就行,中间一路回车不用设置密码短语,除非你怕自己的本地电脑被别人随便用。生成完后要把公钥传到目标服务器,Mac或者Linux本地直接用ssh-copy-id -i ~/.ssh/id_ed25519.pub 普通用户名@目标服务器IP,Windows的话可以用Git Bash或者手动把公钥内容复制到目标服务器普通用户家目录下的.ssh/authorized_keys文件里,记得改一下权限chmod 700 ~/.ssh && chmod 600 ~/.ssh/authorized_keys,这是新手最容易漏的点,权限不对SSH密钥登不进去。
第二个操作,是核对目标服务器的身份信息,敲黑板敲黑板!当年我就是漏了这个才闯的祸。登进去之后别着急干活,先敲hostname看主机名对不对,再敲ip addr看公网私网IP是不是和你任务单上的一致,最后还可以敲cat /etc/motd(如果公司有配置登录提示的话)看一下有没有特殊的业务说明或者维护提醒,三重核对下来基本就不会出错了。核对完身份之后,你可以简单看一下这台服务器的健康状态,CPU用top或者更友好一点的htop(很多测试环境可能没装,线上核心服务器一般都有,测试环境可以先敲yum install htop -y或者apt install htop -y安装,记得先切到root或者用sudo,普通用户敲命令前面加sudo的话,系统会让你输入自己的密码,权限够不够要看你们公司的运维权限分配表),内存用free -h看更直观,磁盘用df -h就行,别只看根目录,要是有单独挂载的数据盘也要看一眼使用率,超过80%就要警惕了,别等占满了再处理,容易崩业务。

第三个必练的基础操作,是重启和关闭服务,别轻易用shutdown或者reboot重启整台服务器,除非整台机器彻底卡死了,不然只重启需要的服务就行。比如你们公司用的是Nginx做反向代理,修改了配置文件之后想重启生效,先敲nginx -t检查一下配置文件有没有语法错误,没错的话再敲systemctl reload nginx平滑重启,不会中断正在访问的用户;如果是有比较大的变更必须硬重启,就敲systemctl restart nginx。当年我师傅说,他见过太多新手改完Apache或者Nginx配置直接restart,结果配置有语法错误服务起不来,线上业务直接挂了半小时的情况,所以服务重启前必检查配置语法,这是第二个新手专属的避坑提醒。平滑重启和硬重启的区别你们可以自己去查一下,但入门阶段只要记住reload优先、restart次之、整台重启最后考虑就行。
好了,今天就先讲这三个最基础、最容易踩坑但又最实用的操作,剩下的用户管理、文件权限、日志查看这些内容我后面会慢慢更。你们在运维工作中有没有像我刚入行那样敲错IP或者重启错服务的经历?欢迎在评论区分享你的踩坑故事,大家一起避坑一起进步。

评论列表 (0条):
加载更多评论 Loading...