
没有啥实际经验 业务运维经验 一直做到服务器硬件运维 大哥们这个问题应该怎么回答 软件方面的问题
1 seers 2023-01-03 16:17:41 +08:00 via Android 大概率是为什么程序、接口、数据库没反应了 |
2 kokutou 2023-01-03 16:18:45 +08:00 via Android 更新的同时保证业务。。。 |
3 AntonChen 2023-01-03 16:21:53 +08:00 OOM 、服务假死.... |
4 kindom 2023-01-03 16:49:49 +08:00 端口用、服耗用源突升排查、多隔服器校、 DNS |
5 opengps 2023-01-03 16:50:36 +08:00 慢 |
6 gold2022 2023-01-03 16:56:40 +08:00 内网 dns 失效,oom |
7 tf2 2023-01-03 17:02:47 +08:00 端口炸了 线程炸了 进程炸了 cgroup 炸了 pod 炸了 磁盘炸了 跳板机炸了 |
8 andyskaura 2023-01-03 17:07:59 +08:00 @lambdaq #7 机房炸了 |
9 106npo 2023-01-03 17:09:52 +08:00 via Android 机房空调坏了导致消防喷淋? |
10 wei2629 2023-01-03 17:10:23 +08:00 重启就好了 |
12 yaron 2023-01-03 17:30:25 +08:00 登录不上了 |
13 salmon5 2023-01-03 17:36:40 +08:00 难道不是硬盘爆了? |
14 Dragonish3600 2023-01-03 17:37:00 +08:00 via iPhone 硬盘满了 |
15 salmon5 2023-01-03 17:37:01 +08:00 难道不是 java 内存爆了? |
16 yongp 2023-01-03 17:39:39 +08:00 大概率就是想让你说一种故障,然后回答解决方案、如何监控、以及后续的优化方案吧 |
17 sampeng 2023-01-03 17:44:23 +08:00 没经验就说不知道。。不丢人 |
19 sampeng 2023-01-03 18:16:33 +08:00 @spr1ngs 面试是一个双向筛选的过程,尤其是运维,你靠网上问?就算面试过了,试用期但凡组长较真,试用期就过不去。太多细节了 |
20 cnoder 2023-01-03 18:28:23 +08:00 top1 硬盘满了 |
21 myd 2023-01-03 18:49:44 +08:00 磁盘满了说明运维根本没干活 |
22 MilkShake 2023-01-03 18:50:37 +08:00 数据查询慢,业务宕了。 |
23 xderam 2023-01-03 18:52:18 +08:00 变更啊,90%以上的故障都是变更引起的。 |
24 asilin 2023-01-03 18:57:06 +08:00 via Android 遇到最多的问题,就是给别人擦屁股 |
25 89ao 2023-01-03 19:03:20 +08:00 这是个开放问题,就是让你找个你最熟悉最牛逼的场景来秀技术,这不顺杆子爬吗 |
26 89ao 2023-01-03 19:30:07 +08:00 重点不在于什么问题,在于怎么秀。哪怕磁盘满,也可以从问题分析,影响面排查,监控发现,自动清理,故障恢复,应急预案等方面去展开 |
27 cndns 2023-01-03 19:45:24 +08:00 就说在项目文档里面把 Linux 拼写成 Linxu ,其他没什么大问题 |
28 wu67 2023-01-03 19:52:32 +08:00 硬盘爆的见的最多....数据量大又不优化, 然后那个日志越来越大越来越大, 有一次把一台机给直接整挂了, 嘻嘻嘻 /dog |
30 zhangyichent 2023-01-03 19:59:09 +08:00 显卡驱动掉了 |
31 snuglove 2023-01-03 20:20:47 +08:00 cpu 高的 内存高的 一些软件跑着跑着连不上的 一般都是看程序日志以及重启解决. |
33 deorth 2023-01-03 23:40:09 +08:00 via Android rm -rf / |
34 earneet 2023-01-04 09:09:43 +08:00 硬件频繁故障,服务部署在了自己公司机房,40 个物理机,两个月内两个 cpu 挂逼,三个硬盘挂逼。 找采购要说法,采购说也智能是照章程办事,后来迁移到了阿里云服务器上。 |
35 8355 2023-01-04 09:32:54 +08:00 你回答完之后楼上的回答之后下一个问题就问你怎么处理的?怎么排查为什么会这样以后你怎么避免再次出现你又说不出来了 上面让你踏踏实实直说你还不想....运维有没有经验连个后端都能问死你 |
36 proxychains 2023-01-04 09:44:37 +08:00 @earneet 第一次见 CPU 挂的 |
37 MoYi123 2023-01-04 10:05:42 +08:00 最多的肯定是更新代码更新出 bug 吧. |
38 dog82 2023-01-04 10:21:15 +08:00 慢 节点挂 重启 |
40 earneet 2023-01-04 13:20:54 +08:00 @proxychains 公司配给我的开发机 cpu 就挂过一个了 |
41 cshlxm 2023-01-04 18:41:32 +08:00 日志把数据盘打满了,数据库把数据盘打满了,新来的运维 rm -rf /*** 了, 服务器网断了,断电重启后服务没起来,硬盘挂了,硬盘挂载不上, 数据损坏造成服务启动不了,升级造成依赖库不可用了,端口冲突造成服务不可用了。。。 |
42 xiaochong2020 2023-01-05 12:37:22 +08:00 假如有一堆 4k 的小文件,占满了 90g 磁盘,你会怎么清理? |
43 apois 2023-01-05 16:08:08 +08:00 实际经验,翻周报,我们这边周报都会有记录问题和解决方案,如果是商业软件出现新问题的话,先联系售后技术支持解决,可以分担一半责任。 |
46 xyjincan 2023-01-06 09:17:20 +08:00 @xiaochong2020 迁移服务,格盘咋样 |