
背景:2 年前端仔,面一个全栈岗,重前端 轻 golang 的
如题,第一次碰到问这种问题,我的回答是如果我能独立解决比如 0-2 小时内一般会处理,如果问题很棘手超过 2 小时我会倾向明天和其他同事到公司讨论解决方案。
不知道回答的对不对 hh ,v 友们一般是怎么回答的呢
1 BruceXu 15 小时 57 分钟前 生产 bug 有对应的流程.发版更不是一个人的事. 你偷偷解决和推到明天解决都是错误的. 别的就不多说了,第一时间通知领导总没错~ |
2 huang86041 15 小时 56 分钟前 不是互联网公司. 按我理解生产端的 bug 和研发有什么关系,第一时间不是找运维吗? |
3 zhengfan2016 OP @BruceXu 对哦。我居然忘记我小卡拉米根本就没有发生产环境的权限 ![]() |
4 wonderfulcxm 15 小时 49 分钟前 via iPhone |
5 aptupdate 15 小时 47 分钟前 via iPhone 先解决问题再追责,保证第一时间恢复生产服务。 |
6 winglight2016 15 小时 44 分钟前 lz 呆过的公司都没有 SOP 吗?我进前司的第一件事就是建立研发 SOP ,包括正式发版和线上问题,线上问题一般都是测试/QA 首先验证、记录到飞书项目里,然后和运营确认问题等级和解决方案,他们解决不了了才会找研发。大部分线上问题都是业务不走正常流程导致的,研发一般都有现成的解决办法给到运营,很少会走到研发这边加班解决。 |
7 lidongyooo 15 小时 44 分钟前 这明显是压力测试,还在这正经答呢。要我说:晚上不属于工作时间,非要修复额外打钱。否则公司倒闭了也得第二天再说。 |
8 levelworm 15 小时 44 分钟前 via iPhone 有 oncall 啊,先给他解决,不行就呼人。 |
9 zhengfan2016 OP @winglight2016 没,我基本呆的都是 0-20 人左右的初创公司,想去 100 人以上的基本就只有大厂外包这一个选项了 hh |
10 Pastsong 15 小时 30 分钟前 晚上不是工作时间,小问题不用处理,大问题走 oncall 流程 |
11 chainzhao188 15 小时 11 分钟前 建议老板花点钱取消晚上,永远只过白天 |
12 catazshadow 14 小时 59 分钟前 via Android 拔机房电源,第二天再说 |
13 spacebound 14 小时 50 分钟前 重点是晚上呀,面试官想听到的是接到 bug 通知,里面组织(配合相关人员进行排查),发布修复的版本。 也就是,加班! |
14 wqhui 14 小时 50 分钟前 紧急的就处理,不紧急的上班再说 |
15 dongzhuo777 14 小时 39 分钟前 肯定事 call 领导了 |
16 adimn 14 小时 25 分钟前 安抚客户, 推卸责任, 阿里云服务器的问题, 我们正在找阿里人解决问题 |
17 54xavier 14 小时 20 分钟前 不是应该先分析 bug 等级吗? 如果不会造成资金、资产损失,只是用户体验差那就拖到第二天,如果会有资金损失,能修复就尽快修复,修复不了考虑暂时下线功能,第二天有时间了好好解决。 |
18 HotieCutie 14 小时 20 分钟前 起床,修改 bug ,测试,更新上线,然后继续睡 |
19 layxy 14 小时 15 分钟前 出现问题第一时间上报啊,和领导反馈 bug 的影响,根据影响范围和等级确定是立即解决还是后续修复 |
20 paopjian 14 小时 10 分钟前 除非是本次更新的致命 bug, 优先回退保证使用, 其他情况都重走开发流程 做 bugfix 开发 |
21 yhxx 14 小时 4 分钟前 如果是个普通国内公司,并且你是真的很想要这份工作,建议你直接背: **立刻** 上报安全生产负责人/值班分管领导等,同时判断严重级别,经领导确认后向相关人员(研发、运营、安全、公关、政府事务等)同步 同时分析事故原因,确认影响面,提供止血方案,如回滚、降级、关闭开关等供负责人决策(啥都没有?等死吧 :doge: 但是既然这是面试,就提前准备一下啊,“为了预防这种情况,我领导建设了整套发布流程,遇到故障可 xx 秒内做到 xxxx”) 成立故障响应小组,确认处理方案,定时同步进展、风险、预估恢复时间 问题解决后,等大家休息好,复盘,查原因、补文档、补监控、补测试,避免同类问题再次发生。 |
22 nuansediao 13 小时 55 分钟前 谁好人家晚上还看钉钉阿? |
23 fao931013 13 小时 46 分钟前 回滚 即答 |
24 blackmatch 13 小时 45 分钟前 公司肯定要有一套执行流程,建议了解一下这方面。 总的原则是:先尽快让业务恢复正常。 一般的流程是:oncall -> 值班人员评估影响 -> 摇人(包括测试、研发等)-> 给出解决方案 -> 执行修复 -> SIT/staging 验证 -> 发版 -> 生产环境验证 -> 输出报告、复盘优化。 如果影响很小,可以第二天处理,按照公司制定的 SOP 流程走。 |
25 z327774948 13 小时 45 分钟前 跟你有啥关系,项目和代码都属于老板,出 bug 也是老板的 bug ,不是你的 bug[dog 狗头保命] |
26 banmuyutian 13 小时 41 分钟前 问出这种问题的基本都是小作坊。。 |
27 mosesyou 13 小时 40 分钟前 1. 线上故障平时要有 sop 2. 1 分钟发现问题,5 分钟定位问题,10 分钟解决问题;对应做好日志、监控、告警、devops |
28 lifei6671 13 小时 32 分钟前 @huang86041 互联网公司没有独立运维,开发者本身就兼职运维了。 ![]() |
29 0x663 13 小时 27 分钟前 看是什么情况,toB 的业务先安抚客户情绪,然后关掉手机睡觉,明天起来把问题抛群里。 公司自营业务的话,问问他们有没有按照规范走流程,先把 BUG 提禅道,然后关掉手机睡觉,明天起来再说。 |
30 DrakezZ 13 小时 26 分钟前 下班不看工作群 上班再说吧 |
31 iixy 13 小时 13 分钟前 给领导打电话,逐级上报请示。 |
32 yongp 13 小时 11 分钟前 一般都是先回滚版本止损,再复现问题,修复 Bug |
33 dudubaba 12 小时 53 分钟前 面试时:第一时间定位解决,解决不了主动找相关责任人协助,先保证系统功能正常。 实际上:大半夜的关我屁事啊,天塌了第二天不能解决吗?关机睡觉! |
34 korvin 12 小时 51 分钟前 |
35 Hidetodong 12 小时 41 分钟前 先回滚保证服务起来 |
36 duuu 12 小时 28 分钟前 看面试官想考你什么,要区分很多不同的情景。 1.面试官想知道你对上线流程有没有概念,前面楼里有很多回答都可以参考,不过也要分情况,比如刚上线的晚上可以回滚,上线了一个月突然出 bug 还能回滚吗?那还是需要走流程,上报,判断 bug 级别 2.面试官想知道你的到来能给团队带来什么,比如是一个初创团队,上线不规范,经常生产遇到 bug ,就会想知道你怎么解决,你这个回答没问题,是解决短期问题的情形,然后再考虑长期解决,你可以最后再附带上说,如果经常遇到这个问题,你会推进建立上线流程规范,来完善这个问题。 3.面试官只是机械性的问你一些问题面试,正好问到这个,或者说你判断不出来面试官是什么想法。你就结合公司规模自己来判断,来选择 1 还是 2 ,结合自己以前公司的经验,也可以结合 1 和 2 来一起回答。反正就是答的全一点 |
37 geminikingfall 12 小时 7 分钟前 该怎么办怎么办,他们公司没有规范吗? |
38 ryd994 10 小时 9 分钟前 via Android 面试是双向选择。 如果你可以不去这家公司,那就硬气地告诉他,下班时间不处理工作问题。业务受影响?你知道业务会受影响为什么不提前安排 oncall ? 如果你没得选,那就捏着鼻子告诉他,你愿意立刻起来工作,并叫醒全部同事一起 |
39 unused 10 小时 0 分钟前 先把老板叫起来开会 |
40 chenluo0429 8 小时 59 分钟前 via Android 你这个几乎是零分回答了。整体的处理流程其实都差不多了,只是根据你的角色不同,在不同的阶段措施有差异而已,基本就是自己执行或者上报推动其他人执行的区别。 首先肯定是确定问题现象,恶性程度,影响范围。然后初步分析大致原因,解决难度,能否回滚,并结合之前的问题信息,来选择修复/回滚/不修复。如果问题较为严重,但是选择修复的话,视情况让另一拨人同时评估回滚影响,随时准备回滚。 |
41 sakeven 8 小时 12 分钟前 先评估影响,影响小的慢慢看。影响大的先止血,具体怎么止血看故障的直接原因,同时上报到主管和相关团队。止完血之后,慢慢查根因和修复。后续再来一个故障复盘啥的,除了 bug 本身,看看哪些环节可以优化。 |
43 bk201 8 小时 1 分钟前 你应该问他公司规定是啥?按规定来。 |
44 arischow 7 小时 57 分钟前 bug 又不是 outage ,当然是上班再看( |
45 tangping 6 小时 14 分钟前 当然是先把领导喊起来再说 |
46 zhangpulin 6 小时 11 分钟前 不应该是先分析,再判断优先级,严重 bug ,摇参与人一起干,自己干,锅自己承担 |
47 feller 1 小时 7 分钟前 via iPhone 做个提示页面(出事了把页面开关打开。),提示系统正在维护,禁止使用。处理后,关闭开关,恢复正常。 |