一个专业的系统运维人员,最多能管理多少台服务器? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Showfom
26.38D
2.12D
V2EX    问与答

一个专业的系统运维人员,最多能管理多少台服务器?

  •  
  •   Showfom
    PRO
    2013-05-28 20:22:04 +08:00 8278 次点击
    这是一个创建于 4569 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近快吐血了,管理200多台服务器,还不是一个机房的,给一个客户管理。。。

    然后今天突然几十台机器出问题。。。

    所以想问问,一个专业的运维人员,最多一个人能管理多少台服务器?
    34 条回复    1970-01-01 08:00:00 +08:00
    blankyao
        1
    blankyao  
       2013-05-28 21:44:21 +08:00
    很好奇这200多台是咋管理的,有啥批量管理的办法没?
    DH
        2
    DH  
       2013-05-28 21:47:02 +08:00
    专业的不在管理多少台吧,而是看维护负载多强的系统。
    iqri2000
        3
    iqri2000  
       2013-05-28 21:48:53 +08:00
    监控程序、批量化脚本、puppet、OSA等平台。
    10台、50台、200台应该都差不多了。
    Zhang
        4
    Zhang  
       2013-05-28 21:48:57 +08:00
    在谷歌一个SA要管理4000-5000台服务器(道听途说的)。
    Ultratude
        5
    Ultratude  
       2013-05-28 21:50:56 +08:00 via iPhone
    DD 那个用户?
    plprapper
        6
    plprapper  
       2013-05-28 21:56:18 +08:00
    看标准化程度吧,如果是一个公司的不同业务,那应该可以管理500的样子。如果标准化程度差,自动工具又不多,200-300已经非常累了。
    feiandxs
        7
    feiandxs  
       2013-05-28 22:00:40 +08:00   1
    不专业的代维表示刚统计了下,截止20130528晚21:30分,我手下保持管理的客户的服务器有213台,包含独立服务器,vps,系统横跨各发行版linux和windows ,有半数服务器是最常见的LNAMP架构,剩下一半乱七八糟干什么的都有……

    我的工具不多,puppet,监控之类,但用的最顺手还是自己这几年攒下来的脚本,其实也都网上抄过来再改的。

    每天实际工作时间大约10小时,算比较累……但再加100台机器,我估计还是10小时。因为这几年我的工作时间好像就没变过。
    qiuai
        8
    qiuai  
    PRO
       2013-05-28 22:12:15 +08:00
    @feiandxs 求开源或者分享一些工具。。。
    ericFork
        9
    ericFork  
       2013-05-28 22:19:59 +08:00
    想提高管理的数量和整个集群的可用性,主要就靠监控、自动化、冗余吧

    人:机器数的比并不固定,看上面的做得如何了
    feiandxs
        10
    feiandxs  
       2013-05-28 22:29:06 +08:00
    @qiuai 工具脚本都是网上现成的,我大部分时间只是按照自己的习惯和需求修改一些,让自己用的更顺手,每个人面对的状况都是不同的。。。

    要说最好用的工具,excel和todolist……

    不过过段时间可以整理下把自己用的py shell perl脚本们扔上来一些。
    Showfom
        11
    Showfom  
    OP
    PRO
       2013-05-28 22:43:29 +08:00
    @Ultratude 小DD,乃回家了没
    Showfom
        12
    Showfom  
    OP
    PRO
       2013-05-28 22:44:22 +08:00
    @feiandxs 求联系方式,求来我公司工作~~
    Showfom
        13
    Showfom  
    OP
    PRO
       2013-05-28 22:45:59 +08:00
    @Zhang 同一个机房好管理啊,要么都内网 IP,要么外网 IP 都连续的。

    关键是我这都是分布在各个不同的机房的, IP 都不是连续的,超级乱。。。。
    c0878
        14
    c0878  
       2013-05-28 22:54:29 +08:00
    管理不同业务 不同系统的服务器比较累 最累的是做idc售后技术支持 客户各种环境各种乱搞 google那种都是上百台跑集群的 方便批量自动管理
    halfbloodrock
        15
    halfbloodrock  
       2013-05-28 22:57:53 +08:00
    曾经最高管理的线上机器约4500+。。。

    线上机器主要依赖的自动化手段有perl,shell的脚本,一个商业化的自动化工具。因为当时还没有puppet还没产生。

    最头疼的其实还是机器上线之前的安装。因为当时没有配置管理工具,build team安装系统总是会给你来点不一样。。。上线之后经常遇到因为build时候的不完善而导致的各种问题。
    Showfom
        16
    Showfom  
    OP
    PRO
       2013-05-28 22:57:53 +08:00
    @c0878 啊是啊,我就是做 IDC 的!!!!!各种客户都见过了 有很多很无语的 哎 今天碰到一个客户,几百G硬盘都特么的 HTML,电影站,小说站,全采集的那种。。。。
    Showfom
        17
    Showfom  
    OP
    PRO
       2013-05-28 22:58:36 +08:00
    @halfbloodrock 上次碰到一个客户来问我为毛单个文件下无法放 10 万个文件。。。。一问,全特么的放 Flash 小游戏的 swf 文件。。。 10 多万个文件都放在一个目录下。。。
    Showfom
        18
    Showfom  
    OP
    PRO
       2013-05-28 22:59:13 +08:00
    @halfbloodrock 求联系方式取经
    merlin852
        19
    merlin852  
       2013-05-28 23:36:46 +08:00 via Android
    @feiandxs +1 同感!
    linux下还好,批量ssh+脚本命令基本都能搞定,win很麻烦,dos,powershell功能有限(可能我知道的不多,脚本功力有限),操作起来真的很烦,特别是同一个东西得重复做好多次
    ohhe
        20
    ohhe  
       2013-05-28 23:42:23 +08:00
    你的t.tt是在哪里的服务器上,感觉速度不错
    求购买链接
    Showfom
        21
    Showfom  
    OP
    PRO
       2013-05-29 00:05:09 +08:00
    @ohhe 你访问到了哪个 IP?我用了四个机房做 DNS 轮转呢。。。
    Showfom
        22
    Showfom  
    OP
    PRO
       2013-05-29 00:05:35 +08:00
    @ohhe 目前有美团云,42qu 的天坛,elinkvps,还有xehost
    likuku
        23
    likuku  
       2013-05-29 00:32:56 +08:00
    @Showfom zfs 吧,单个目录下2^48个文件最多。。。
    ohhe
        24
    ohhe  
       2013-05-29 00:45:13 +08:00
    @Showfom 218.245.3.241
    swulling
        25
    swulling  
       2013-05-29 01:49:52 +08:00
    @Zhang 这个数字只多不少。
    swulling
        26
    swulling  
       2013-05-29 01:51:33 +08:00
    @Zhang 貌似我的形容有问题,Google OP人均 4k的机器是事实,非常厉害
    swulling
        27
    swulling  
       2013-05-29 01:53:53 +08:00
    @c0878
    @Showfom 其实主要和服务和机器有关

    假如同样的配置,同样的服务,500台和1000台有啥大的区别么。

    最伤心的是机器配置不一样,环境不一样,上面跑的服务五花八门。。
    Showfom
        28
    Showfom  
    OP
    PRO
       2013-05-29 03:30:14 +08:00   1
    @ohhe 这个是 vps.42qu.com 的天坛机房
    Showfom
        29
    Showfom  
    OP
    PRO
       2013-05-29 03:30:48 +08:00
    @swulling

    机器配置不一样,系统不一样,机房不一样。。。。唯一一样的就是所有国外大大小小的机房都有坑爹的地方。。。
    happlebao
        30
    happlebao  
       2013-05-29 06:05:46 +08:00
    @swulling OP 指代什么?搜不到啊。
    BackBox
        31
    BackBox  
       2013-05-29 08:35:05 +08:00
    @feiandxs
    @halfbloodrock
    求联系方式,,取经。
    swulling
        32
    swulling  
       2013-05-29 10:58:24 +08:00   1
    @happlebao 运维工程师,现在流行叫devops
    happlebao
        33
    happlebao  
       2013-05-30 02:17:04 +08:00
    @swulling 再问一下,OP是哪个词组的缩写?我就查得到SA是system administrator。
    swulling
        34
    swulling  
       2013-05-30 10:44:17 +08:00
    @happlebao
    DevOps (a portmanteau of development and operations)
    --- Google
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5277 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 07:14 PVG 15:14 LAX 23:14 JFK 02:14
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86