NVIDIA GPU 智算集群运维工程师 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
NascentCoreAI
V2EX    远程工作

NVIDIA GPU 智算集群运维工程师

  •  
  •   NascentCoreAI 2023-10-30 14:45:35 +08:00 1528 次点击
    这是一个创建于 713 天前的主题,其中的息可能已经有所发展或是发生改变。

    公司介绍: 算想未来是一家大模型算力云服务技术服务商;正在研发一款云原生、基于 K8s 的大模型训练平台软件产品;目前已有稳定营收、收支平衡、正在进行天使轮或 A 轮融资;算想未来的目标产品是开放的大模型算力云市场,一个匹配中小企业大模型算力需求与多样化的 GPU 算力供应源的开放式的、分布式的算力市场;该产品一方面解决算力供需匹配问题、另一方面基于算想未来大模型算力平台软件,提高算力使用效率、降低大模式算力用户使用成本。 算想未来团队来自 Google 等世界领先的大模型计算平台基础设施研发团队;创始团队合计超过 30 年的人工智能基础设施软件的研发经验。团队有丰富的创业经验,创始人是连续创业者,曾于 2019 年 4 月加入 Pixie ( https://px.dev ),作为创始团队成员和技术负责人,带领团队完成产品研发、并于 2020 年 12 月被纽约证券交易所上市公司 New Relic 收购,前后历时不到 2 年。 算想未来获得奇绩创坛天使轮融资;从全球超过 5000 家申请者中脱颖而出入选奇绩创坛 2022 年秋季创业营(录取率不到 1%)。团队帮助中国大模型团队迅速突破模型训练的算力墙,让大模型训练规模赶超 OpenAI 、Google ,打开大模型算法和 AI 应用迭代飞轮,让大模型发生在中国,让中国成为 AI 经济世代的领导者! 面试流程: 2 轮线上 1 轮线下

    薪资待遇

    • 20k-40k 12 月 工作亮点
    • 业界最热门的大模型及 AGI 赛道初创团队
    • Google 等世界顶级大模型 AI 算力平台技术专家带队;
    • 解决中国算力卡脖子难题,为中国大模型团队提供低成本、高性价比算力;
    • 与全球业界顶尖工程团队、高校教授、研究机构定时交流前沿技术;
    • 混合办公(北京、或远程)、平等沟通、极致扁平化团队;
    • 内部信息完全公开,为工程师打开产品、商业的大门;
    • 丰厚期权; 关键词 DevOps 、Kubernetes 、Docker 、Python 、运维开发经验 能力要求
    • 计算机及计算机相关专业本科或以上学历,熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
    • 独立解决生产环境中的技术问题,阅读英文技术文档
    • 精通 Linux 环境下 GPU 、IB 网络的运维管理、Kubernetes 运维管理
    • 熟悉 Kubeflow 、Ansible 、Ceph 、Harbor 等云原生工具
    • 熟悉 Golang 、Python 、Shell 等编程语言
    • 熟悉服务端基础技术(存储系统、数据库、消息队列、微服务、安全等)、熟悉分布式系统可扩展性机制和功能、熟悉 IaC ( Infrastructure as Code )最佳实践、熟悉公有云产品服务和系统架构
    • 坚持高质量 DevOps 工程实践(测试、集成、架构)、抱有 AI 信仰:坚信 AI 改变世界
    • 乐于并且善于与团队进行远程合作,在各种场合下卓越的沟通能力(代码、文档、即时通信工具、音视频会议、线下会议等等) 岗位职责
    • 对 NVIDIA GPU 智算集群服务器及 IB 网络进行配置、优化,适配 Kubernetes ;
    • 编写私有化部署的交付部署方案,编写部署和运维软件工具和脚本;
    • 指导私有化部署客户现场交付,根据用户需求、IT 资产具体情况,制定可靠、高效的交付部署方案;
    • 参与设计、开发 K8s 上的大模型训推平台;
    • 参与制定公司整体软件工程规范,持续迭代优化公司软件工程质量、提升工程团队研发效能、提升产品服务质量; 联系方式
    • 巩女士,Email: [email protected] ,手机:15910555162 (微信同手机号)
    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5972 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 35ms UTC 06:18 PVG 14:18 LAX 23:18 JFK 02:18
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86