家人们, NV 机会来啦~[上海/北京/深圳] [NVIDIA 英伟达] [深度学习岗位] - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
外包信息请发到 /go/outsourcing 节点。
不要把相同的信息发到不同的节点
zoe1016aaa
V2EX    酷工作

家人们, NV 机会来啦~[上海/北京/深圳] [NVIDIA 英伟达] [深度学习岗位]

  •  
  •   zoe1016aaa 2023-07-24 10:50:04 +08:00 1973 次点击
    这是一个创建于 810 天前的主题,其中的信息可能已经有所发展或是发生改变。

    [ 地点 ] :Shanghai/Beijing/Shenzhen

    [ 发送简历到 ] :[email protected]

    [ WeChat 可加微信 ] :18867144803

    代码能力〉工作年限

    1---Deep Learning Performance Architect-Compiler/LLM-TensorRT

    主要做的是围绕深度学习端到端的 AI 软件全栈,包括但不限于训练框架、核心计算库、推理优化工具(比如 TensorRT ),AI 编译器,模型压缩等全栈软件栈。以及可以在 AI 软件全栈基础上影响到下一代甚至下两代硬件架构的特性设计。

    Required skills: 良好 C++编程,熟悉 AI 软件栈底层或者计算机体系结构,熟悉上层算法与 Python 是加分项。

    地点:北京与上海

    2---Deep Learning Performance Architect-TensorRT

    负责 NVIDIA 深度学习推理引擎 TensorRT 的设计、开发和维护工作(e.g. TensorRT 模型导入的流程和相关工具,图优化,算子的 CUDA 实现及代码生成,算子性能优化等),以及对当前主流的深度学习模型使用 TensorRT 进行推理的性能进行分析和优化。同时,还将与 NVIDIA GPU 体系结构设计团队合作来推动 NVIDIA 深度学习解决方案的软硬件协同设计和研发。

    岗位基本要求: 熟练掌握 C++编程

    其它密切相关的技能 /经验: 深度学习框架 /深度学习编译器开发,性能分析 /建模 /优化相关的方法论 /工具,计算机体系结构相关知识,CUDA kernel 开发 /优化

    地点:北京与上海

    3---Deep Learning Performance Architect-Operator

    主要做的是针对不同 GPU 架构为 TensorRT, cuDNN, cuBLAS, cuSPARSE 等深度学习算子库提供高性能基础算子以及算子融合实现,包含在线代码生成,代码融合等相关开发工作,以及根据当代 GPU 优化瓶颈影响后续硬件架构特征设计和验证工作。

    Required skills: 良好 C++编程,熟悉计算机体系结构, 有 TVM, MLIR 相关开发经验是加分项。

    地点:上海与北京

    4---Deep Learning Performance Architect

    主要做的是围绕运算架构的全栈优化,包括但不限于深度学习模型分析与预测,架构的性能分析,编译器性能分析以及对主流运算架构,软件生态的分析。使 NVIDIA 软件生态与计算架构更好的支持主流应用。

    Required skills: 良好 C++/Python ,熟悉 AI 软件或者计算机体系结构。

    地点:北京与上海

    5---Developer Technology Engineer-AI

    客户的深度学习和高能性计算应用在 NVIDIA 生态上的移植和优化。这些应用包括大语言模型,CV ,Speech,推荐系统和分子动力学,计算力学,计算量子化学等。通过算法和工程优化,提供系统级的优化方案。深度与内部架构和产品团队合作,构建和完善 NVIDIA 软硬件加速生态。

    Required skills: Required Skills: 良好 C/C++编程能力,分析能力和沟通能力,熟悉深度学习或 GPU 加速计算软件栈,扎实的深度学习理论基础或精通 GPU 架构和优化。

    地点:北京,上海与深圳

    6---自动驾驶算法部署岗位

    你将从事的工作

    分析客户或内部团队提出的 cuDNN 和 TensorRT 稳定性和性能问题

    与分布在美国、亚太地区和印度的国际团队合作开发 cuDNN 和 TensorRT 。

    从分析和开发中提取功能需求或常见问题,并生成文档

    我们需要看到什么?

    要求计算机科学或电子工程学士学位,硕士学位优先。

    3-5 年以上相关工作经验

    具有较强的 C 、C++ 和/或 python 编程技能

    了解流行的推理网络和层级

    具有使用 Caffe 、TensorFlow 或 Torch 等深度学习框架的工作经验

    英语和普通话书面和口头表达能力强

    能够在多元化的团队环境中与跨部门的同事良好合作

    具有很强的客户沟通能力,积极主动地提供所需的高响应支持

    地点:上海

    3 条回复    2023-07-26 11:44:48 +08:00
    yanbc
        1
    yanbc  
       2023-07-25 18:38:21 +08:00
    NVIDIA 都没有人回复讨论吗?连个”薪资范围都没有“的吐槽都没有?(纯好奇哈
    zoe1016aaa
        2
    zoe1016aaa  
    OP
       2023-07-26 11:08:52 +08:00
    @yanbc 可能大家就默默收藏一下吧,我们的薪资还是比较有竞争力哈哈
    deplivesb
        3
    deplivesb  
       2023-07-26 11:44:48 +08:00
    自知自愧不如,就不凑热闹了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2647 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 13:59 PVG 21:59 LAX 06:59 JFK 09:59
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86