电话:020-82402647
关闭
面向大语言/多模态模型的KVCache显存和IO/bit位优化推理-A Star 83300-83300元 收藏 投递简历 立即沟通
您当前的位置: 首页 > 职位列表 > 职位详情
2025-09-18 更新被浏览:

面向大语言/多模态模型的KVCache显存和IO/bit位优化推理-A Star

83300-83300元
广东 · 广州 · 海珠区 · 不限经验 · 硕士学历
职位描述
小程序
微信小程序
↑微信扫上方二维码↑
即可在微信小程序内查看并分享
微信扫码分享
微信扫一扫:分享
↑微信扫上方二维码↑
便可将本文分享至朋友圈
  • 招聘人数:1 人
  • 性别要求:不限性别
工作内容:1、负责研发软硬件协同的优化能力,提升阿里云训推场景在异构资源上计算性能,进一步提高资源利用率; 2、负责设计、实现、维护 AI 和高性能计算所需要的大模型推理场景的性能优化,聚焦模型通信场景的能力建设,完善集合通信、点对点通信等通信方式与推理框架的联合方案设计,推动提升推理性能。 岗位要求:1、分布式系统、计算机体系结构、编译优化或通信与计算协同设计方向的博士研究生; 2、具备AI训推/推理计算性能分析与优化的经验,能深入分析AI模型在GPU平台上的性能瓶颈,提出并实施优化方案;针对分布式训练和推理系统,进行性能调优,提升系统的吞吐量和效率; 3、熟悉业界常见的优化栈(cuda/rocm/cutlass/ck/triton等),在高效的内存管理、通信优化(NvLink/Infiniband/RoCEv2等)关键技术上有实操经验; 4、分布式系统研发经验是加分项:设计和实现高效的分布式训练和推理框架,解决大规模分布式系统中的通信、同步和负载均衡问题;探索新型的分布式架构,提升系统的可扩展性和容错性; 5、前沿技术研究:跟踪AI Infra领域的最新研究进展,探索新的硬件架构、算法和系统优化技术;发表高水平学术论文,参与国际顶级会议(如ISCA、MICRO、OSDI、SOSP、ATC、NSDI等)。
联系我时就说是在 中智聚才网 上看到的
职位发布者
李童 经理 立即沟通
电话:188****4926 微信扫码查看
地址:广东/广州/海珠区
中智聚才网安全提示
求职过程请勿缴纳费用,谨防诈骗!若信息不实请举报。
该公司的其他职位
生成职位海报
分享到朋友圈
问公司
对职位有疑问?快来问问吧
简历投递成功
您可以在 个人中心 - 简历管理 - 我的简历 中查看您创建的简历
您可能感兴趣的职位:
关注微信公众号
投递结果早知道
联系方式
联系我时,请说是在中智聚才网上看到的
中智聚才网平台核验
实地核验
平台已实地走访用人单位核实企业地址信息
中智聚才网平台核验服务
我们会对职位信息进行全面考察,竭尽全力为您打造安全的求职环境
知道了
正在获取二维码...
请使用微信扫一扫
微信扫码查看
客服服务热线
020-82402647
(工作日)9:00-19:00
微信公众号
手机浏览

Copyright C 2021 All Rights Reserved 版权所有 中智广州经济技术合作有限公司 粤ICP备19129036号-5 44010402002617

地址:广州市越秀区中山三路33号中华国际中心B塔43楼 EMAIL:gzzq@ciicgz.com

人力资源证: 440104190030

Powered by PHPYun.

关注

用微信扫一扫

反馈
顶部