logo of xiaohongshu

小红书【Ace顶尖实习生】云原生多集群AI调度技术研究

实习兼职基础后端地点:杭州 | 上海 | 北京状态:招聘

工作描述


任职要求

1、不限年级,本科及以上在读,人工智能/计算机/软件工程等相关专业优先;
2、优秀的代码能力,熟练掌握至少一门编程语言,包括但不限于Python/C/C++/Java/Go等其中一门开发语言;
3、有分布式系统/数据库系统/云原生等相关技术的研究和开发经验优先;
4、在顶级学术会议或期刊发表论文或有深入研究经历者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。

工作职责

随着公司AI业务的快速增长,单一 Kubernetes 集群往往无法满足大规模 AI 训练和推理任务的需求。业务通常需要管理多个 Kubernetes 集群或者多云的GPU资源,以实现工作负载的统一分发、部署和管理。

云原生多集群AI调度就是在云原生环境下,探索通过多集群管理技术对复杂且多样的AI负载进行高效调度和资源管理,兼顾弹性扩展,实现全局资源效率和任务执行效率的提升。
包括英文材料
Python+
C+
C+++
Java+
Go+
分布式系统+