机器学习平台大模型实习生
岗位职责
1、参与前沿技术的调研与探索,包括对新兴的大模型架构、工程基建及应用场景的研究,尝试开发demo,验证可行性;
2、参与大模型相关应用的设计与开发工作,开发对话类、Agent类等智能应用;
3、参与大模型推理过程的优化,研究如何提升推理速度与效率,探索推理加速方法(如模型压缩、量化等)以应对实际场景中的计算资源限制;
4、参与构建和优化大模型训练的工作流和pipeline,协助实现从数据输入、模型训练、微调到推理和部署的自动化流程,提高开发效率。
岗位基本要求
1.本科及以上学历,计算机科学、软件工程、人工智能、数据科学等相关专业优先。
2.熟悉至少一种编程语言,如Python、Java、C++等,了解常见的开发工具和环境;
3.具备良好的团队合作能力和沟通能力,有较强的学习能力和解决问题能力。
具备以下条件优先
1、具备参与实际大模型项目经验,具备一定的数据分析和处理能力,了解数据可视化工具和方法者优先;
2、对机器学习、深度学习以及自然语言处理相关算法有一定的了解,熟悉大模型框架者优先。