岗位职责
岗位职责:1. 承担基于GPT系列或者其他开源大模型的开发和调优工作,包括训练流程搭建、指令微调、P’ompt工程以及面向下游任务的效果优化等;2. 完成大规模预训练模型在到店业务场景中的应用落地,支持业务目标提升。3. 紧跟业界大模型进展,探索前沿技术,解决到店业务的实际问题,包括智能问答、图文内容生成等;4. 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案。岗位基本要求:1. 有大语言模型(LLM)预训练经验,熟悉相关技术细节和优化策略,如大规模语料收集、模型调优优化、自弱监督学习、强化学习等2. 有小样本学习 (Few-shot learning)、提示学习(P‘rompt learning)等相关技术经验;3. NLP相关领域3年以上经验,具有扎实的算法理论基础,熟练掌握自然语言主要算法模型,如实体识别、知识抽取等。熟悉NLP主流大模型,如ChatGPT/T5/PaLM/LLaMA/GLM等,对模型背后的原理和各自适用场景有深入的理解; 4. 有基于Tensorflow、PyTorch等深度学习框架的实战项目经验;5. 具备较强的团队协作能力和沟通能力,有较强的学习能力和业务分析及问题解决能力。具备以下优先:1. 具有生成式模型训练及开发经验、信仰AIG者优先;2. 有NLP、多模态研发背景,对QA/机器翻译/图文生成相关领域有深入理解的优先。3. 对大规模预训练语言模型技术现状和发展趋势有深刻的理解和认知,并对相关技术有极高的热情。4. 计算机相关专业博士优先, 发表过大模型相关研究AI顶会论文优先; 5. 具备有良好的代码开发能力,有开源项目开发经验优先。
工作地址
沙坪坝区-沙坪坝区 (重庆沙坪坝区磁器口南街4号2-1(2楼)) 查看地图
