【时空数据流调度专家】
-职位描述
1、 承接端到端自动驾驶/大语言各类前沿AI模型负载,面向自研AI芯片,聚焦研发设计AI模型的数据流时空调度算法、编译软件栈,实现高性能推理;
2、 参与AI模型的时空数据流调度器构建,包括数学建模、算法开发、计算图优化,用简洁优美的数学方法,将大规模计算图负载切分、调度到自研AI芯片上,验证正确性、优化AI负载的推理性能;
3、 参与AI算子库的开发和优化,支撑算法模型推理所需算子的功能和基本性能要求,分析性能瓶颈,构建方案优化;
4、 与自研芯片架构师合作,协助芯片架构设计与演进,参与制定芯片软硬件协作方案。
-职位要求
1、计算机、软件、电子直接相关专业硕士及以上,或运筹学、数学类的基础专业硕士及以上;
2、5年以上 C/C++/汇编开发经验;
3、1年以上高性能算子优化、推理引擎或AI编译器开发经验,具备CPU/GPU/NPU深度性能优化经验者优先;
4、具备AI模型大算力调度、策略调优、高性能计算或相关项目经验者优先。熟悉图优化、主流深度学习算法者优先。
Base 北京/上海/杭州
【NPU编译器架构师】
-职位描述
1、负责设计和构建自研NPU编译器及工具链的核心架构;特别是跨模块接口设计、硬件抽象定义、编程模型设计、关键性能考量等方面。
2、编译器架构设计:聚焦于编译器(包含运行时)各模块间的接口设计。
硬件抽象定义:定义合理的NPU硬件抽象,在跨平台和发掘硬件效率之间找到最佳平衡。
3、开发者界面定义:定义编程模型和工具链界面,提升自定义算子开发和模型适配效能。
4、前沿技术研究:跟踪编译器技术(如MLIR、LLVM)、AI芯片架构及深度学习框架的最新进展,探索创新性解决方案。
-职位要求
1、教育背景:计算机科学、EE、数学或相关专业硕士及以上学历。
2、技术能力:深入理解计算机体系结构,熟悉SIMD、多核并行、内存层级优化等特性。
3、熟悉AI计算并行特征,roofline理论等,具备5年以上编译器开发经验,熟悉LLVM、MLIR、GCC等编译框架,有基于NPU/GPU/ASIC等架构的AI编译器开发经验者优先。
4、具备优秀的系统设计能力和技术领导力,能够主导复杂模块的设计研发。
5、良好的沟通能力,能够跨团队推动技术方案落地。
6、对AI芯片架构及编译器技术有热情,具备创新思维和问题解决能力。
加分项
7、有自研AI芯片编译器的完整开发经验。在顶级会议(PLDI、ASPLOS、MICRO等)或期刊发表过相关论文。
Base 北京/上海/杭州
【大模型框架开发工程师】
职位描述
1、负责设计,开发和优化大模型推理框架,使能理想汽车的自动驾驶/座舱大模型落地在自研芯片平台;
2、主要通过系统优化(量化,系统优化)的手段,提升大模型在芯片上的运行效率;
3、负责机器学习系统前瞻技术的调研和引入;
4、与算法和硬件部门深度合作,进行算法,软件,硬件的联合优化。
职位要求
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、精通C/C++,精通算法与数据结构,熟悉Python;
3、深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
4、熟悉深度学习算法基本原理,熟悉神经网络基本架构,了解至少一种深度学习训练或推理框架及其模型文件的解析,如Pytorch、Tensorflow;
5、熟悉TensorRT-LLM、VLLM等;
6、了解主流LLM/VLM模型,有LLM模型加速优化经验者优先;
7、了解MLIR,有MLIR开发经验者有限。
Base:上海
Base 北京/上海/杭州
薪资范围:40~80k,优秀候选人有股票
欢迎发送简历到yebin1@lixiang.com
也欢迎转发,有适合的朋友欢迎推荐!
-职位描述
1、 承接端到端自动驾驶/大语言各类前沿AI模型负载,面向自研AI芯片,聚焦研发设计AI模型的数据流时空调度算法、编译软件栈,实现高性能推理;
2、 参与AI模型的时空数据流调度器构建,包括数学建模、算法开发、计算图优化,用简洁优美的数学方法,将大规模计算图负载切分、调度到自研AI芯片上,验证正确性、优化AI负载的推理性能;
3、 参与AI算子库的开发和优化,支撑算法模型推理所需算子的功能和基本性能要求,分析性能瓶颈,构建方案优化;
4、 与自研芯片架构师合作,协助芯片架构设计与演进,参与制定芯片软硬件协作方案。
-职位要求
1、计算机、软件、电子直接相关专业硕士及以上,或运筹学、数学类的基础专业硕士及以上;
2、5年以上 C/C++/汇编开发经验;
3、1年以上高性能算子优化、推理引擎或AI编译器开发经验,具备CPU/GPU/NPU深度性能优化经验者优先;
4、具备AI模型大算力调度、策略调优、高性能计算或相关项目经验者优先。熟悉图优化、主流深度学习算法者优先。
Base 北京/上海/杭州
【NPU编译器架构师】
-职位描述
1、负责设计和构建自研NPU编译器及工具链的核心架构;特别是跨模块接口设计、硬件抽象定义、编程模型设计、关键性能考量等方面。
2、编译器架构设计:聚焦于编译器(包含运行时)各模块间的接口设计。
硬件抽象定义:定义合理的NPU硬件抽象,在跨平台和发掘硬件效率之间找到最佳平衡。
3、开发者界面定义:定义编程模型和工具链界面,提升自定义算子开发和模型适配效能。
4、前沿技术研究:跟踪编译器技术(如MLIR、LLVM)、AI芯片架构及深度学习框架的最新进展,探索创新性解决方案。
-职位要求
1、教育背景:计算机科学、EE、数学或相关专业硕士及以上学历。
2、技术能力:深入理解计算机体系结构,熟悉SIMD、多核并行、内存层级优化等特性。
3、熟悉AI计算并行特征,roofline理论等,具备5年以上编译器开发经验,熟悉LLVM、MLIR、GCC等编译框架,有基于NPU/GPU/ASIC等架构的AI编译器开发经验者优先。
4、具备优秀的系统设计能力和技术领导力,能够主导复杂模块的设计研发。
5、良好的沟通能力,能够跨团队推动技术方案落地。
6、对AI芯片架构及编译器技术有热情,具备创新思维和问题解决能力。
加分项
7、有自研AI芯片编译器的完整开发经验。在顶级会议(PLDI、ASPLOS、MICRO等)或期刊发表过相关论文。
Base 北京/上海/杭州
【大模型框架开发工程师】
职位描述
1、负责设计,开发和优化大模型推理框架,使能理想汽车的自动驾驶/座舱大模型落地在自研芯片平台;
2、主要通过系统优化(量化,系统优化)的手段,提升大模型在芯片上的运行效率;
3、负责机器学习系统前瞻技术的调研和引入;
4、与算法和硬件部门深度合作,进行算法,软件,硬件的联合优化。
职位要求
1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、精通C/C++,精通算法与数据结构,熟悉Python;
3、深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
4、熟悉深度学习算法基本原理,熟悉神经网络基本架构,了解至少一种深度学习训练或推理框架及其模型文件的解析,如Pytorch、Tensorflow;
5、熟悉TensorRT-LLM、VLLM等;
6、了解主流LLM/VLM模型,有LLM模型加速优化经验者优先;
7、了解MLIR,有MLIR开发经验者有限。
Base:上海
Base 北京/上海/杭州
薪资范围:40~80k,优秀候选人有股票
欢迎发送简历到yebin1@lixiang.com
也欢迎转发,有适合的朋友欢迎推荐!