AI 院--多模态音频团队--音频生成算法工程师（社招）

Z.ai • Onsite • 5 months ago

Apply

AI can make mistakes so check important info. Chat history is never stored.

Explore job details

Tailor my resume

Practice an interview

Develop new skills

Job Description

AI 院--多模态音频团队--音频生成算法工程师（社招）北京全职互联网 / 电子 / 网游职位描述1. 负责交互大模型中的音频生成、音频理解算法研究、训练、应用，包括但不限于指令控制TTS、语音理解、语义VAD、音频编解码器等。
2. 负责模型的多机多卡训练、高性能推理等；
3. 负责将生成技术落地到业务，熟悉语音合成中的SFT技术，并进行持续优化。
职位要求1. 硕士及以上学历，计算机、数学、通信等相关专业；具备良好的学习能力、逻辑思维能力、沟通协作能力；
2. 有三年及以上语音合成算法经验，或三篇及以上顶会论文（各类CCF-A会、ICASSP/INTERSPEECH等）；
3. 熟练使用Python和Pytorch/Tensorflow深度学习框架；
4. 对以下至少一种熟悉并有相关经验：
1）语音大模型的框架&理论，包括但不限于Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM；
2）音频理解大模型/ASR大模型，包括但不限于qwen-audio、sensevoice、whisper；
3）上一代语音合成模型，包括但不限于Tacotron、Fastspeech；
4）各类声码器的原理&优化，包括但不限于Hifi-GAN，MelGAN，BigvGAN；
5）有业务落地工程经验优先。投递

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry

IT & Software

Company Size

51-200 employees

Headquarters

Beijing, CN

Year Founded

Unknown

Website

zhipuai.cn

Social Media