Z.ai

AI 院--多模态音频团队--音频生成算法工程师(社招)

Z.ai  •  Onsite  •  5 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

AI 院--多模态音频团队--音频生成算法工程师(社招)北京全职互联网 / 电子 / 网游职位描述1. 负责交互大模型中的音频生成、音频理解算法研究、训练、应用,包括但不限于指令控制TTS、语音理解、语义VAD、音频编解码器等。
2. 负责模型的多机多卡训练、高性能推理等;
3. 负责将生成技术落地到业务,熟悉语音合成中的SFT技术,并进行持续优化。
职位要求1. 硕士及以上学历,计算机、数学、通信等相关专业;具备良好的学习能力、逻辑思维能力、沟通协作能力;
2. 有三年及以上语音合成算法经验,或三篇及以上顶会论文(各类CCF-A会、ICASSP/INTERSPEECH等);
3. 熟练使用Python和Pytorch/Tensorflow深度学习框架;
4. 对以下至少一种熟悉并有相关经验:
1)语音大模型的框架&理论,包括但不限于Diffusion、Vall-E/SpearTTS/AudioLM、MusicLM;
2)音频理解大模型/ASR大模型,包括但不限于qwen-audio、sensevoice、whisper;
3)上一代语音合成模型,包括但不限于Tacotron、Fastspeech;
4)各类声码器的原理&优化,包括但不限于Hifi-GAN,MelGAN,BigvGAN;
5)有业务落地工程经验优先。 投递
Z.ai

About Z.ai

Z.ai is the AI company behind the GLM series models, dedicated to inspiring the development of AGI to benefit humanity.

Industry
IT & Software
Company Size
51-200 employees
Headquarters
Beijing, CN
Year Founded
Unknown
Social Media