百川智能

百川智能-大模型数据工程师

百川智能  •  Onsite  •  3 months ago
Apply
AI can make mistakes so check important info. Chat history is never stored.

Job Description

百川智能-大模型数据工程师北京社招全职职位描述1. 参与分布式爬虫系统的建设,优化数据调度、抓取、解析、存储全栈流程
2. 协助开发定向抓取流程,提升数据覆盖率,构建完善的专业领域的知识库
3. 熟悉LLM、了解RAG全流程,参与搜索内容理解、召回、排序算法开发,提升RAG系统效果
4. 参与数据的清洗、处理、分析,提升从抓取到模型全链路数据的稳定性和时效性职位要求1. 本科及以上学历,2年以上爬虫或大数据处理相关工作经验
2. 熟悉http/tcp等网络协议,熟悉主流盘虫技术,熟练使用相关工具如fiddler、scrapy
3. 熟悉大数据生态,熟练使用Hadoop、Spark、hive、hbase等开源框架,具备海量数据处理能力
4. 熟悉Python/Java/Go其中一种语言,具备扎实的编码能力
5. 熟悉爬虫对抗技术,了解Android程序apk解包/逆向,有apk/小程序抓取经验者优先
6. 熟悉PyTorch/TensorFlow等深度学习框架,具备深度学习、机器学习、自然语言处理等领域的基础知识者优先
7. 熟悉大数据框架底层原理,能够独立定位和优化数据处理瓶颈,具备一定大数据组件自运维能力者优先 投递
百川智能

About 百川智能

Industry
Unknown
Company Size
Unknown
Headquarters
Unknown
Year Founded
Unknown
Social Media