Jobless Developer
Bosch Group logo
Bosch Group

Posted 6 months ago

Open

数据挖掘工程师(大模型方向)_XC

ShanghaiOn-siteFull-time

AI Summary

数据挖掘工程师(大模型方向)_XC Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance to improve quality of life all across the globe.

About this role

数据挖掘工程师(大模型方向)_XC

Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance to improve quality of life all across the globe. Welcome to Bosch.

构建下一代 智能数据挖掘平台,以大模型为核心驱动力,通过文本搜索、图像搜索、多模态理解等方式,实现大规模自动驾驶数据的智能发现与价值提炼。负责设计与实现基于 Qwen / CLIP / EVA / BLIP 等多模态模型的语义搜索与向量检索方案,支持感知难例挖掘、仿真场景检索、标签一致性分析等任务,推动数据生产与模型训练的智能化。

主要职责

  1. 负责构建 文本 / 图像 / 多模态搜索系统,实现语义级别的数据检索;
  2. 基于 Qwen / CLIP / EVA / BLIP / SigLip 等模型,设计 embedding 策略与特征融合方法;
  3. 构建并优化 向量索引(Faiss / Milvus / Elasticsearch,支持高效相似度搜索与难例发现;
  4. 设计数据挖掘与评估策略,如跨模态检索精度评估、embedding 质量分析、Recall / Precision 优化;
  5. 与标注、算法、仿真团队协作,推动图文搜索在数据筛选、质量控制与模型反馈闭环中的落地;
  6. 探索 生成式搜索(Retrieval-Augmented Generation, RAG 在数据挖掘中的创新应用。

Qualifications

  • 计算机科学、人工智能、电子信息或相关专业本科及以上学历;
  • 熟悉 深度学习 / 向量检索 / 数据挖掘 相关技术;
  • 精通 PyTorch / Transformers / LangChain 等框架;
  • 熟悉至少一种 大语言模型或多模态模型(Qwen / LLaVA / BLIP / CLIP / EVA
  • 理解 embedding 表征、相似度度量、RAG 架构与语义索引 的基本原理;
  • 具备良好的编程习惯与工程实现能力(Python / FastAPI / Docker 优先)。

加分项:

  • 熟悉 Qwen 系列模型 或具备其二次开发 / 推理部署经验;
  • 具备 图文检索系统 / 数据挖掘平台 架构经验;
  • 有大规模数据处理经验(Spark / Ray / Elastic / Milvus);
  • 熟悉自动驾驶数据结构(场景、标签、难例定义等);
  • 有算法评估与可视化工具开发经验。

Explore related jobs

Browse these categories