J
招聘平台
职位公司博客职迹
English登录注册

关于我们

  • 公司介绍
  • 联系我们
  • 加入我们

求职服务

  • 职位搜索
  • 薪资洞察
  • 常见问题

企业服务

  • 发布职位
  • 企业入驻

法律条款

  • 用户协议
  • 隐私政策

© 2026 JobQuip招聘平台. 版权所有.

首页职位大数据开发工程师

大数据开发工程师

Neruva Studios ·远程·2026/4/20

薪资范围

薪资面议

职位类型

全职

工作地点

远程

发布日期

2026/4/20

职位详情

职位描述

1. 架构设计:负责公司 PB 级用 户行为数据(AppList + GPS)仓库的建设。设计基于StarRocks + MinIO 的 存算分离 架构,在私有化物理机环境下实现低成本存储与秒级多维 查询。 2. ETL 与 Python 工程化:放弃传统 Java 开发模式,主导使用 PySpark 编写高性能数据清洗脚本。解决海量JSON/GPS 日志处理中的数据倾斜与内存溢出 (OOM) 问题,建立 Python Native 的数据工程体系。 3. AI 数据管道建设:负责搭建数据湖 -> 训练集群的高速数据传输通道。解决海量小文件读取瓶颈,优化 I/O 吞吐,确保清洗后的语料能高速流向 GPU 集群,保障AI训练效率。 4. 集群稳定性:负责私有云环境下大数据组件(Spark on K8s/YARN, StarRocks)的部署与监控。配合 AI 团队进行资源隔离(CPU vs GPU),确保数据处理与模型训练互不干扰。

任职要求

1. 计算机相关专业本科及以上学历,5 年以上大数据架构经验,必须有 PB 级数据处理实战经验。 2. 精通 Python (PySpark):具备大型 Python 工程开发能力。同时具备 阅读 Java/Scala 报堆栈 (Stack Trace) 的能力,能排查 Spark 底层的 JVM 问题。 3. 精通MPP数据库,是 StarRocks、Apache Doris 或 ClickHouse 的重度使用者。 4. 熟悉 私有云/IDC 环境下的资源规划,具备在物理机上搭建和维护大规模集群的能力。

登录后查看申请方式

联系方式

该职位未公布直接联系方式,请通过上方按钮投递简历。

关于公司

N
Neruva Studios

互联网

查看公司主页