日本跨境电商平台

企业魅力点:

日本最大的电商平台之一,整合金融、旅游等 70 多种服务,建立独特生态圈。自研高效 AI模型,宏大的 代理型生态系统 愿景、将 AI 深度融入业务血脉的战略决心,以及通过扎实的技术研发为用户、卖家和内部运营带来的切实价值。

工作地点:

日本东京(可为国内优秀人选提供签证)

业务内容:

  1. 设计、实施和维护机器学习管道,用于模型的自动训练、测试和部署,确保可扩展性和效率。
  2. 与机器学习工程师协作,排查和优化模型性能,确保模型可投入生产并符合既定的服务等级协议(SLA)。
  3. 管理和监控 Kubernetes 集群及相关基础设施,以支持高负载的机器学习工作,实施安全性和弹性的最佳实践。
  4. 开发并维护有关机器学习基础设施、工具及最佳实践的文档,为机器学习团队提供指导和支持。
  5. 持续评估并引入新技术和工具,以提升机器学习平台的能力和性能。

必须条件:

  1. 经验:3 年以上 MLOps 经验,并具有管理机器学习基础设施的成功记录。
  2. Kubernetes 熟练度:深入理解 Kubernetes(K8s)基础设施及其在管理机器学习工作负载中的应用。
  3. 编程技能:精通 Python 或 Golang。
  4. 具备 Linux 操作系统的实际经验,能够维护系统性能,确保正确配置,并利用工具排查软件、硬件及网络相关问题。
  5. 教育背景:计算机科学、工程或相关技术学科的学士或更高学位。
  6. 良好的沟通与团队合作能力。
  7. 对技术和解决具有挑战性的问题富有热情。

优先条件:

  1. 熟悉机器学习框架(如 TensorFlow、PyTorch)及 CUDA。
  2. CI/CD 工具:具有 CI/CD 工具(如 GitHub Actions、Jenkins、GitLab CI)和容器技术(如 Docker)经验。
  3. 具有训练大型模型(包括大型语言模型)的经验。

薪资待遇:

年薪:面议

私信或留言即可快速投递简历并了解岗位更多详细信息!