募集要項
- 募集背景
- 事業拡大に伴う増員となります。
- 仕事内容
-
【職務内容】当社の機械学習基盤「ML Platform」の開発・運用を担当していただきます。社内のAI技術者やプロダクトチームが効率的かつ迅速に機械学習モデルの開発・デプロイを行えるよう、プラットフォームの機能強化や最適化を行います。
【具体的には】・物理GPUノードのセットアップ(OSインストールやパラメータチューニング) Kubernetesクラスタの構築・運用
・定期的なKubernetesクラスタのバージョンアップデート 最新のKubernetesバージョンへのキャッチアップなど
・NVIDIA H100 / H200 やRoCEv2/RDMA、NCCLなどの技術検証・導入
・GPUインスタンスの提供 機械学習ジョブの管理
・モデルのデプロイ機能の開発・運用 などを行い、ユーザーのニーズに応じた新機能の追加やUXの改善にも取り組んでいただきます。サービスは主にKubernetes上で構築されているため、機械学習の知識に加え、Kubernetesカスタムコントローラー(Go言語)の開発など、kubernetesへの深い理解に基づいた学習サービスの開発・運用を担当します。加えて、Kubeflowなどの機械学習エコシステムの検証・導入・コントリビュートを通じて、基盤の強化と機能拡充を図ります。
【職種の魅力】
このポジションでは、最先端の技術に挑戦する機会が豊富にあります。最新のGPUハードウェアや機械学習フレームワーク、Kubernetesの新機能など、常に技術の最前線で活躍できます。
ソフトウェア開発からインフラ構築、機械学習の応用まで、多岐にわたる技術領域に携わることで、幅広いスキルを習得・活用することが可能です。
■プログラミング言語 Go言語 Python ■プラットフォーム・オーケストレーション Kubernetes Docker ■機械学習フレームワーク TensorFlow ■分散処理技術 MPI NCCL RoCEv2/RDMA ■機械学習エコシステム Kubeflow Kueue MPI Operator ■ハードウェア NVIDIA GPU(H100など最新モデル) 高性能ネットワークインフラ ■開発手法 アジャイル開発 CI/CDの実践 ■コミュニケーションツール Slack Confluence JIRAなど ■その他の技術要素
- 応募資格
-
- 必須
-
【いずれか必須】
・機械学習や GPU に対する基本的な知識および理解
・Linux 環境における開発および運用経験
・Kubernetes などのコンテナオーケストレーションツールを用いた運用経験
・プログラミング言語を用いた 3 年以上の開発経験(Go が望ましい)
【歓迎】
・Kubernetes カスタムコントローラーの開発経験 Kubernetes 各種認定資格の取得(CKA/CKAD/CKS/KCNA) 最新の機械学習やフレームワークに対する知識および理解 HPC を目的とした大規模計算クラスタに対する知識および理解 MLOps の知識・実践経験 Kubeflow、 Kueue、 MPI Operator の知識・運用経験(分散学習の経験) Web API におけるセキュリティ対策の経験 パブリッククラウド(GCP/AWS/etc.)の AI 系サービスを用いた開発経験 フロント(React)の開発経験 OSS コミュニティでの開発経験
- 雇用形態
- 正社員
- 勤務地
- 東京都
- 年収・給与
- 600~1000万円
- 待遇・福利厚生
- 通勤手当 住宅手当 技術者に対しての特殊諸手当多数(技術支援金、マルチディスプレイなど他多数)従業員持株会、社内融資制度、家賃補助制度、社内カウンセリング制度、慶弔見舞金制度、社内親睦会費補助制度
- 休日休暇
- 慶弔休暇 年末年始 夏期休暇 有給休暇 週休二日制(土日祝)、リフレッシュ休暇(勤続2年間で5日間、勤続5年間で1ヶ月間)、家賃補助制度(2駅ルール、どこでもルール)
