募集要項
- 募集背景
-
生成AIを活用したSaaSプロダクトの利用拡大に伴い、
サービスの安定稼働とインフラ基盤の強化が重要になっています。
生成AIサービスでは、外部AI APIとの連携、大量データ処理、
アクセス集中、レスポンス速度、クラウドコストなど、
一般的なWebサービスとは異なる技術課題が発生します。
そのため、単なる保守運用ではなく、障害を未然に防ぎ、
ユーザーが安心して使い続けられる仕組みを設計する
SRE領域の強化を進めています。
具体的には、以下のような課題に取り組んでいただきます。
・SLI/SLO設計による信頼性指標の明確化
・監視、アラート、障害検知の仕組みづくり
・クラウドインフラの再設計と可用性向上
・生成AIレスポンスやAPI通信の改善
・IaC、CI/CD、自動化による開発生産性向上
・クラウド利用状況の分析とコスト最適化
事業成長を技術面から支えたい方に適した環境です。
- 仕事内容
-
生成AIを活用したSaaSプロダクトにおいて、生成AIを活用したSaaSプロダクトのSREとして、
サービス信頼性向上、クラウド基盤設計、監視体制構築、
DevOps推進、パフォーマンス改善を担当していただきます。
サービスの安定稼働と継続的な改善をお任せします。
単なるインフラ運用ではなく、
「サービスを止めない仕組み」を設計し、
プロダクトの成長に耐えられる基盤づくりを進める役割です。
生成AIサービスは、外部AI APIとの連携、アクセス負荷の変動、
大量データ処理、レスポンス速度、クラウドコストなど、
従来型のWebサービスとは異なる課題が発生します。
そのため、監視や障害対応にとどまらず、
アーキテクチャ設計、自動化、パフォーマンス改善、
コスト最適化まで幅広く関わることができます。
【サービス信頼性向上】
・SLI/SLOの設計、運用
・モニタリング環境の設計、構築
・アラート設計、通知ルールの改善
・障害検知、原因分析、再発防止策の実施
・運用フロー、障害対応フローの改善
【クラウドインフラ設計】
・主要クラウド環境の設計、構築、運用
・コンテナ基盤の設計、改善
・IaCによるインフラ構成管理
・高可用性を意識したアーキテクチャ設計
・負荷分散、スケーリング設計
【パフォーマンス改善】
・生成AIレスポンスの最適化
・API通信やデータ処理の改善
・ボトルネック調査、原因分析
・キャッシュ戦略の設計、改善
・大量アクセスを想定した処理設計
【DevOps推進】
・CI/CD環境の改善
・デプロイ作業の自動化
・運用作業の自動化
・開発チームとの連携による品質改善
・リリース速度と安定性を両立する仕組みづくり
【クラウドコスト最適化】
・クラウド利用状況の可視化
・リソース使用量の分析
・不要リソースの削減
・費用対効果を意識した構成改善
経験に応じて担当範囲を調整し、
得意領域からスタートできます。
将来的には、SREリード、プラットフォームエンジニア、
インフラアーキテクト、DevOps推進責任者など、
技術基盤をリードするキャリアを目指せます。
- 応募資格
-
- 必須
-
・SREとしての実務経験1年以上
またはインフラエンジニアとしての実務経験
・クラウド環境におけるWebアプリケーション基盤の
設計、構築、運用いずれかの経験
・監視、障害対応、原因分析、改善活動のいずれかに
関わった経験
・開発チームやビジネス側と連携しながら、
サービス改善に取り組める方
- 歓迎
-
・SLI/SLO設計、運用の経験
・モニタリングツールを用いた監視体制の構築経験
・IaCを活用したインフラ管理経験
・コンテナ基盤の構築、運用経験
・CI/CD環境の設計、改善経験
・API、データ処理、レスポンス速度の改善経験
・クラウドコストの分析、最適化経験
・生成AI、AI SaaS、LLM連携サービスへの関心
- フィットする人物像
-
・安定運用だけでなく、仕組み化や改善に関心がある方
・障害対応を一時対応で終わらせず、再発防止まで考えられる方
・サービス成長に合わせた技術基盤づくりに挑戦したい方
・新しい技術を学び、実務に取り入れることが好きな方
・開発チームと協力しながら、品質向上を進められる方
・裁量ある環境で、自ら課題を見つけて動きたい方
- 雇用形態
- 正社員
- 勤務地
- 東京都
- 年収・給与
- 900万円 ~ 1249万円