募集要項
- 募集背景
-
事業拡大と共にユーザーが拡大していく中、真に求める情報を届けるために以下のような課題に向き合っています。
・効率的に情報拡充するためのデータパイプラインの開発、改善
・Web上のニュース、論文、特許、社内文書などを安定的に収集・拡充していくための監視基盤の構築
・ユーザーの行動を元に情報を完全自動で拡張する仕組みの構築
- 仕事内容
-
■業務概要:
全プロダクト共通のデータ配信システムに位置する、Webクローラーと文書配信パイプラインの設計、開発、運用を行なっていただきます。データプラットフォームチームをリードし生産性の最大化を行うことも期待しています。
■業務内容:
・TypeScript/Pythonを用いたWebニュース・特許・論文などを配信するデータプラットフォームの開発と運用
・大規模言語モデル(LLM)の学習に必要となる日本語データセットの作成
・顧客の社内文献を解析/配信するための解析ロジック及びデータパイプラインの新規構築と運用
・FaaS/CaaSによる分散処理のスケーラビリティ向上と監視設計
■チーム構成:
Opendata Team(8名)
内訳:Manager1名、サーバーサイドエンジニア2名、データエンジニア1名、機械学習エンジニア3名、MLOps1名、Data Reliability Engineer1名
■開発環境:
[開発言語] Webクローラー: TypeScript(Node.js)
データパイプライン: Python
[コンテナ] Docker
[IaC] Terraform
[クラウド] AWS, GCP
■求人の魅力:
・数億件規模の文書データのサーバーレス分散処理に携わることができる
・数万サイトを対象としたWebクローラーの開発に携わることで、Webフロント・バックエンド両方の知見を活かしつつ、不安定なシステムの監視・運用設計のノウハウを取得できる
・PdMやCustomer Successチームとコミュニケーションしながら新規開発や改善策を自身で提案・開発することで、事業へのコミットを経験できる
- 応募資格
-
- 必須
-
※すべて必須
・バックエンドエンジニア(サーバーサイドエンジニア、データエンジニア)の経験5年以上
・要件定義から設計~実装~運用に至るまでを一気通貫での経験
- 歓迎
-
・コンピュータサイエンスに関連する技術分野の修士号または博士号
・チーム開発をリードした経験
・顧客向け自社開発サービスの開発、運用経験
・文書検索や文書推薦を行うサービスの開発、運用経験
・サーバーレスに対する幅広い知見と業務経験
・Terraformを用いた開発/運用経験
・データパイプライン・ETLの構築やワークフローエンジン、分散処理フレームワークを用いた開発/運用経験(Hadoop、Sparkなど)
- フィットする人物像
-
・コンピュータサイエンス、分散処理が好き
・最新の理論や事例をフォロー、検証するのが好き
・与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
・ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
・前向きなチャレンジ精神
- 雇用形態
-
■雇用形態:正社員
※3カ月間の試用期間があります。その間の待遇・給与に変更はありません。
■雇用期間:期間の定めなし
- 勤務地
-
北海道 / 青森県 / 岩手県 / 宮城県 / 秋田県 / 山形県 / 福島県 / 茨城県 / 栃木県 / 群馬県 / 埼玉県 / 千葉県 / 東京都 / 神奈川県 / 山梨県 / 富山県 / 石川県 / 福井県 / 新潟県 / 長野県 / 愛知県 / 静岡県 / 岐阜県 / 三重県 / 大阪府 / 京都府 / 兵庫県 / 滋賀県 / 奈良県 / 和歌山県 / 広島県 / 岡山県 / 鳥取県 / 島根県 / 山口県 / 徳島県 / 香川県 / 愛媛県 / 高知県 / 福岡県 / 熊本県 / 佐賀県 / 長崎県 / 大分県 / 宮崎県 / 鹿児島県 / 沖縄県
※基本的にはフルリモート体制(居住地は日本国内に限ります)
- 勤務時間
- フレックスタイム制(1日8時間/コアタイム10時~14時)
- 年収・給与
-
■想定年収 5,798,000円~8,798,000円
※月給×12ヶ月+リモートワーク準備一時金5万円
■月給(一律手当含む):479,000円~729,000円
<内訳>
基本給:335,168円~520,537円
固定残業代45時間分:123,832円~188,463円 ※超過分は別途支給
顧客と向き合う手当:2万円
■昇給あり(年2回/5月、11月)