募集要項
- 仕事内容
-
私たちが目指すのは、Web上のあらゆるビジネス情報を再整理し、ビジネスシーンでのデータ活用業務を自然言語処理AIで総置換することです。そのために、世界中のニュース、企業情報、論文、特許などをWebから収集、抽出、加工して顧客に提供し、企業の製品化・事業化を加速させられるような「オープンデータリサーチサービス」を開発しています。
【ミッション】
Web上にある世界中のビジネスデータを機械学習を活用したプロダクトで提供できるようにデータ化するために必要となる、モデル開発以外の全てのエンジニアリングをお任せします。
【業務内容】
・自然言語処理や画像処理を用いたコンテンツ抽出エンジンのMLパイプライン設計/運用
・HTMLやPDFからコンテンツを抽出するMLアプリケーションのプロトタイプ開発
・FaaS/CaaSによる分散処理のパフォーマンスチューニングと監視設計
・数万オーダーのWebサイトから汎用的にクローリングするシステムの異常検知機構の構築
【現状の課題】
・コンテンツ抽出のノイズが多く、検索の適合率を下げてしまう要因になっている。
・Webクローラーが時間経過とともにサイト側の構造変化によって劣化してしまうのを予測・自動復旧するシステムが存在しない。
【ポジションに期待する役割】
・コンテンツ抽出の精度を向上する新しいアルゴリズムまたは処理基盤の探索と検証
・流量の異なる多種多様なサイトのクローリングにおける異常検知機構の探索と検証
【開発環境】
[開発言語]
JavaScript(Node.js), Python, Rust
[コンテナ技術]
Docker
[IaC]
Terraform
[AWS]
Lambda, SQS, Step Functions, Fargate, S3, Aurora, DynamoDB, OpenSearch
[GCP]
Cloud Composer, Cloud Run, Cloud Functions
- 応募資格
-
- 必須
-
【すべて必須】
1.クラウド上で機械学習モデルを用いたソフトウェア開発経験(Python)
2.以下の項目を1つ以上満たす方
・機械学習など大規模データを扱うバッチ処理、ワークフローの開発/運用経験
・MLOpsの企画/設計/開発/運用経験
- 歓迎
-
・顧客向け自社開発サービスのデータ基盤の開発、運用経験
・サーバーレスおよびMLOpsに対する幅広い知見と業務経験
・コンピュータサイエンスに関連する技術分野の修士号または博士号
・リーダーなどの立場で事業背景を理解し自ら短期施策を立案/実行した経験
・Elasticsearchの利用/運用経験
- フィットする人物像
-
求める人物像
・コンピュータサイエンス、分散処理が好き
・最新の理論や事例をフォロー、検証するのが好き
・与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
・ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
・前向きなチャレンジ精神
- 雇用形態
- 正社員
- 勤務地
- 東京都
- 勤務時間
- ■裁量労働制 ■標準労働時間 10:00~19:00(職種による) ■フレックスタイム制コアタイム:10:00~14:00 (標準労働時間月160時間)(職種による) ■リモートワーク可 ※時間にも場所にも縛られずに柔軟な働き方を実践しております!
- 年収・給与
- 700万円~1349万円
- 待遇・福利厚生
- 【保険】 ■各種社会保険完備(関東ITソフトウェア健康保険組合加入) 【手当】 ■通勤交通費(リモートのため実費支給) ■顧客と向き合う手当 ・毎月2万円を経費申請などの手続きなしで一律に支給 ・自己研鑽や顧客価値向上のために自由に利用 (書籍購入/セミナー受講/備品購入等) ■リモートワーク準備一時金 ・リモートワークを行うための準備に要する費用として50,000円を一律支給 ・入社後最初の給与に反映され支給 【その他】 ■健康診断・インフルエンザ予防接種 ■月1回の研究日制度(自身の技術向上・学習目的) ■希望のPC支給 ■オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供 ■オフィスグリコ設置
- 休日休暇
- 【年間休日】 ■123日 ■完全週休2日制(土日祝) ■年末年始休暇 【有給休暇】 ■入社時付与 ※付与日数は入社月による 【その他】 ■産休取得実績有り