募集要項
- 募集背景
- 事業拡大に伴う増員となります。
- 仕事内容
-
スマサテのプロダクトの心臓部である「データ基盤」の開発・運用を担うポジションです。世の中に散らばる膨大かつ雑多な不動産情報を収集し、誰もが使える「綺麗なデータ」へとクレンジング・構造化していくのがメインミッションです。データサイエンティストの高度な分析や、アプリケーションの高速処理に耐えうる「綺麗で構造化されたデータ」へと継続的に変換・蓄積するため、スケーラブルなデータパイプラインの設計・運用をリードしていただきます。
【具体的には】
・データ基盤(DWHやデータレイク等)のアーキテクチャの選定、設計、構築
・Web上からの継続的な不動産データ収集(クローリングやスクレイピング)、クレンジングおよび整形プログラムの実装
・バッチ処理やストリーミング処理のデータパイプラインの構築と最適化
・データ品質の担保、インフラ基盤やパイプラインの監視、パフォーマンスチューニング
・アプリチームやデータサイエンティストとの要件定義、データスキーマのすり合わせ
- 応募資格
-
- 必須
-
・ Pythonを用いたデータパイプライン(ETL/ELT)またはデータ処理バッチの開発経験(3年以上)
・ AWSやGCP等クラウドインフラを利用したデータ基盤(DWH、データレイク等)の構築・運用経験
・ SQLを用いた複雑なデータ抽出・集計の実務経験
・ RDBMSおよびNoSQLデータベースの設計・運用経験
【歓迎】
・ 大規模データ(数億~10億レコード超)を扱う処理基盤の最適化経験
・ 大規模なWebクローラー/スクレイピングシステムの構築・運用経験
・ dbt/Airflow等のオーケストレーションツールを用いた開発・運用経験
・ BIツール(Tableau、Metabase等)のデータマート構築・運用経験
・ Elasticsearch等を用いた検索システムの構築・チューニング経験
・ 生成AI×データ活用の経験(RAG/LLM連携等)
- 雇用形態
- 正社員
- 勤務地
- 東京都
- 年収・給与
- 600~1000万円
- 待遇・福利厚生
- 通勤手当
- 休日休暇
- 結婚休暇 ・ 産前産後・育児休暇、年間休日120日以上、完全週休2日制(土・日)、祝日、年末年始休暇、年次有給休暇(入社時から付与)
