データ製造業を始めた話。データエンジニアの個人開発にオススメできる理由

このような一般社団法人を立ち上げて政治関連のデータ製造業を始めました（Xなど見てね）

この立ち上げを通して、データエンジニアの個人開発テーマとして、データ製造業はとても良いんじゃないかなと思っているのでその理由などを書きます。

いいポイント①：求められる提供方法や品質の勘所がわかる

など、データエンジニアが得意とする領域のスキルを生かした開発が求められます。今回僕が作ったものだと

みたいな構成を取ったのですが、これはデータエンジニア経験が無いとなかなか出ない発想かもなと思っています。

クラウドインフラコストはデータストレージ費用だけで済みます。

こうした仕組みが用意されており、提供されたデータに対するクエリコストはコンシューマー側が負担するモデルになっているからです。つまりユーザーが増えても、利用クエリ数が増えても、こちら側のインフラコストはほぼ変動しません。

会社紹介やデータ利用ガイドのサイトも、Hugoで静的サイトを作ってCloudflare Pagesにデプロイする形にしているので意図しない課金は発生しません。（Cloudflare Pagesは帯域幅が無制限なのが素晴らしい。）

心穏やかにマイペースに運用できます。

データエンジニアをしているとデータ基盤サイドの開発に集中することが多く、データ自体を生成するアプリケーションの開発にはあまり携わらなくなっていくことが多いのかなと思います。

アプリケーション開発の経験が薄れていくと、「そもそもソースシステムのこのモデルがイミュータブルになっていたら全てが解決するな」みたいな発想も出づらくなっていくのかなと思っています。

sage-base.com のアプリケーションだと、LLMによるデータ生成と人力によるデータ入力を両立するような作業UIや、生成結果を確認＆承認できるUIなどを作っており、データのCRUDを意識したものづくりを久しぶりにできている感覚があります。

これはデータエンジニアとか関係ないのですが、アプリケーションを構築するコストが相対的に落ちていくのに従って、信頼できる使いやすいデータソースの価値は上がっているように思います。

「データソース」はたくさんの人の助けになれるアウトプット形式になりうるかなと思います。

もし sage-base.com の開発一緒にやっていきたいぞって人いたらお話ししましょう