この記事は「検索・発見プロダクト 全部俺 Advent Calendar 2023」の4日目です。(相変わらず遅れ...)
前回の記事の続きで、ビジネス・データサイエンスの視点です。
ビジネスの視点・データサイエンティストの視点
大量のデータを眺めるのが好きだったので、たくさんデータがあり、かつ同期が優秀だったという理由から、新卒では大手の人材系の企業に入社しました。
とはいえ、新卒の会社でがっつり学んだと思うのは、検索でビジネスするのは結構難しいということ、(大量の)データを活用してプロダクトの体験を改善できるということです。
ビジネスパーソンの視点
私は新卒の会社にデータサイエンティストとして入社したのですが、ビジネス色の強い会社でもあったので、ビジネスのことを考える機会が多かったです。
その時の記事は以下のような内容(noteの記事)
当時から検索や推薦(ときに広告)に関連するプロダクトの開発に関わっていたのですが、ビジネスとしての価値貢献がなかなか現れにくい領域でもあるなと感じていました。そうした検索などのサービスは利用者の利便性を目指して作りますが、収益源がサービス利用者から発生する訳ではない場合が多いのです。
例えば、求人検索サービスの多くは基本的な収益源は求人掲載費から発生し、仕事を探すユーザーがお金を払うことはほとんどないと思います。多くのECでも収益源は販売店の利用料や、販売手数料で、実は商品を探しているユーザーからの収益はほとんどありません(商品を購入してくれたから手数料が発生したと考えると、購入者から収益が発生したと考えることもできなくはありませんが)。GoogleやBing等の検索サービスも同様に、広告が大きな収益源です。一方で、薬剤、特許、会社の事故情報など特殊なデータベースでは利用者が利用料を支払う形のものも多くあります。ただし、そうしたサービスでも実際のところは法人としての契約になるために利用者と決済者が別ということが多々あります。
会社組織の中で、直接お金を支払っていないユーザーのためになるシステムを作るというのはなかなか難しいものです。(本筋とはそれますが、それゆえにコンテンツ掲載者の論理が強くなっていくというのもよくある話です。検索サービスの広告枠が年々大きくなっていくことはよくある話です。)
ですが、サービスの利用者(検索・発見体験に価値を感じる人)に利便性を届けることができなければ、そのサービスはやがて廃れていくでしょう。具体例は出しませんが、検索サービスに広告が増えすぎてユーザーが離れてしまったサービスがある一方、利用者の利便性を追求しすぎたため事業として成り立たなくなってしまったサービスもあります。利便性を届けユーザーに使ってもらいながら、収益性を確保・拡大していくのは結構難しいものです。
以前書かせてもらった「検索システム ― 実務者のための開発改善ガイドブック」でもその辺のことは触れていて、検索システムを維持・改善していくためにはどこで収益が生まれ、誰がシステムに投資することを決めているかを明確にしなければいけません。
ということで、ビジネスの視点として、検索・発見体験を支えるプロダクトを開発していく場合、その収益がどのような構造で発生しているか、ステークホルダーは誰か(利用者の他に、特に投資決済者と売り上げの発生元)を把握し、ビジネスの成長のために利用者の利便性と収益性のバランスをとる必要があります。
これは会社で検索・発見に関するプロダクトを開発する場合、必ずおさえなくてはいけないポイントの一つです。
データサイエンティストの視点
ビジネスへの理解を深めるかたわら、データサイエンティストとしても仕事をしておりました。
昨今の検索・発見体験を支えるプロダクトでは、データの活用がほぼ必須となってきています。検索・発見体験を作っていく際に必要なデータ活用の観点としては主に次の2つです。(検索・発見体験に特化している訳ではなく、一般的に言えることだとは思います。)
意思決定の精度:データを収集・分析してプロダクト改善に活用すること
システムの自動化:データを元にシステムのロジックを自動化すること
1つめは、どのようなデータを元に意思決定を行い、システムを改善できるかという視点です。ユーザーを理解したり、システムを理解したりするためにどのようなデータが必要か、行った施策を評価するためにどのような指標やテストが可能かなどがこれにあたります。それについては、以前記事を書いたりしました。
2つ目はデータに基づく意思決定をシステムに組み込み、自動化を行うという視点です。これは、主に機械学習などの技術を用いて検索や推薦のランキングを最適化したり、アイテムの取得をするための埋め込みベクトルを取得するなどの話です。
実はプラスの側面だけでなく、システムとデータを繋ぎ込むのはなかなか大変な側面もあります。有名なのはGoogleの「Machine Learning: The High-Interest Credit Card of Technical Debt」という論文ですかね。機械学習使うシステムの技術的負債は高利子のクレジットカードみたいに増えるから、ポイントおさえて気をつけようという感じです。
詳細は長くなるのでこのへんのシステムの話はこの後の「エンジニアの視点」の話て話すことにしますが、簡単に言うとユーザー行動ログ、検索対象のコンテンツに関するデータが大量にあればそれを活用して検索・発見体験は飛躍的に改善することができると言うことです。
と言うことで、データサイエンティストの観点として、検索・発見体験を実現するプロダクトではデータの活用が非常に重要であり、(1) 正しく意思決定するために検索・発見体験特有の評価設計が欠かせず、 (2) システムの最適化にユーザー行動ログやコンテンツのデータを活用することで体験が飛躍的に向上する、ことが重要になります。
ということで、今回はビジネスパーソンおよびデータサイエンティストの視点からのお届けでした。