機械学習ベースのレポート

NetflixやAmazonなどの企業は、ユーザーの行動に基づいて商品やコンテンツを提案するレコメンデーションエンジンを活用しています。例えば、Amazonで商品を購入すると、興味を持ちそうな他の商品が表示されます。同様に、Netflixは視聴履歴に基づいてテレビ番組や映画を提案します。

私たちは、インターネット全体におけるプレミアムテクノロジーの採用にも同じコンセプトを適用しました。私たちのシステムは、同様のプレミアムテクノロジープロファイルを持つ他のウェブサイトの行動を分析することで、ウェブサイトがどのテクノロジーの採用を検討するかを予測します。

仕組み

当社は、テクノロジーに多大な投資を行っている Web サイトを特定し、それらの Web サイトがどのテクノロジーを使用しているかを判断します。
これらのテクノロジーの重複を測定して、Web サイト間の類似性のレベルを判定します。
重複が大きいほど、一方のサイトで使用されていて、もう一方のサイトでは使用されていないプレミアムテクノロジーの推奨が強くなります。

従来のAIモデルを使わない理由

なぜ私たちのレコメンデーションシステムに行列分解のような機械学習アプローチを採用しないのかと疑問に思うかもしれません。いくつかのAIモデルをテストしましたが、結果は芳しくありませんでした。これらのモデルは、解釈や制御が難しい「マジックナンバー」と呼ばれる複雑な内部パラメータにも依存しているからです。

例えば、MatrixFactorizationTrainerのドキュメントには、「より良い結果を得るには、以下の値を使用してください」という文言があり、その後に説明されていない2つの変数が続きます。これらの値がなぜ結果を改善するのかについての透明性が欠如しているため、モデルの検証と信頼性が困難になっています。

対照的に、私たちが選択したアルゴリズムは、明確で広く理解されている方法論に基づいています。私たちは、それがどのように機能し、どのように実装され、そしてなぜ有意義な結果を生み出すのかを正確に理解しています。