[解決済み] アマゾンのレコメンデーション機能の仕組み

2022-05-11 16:24:15

質問

アマゾンのレコメンデーション技術の画面の裏側には、どのような技術があるのでしょうか？アマゾンのレコメンデーションは現在最も優れていると思いますが、どのようにして私たちに適切なレコメンデーションを提供しているのでしょうか？

最近、私たちも同じようなレコメンデーションのプロジェクトに関わっていますが、技術的な観点からアマゾンのレコメンデーション技術の裏側を知りたいと思います。

どのような情報でも構いませんので、ぜひ教えてください。

更新しました。

これは特許は、パーソナライズされたレコメンデーションがどのように行われるかを説明していますが、あまり技術的ではありません。

Daveのコメントより。アフィニティ分析は、このようなレコメンデーションエンジンの基礎を形成しています。また、このトピックに関するいくつかの良い読み物もあります。

マーケット・バスケット分析の謎解き
マーケット・バスケット分析
アフィニティ分析

お勧めの読み物です。

データマイニング。概念と手法

どのように解決するのですか？

それは芸術であり、科学でもあります。典型的な研究分野は、データマイニングの分野のサブセットであるマーケットバスケット分析 (親和性分析とも呼ばれます) を中心に展開されています。このようなシステムの典型的なコンポーネントには、主要なドライバー項目の識別と、親和性のある項目 (アクセサリーのアップセル、クロスセル) の識別が含まれます。

彼らがマイニングするデータソースを覚えておいてください...

購入されたショッピングカート = 実際の商品に対して使われた実際の人々のお金 = 強力なデータであり、その量は膨大です。
カートに追加されたが放棄されたアイテム。
同じ商品を異なる価格で提供し、その結果を見るというオンライン上の価格設定実験（A/Bテストなど）。
パッケージング実験 (A/B テストなど)。異なる製品を異なるバンドルで提供したり、さまざまなアイテムの組み合わせを割り引いたりする。
ウィッシュリスト - あなたにとって特別なもので、集計すると、バスケット分析データの別のストリームと同様に扱うことができるものです。
リファーラルサイト (どこから入ってきたかを識別することで、興味のある他のアイテムのヒントになります)
滞留時間 (クリックバックして別のアイテムを選択するまでの時間)
あなたや、あなたのソーシャルネットワーク/購買サークルの人々による評価 - あなたが好きなものを評価すれば、あなたが好きなものをより多く得ることができ、また、" I already owned it" ボタンで確認すれば、あなたの非常に完全なプロファイルが作成されます。
人口統計学的情報 (配送先住所など) - あなたの子供、あなた自身、あなたの配偶者など、あなたの一般的な領域で何が流行っているのかがわかります。
ユーザーセグメンテーション = 幼児のために別々の月に 3 冊の本を購入したか？おそらく子供かそれ以上の子供がいる...など。
ダイレクトマーケティングのクリックスルーデータ - その企業から電子メールを受け取り、クリックスルーしたのか？どのメールであったか、何をクリックしたか、その結果買ったかどうかがわかる。
セッションでのクリックパス - カートに入れたかどうかに関係なく、何を表示したのか。
最終購入前に商品を閲覧した回数
実店舗を扱っている場合、物理的な購入履歴がある可能性があります (例: toys r us など、オンラインと実店舗を兼ねたもの)。
などなど。

幸いなことに、人々は全体として同じような行動をするので、購買集団について知れば知るほど、何が売れて何が売れないのかがよくわかり、すべての取引、すべての評価/ウィッシュリストの追加/閲覧によって、より個人的にカスタマイズした推奨をする方法がわかります。これは、推薦文などに含まれるすべての影響のほんの一例に過ぎないことを心に留めておいてください。

私は以前、Microsoft の Commerce Server という製品のデータマイニングと分析を担当する PM として働いていました。しかし、販売量が多ければ多いほど、より良いデータがあればあるほど、より良いモデルを作ることができます。コマースサイトの中で、これだけのデータを使ってモデルを作るのは、とても楽しいことだと想像できます。現在、これらのアルゴリズムの多くは（コマース・サーバーから始まったプレディクターなど）、直接Amazonで動作するよう移行しています。マイクロソフト SQL .

持っておくべき大きなテイクアウェイは4つです。

Amazon (または他の小売業者) は、大量のトランザクションと大量の人々の集合データを見ています...これにより、サイト上の匿名ユーザーに対してかなりうまく推薦することができます。
Amazon (または洗練された小売業者) は、ログインしている人の行動と購入を追跡し、それを使って大量の集計データの上にさらに洗練されたものを載せています。
多くの場合、蓄積されたデータをオーバーライドして、特定の品目のプロダクトマネージャー (たとえば、「デジタルカメラ」部門や「ロマンス小説」部門などを所有する人) が本当にエキスパートであるような提案の編集権を握る手段が存在します。
プロモーション取引 (たとえば、sony や panasonic、nikon、canon、sprint、verizon が小売業者に追加のお金を支払う、または大量に購入するとより良い割引を提供するなど) によって、特定の "suggestions" が他のものより頻繁に上位に来ることがよくありますが、この背景には常に、各取引でより多くを稼ぐ、または卸売コストを削減するなど、妥当なビジネス論理とビジネス理由が存在します。

実際の実装は？大規模なオンラインシステムのほとんどは、パイプライン (またはフィルターパターンの実装、ワークフローなど、好きなように呼んでください) のセットに集約され、何らかの形式のビジネスロジックを適用する一連のモジュールによって、コンテキストが評価されるようになっています。

たとえば、おすすめのパッケージやアップセル (今見ている商品と一緒に購入する) や代替品 (今見ている商品の代わりにこれを購入する)、ウィッシュリスト (製品カテゴリなどによる) から最も関連の高い商品を取得するパイプラインがあります。

これらのパイプラインの結果は、ページのさまざまな部分 (スクロールバーの上、スクロールの下、左、右、異なるフォント、異なるサイズの画像など) に配置することができ、どのパフォーマンスが最も優れているかをテストすることができます。これらのパイプラインのビジネスロジックを定義するプラグアンドプレイの簡単なモジュールを使用しているので、結局はレゴブロックに相当するモラルがあり、別のパイプラインを構築するときに適用したいビジネスロジックを簡単に選択でき、より速いイノベーション、より多くの実験、そして最終的には高い利益を得ることができるのです。

いかがでしたか？ Amazon だけでなく、あらゆる e コマースサイトで一般的にどのように機能するのか、少しは理解していただけたでしょうか。 Amazon は (そこで働いたことのある友人と話したところでは)、非常にデータ駆動型で、ユーザーエクスペリエンス、価格設定、プロモーション、パッケージングなどの効果を継続的に測定しているそうです。- 彼らは非常に洗練されたオンライン小売業者であり、利益を最適化するために使用する多くのアルゴリズムの最先端にいると思われます。

[解決済み] アマゾンのレコメンデーション機能の仕組み

質問

どのように解決するのですか？

関連

[解決済み] モジュラスディビジョンのしくみ

[解決済み] 32ビット整数のセットビットの数を数えるには？

[解決済み] 円周率の計算が正確かどうかを判断するにはどうしたらよいですか？

[解決済み] 40 億の整数以外の整数を生成する。

[解決済み] セッションとは何ですか？どのように機能するのですか？

[解決済み】ビットシフト（bit-shift）演算子とは、どのようなもので、どのように機能するのですか？

[解決済み】ユニコード1文字には何バイトかかりますか？

[解決済み] 一意な（繰り返しのない）乱数をO(1)で？

[解決済み] 2^nとn*2^nは同じ時間複雑性か？

[解決済み] 3つのスタックを持つ待ち行列を実装するには？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

operator=' にマッチしない等号の両端がマッチしない

[解決済み] テールコール最適化とは何ですか？

[解決済み] クレジットカードの番号からカードの種類を判別する方法は？

[解決済み】このゲームの数学的/計算原理は何ですか？

[解決済み] 一意な（繰り返しのない）乱数をO(1)で？

[解決済み] DijkstraのアルゴリズムとA-Starの比較は？

[解決済み] Kotlin - 配列から重複する文字列を削除する方法は？

[解決済み] 2つのキューを使用したスタックの実装

[解決済み] 2^nとn*2^nは同じ時間複雑性か？

[解決済み] 窓から猫を放り投げる