ECサイトにおける購買予測モデルへの挑戦

2017/7/27

昨今、デジタルマーケティング業界ではデータを活用したマーケティングの効率化やディープラーニングが注目を浴びてきており、導入企業も年々増加傾向となっています。
各企業は自社で保有するビッグデータをどのように利用すべきか? 新しい技術をマーケティングの生産性向上のためにどう生かしていくべきか?など、マーケティング担当者の悩みは尽きないのではないかと思われます。

本稿では、マーケティングの生産性向上をテーマに、GMO NIKKOで取り組んだひとつの事例を紹介します。

ECサイトにおけるレスポンス型広告の課題

結論から言うと、上記に記載した取り組みがすべてとなります。
では、なぜこのような取り組みが必要だったかという点から触れたいと思います。

GMO NIKKOでは取扱商品点数の多いECサイトのマーケティングのお手伝いをするケースが多数あるのですが、大手のECサイトになると、膨大な取り扱い商品があるわけで、それらの商品を利用しECサイトとしての新規顧客をどのように効率的に獲得することができるのか?という課題は常について回るものです。

取り扱い商品の中からどの商品をフックにプロモーションを行うべきか?

①企業がその時に押し出したい商品(新入荷・キャンペーン等)
②その時の売れ筋商品
③ダイナミック型広告を活用したレコメンドバナーに任せる

いずれの方法も間違いではないと思います。
ただ、①では消費者のニーズにマッチしているのか?②ではすでに商品訴求力のピーク時期が過ぎてしまっていないか? ③ではレコメンドエンジン次第であって広告主側のマーケティングナレッジとしては得られるものはないのではないか?
といったそれぞれにおいての払拭できない課題が残るのではないかと思われます。

いかに効率的かつスピーディに訴求すべき商品を数万点の商品の中から探し出すかということは、ECサイトのマーケティングに携わった方なら1度は悩んだことがあるのではないでしょうか。

■バナー広告における訴求商品の重要性

WEB広告におけるECサイトのプロモーションとして一般的な手法は、リスティング広告やレコメンド型広告であることは周知の事実ではありますが、いずれの手法においても「網羅性」を持って商品点数の多いECサイトのマーケティングを実現しているのではないでしょうか。

多くの商品数に対して、網羅性のあるキーワード入稿やフィード展開を行うことで「当てにいく」のではなく「ユーザーに当たりに来てもらう」という受け身型のプロモーションを極めることはできます。
その運用を高いレベルで実行することで一定のパフォーマンスは約束されているかもしれません。
ただ、未知の消費者に対して適切な商品を届けることで生まれる新たな接点は、受け身型のプロモーションだけでは決して実現することはできないのではないでしょうか。新たな接点を作り続けることがECサイトの価値を高め広告主に利益をもたらすためのファクターであるならば、受け身型のプロモーションから脱却しなければならないことは言うまでもありません。

では、どのように受け身型のプロモーションから脱却し、未来の顧客に対して、高い確率でニーズが発生するであろう商品を選択しプロモーションを行うことができるのでしょうか?

GMO NIKKOでは、過去に広告主側の事業データを提供いただくことで「新規ユーザー」が初めて購入する商品を把握し、初期購入に繋がりやすい要素の分析を行ってきました。商品単価・ジャンルなど傾向値をスコアリングすることでプロモーション商品を選択するうえでのフィルタリング機能(「当たりにくい商品」の選別)を進めてきました。
これによって、一定の基準値を持って精査が可能となり、結果として無駄なコスト削減には一定の成果が得られました。

例えば、新規顧客の購買データを分析することで、仮に初期購入単価のテーブルが500円~1,000円で60%を占めており、既存顧客の同テーブルの割合を大きく上回っていたとしたら、新規ユーザー向けのプロモーションとしては1000円以内の商品が望ましいという仮説が立ちやすくなります。
ここに商品ジャンルが掛け合わされることで、各ジャンルごとの適切な商品単価も傾向値が見えてくるのではないでしょうか。

もちろん、マーケティング上ではLTVの概念も考慮しなくてはなりません。そのため、低単価商品で獲得した新規ユーザーがいかに継続し、高価格帯商品へのアップセルに繋がっているのかというナーチャリングについては別途検証していく必要はあります。

事業データ×フィード情報を機械学習させることで人力では見いだせない領域へ

ただ、購買データというこれまでのファクトベースの分析では「当てにいく」ためのECマーケティングにはつながらず、あくまで「当たらない確立を上げる」ための取り組みに閉じられており、圧倒的な効率化には繋がりませんでした。

どうすれば数万、数十万の商品の中から当たりを見つけ出すことができるのか?

そこで目を付けたのが「フィード情報」でした。
「フィード情報」には数多くの商品情報が含まれており、単一の商品を特定する情報で構成されています。
商品タイトル・価格・ジャンル・色・商品説明・メーカー・素材など数々の情報を得ることができます。

これらの「文字情報」を言語解析し、過去に売れ筋となった商品情報と売れなかった商品情報を機械学習させることで、数ある商品の中から「当たる確立の高い商品」を発見することができるのではないか?
漠然としたゴール設定の中、ECサイトにおける購買予測モデルプログラム開発に着手することになりました。

フィード情報に含まれる商品の属性データと、事業データから抽出できる新規購入ユーザ数のデータを用意することができたので、これらのデータを使って教師あり学習をするモデルを考えました。ただし、新規購入ユーザ数を、そのまま当てるのは難しいと考え、新規購入ユーザ数を3つのレンジに分けて、各商品がどのレンジに該当するかを予測する、というクラス分類の問題設定にしました。

インプット
・商品タイトル
・ジャンル
・色
・商品説明
・メーカー
など文字データ

分類モデル

アウトプット
・多い
・中間
・少ない

モデル構築に関しては、従来からよく使われているtf-idfを使った単語ベクトルとランダムフォレストなどの組み合わせ、学習時間が早いと評判で教師あり学習としても使えるfastTextを利用しました。

予測結果:
モデル構築に利用したデータとは別にテスト用データを用意して、いくつかのアルゴリズムのモデルで試行錯誤した結果を見ていきます。

今回のクラス分類では「多い」の適合率(Precision)を重要視していたので、こちらの数値で比較しています。

tf-idf + ランダムフォレスト
・入力に使った単語の品詞は名詞のみ
・Precision 0.17

fastText
・入力に使った単語の品詞は名詞のみ
・Precision 0.19
・若干向上

fastText
・品詞:名詞、動詞、形容詞、形容動詞、副詞、連体詞
・Precision 0.22
・若干向上

tf-idf + LinerSVC
・品詞:名詞、動詞、形容詞、形容動詞、副詞、連体詞
・ngram_range (1,2)
・Precision 0.44
・Precisionが大きく向上したが、保存したモデルから1件の予測問い合わせの結果が返るまで数十秒かかる

fastText
・品詞:名詞、動詞、形容詞、形容動詞、副詞、連体詞
・wordNgram 2
・Precision 0.40
・Precision 0.4 を維持しつつ、保存したモデルから1件の予測問い合わせの応答が数秒で返り、確認ツールとして使うには都合が良い

現在、最後のfastTextのモデルで入力データの予測結果を確認できるデモツールを作り、どの程度商品選択の支援ツールとして使えるか現場の担当者に試してもらっているところです。

■今後の取り組み

今回の取り組みは、膨大な取扱商品数の中から宝を探り出すという成果を得るために、

①事業データ
②フィードデータ
③機会学習

というアセットとテクノロジーを用いて解決の糸口を探るきっかけになっていると感じています。
まだまだ仮説検証の繰り返しが必要な段階ではあるものの、検証結果をもとにいくつかの変動値を見直していくことで精度の高い予測モデルが実現できるのではないかと期待しています。

また、今後は画像認識を活用するなどさらなる予測モデルの精度向上へと繋げていくことも実現していきたいと考えています。

広告運用がオートメーション化されつつある中、広告代理店としてメディアプランニング、運用コンサルティング領域だけではなく、クリエイティブやテクノロジーを活用したコミュニケーション手段を創出していくことで新たな価値を生み出していかなければなりません。
そして広告主の事業に一歩踏み込みパートナーとして最大限のパフォーマンスを発揮することを今後は求められてくるのではないかと感じています。

そのためにも「課題」をスタート地点に「解決手段」を今後も模索していきたいと思います。

共著:椎名亮/清水康成

photo

ライター:椎名 亮


2005年 日広(現GMO NIKKO株式会社)入社
広告事業本部マーケティングソリューション1部 エグゼクティブマネージャー
業種特化型の営業スタイルをベースとし、テクノロジーを活用した課題解決やデータマネジメント領域が得意分野。
またWEB/アプリの両面におけるスマートフォンプロモーション分野も得意とする。

Contents

ico人気記事