知能情報メディア実験II T-10 「機械学習による推薦アルゴリズム」

担当教員

実験について

背景:推薦とは何か

コンピュータネットワークとインターネットWebの発展に伴い,情報発信の低コスト化,各種サービスのオンライン化が近年は急速に発達した.これに伴い,ネットワークに溢れる大量の情報を利用して,サービスのユーザに,できるだけ効率よくユーザが望むような情報を提供するための技術が必要とされている.

あなたは今,レンタルDVDショップから映画をレンタルしようとしているとしよう.そのショップには1万タイトルの映画の貸し出しを行っている.あなたは1万本の映画のなかから,どのようにして今日見たい映画を選べばよいだろうか? もし一万本のDVDが,あいうえお順,あるいは発売日順に陳列されていたとしたらどうだろうか? ユーザが見たい映画にたどり着くのは容易ではない.そのため,ショップでは,邦画・洋画や,アクション・ラブコメ・SF・歴史などある程度のジャンルに分類した上でDVDを陳列する.

もしあなたが洋画のアクション映画を見たいと心に決めていた場合は,ジャンル毎の陳列はそれなりに求める映画を探す上で役に立つだろう.これは検索の問題である. 一方で,もしあなたが自分でどんな映画を見たいかを自覚していない場合はどうだろうか? もっとも単純な選択の基準は,たとえば以下のものになるだろう.

  • リリース一週間以内新作を見る (新しい映画が見たい)
  • 今週最も貸し出しが多かった作品を見る (人気のある映画が見たい)
  • ショップ店員のオススメ映画を見る (映画に詳しい人が好む映画が見たい)
  • これらはリリース時期や人気,権威ある人物の評価など,映画の内容とは異なる外部的な要因に基づいた選択である.これらは全てショップ側からの推薦と捕らえることができる. このような推薦はレンタルDVDに限らず様々な場面で見かけることができる.たとえば書店にいけば目立つ場所に平積みされた新作の書籍や,売れ行きベストテンを陳列した棚をみることができる.

    システムによる推薦

    このようにアイテムをオススメする側からの能動的な情報提供を推薦とよぶ。上記の新作やベストテン(あるいは"今売れています")は伝統的なオススメ手法であるが,これらの推薦情報は,万人に共通した評価基準(新しさ,人気など)に基づいたものであり,万人に受け入れやすいが,バラエティに乏しいという欠点がある.

    近年では,サービスのオンライン化によって,誰が何を買った(見た,借りた)といったログ情報が蓄積されていることから,画一的ではない,それぞれのユーザの好みに応じた推薦を実現することが可能になっている.最も有名な例は,amazon.comによる,"この本を買った人はこんな本も買っています"であろう.

    amazon推薦の例

    またソーシャルブックマークされたページに類似ページを提示する機能も推薦の一種といえる(以下の画像は一部編集されています)。

    hatenaの推薦

    このように,情報の受け手に提示する情報を適応させることを個別化とよぶ。推薦において個別化を実現する代表的な手法として協調フィルタリングが知られている.協調フィルタリングでは,それぞれのユーザが蓄積した情報に基づいて,機械学習の各種テクニックを利用し推薦情報を生成する. この実験では,約6000人程度のユーザが約4000タイトルの映画に対して付与した5段階の評価情報(MovieLens)を元に,まだ見ていない映画の評価を推定し,その評価をもとにオススメの映画を推薦するシステムを作成する.

    実験の概要

    この実験では主に以下の内容について実装を行い、レポートを提出する。