Twitter検索のクエリ傾向

Twitterが検索について興味深いデータを公開しました。

Studying rapidly evolving user interests – Twitter Engineering Blog
http://engineering.twitter.com/2012/06/studying-rapidly-evolving-user.html

ツイートやリアルタイム検索のクエリに含まれる単語を調べると、
ある1時間または1日に最も頻繁に登場した単語は、
次の1時間または1日の内容とは大きく異なる傾向にあることがわかった。
この傾向はウェブ上の他のコンテンツと比べてかなり強い。

  • 2011年10月の全ての検索クエリを調べたところ、平均して、ある1時間に上位1000位に入った検索語の約17%が、次の1時間にはもはや1000位以内には存在しないということが分かった。
  • 時間単位ではなく1日単位で調べた場合、ある1日に上位1000位に入った検索語の約13%が、次の日には1000位以内には存在しないということが分かった。
  • 大きなイベントの間には検索クエリが急上昇する回数(クエリスパイク)が増加する。例えば、2011年10月5日にSteve Jobsが死去したニュースが出た際には、「steve jobs」という検索クエリがごくわずかな検索数から検索クエリ全体の15%へと急上昇した。これは検索されたクエリの6件に1件の割合だった。また、「apple」や「stay foolish」という関連クエリも急上昇している。

graph-apple-queries

また、ニューヨーク、イスタンブール、東京、サンパウロの4都市での1年および1日のTwitterの利用状況を調査したところ、東京のユーザーは主に夜にTwitterを利用する傾向があることが分かった。

sleeping_grid-miguel

Twitterのリアルタイム性が顕著に出ているデータで面白いですね。
ただ、東京では夜に利用が多いというは他のサービスでも同じような傾向なので、東京というか日本のネットユーザーの傾向だと思います。

広告

Googleリアルタイム検索の代わりは?

Googleリアルタイム検索が利用出来なくなってしまいましたので
代替となるリアルタイム検索サービスを紹介したいと思います。

Yahoo!リアルタイム検索
・Twitterと業務提携
・適合度順、更新日順で並び替えが可能
・検索結果画面から直接「お気に入り」「リツイート」「返信」が可能
・注目のキーワードを表示
・過去24時間以内のツイートのみが対象
・PC版のみ提供

Twitter検索(twitter.com)
・本家Twitterが提供する検索サービス
・ログインしている場合はパーソナライズされた検索結果が表示
・トレンド、関連する画像や動画も表示
・トップ(適合度順)、全て(更新日順)、リンク付きのツイートで並び替えが可能
・PC版、スマートフォン版あり

Twitter検索(search.twitter.com)
・本家Twitterが提供するもう一つの検索サービス
・検索結果画面から直接Reply(返信)が可能
・言語ごとのフィルタが可能
・TrendingTopics, NiftyQueriesを表示
AdvancedSearchで詳細な条件での検索が可能(感情などもあり)
・PC版、スマートフォン版あり

NAVERリアルタイム検索
・Twitter以外にニュースやブログなども対象
・PC、スマートフォン、ケータイの各デバイスに最適化

Bingソーシャル(Beta)
・最新、最も一致する検索結果で並び替えが可能
・注目のリンクを表示
・PCのみで提供

TOPSY
・過去のツイートを簡単に検索可能
・ツイート以外にウェブ、画像、動画、エキスパートでフィルタが可能
・関連性、日付で並び替えが可能
・言語ごとのフィルタが可能
・メールアラート、RSS購読が可能
・PCのみで提供

新しいTwitter検索はパーソナライズ検索

Twitter検索がリニューアルされて関連する画像や動画も表示されるようになりましたが
実はアルゴリズムも新しくなっており、検索結果はパーソナライズされています。

Twitterのエンジニアブログより抜粋して概要を説明します。

ユーザーはもっとも印象に残ったツイートや友人の間で評判のあったツイートに興味がある。
我々の新検索システムでは個別のユーザーごとに
もっとも関連性が高いツイートを検索結果に表示する。
そして、ユーザーの間で反響のなかったツイートは排除される。
つまり検索結果のパーソナル化だ。

Often, users are interested in only the most memorable Tweets or those that other users engage with. In our new search experience, we show search results that are most relevant to a particular user. So search results are personalized, and we filter out the Tweets that do not resonate with other users.

パーソナル化には3つの情報に着目している
・インデックスされる時間の静的な情報
・リアルタイムに取得される反響の情報
・検索時に取得される検索する人の情報

To support relevance filtering and personalization, we needed three types of signals:
・Static signals, added at indexing time
・Resonance signals, dynamically updated over time
・Information about the searcher, provided at search time

こうした情報を総合してそれぞれのツイートの個人別の関連性が計算され、
パーソナライズされた検索結果として表示されます。

実際に新しくなったTwitter検索を使ってみた感想としては、
ニュース系の一般的な情報のツイートのあとに
各ユーザーのツイートが表示されるパターンが多く見られて
以前よりは関連性は高くなっているかと感じました。
ただパーソナライズされているため、
全員が同じようなパターンではないと思います。

また、Googleのリアルタイム検索のように、
スペル訂正(”Aple” → “Apple”ではありませんか?)や
クエリの書き換え(”アップル” → “Apple”でも同時に検索)などの
便利な検索機能がまだ無いため改善の余地はまだまだありそうです。