下腹オプティマイザ

主にIT関係の雑記帳です。全然関係ないことも書くかもしれないです。

俺のブログ記事がSmartNewsに取り上げられる方法を考えた

ココに書いてある3つのことを実践すればアクセス殺到!?

あり得ないって?

考えるくらいタダなんだから考えさせてよ。

まずは方法を考えるまでに至った情報、理屈を綴った。

SmartNewsの情報 

まず参照したのがSmartNews公式:媒体運営者の皆様へ

Publishers | スマートニュース株式会

http://about.smartnews.com/ja/2015/04/21/20150421/

独自のSmartFormat 

独自フォーマットが必要なのか?

SmartFormat ファイルのフォーマットは、RSS 2.0 の仕様 (http://cyber.law.harvard.edu/rss/rss.html) 、もしくはAtomの仕様(http://tools.ietf.org/html/rfc4287)に準拠します。また、XML の namespace を用いて一部仕様を拡張しております。

 

http://docs.smartnews.com/smartformat/ja/より

 

うん、要するにRSSAtomってことらしい。一部が拡張されているだけであってわざわざ拡張する必要ななさそう。

 

求められる「良質」なコンテンツ

SmartNews側のポリシーとしてはSmartNewsというアプリ自体の質を損なわないように

表示するコンテンツは「良質」なものが求められるようだ。

SmartNewsは、主に媒体運営者とそのユーザーとのエンゲージを弊社独自のアルゴリズムで観測し、“いま・もっとも注目されているコンテンツ”を割り出し、その評価をもとにSmartNewsユーザーの皆様へ良質なコンテンツを表示する仕組みをとっています。その際、コンテンツ(各記事)を中心とする評価を基準に表示を行います。SmartNewsでは、検索エンジンと同様にこのような仕組みをロボットで自動的に行っています。これが、人手を使って良質なコンテンツを選定する他のサービスとの違いです。 

 http://docs.smartnews.com/smartformat/ja/より 

 

それも"いま・もっとも注目されている"とまで言っているわけだからよほどバズらなければいけないようだ。

 

これらの選定については社内独自のアルゴリズムで行っているようだが、現状非公開。

少しでもこのアルゴリズムについてより多く知ることができれば選出される可能性を効果的に上げることができるはず。

 

確率は1万分の1以下?! 

この選出方法の核となるアルゴリズムについて既にSmartNewsに取材している記事があった。

 

web-tan.forum.impressrd.jp

 

まず目に入ったのがフローチャート

インターネット

抽出

言語識別

カテゴリ分け

類似排除

注目度順

 

というのが基本的な流れのようだ。注目すべきはそこに添えられている数字だ。

インターネットから抽出されるのが約1000万件以上

かなりの数が抽出されるように思えるが、この後に言語識別が入ることから分かるように

世界で1000万件というわけだ。

 

そして最終的に1000件~程度に絞られる。

単純計算でも1万分の1、最初の段階でも入らない可能性があるわけだからもっと低いことは容易に想像できる。

 

情報は鮮度が命!

何はともあれこの1000万件入れなければ終わりなわけだが、これは恐らく次の二つ

  • SmartFormatに準拠しているか
  • 記事が作成されて一定時間が経過していないか

であろう。一つ目は言うまでも無いが、二つ目の根拠はSmartNewsが「いま」というキーワードを多用していることだ。時間というのはとても計算しやすくSmartNewsにとって重要なファクターであれば最初の段階で切り分けられるのが自然だ。

 

流行りの乗るだけではだめ?!

SmartNewsは「いま」の次に「もっとも注目されている」と題しているが

もっとも注目されている記事を書くために一番手っ取り早いのは「流行り」に乗ることが一般的。しかし、単純に注目されている記事だけを集めただけでは流行りモノでアプリが満たされてしまう。

はっきり言って「妖怪◯ォッチ」で満たされたニュースアプリなど誰も見たくないわけだ。

そのためにSmartNewsはカテゴリ分けを行い類似度の高い記事を排他するのだ。

 

SmartNewsに載るためにする3つのこと

「うーん、結局どうすればいいの」って?

俺的には次の3つ

  • フォーマットを合わせる(大前提)
  • 自分の得意な分野の最先端を追う
  • 日々コンスタントにコンテンツを配信する 

 

1つ目は当然ねここから確認できるのでvalidになるか確認する

http://validator.engine.smartnews.be/url

試しにこのブログをやったらwarningだった。

f:id:kurogomapurin11:20150424083407p:plain

一応大丈夫そう。完全にだめだとinvalid。OKならvalidっぽい。

 

2つ目は結局のところ生存競争と同じで得意分野で戦って勝たないとだめってこと。

いくら流行り物が求められていてもその分野の専門家のほうが速く良質なのでは。

付け焼き刃な記事ではなくて普段から鍛えた知識を素早く振るうことが一番の近道

 

3つ目はどうもSmartNewsはサイトのコンテンツの量にも着目しているようで

私のような超不定期で量のないサイトはアウトオブ眼中というか、量が無ければ質が伴わないとも考えられるね。

つまり日頃の努力も評価してくれるわけだ。

 

まとめ

要約すると「SmartNews、めっちゃスマートじゃん」

俺みたいにちょっとずる賢く記事載せてアフィリエイト稼いじゃおーみたいな輩を見事に排他する仕組みを構築することに成功しているよう。客観的に考えて良質で鮮度の高い情報を機械的にする方法的確に実現することに成功しているように見える。

実際私も非常によくこのアプリを使っているが飽きない。

だが、現状、全てが全て機械的にやっているわけではなく人間も部分的に介入しているようだ。むしろ付け入る隙は人間の方がありそうだが、そうなると。。。。