ホーム  > 気になるニュース  > インターネット  > 日本のブログ、約4割がスパム?

2008 .03 .26

日本のブログ、約4割がスパム?

ニフティがスパムブログの判別技術を開発、国内記事の約4割がスパム(INTERNET Watch)
ニフティは26日、マーケティング分野の社内研究機関「ニフティ研究所」において、スパムブログを判別できるフィルタリング技術を開発したと発表した。
このブログは主に自分の興味ある事柄をメモしておく場として書いてます。はてブやTumblrなんかも使ってるけど今ひとつやりたい使い方にマッチしないのでブログという体裁で続けてるんですね。本代が欲しいのでアフィリエイトやアドセンスも入れてるけどコンテンツマッチの精度を確認したい、という目的もあったりします。

そんな趣旨なのでニュース記事を元にした二次情報が多く、記事の引用も多いので「スパム」って判定されてたらやだなーとも思ったり。

ニフティ研究所ではスパムブログを下記のように定義しています。
【スパムブログの種類】
スパムブログには、手法や目的、内容によってさまざまな種類があり、ニフティ研究所では、スパムブログを以下のように分類・定義しました。
○自動生成系
・引用スパム
他ブログやニュース記事、検索されやすいワードの検索結果スニペットなどの引用を自動的に取得して、記事を生成している。
・アフィリエイトスパム
商品写真とそのアフィリエイトリンクを大量に自動で掲載しているブログ。内容がほとんどない。
・ワードサラダ
文章をフレーズ単位で機械的に組み合わせて生成しているブログ。一見、人間が書いているように見えて、良く見ると文章の意味が通じていない。
・自動マルチポスト
同一記事を複数のブログに機械的に大量に投稿する。

○アダルト系
・わいせつ記事
わいせつな文章や画像、動画などが掲載されているブログ。
・出会い系
出会い系サイトを運営しているブログや、その入口となっているブログ。
・ワンクリック詐欺
ワンクリック詐欺を運営しているブログや、ワンクリック詐欺に誘導するための入口となっているブログ。

ニフティ、スパムブログのフィルタリング技術を開発(ニフティ株式会社)
前述のようにこのブログは公にされているニュースを扱ってるので、「キーワード引用系ロボットブログ」や「ワードサラダブログ」からのトラックバックやコメントがたくさん来ます。全部削除してるけど手間だし、cgiは叩かれてしまうのでサーバ負荷もありますね。

ニフティの取り組みなどで、こうしたスプログが少しでも減ってくれればいいんですけど。。。

とはいえちょっと気になる記述も。前述のニフティのリリースには、
ニフティのブログ評判分析サービス「BuzzPulse(バズパルス)」では、国内の約9割強のブログ、4.5億記事(2008年3月現在)を分析対象としており
とあるんですけど、
・そもそもニフティが把握している範囲のブログ数はいくつなのか?
・いつからいつまでの集計期間中での4億5,000万記事数なのか?
がよく分からないです。

2007年10月~2008年2月の各月約10万記事中、40%がスパムと認定された、というのがニフティの発表なので母数や集計対象がよく分からないんですよね。1ブログから均等にNエントリーを抽出して10万記事なのか、とか。バズパルスについてにも数字の根拠がないなぁ。

要は、数字としてまとまってると理解を早めるのに効果的なんだけど、「日本のブログ記事は4億5,000万あって、そのうち4割がスパムだ」っていうのはミスリードと思うんですよね。4割って数字だけみるとそんなもんかなぁって気はしますけど。

総務省の「ブログ及びSNSの登録者数」も「本当か?」って感じを持ってるんですけど、数字ってそのまま一人歩きしてしまう危険性があるものなのでその辺の集計期間や根拠となる母数について知りたいなと思いました。

とはいえこうしたフィルタリングの取り組みは評価できるものだし、もっと他社なんかにも広まっていって欲しいですね。

▼参考リンク
ニフティ、スパムブログのフィルタリング技術を開発~スパムブログについての自主調査を実施~(ニフティ株式会社)
BuzzPulse(@nifty)

▼関連記事
「日本のブログ、4割がスパム」――ニフティが新技術で分析(ITmedia News)
日本のブログの4割は「スパム」 ニフティが調査 -(asahi.com)

« ブックオフ、政府系銀行が筆頭株主に | ホーム | ついに、やっぱり。「LAST GIGS」完全版リリース »



この他のエントリー

アーカイブ