ニフティがスパムブログの判別技術を開発、国内記事の約4割がスパム(INTERNET Watch)
ニフティは26日、マーケティング分野の社内研究機関「ニフティ研究所」において、スパムブログを判別できるフィルタリング技術を開発したと発表した。
このブログは主に自分の興味ある事柄をメモしておく場として書いてます。はてブやTumblrなんかも使ってるけど今ひとつやりたい使い方にマッチしないのでブログという体裁で続けてるんですね。本代が欲しいのでアフィリエイトやアドセンスも入れてるけどコンテンツマッチの精度を確認したい、という目的もあったりします。
そんな趣旨なのでニュース記事を元にした二次情報が多く、記事の引用も多いので「スパム」って判定されてたらやだなーとも思ったり。
ニフティ研究所ではスパムブログを下記のように定義しています。
【スパムブログの種類】
スパムブログには、手法や目的、内容によってさまざまな種類があり、ニフティ研究所では、スパムブログを以下のように分類・定義しました。
○自動生成系
・引用スパム
他ブログやニュース記事、検索されやすいワードの検索結果スニペットなどの引用を自動的に取得して、記事を生成している。
・アフィリエイトスパム
商品写真とそのアフィリエイトリンクを大量に自動で掲載しているブログ。内容がほとんどない。
・ワードサラダ
文章をフレーズ単位で機械的に組み合わせて生成しているブログ。一見、人間が書いているように見えて、良く見ると文章の意味が通じていない。
・自動マルチポスト
同一記事を複数のブログに機械的に大量に投稿する。
○アダルト系
・わいせつ記事
わいせつな文章や画像、動画などが掲載されているブログ。
・出会い系
出会い系サイトを運営しているブログや、その入口となっているブログ。
・ワンクリック詐欺
ワンクリック詐欺を運営しているブログや、ワンクリック詐欺に誘導するための入口となっているブログ。
ニフティ、スパムブログのフィルタリング技術を開発(ニフティ株式会社)
前述のようにこのブログは公にされているニュースを扱ってるので、「キーワード引用系ロボットブログ」や「ワードサラダブログ」からのトラックバックやコメントがたくさん来ます。全部削除してるけど手間だし、cgiは叩かれてしまうのでサーバ負荷もありますね。
ニフティの取り組みなどで、こうしたスプログが少しでも減ってくれればいいんですけど。。。