剽窃はお世辞ではありません:元のコンテンツをコピーするスクレーパーに対処する方法

Ravenツールが2億ページのクロールで実施した調査によると、ページの29%に重複コンテンツの問題がありました。

うわー。

あなたはあなたの聴衆が読みたいと思うであろう主題を掘り起こすために一生懸命に働きます。次に、調査を実施して、聴衆に最高のアイデアとデータを提示できるようにします。最後に、優れたコンテンツを作成し、編集して公開します。

何のために?

スクレーパーはあなたの記事が目玉を獲得するのを待っています。あなたの記事が注目を集めると、彼は何も考えずに自分のWebサイトにコンテンツをすばやくコピーして貼り付けます。

彼はあなたの作品をコピーすることによってあなたのトラフィックのチャンクを受け取ります。そして、彼はまた、作品をまとめた創造的な人物であると主張します。

ああ!おぞましい。

しかし、待ってください、もっとあります…

あなたの記事のコピーされたバージョンはあなたのターゲットキーワードの検索ランキングであなたの元のものを打ち負かすことさえできます(しかし、これが起こる可能性はわずかです)。

これは、同じキーワードでランク付けされた、再利用されたコンテンツと元のコンテンツの例です。スクレーパーがあなたの仕事を盗むときも同じことが起こり得ます。

image09

したがって、スクレーパーはあなたのブランドを妨げ、あなたのハードワークからのトラフィックを奪う可能性があります。

私はこれが大きな苦痛であることを知っています。 2016年のB2Bコンテンツマーケティングベンチマークレポートでは、魅力的なコンテンツの作成がB2Bマーケターによる最大の課題として挙げられました。

image28

さらに、Social Media Examinerのレポートによると、マーケターの81%がオリジナルコンテンツの使用を増やすことを計画しています。

したがって、この記事では、模倣者の扱いを支援したいと思います。もちろん、すべてのスクレーパーが盗むのを止めることはできません。しかし、あなたは間違いなくあなたの利益のために状況を使うことができます。

ニール・パテルとの相談
私の代理店があなたのウェブサイトへの大量のトラフィックをどのように促進できるかをご覧ください

SEO-大量のSEOトラフィックのロックを解除します。実際の結果をご覧ください。
コンテンツマーケティング-私たちのチームは、共有され、リンクを取得し、トラフィックを引き付ける壮大なコンテンツを作成します。
有料メディア-明確なROIを備えた効果的な有料戦略。
電話を予約する

スクレーパーと戦うために使用できる戦略とツールを共有する前に、いくつかの良いニュースをお伝えしたいと思います…

多くのマーケティングの達人に浮かぶ恐れがあり、Googleが重複コンテンツの問題であなたにペナルティを科すのではないかという恐れがあります。そのため、多くのブロガーは自分のコンテンツを転用することを恐れています。

しかし、Matt Cuttsは、2013年に、重複コンテンツのペナルティなどはないと公式に述べています。

Webのコンテンツの25〜30%は重複コンテンツであり、それで問題ありません。

はい、Googleは重複コンテンツに対してウェブサイトにペナルティを科す権利を留保しますが、コンテンツを過度にコピーして検索結果を操作しようとしている場合に限ります。


さて、コンテンツが盗用されてもすべてが失われることはないので、スクレーパーを処理するために従う必要のあるツールと手順から始めましょう。

すべての記事で寛大に内部リンクを実行し、Googleウェブマスターツールを使用して着信リンクを監視し、このWordPressプラグインを使用します
人々があなたのコンテンツを盗むのを止めることはできませんが、無料のトラフィックを増やすのはどうですか?

スクレーパーがあなたのコンテンツをコピーした場合、おそらく彼はハイパーリンクを削除する努力をしません。

したがって、それらを利用するための優れた方法は、すべての記事で寛大な内部リンクを実行することです。これは、WebサイトのSEOに最適であり、Webサイトのクロール性を向上させ、訪問者のナビゲーションを支援します。さらに、コピーした記事からリンクされたページへのトラフィックを増やすこともできます。

あなたの内部の製品とカテゴリーのページはそれ自身でリンクを引き付けないかもしれません。しかし、それらにリンクすることによって、あなたはあなたのウェブサイト上のリンクジュースがうまく流れることを確実にします。

image01

そのため、すべての記事でインターネットマーケティングのガイドも定期的に参照しています。

Glenysは内部リンクの実験を行い、14の内部リンクを追加することで、GoogleとBingの最初のページで購入者のキーワードをランク​​付けすることができました。

image20

内部リンク中は、ブログの関連記事/ページを参照し、説明的なアンカーテキストを使用するようにしてください(すべてのハイパーリンクにキーワードを詰め込まないでください)。

image06

リンクと参照トラフィックを取得するのは良い気分だと思います。しかし、スクレイプされたWebサイトがGoogleによってフラグ付けされた場合はどうなりますか?

怪しげなリンクでGoogleからペナルティを受けたくない。したがって、新しい着信リンクがないかWebマスターツールを監視し続ける必要があります。 [トラフィック]>[サイトへのリンク]に移動します。

image15

このセクション内にリストされているドメインから、任意のドメインをクリックして、リンク元の特定のページを見つけることができます。

image05

Kristi Hinesは、cornerstone-works.comをクリックして、Webサイトが彼女の投稿タイトルを露骨にコピーしていることを発見しました。ウェブサイトにアクセスしたところ、彼女は自分の記事全体が一言一句コピーされていることに気づきました。

image04

Googleウェブマスターツールは、検索の巨人があなたのウェブサイトに重複する問題を見つけた場合にも通知します。

WordPressを使用している場合は、ウェブサイトがウェブサイトのページにリンクするたびに通知を受け取るようにトラックバックを設定することもできます。

2012年の記事で注目すべきProBloggerの20人のブロガーにリストされた後:

Kristi Hinesは、18のサイトが彼女のcを盗んだことを発見しました

 

トラックバックを介して彼女のWordPressダッシュボードで、逐語的に(リンクはそのまま)。

image26

内部リンクと着信リンクの監視に加えて、Pubsubhubbubプラグインpingを実行することもお勧めします。

ツールにpingを実行するとどうなりますか?

あなたの記事のコピーされたバージョンがどのようにあなたを凌駕することができるかを私があなたに言ったことを覚えていますか?これは主に、Googleが元のバージョンより前にコピーされた記事を検出した場合に発生します。

Pubsubhubbubプラグインは、信頼できるソースに、あなたが記事の元のソースであり、最初に公開したことを伝える方法です。

image16

WordPressを使用していない場合は、次のpubsubプロトコルを使用できます。

この「魔法の」ツールを使用して、コピーしたコンテンツのリンク属性を設定します
了解しました。リンクアトリビューション用のこの次のJavascriptベースのツールでは、小さなコードで遊ぶ必要があります。使いやすく、非常に強力ですが、不安を感じる場合は、フリーランサーを雇ってください。

人々は、キーボードショートカット、右クリック、またはドロップダウンメニューを使用して、Webサイトからコンテンツをコピーします。

しかし、誰かがWebサイトから一定量のテキストをコピーしたときに、コピーしたテキストのセクションに元のコンテンツへのリンクを配置するとよいと思いませんか。

それができれば、テキストが貼り付けられた場所にWebサイトへのリンクが自動的に表示されます。これは、誰かがWebサイトからコンテンツをコピーするたびに、RollingStoneがソーシャルメディアアカウントと元の記事のリンクを配置する方法の例です。

image00

ここで、Andre Alparと彼のチームによる、上記の状況の実装を支援できるオープンソースJavascriptベースのコードを紹介します。完全にカスタマイズ可能で、WordPress/Drupalを含むほとんどのCMSプラットフォームで動作します。

コードには、コアコード、モディフィケーションコード、フックコードの3つの部分があります。これらを使用してツールを設定する方法は次のとおりです。

ステップ1–ここからコアコードをダウンロードして「copyenrich-filter.js」として保存します。次に、ここから変更コードをダウンロードして「copyenrich.js」として保存します。

ステップ2– http://www.yourdomain.com/js/のような新しいディレクトリの下で、サーバーにファイルをアップロードします。

ステップ3–ページでスクリプトをアクティブ化するには、フッターにフックコードを追加する必要があります–本文の終了タグの直前です。 Webサイト全体でスクリプトをアクティブ化する場合は、Webサイトテンプレートに変更を加える必要があります。

image07

Copy-Magic-Pasteをアクティブにしたので、実行できるいくつかのカスタマイズを紹介します。

コピーされたコンテンツを変更する最小の長さを設定する– filter_minlengthの下の数を変更することにより、Webサイトの引用を表示する文字数を変更できます。

image21

ソースURLの後ろにテキストを追加する–filter_source_urlの下でURLの前に表示されるコンテンツを変更することもできます。

デフォルトは「Foundon:」です。

注:\ n\nはそのままにしておきます。そうしないと、コピーされたコンテンツが失われます。

image13

コンテンツがGoogleAnalytics(GA)からコピーされた回数を追跡する– GAを介してWebサイトのトラフィックを分析している場合は、このスクリプトを使用してコンテンツのコピーを追跡することもできます。 GA内で確認できる「ページにコピー」パラメータが含まれています。

パラメータの名前を変更する場合は、filter_analytics_nameを変更して自由に変更してください。

image08

GAでコピーイベントを見つけるには、[動作]>[イベント]>[概要]に移動します。

image23

それがコピーされた正確なページからの正確なテキストを知りたいですか?

次に、[イベントラベル]> [完全なレポートを表示]に移動した後、セカンダリディメンションとして「ページ」を追加します。

image10

この素晴らしいCopy-Magic-Pasteツールには、他にもカスタマイズや機能があり、ここで確認できます。

これらの3つのツールを使用してスクレーパーの上にとどまる
ウェブサイトからすべての記事のタイトルまたはランダムなテキストのチャンクを定期的に検索しない限り、コンテンツをコピーするすべてのウェブサイトを見つけることはできません。より良い代替策は、これら3つのツールから助けを得ることです。

Screaming Frog –これは、Webサイトの最大500ページをクロールして、重複するコンテンツの問題を見つけることができる無料のツールです。

image27

プログラムをダウンロードしてインストールした後、サイトのURLを入力する必要があります。次に、「スタート」ボタンを押します。

image12

ツールが結果を返したら、フィールド(ページタイトル、メタ説明、H1、H2、画像など)をクリックし、重複フィルターを選択して、Webサイトで重複するコンテンツの出現を検索できます。

image03

Copyscape –このツールは、Web上で最も強力な盗用検索エンジンになることを約束します。コンテンツのURLを入力するだけで、Web上に重複が浮かんでいるかどうかをツールに確認させることができます。

Copyscapeプレミアムを購入して、バッチ検索でWebサイトの最大10,000ページをチェックすることもできます。また、盗用者に警告し、Webサイトのコンテンツを保護するためのバナー(以下のようなもの)も提供しています。

image22

Googleアラート–これは、コンテンツが再公開されているかどうかを確認するための、検索大手によるすばらしい無料ツールです。

 

ywhereオンライン。投稿の正確なタイトルが表示されたときに、引用符で囲むことでアラートを設定できます。

image14

Kristiが行ったように、電子メール通知を設定するか、これらのアラートをRSSフィードに送信することもできます。

image18

スクレーパーのホスティングプロバイダーにDMCAの苦情を申し立て、後で検索エンジンに申し立てます
コンテンツをコピーしているWebサイトを見つけたら、それらを無視するか、追跡するかを選択できます。

(上記で概説したツールと戦略によって)SEOに役立つ良好な参照トラフィックとリンクを取得している場合は、この手順をスキップしてください。しかし、彼らが権威の高いウェブサイトであり、検索結果であなたを上回っている可能性がある場合は、スクレーパーを追いかけることはあなたの時間の価値があるかもしれません。

お問い合わせフォーム、ソーシャルメディアアカウント、メールアドレスを介してサイトのウェブマスターに直接連絡することから始めます。 Who.Isツールを使用して、ドメインの所有者と管理者のアドレスに関する情報を見つけることができます。

image11

彼らが誤ってあなたのコンテンツをコピーしたプロのウェブサイトである場合、彼らはあなたの通知を見た後にあなたのコンテンツを削除します。

応答がない場合(またはメールアドレスや連絡先情報が見つからない場合)は、ホスティングプロバイダーまたはドメイン登録者に連絡することをお勧めします。この情報は、Who.isツールにWebサイトを接続することで入手できます。

image17

上のスクリーンショットでは、ウェブサイトがGodaddyに登録され、Hostgatorでホストされていることがわかります。したがって、ここのHostgatorでDMCAフォームに記入できます。また、Copyrightclaims @ godaddy.comでGodaddyに連絡して、自社がホストするWebサイトが著作権で保護された素材を盗んでいることを通知することもできます。

デジタル情報のホスティングプロバイダーとプロセッサーは、デジタルミレニアム著作権法DMCA)に基づいて著作権で保護されたコンテンツを削除するための厳格な手順に従う必要があります。

ホストがアクションを実行しない場合(Webサイトを一時停止/削除するか、コンテンツを削除する)、次のようにします。

1. DMCAによる削除サービスを利用します(月額$ 10)。

image24

WordPressを使用している場合は、ウェブサイトでバッジを使用して泥棒に警告することもできます。

image19

2.コピーされたコンテンツのインデックスを解除するために、Google、Yahoo、Bingに直接DMCAの申し立てを行います。

コピーしたコンテンツリンクと元の著作物の詳細を簡単なフォームに記入する必要があります。

image25

結論
グーグルは1997年以来、オリジナルのコンテンツから複製を分離してきました。彼らはウェブがそれをたくさん含んでいることを知っています。しかし、「重複コンテンツ」は2005年に流行語になりました。このフレーズへの関心がどのように高まったかを見てください。

thatimage02

ただし、注意を払い、高品質のコンテンツから最大限のメリットを確実に得られるようにする必要があります。最終的には、Googleがあなたの味方であり、スクレーパーが検索の巨大な結果から完全に削除される可能性があることを忘れないでください。

あなたのウェブサイトのコンテンツが他のウェブサイトによってコピーされたことはありますか?この問題をどのように解決しましたか?