通常、Web サイトを構築する目的は、検索エンジンにインデックス登録してもらい、プロモーションを拡大することです。しかし、Web サイトに個人のプライバシーや機密性の高い非公開の Web ページが含まれており、検索エンジンによるインデックス登録やクロールを禁止する必要がある場合、どうすればよいでしょうか。たとえば、Taobao は検索エンジンによるインデックス作成が禁止されている Web サイトの例です。この記事では、検索エンジンによる Web サイト コンテンツのインデックス作成とクロールをブロックまたは禁止するいくつかの方法について説明します。 検索エンジンのスパイダーはインターネットを絶えずクロールしています。当社のウェブサイトが検索エンジンによるインデックス作成を禁止する措置を講じなければ、検索エンジンによって簡単にインデックス作成されてしまいます。ここでは、検索エンジンがウェブサイトのコンテンツをインデックスしないようにする方法を説明します。 まず、robots.txtメソッド 検索エンジンはデフォルトで robots.txt プロトコルに準拠しています (一部の不正なエンジンは除きます)。robots.txt テキスト ファイルを作成し、Web サイトのルート ディレクトリに配置します。コードを次のように編集します。
上記のコードを使用すると、検索エンジンにこの Web サイトをクロールしてインデックスしないように指示できます。上記のコードを使用するときは注意してください。これにより、すべての検索エンジンが Web サイトのどの部分にもアクセスできなくなります。 Baidu検索エンジンによるウェブページのインデックス作成とクロールのみを禁止する場合 1. robots.txt ファイルを編集し、マークアップを次のように設計します。
上記の robots ファイルは、Baidu からのすべてのクロールを禁止します。 ここで、Baidu のユーザーエージェントについてお話ししましょう。Baiduspider のユーザーエージェントとは何でしょうか? Baidu はさまざまな製品に異なるユーザーエージェントを使用します。
各製品の異なるユーザーエージェントに基づいて、異なるクロール ルールを設定できます。次のロボット実装では、Baidu からのクロールはすべて禁止されますが、画像検索による /image/ ディレクトリのクロールは許可されます。
注意: Baiduspider-cpro および Baiduspider-ads によってクロールされた Web ページはインデックス化されません。これらは顧客と合意した操作を実行するだけなので、ロボット プロトコルに準拠していません。これは Baidu に連絡することによってのみ解決できます。 Google 検索エンジンによる Web ページのインデックス作成とクロールのみを禁止するにはどうすればよいでしょうか? 方法は次のとおりです。 robots.txt ファイルを編集し、次のようにマークします。
2番目は、ウェブページコード方式 ウェブサイトのホームページ コードの <head> と </head> の間に、コード <meta name="robots" content="noarchive"> を追加します。このタグは、検索エンジンがウェブサイトをクロールしてウェブ ページのスナップショットを表示することを禁止します。 Baidu 検索エンジンが Web サイトをクロールして Web ページのスナップショットを表示するのを防ぐには、Web サイトのホームページの <head> コードと </head> コードの間に <meta name="Baiduspider" content="noarchive"> を追加します。 Google 検索エンジンがウェブサイトをクロールしてウェブページのスナップショットを表示するのを防ぐには、ウェブサイトのホームページの <head> コードと </head> コードの間に <meta name="googlebot" content="noarchive"> を追加します。 さらに、次のような状況のように、私たちのニーズが非常に奇妙な場合もあります。 1. ウェブサイトに robots.txt が追加されましたが、Baidu 検索でまだ見つかりますか? 検索エンジンのインデックスデータベースの更新には時間がかかるためです。 Baiduspider はお客様の Web サイト上の Web ページへのアクセスを停止しましたが、Baidu 検索エンジン データベースに確立された Web ページ インデックス情報をクリアするには数か月かかる場合があります。ロボットの設定が正しいかどうかも確認してください。掲載を拒否する必要がある場合は、苦情プラットフォームを通じてリクエストを送信することもできます。 2. ウェブサイトのコンテンツを Baidu でインデックス化したいのですが、スナップショットとして保存したくありません。どうすればいいですか? Baiduspider はインターネット メタ ロボット プロトコルに準拠しています。 Web ページのメタ設定を使用すると、Baidu でそのページのみをインデックスし、検索結果にそのページのスナップショットを表示しないようにすることができます。ロボットの更新と同様に、検索エンジンのインデックス データベースの更新にも時間がかかります。そのため、Web ページのメタを通じて Baidu がページのスナップショットを検索結果に表示することを禁止した場合でも、Web ページのインデックス情報がすでに Baidu 検索エンジン データベースに設定されている場合は、更新がオンラインで有効になるまでに 2 ~ 4 週間かかることがあります。 3. Baidu にインデックス登録したいが、Web サイトのスナップショットを保存したくない場合は、次のコードで問題を解決できます。 4. すべての検索エンジンが Web ページのスナップショットを保存することを禁止する場合、コードは次のようになります。 よく使用されるコードの組み合わせを以下に示します。
要約する 以上がこの記事の全内容です。この記事の内容が皆様の勉強や仕事に何らかの参考学習価値をもたらすことを願います。123WORDPRESS.COM をご愛顧いただき、誠にありがとうございます。これについてもっと知りたい場合は、次のリンクをご覧ください。 以下もご興味があるかもしれません:
|
<<: Vue プロジェクトで Baidu Map API を使用する方法
>>: Node.js で MySQL データベースにバッチデータを挿入する方法
目次1. 技術の選択2. 技術的な実装vue-json-excelプラグインを使用して実装1. vu...
目次序文一般的な方法1. 親コンポーネントを介して子コンポーネントの発行イベントをリッスンしてpro...
1.1 nginxインストールパッケージとインストールスクリプトをクライアントにコピーし、スクリプト...
データの初期化 `test_01` が存在する場合はテーブルを削除します。 テーブル「test_01...
mysql5.7.18の解凍版はmysqlサービスを起動します。具体的な内容は以下のとおりです。 1...
nginx (エンジン x) は、高性能な HTTP およびリバース プロキシ サーバー、メール プ...
私は頻繁にシステムをインストールするので、インストールのたびにいくつかのソフトウェアを再インストール...
最近はMySQLのパフォーマンス最適化についても研究しているので、今日の投稿は勉強ノートとしても使え...
序文CSS グリッドは通常、さまざまなフレームワークにバンドルされていますが、実際のビジネス ニーズ...
コードをコピーコードは次のとおりです。 <HTML> <ヘッド> <T...
背景: Linux サーバーのファイルのアップロードとダウンロード。 XShell+Xftp インス...
目次1. テレポートについて知る2. テレポートの基本的な使い方3. 最初のステップの最適化4. 第...
前面に書かれた多くの場合、現在のプロジェクトの状況とビジネスニーズに基づいて Nginx をインスト...
この記事では、Vue3.0の手書きカルーセル効果の具体的なコードを参考までに共有します。具体的な内容...
<br />今は情報爆発の時代であるだけでなく、サービス爆発の時代でもあります。それはす...