新しい設定ファイルを作成します (たとえば、nginx インストール ディレクトリの下の conf ディレクトリに移動し、agent_deny.conf を作成します) Scrapyなどのツールによるクロールを無効にする if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) { return 403; } 指定されたUAまたは空のUAによるアクセスを禁止する #禁止のスクレイピー $http_user_agent の場合、(Scrapy|Curl|HttpClient) { 403 を返します。 } #禁止されたUA if ($http_user_agent ~ "Bytespider|FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|YisouSpider|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|^$" ) { 403 を返します。 } #GET|HEAD|POST メソッドによるアクセスは禁止 ($request_method !~ ^(GET|HEAD|POST)$) の場合 { 403 を返します。 } 次に、Web サイト構成のサーバー セクションに次のコードを挿入します: include agent_deny.conf; nginxを再起動します。 /data/nginx/sbin/nginx -s リロード クローリングをシミュレートするために curl -A を使用してテストを実行できます。例: curl -I -A 'YYSpider' <<www.xxx.con>> 結果
空の UA でクロールをシミュレートします。 curl -I -A' ' <<www.xxx.cn>> 結果
Baiduスパイダーのクローリングをシミュレートします。 curl -I -A 'Baiduspider' <<<www.xxx.cn>>>
UAタイプ FeedDemon コンテンツ コレクション BOT/0.1 (JCE 用 BOT) SQL インジェクション CrawlDaddy SQL インジェクション Java コンテンツ コレクション Jullo コンテンツ コレクション Feedly コンテンツ コレクション UniversalFeedParser コンテンツ コレクション ApacheBench cc 攻撃者 Swiftbot 役に立たないクローラー YandexBot 役に立たないクローラー AhrefsBot 役に立たないクローラー YisouSpider 役に立たないクローラー (UC Shenma Search に買収されました。このスパイダーはリリースできます!) jikeSpider 役に立たないクローラーMJ12bot 役に立たないクローラーZmEu phpmyadmin 脆弱性スキャンWinHttp コレクションcc 攻撃EasouSpider 役に立たないクローラーHttpClient tcp 攻撃Microsoft URL コントロール スキャンYYSpider 役に立たないクローラーjaunty wordpress ブラスト スキャナーoBot 役に立たないクローラーPython-urllib コンテンツ コレクションIndy ライブラリ スキャンFlightDeckReports Bot 役に立たないクローラーLinguee Bot 役に立たないクローラー Nginx アンチホットリンク設定 背景: サードパーティの参照リンクが画像にアクセスしてサーバーのリソースとネットワーク トラフィックを消費するのを防ぐために、サーバー上でホットリンク防止制限を行うことができます。 アンチホットリンクを実現するための方法を参照 動作モジュール: ngx_http_referer_module。 有効な変数: $invalid_referer、グローバル変数。 構成ドメイン: サーバー、場所 構成: サーバー{ 聞く 80; サーバー名 www.imcati.com refer-test.imcati.com; ルート /usr/share/nginx/html; 場所 ~*\.(gif|jpg|jpeg|png|bmp|swf)$ { valid_referers なし、www.imcati.com がブロックされました。 ($invalid_referer) の場合 { 403 を返します。 } } }
nginx アンチホットリンクとアンチクローラーの詳細な設定に関するこの記事はこれで終わりです。より関連性の高い nginx アンチホットリンクとアンチクローラーの設定内容については、123WORDPRESS.COM の以前の記事を検索するか、以下の関連記事を引き続き参照してください。皆様の今後の 123WORDPRESS.COM へのご支援をお待ちしております。 以下もご興味があるかもしれません:
|
<<: VueはEChartsを使用して折れ線グラフと円グラフを実装します
フロントエンド開発者が必ず知っておくべきケースとして、タブバーの切り替え効果があります。タブバー自体...
目次1. MySQL 8.0.18のインストール2. 環境変数を設定する3. 接続テスト1. MyS...
1. はじめにGit は、規模の大小を問わずあらゆるプロジェクトを俊敏かつ効率的に処理するために使用...
ウェブサイトをデザインするにはインスピレーションが必要です。良いインスピレーションを得るには、より多...
導入Alibaba Cloud のような OSS ストレージ サービスを使用している場合は、サービス...
ツリーマップは主にツリーのようなデータ構造を視覚化するために使用され、特殊なタイプの階層です。これを...
目次1. はじめに2. 出力情報の説明3. netstatの共通パラメータ4. netstatネット...
目次1. クロスドメインはどのように形成されるのでしょうか? 2. クロスドメインの根本的な原因3....
次のコードは、私の test.html にあります。ビデオは、c:\test.html などの絶対パ...
以下の属性はブラウザとの互換性があまりありません。 1.transform:rotate(45度) ...
画面紹介Screen は、コマンドライン端末切り替え用に GNU プロジェクトによって開発されたフリ...
Web デザインにおけるツリーとは何ですか?簡単に言うと、リンクをクリックするとサブディレクトリが展...
基本イメージが以前に構成されていて、これらのイメージが他の場所でも必要な場合はどうなりますか?回答:...
最近、Docker とホストが同じネットワーク セグメント上で通信する問題を解決し、そのプロセス全体...
VueはRefを使用してレベル間でコンポーネントインスタンスを取得します例の紹介開発プロセスでは、レ...