新しい設定ファイルを作成します (たとえば、nginx インストール ディレクトリの下の conf ディレクトリに移動し、agent_deny.conf を作成します) Scrapyなどのツールによるクロールを無効にする if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) { return 403; } 指定されたUAまたは空のUAによるアクセスを禁止する #禁止のスクレイピー $http_user_agent の場合、(Scrapy|Curl|HttpClient) { 403 を返します。 } #禁止されたUA if ($http_user_agent ~ "Bytespider|FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|YisouSpider|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|^$" ) { 403 を返します。 } #GET|HEAD|POST メソッドによるアクセスは禁止 ($request_method !~ ^(GET|HEAD|POST)$) の場合 { 403 を返します。 } 次に、Web サイト構成のサーバー セクションに次のコードを挿入します: include agent_deny.conf; nginxを再起動します。 /data/nginx/sbin/nginx -s リロード クローリングをシミュレートするために curl -A を使用してテストを実行できます。例: curl -I -A 'YYSpider' <<www.xxx.con>> 結果
空の UA でクロールをシミュレートします。 curl -I -A' ' <<www.xxx.cn>> 結果
Baiduスパイダーのクローリングをシミュレートします。 curl -I -A 'Baiduspider' <<<www.xxx.cn>>>
UAタイプ FeedDemon コンテンツ コレクション BOT/0.1 (JCE 用 BOT) SQL インジェクション CrawlDaddy SQL インジェクション Java コンテンツ コレクション Jullo コンテンツ コレクション Feedly コンテンツ コレクション UniversalFeedParser コンテンツ コレクション ApacheBench cc 攻撃者 Swiftbot 役に立たないクローラー YandexBot 役に立たないクローラー AhrefsBot 役に立たないクローラー YisouSpider 役に立たないクローラー (UC Shenma Search に買収されました。このスパイダーはリリースできます!) jikeSpider 役に立たないクローラーMJ12bot 役に立たないクローラーZmEu phpmyadmin 脆弱性スキャンWinHttp コレクションcc 攻撃EasouSpider 役に立たないクローラーHttpClient tcp 攻撃Microsoft URL コントロール スキャンYYSpider 役に立たないクローラーjaunty wordpress ブラスト スキャナーoBot 役に立たないクローラーPython-urllib コンテンツ コレクションIndy ライブラリ スキャンFlightDeckReports Bot 役に立たないクローラーLinguee Bot 役に立たないクローラー Nginx アンチホットリンク設定 背景: サードパーティの参照リンクが画像にアクセスしてサーバーのリソースとネットワーク トラフィックを消費するのを防ぐために、サーバー上でホットリンク防止制限を行うことができます。 アンチホットリンクを実現するための方法を参照 動作モジュール: ngx_http_referer_module。 有効な変数: $invalid_referer、グローバル変数。 構成ドメイン: サーバー、場所 構成: サーバー{ 聞く 80; サーバー名 www.imcati.com refer-test.imcati.com; ルート /usr/share/nginx/html; 場所 ~*\.(gif|jpg|jpeg|png|bmp|swf)$ { valid_referers なし、www.imcati.com がブロックされました。 ($invalid_referer) の場合 { 403 を返します。 } } }
nginx アンチホットリンクとアンチクローラーの詳細な設定に関するこの記事はこれで終わりです。より関連性の高い nginx アンチホットリンクとアンチクローラーの設定内容については、123WORDPRESS.COM の以前の記事を検索するか、以下の関連記事を引き続き参照してください。皆様の今後の 123WORDPRESS.COM へのご支援をお待ちしております。 以下もご興味があるかもしれません:
|
<<: VueはEChartsを使用して折れ線グラフと円グラフを実装します
1. BIOSを確認するまず、コンピュータの起動モードを確認します。win+R と入力し、msinf...
ポートが占有されているかどうかは、これまで一度もわかりませんでした。多くの人に尋ねて、ようやくわかり...
これは私の最初のブログ投稿です。時間の制約があるため、どのようにフォーマットすればよいかわかりません...
ムーアの法則はもはや適用されない2004年にフレックストロニクスがフロッグデザインを買収したのを皮切...
1. はじめにこの記事では、Docker Swarm を使用して Nebula Graph クラスタ...
目次序文参考比較手動比較浅い比較徹底比較要約する序文JavaScript でプリミティブ値を比較する...
http1.1 プロトコルのデフォルトのリクエスト ヘッダーでは、図に示すように、デフォルトで ke...
この記事では、Centos7.3でのmysql5.7.18のインストールと初期パスワードの変更につい...
この例で開発されたカスケード ドロップダウン メニューは、既存の JSON データに基づいて作成され...
この記事では、RHEL8 のネットワーク サービスとネットワーク構成ツール、およびネットワーク ファ...
1. はじめに● ランダム書き込みではヘッドがトラックを頻繁に変更するため、効率が大幅に低下します。...
最近、プロジェクトで nginx を使用し、バックエンドで Java を使用しました。バックエンドで...
最近、CSS 関連の知識ポイントをいくつか見直し、CSS における典型的なマージンの重なりの問題を整...
背景: Linux サーバーのファイルのアップロードとダウンロード。 XShell+Xftp インス...