ヘッドレスブラウザとは何ですか?ヘッドレス ブラウザは、グラフィカル インターフェイスで実行できるブラウザです。ヘッドレス ブラウザをプログラムで制御して、テストの実行、Web ページのスクリーンショットの取得など、さまざまなタスクを自動的に実行できます。 なぜ「ヘッドレス」ブラウザと呼ばれるのでしょうか?「ヘッドレス」という言葉は、元々は「ヘッドレス コンピュータ」から来ています。 「ヘッドレス コンピュータ」に関する Wikipedia のエントリ: ヘッドレス システムとは、モニター (つまり「ヘッド」)、キーボード、マウスなしで動作するように構成されたコンピュータ システムまたはデバイスです。ヘッドレス システムは通常、ネットワーク接続を介して制御されますが、一部のヘッドレス システム デバイスでは、デバイス管理のために RS-232 シリアル接続も必要です。運用コストを削減するために、サーバーはヘッドレス モードで実行されることがよくあります。 ヘッドレスブラウザを検出するのはなぜですか?前述の 2 つの無害な使用例の他に、ヘッドレス ブラウザを使用して悪意のあるタスクを自動化することもできます。最も一般的な形式は、Web クローラー、トラフィックの偽装、または Web サイトの脆弱性の検出です。 非常に人気のあるヘッドレス ブラウザは Phantomjs です。Qt フレームワークをベースとしているため、一般的なブラウザと比較してさまざまな機能があり、識別方法も多数あります。 しかし、Chrome 59 以降、Google はヘッドレス Google Chrome ブラウザをリリースしました。 Phantomjsとは異なり、他のフレームワークではなくオーソドックスなGoogle Chromeをベースに開発されているため、プログラムが通常のブラウザなのかヘッドレスブラウザなのかを区別することが困難です。 以下では、プログラムが通常のブラウザで実行されているか、ヘッドレスブラウザで実行されているかを判断するためのいくつかの方法を紹介します。 ヘッドレスブラウザの検出注: これらの方法は 4 台のマシン (Linux 2 台、Mac 2 台) でのみテストされていますが、ヘッドレス ブラウザーを検出する方法は他にもたくさんあります。 ユーザーエージェントまず、ブラウザの種類を判断する最も一般的な方法である、ユーザーエージェントを確認する方法を紹介します。 Linux コンピュータ上の Chrome バージョン 59 ヘッドレス ブラウザのユーザー エージェント値は次のとおりです。 「Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (Khtml、Gecko に類似) HeadlessChrome/59.0.3071.115 Safari/537.36」 したがって、次のようにしてヘッドレス Chrome ブラウザかどうかを検出できます。 if (/HeadlessChrome/.test(window.navigator.userAgent)) { console.log("Chrome ヘッドレスが検出されました"); } ユーザーエージェントは HTTP ヘッダーから取得することもできます。ただし、これらのシナリオは両方とも簡単に偽造できます。 プラグインnavigator.plugins は、現在のブラウザのプラグイン情報を含む配列を返します。通常、通常の Chrome ブラウザには、Chrome PDF ビューアや Google Native Client などのデフォルトのプラグインがいくつか用意されています。対照的に、プラグインのないヘッドレス モードでは、空の配列が返されます。 (navigator.plugins.length == 0)の場合{ console.log("Chrome ヘッドレスである可能性があります"); } 言語Google Chrome には、現在のブラウザの言語設定を取得できる JavaScript プロパティが 2 つあります。navigator.language と navigator.languages です。最初のものはブラウザインターフェースの言語を参照し、2 番目のものはブラウザユーザーが選択したすべての二次言語を格納する配列を返します。ただし、ヘッドレス モードでは、navigator.languages は空の文字列を返します。 if (navigator.languages == "") { console.log("Chrome ヘッドレスが検出されました"); } ウェブGLWebGL は、HTML キャンバスで 3D レンダリングを実行できる一連の API を提供します。これらの API を通じて、グラフィックス ドライバーのベンダーとレンダラーを照会できます。 Linux 上の通常の Google Chrome ブラウザでは、レンダラーとベンダーの値は「Google SwiftShader」と「Google Inc.」として取得されます。 ヘッドレス モードでは、「Mesa OffScreen」 (ウィンドウ システムを使用しないレンダリング テクノロジの名前) と、オープン ソースの Mesa グラフィック ライブラリのオリジナル プログラマーである「Brian Paul」が表示されます。 var キャンバス = document.createElement('キャンバス'); var gl = canvas.getContext('webgl'); var debugInfo = gl.getExtension('WEBGL_debug_renderer_info'); var ベンダー = gl.getParameter(debugInfo.UNMASKED_VENDOR_WEBGL); var レンダラー = gl.getParameter(debugInfo.UNMASKED_RENDERER_WEBGL); if (ベンダー == "Brian Paul" && レンダラー == "Mesa OffScreen") { console.log("Chrome ヘッドレスが検出されました"); } ヘッドレス ブラウザのすべてのバージョンで、これら 2 つの値が同じであるわけではありません。ただし、現在ヘッドレスブラウザでは値は「Mesa Offscreen」と「Brian Paul」です ブラウザの機能Modernizr は、HTML および CSS のさまざまな機能に対する現在のブラウザのサポートを検出できます。通常のChromeとヘッドレスChromeの唯一の違いは、ヘッドレスモードではHIDPI/Retinaのヘアラインがサポートされているかどうかを検出するために使用されるヘアライン機能がないことです。 if (!Modernizr["ヘアライン"]) { console.log("Chrome ヘッドレスである可能性があります"); } 画像の読み込みに失敗しました最後に、私が見つけた最後の方法であり、最も効果的と思われる方法は、ブラウザで正しく読み込まれていない画像の高さと幅を確認することです。 通常の Chrome では、正常に読み込めなかった画像のサイズはブラウザのズームに関係しますが、絶対にゼロにはなりません。ヘッドレス Chrome ブラウザでは、この画像の幅と高さはどちらも 0 です。 var body = document.getElementsByTagName("body")[0]; var image = document.createElement("img"); 画像を拡大 image.setAttribute("id", "偽画像"); body.appendChild(画像); image.onerror = 関数(){ 画像の幅が 0 の場合、画像の高さは 0 になります。 console.log("Chrome ヘッドレスが検出されました"); } } 上記は、JavaScript を使用して現在のブラウザがヘッドレス ブラウザであるかどうかを検出する方法の詳細です。JavaScript の詳細については、123WORDPRESS.COM の他の関連記事に注目してください。 以下もご興味があるかもしれません:
|
<<: シェルを使用してMySQLデータバックアップスクリプトを作成する
>>: Linux で固定 IP を設定する方法 (テスト済みで効果的)
この記事では、動的なパーティクル効果を実現するためのjQueryの具体的なコードを参考までに紹介しま...
<p><b>これは太字フォントです</b></p> ...
初心者は自分で録音しましょう1. スーパーバイザーをインストールします。 Supervisor は ...
Linux では、基本的に vi エディタのように「.sh」拡張子を持つテキストの処理と実行を記述す...
説明する2 つの日付間の時間間隔を返します。文法DateDiff(間隔、日付1、日付2 [、週の最初...
この記事は、VMware Workstation 12 ProのインストールLinuxチュートリアル...
Linux の優れた点は、マルチユーザー、マルチタスク システムにあります。 Linux では通常、...
この記事では、マウスを動かしたときにセカンダリ メニュー バーを実装するために HTML+CSS を...
1. MySQLをインストールするこの記事はAPT経由でインストールされており、インストールされてい...
TeamCenter12はアカウントのパスワードを入力し、ログインをクリックすると、404または50...
目次前面に書かれたログインの概要ログインビジネスプロセスログインサービスの関連技術ポイントログイント...
この記事では、CSS で放射状グラデーションを使用して、次の図に示すクーポン スタイルの効果を実現す...
エラーメッセージ:制御プロセスがエラー コードで終了したため、mysqld.service のジョブ...
1. インストール前の準備: 1.1 JDKをインストールするopenjdkをアンインストールする...