序文仕事で Linux サーバーに Selenium クローラー プログラムを展開する必要があります。これを皆さんと共有したいと思います。ご興味があれば、ぜひご覧ください。 1. セレンとは何ですか?Selenium は、Web アプリケーションのテストに使用されるツールです。 Seleniumテストは、実際のユーザーが操作しているのと同じようにブラウザで直接実行され、クローラーはそれを使用してjsによって動的に読み込まれたデータをクロールします。 2. 使用手順1. ライブラリをインポートするコードは次のとおりです selenium.webdriverからChromeをインポート selenium.webdriver.chrome.service から Service をインポート from selenium.webdriver.chrome.options import Options # ヘッドレスブラウザを使用する from selenium.webdriver import ChromeOptions chrome_options = オプション() オプション = ChromeOptions() options.add_experimental_option('excludeSwitches', ['enable-automation']) # => 自動テストソフトウェアによって制御されているブラウザを削除します。options.add_experimental_option('useAutomationExtension', False) chrome_options.add_argument("--headless") # => Chrome のヘッドレス モードを設定します chrome_options.add_argument('--no-sandbox') chrome_options.add_argument('--disable-gpu') chrome_options.add_argument('--disable-dev-shm-usage') 2. テストコードコードは次のとおりです。 s = サービス(r"/home/driver/chromedriver") ドライバー = Chrome( サービス=s、オプション=chrome_options ) ドライバー.get("https://www.baidu.com") print(div.title) を印刷します。 3. 展開手順1. Chromeをインストールするコマンドは次のとおりです。 yum で https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm をインストールします Chromeのバージョンを確認します: google-chrome --version 2. chromedriverをインストールするコマンドは次のとおりです。 対応する Chrome バージョンに応じて、chromedriver ドライバー アドレスをダウンロードします: https://npm.taobao.org/mirrors/chromedriver 私のバージョン番号は: 96.0.4664.45 https://npm.taobao.org/mirrors/chromedriver/96.0.4664.45/chromedriver_linux64.zip をダウンロードしてください yum インストール -y zip を解凍します unzip chromedriver_linux64.zip # zip ファイルを解凍します mkdir driver # ドライバーを保存するための新しいフォルダーを作成します chmod 777 driver/chromedriver # これは権限です。ここでは 777 を与えます 3. テストコードを実行する新しいtest.pyファイルを作成する vi テスト.py test.py を保存して実行します。 これを見ると、私のリクエストは成功したようです。 要約するLinux システムでの Selenium クローラー プログラムの展開に関するこの記事はこれで終わりです。Linux Selenium クローラー プログラムに関する関連コンテンツの詳細については、123WORDPRESS.COM の以前の記事を検索するか、以下の関連記事を引き続き参照してください。今後も 123WORDPRESS.COM を応援していただければ幸いです。 以下もご興味があるかもしれません:
|
>>: MySQL の基本: グループ化関数、集計関数、グループ化クエリの詳細な説明
1. 分割スクリプト (splitNginxLog.sh) を作成します。 * この例では、ログ分割...
<textarea></textarea> は、複数行を入力できるテキスト ...
実際、Apacheクラスタを構築するのは難しくありません。私もインターネットで情報を見つけて自分で設...
1. 広告の 85% は未読です<br />解釈: 成功する広告の 15% にどうやって...
まずは投稿する前に! 「I Want to Study on My Own!」に改めて感謝します。た...
目次序文静的スコープと動的スコープ静的スコープ実行プロセス動的スコープ実行プロセスエクササイズ練習1...
ワイルドカードのカテゴリ: %パーセント ワイルドカード: 任意の文字が任意の回数出現できることを示...
この記事では、マウスドラッグ効果を実現するためのJavaScriptの具体的なコードを参考までに紹介...
1. 背景Sysbench は、システムのハードウェア パフォーマンスをテストできるストレス テスト...
目次1. 問題の説明2. 問題分析3. 解決策解決策1: ディレクトリを作成する解決策2: 構成ファ...
1.ファビコン.cc ico アイコンの Web サイトをオンラインで作成するには、画像をアップロー...
Nginx グローバル変数Nginx には、$variable 名を通じて使用できるグローバル変数が...
同僚から助けを求められました。バックエンド システムへのログインは成功したものの、システムには正常に...
MacOS Catalina アップグレード後の VMware ブラック スクリーンに対する完璧なソ...
Autotrash は、古い削除済みファイルを消去するプロセスを自動化するコマンド ライン プログラ...