Linux システムでの Selenium クローラー プログラムの導入の概要

Linux システムでの Selenium クローラー プログラムの導入の概要

序文

仕事で Linux サーバーに Selenium クローラー プログラムを展開する必要があります。これを皆さんと共有したいと思います。ご興味があれば、ぜひご覧ください。


1. セレンとは何ですか?

Selenium は、Web アプリケーションのテストに使用されるツールです。 Seleniumテストは、実際のユーザーが操作しているのと同じようにブラウザで直接実行され、クローラーはそれを使用してjsによって動的に読み込まれたデータをクロールします。

2. 使用手順

1. ライブラリをインポートする

コードは次のとおりです

selenium.webdriverからChromeをインポート
selenium.webdriver.chrome.service から Service をインポート
from selenium.webdriver.chrome.options import Options # ヘッドレスブラウザを使用する from selenium.webdriver import ChromeOptions
chrome_options = オプション()
オプション = ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation']) # => 自動テストソフトウェアによって制御されているブラウザを削除します。options.add_experimental_option('useAutomationExtension', False)
chrome_options.add_argument("--headless") # => Chrome のヘッドレス モードを設定します chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--disable-dev-shm-usage')

2. テストコード

コードは次のとおりです。

s = サービス(r"/home/driver/chromedriver")
ドライバー = Chrome(
     サービス=s、オプション=chrome_options
 )
 ドライバー.get("https://www.baidu.com")
 print(div.title) を印刷します。

3. 展開手順

1. Chromeをインストールする

コマンドは次のとおりです。

yum で https://dl.google.com/linux/direct/google-chrome-stable_current_x86_64.rpm をインストールします
Chromeのバージョンを確認します: google-chrome --version

2. chromedriverをインストールする

コマンドは次のとおりです。

対応する Chrome バージョンに応じて、chromedriver ドライバー アドレスをダウンロードします: https://npm.taobao.org/mirrors/chromedriver
私のバージョン番号は: 96.0.4664.45
https://npm.taobao.org/mirrors/chromedriver/96.0.4664.45/chromedriver_linux64.zip をダウンロードしてください 
yum インストール -y zip を解凍します
unzip chromedriver_linux64.zip # zip ファイルを解凍します mkdir driver # ドライバーを保存するための新しいフォルダーを作成します chmod 777 driver/chromedriver # これは権限です。ここでは 777 を与えます

3. テストコードを実行する

新しいtest.pyファイルを作成する

vi テスト.py 

ここに画像の説明を挿入

test.py を保存して実行します。

ここに画像の説明を挿入

これを見ると、私のリクエストは成功したようです。

要約する

Linux システムでの Selenium クローラー プログラムの展開に関するこの記事はこれで終わりです。Linux Selenium クローラー プログラムに関する関連コンテンツの詳細については、123WORDPRESS.COM の以前の記事を検索するか、以下の関連記事を引き続き参照してください。今後も 123WORDPRESS.COM を応援していただければ幸いです。

以下もご興味があるかもしれません:
  • LinuxベースのSelenium環境を構成し、操作を実装する

<<:  アニメーションとトランジションの違い

>>:  MySQL の基本: グループ化関数、集計関数、グループ化クエリの詳細な説明

推薦する

CentOS 7 での Nginx ログタイミング分割の実装手順の詳細説明

1. 分割スクリプト (splitNginxLog.sh) を作成します。 * この例では、ログ分割...

HTML のテキストエリア タグ

<textarea></textarea> は、複数行を入力できるテキスト ...

ApacheとTomcatによるクラスタ環境構築プロセスの分析

実際、Apacheクラスタを構築するのは難しくありません。私もインターネットで情報を見つけて自分で設...

17の広告効果測定の解釈

1. 広告の 85% は未読です<br />解釈: 成功する広告の 15% にどうやって...

ウェブページ(ウェブサイト)のデザインと制作に関する考えや経験の共有

まずは投稿する前に! 「I Want to Study on My Own!」に改めて感謝します。た...

JavaScript の静的スコープと動的スコープを例を使って説明します

目次序文静的スコープと動的スコープ静的スコープ実行プロセス動的スコープ実行プロセスエクササイズ練習1...

Mysql | ワイルドカード(%、_ など)を使用したファジークエリの詳細な説明

ワイルドカードのカテゴリ: %パーセント ワイルドカード: 任意の文字が任意の回数出現できることを示...

マウスのドラッグ効果を実現するJavaScript

この記事では、マウスドラッグ効果を実現するためのJavaScriptの具体的なコードを参考までに紹介...

sysbenchツールによるMySQLデータベースのパフォーマンステストの実装方法

1. 背景Sysbench は、システムのハードウェア パフォーマンスをテストできるストレス テスト...

nginx.pid を開く際の失敗と無効の解決策

目次1. 問題の説明2. 問題分析3. 解決策解決策1: ディレクトリを作成する解決策2: 構成ファ...

実用的なウェブオンラインツール12選

1.ファビコン.cc ico アイコンの Web サイトをオンラインで作成するには、画像をアップロー...

Nginx のアクセス制御とパラメータ調整方法

Nginx グローバル変数Nginx には、$variable 名を通じて使用できるグローバル変数が...

nginxリバースプロキシによるセッション障害の問題の解決策

同僚から助けを求められました。バックエンド システムへのログインは成功したものの、システムには正常に...

MacOS Catalina アップグレード後の VMware ブラック スクリーン問題に対する完璧な解決策の詳細な説明

MacOS Catalina アップグレード後の VMware ブラック スクリーンに対する完璧なソ...

スケジュールされた時間に古いジャンクファイルを自動的に削除する Linux 用の Autotrash ツール

Autotrash は、古い削除済みファイルを消去するプロセスを自動化するコマンド ライン プログラ...