Linux に Python クローラー スクリプトを展開し、スケジュールされたタスクを設定する方法

Linux に Python クローラー スクリプトを展開し、スケジュールされたタスクを設定する方法

昨年、プロジェクトの必要性により、Python でクローラーを作成しました。クロールされたデータは、本番環境の PG データベースに保存する必要があります。したがって、スクリプトを CentOS サーバーに展開し、スクリプトを自動的に開始するスケジュールされたタスクを設定する必要があります。

実装手順は次のとおりです。

1. pip をインストールします (オペレーティング システムには直接使用できる python2.6 が付属していますが、pip はありません)

# pip インストール パッケージをダウンロードします wget "https://pypi.python.org/packages/source/p/pip/pip-1.5.4.tar.gz#md5=834b2904f92d46aaa333267fb1c922bb" --no-check-certificate
# インストールパッケージを解凍してインストールします tar -xzvf pip-1.5.4.tar.gz
cd pip-1.5.4
python setup.py インストール

2. pipでサードパーティのライブラリをインストールする

PyGreSQL==5.0.3 を pip でインストールします
pip インストール リクエスト == 2.18.3

3. スケジュールされたタスクを設定する

# スケジュールされたタスクサービスを開始します service crond start
# スケジュールされたタスクのサービスステータスを表示する service crond status
# スケジュールされたタスク編集ウィンドウを開く crontab -e 
# 毎日 0:00 と 12:20 に 1 回ずつ実行され、ログに書き込まれる 2 つのスケジュールされたタスクを追加します 0 0 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

20 12 * * * /usr/bin/python /home/longrise/psrd/collect.py > /home/longrise/psrd/collect.log 2>&1 &

スケジュールされたタスクの構文は次のとおりです。
# 詳細については man 4 crontabs を参照してください

# ジョブ定義の例:
# .---------------- 分 (0 - 59)
# | .------------- 時間 (0 - 23)
# | | .---------- 月日 (1 - 31)
# | | | .------- 月 (1 - 12) または jan、feb、mar、apr ...
# | | | | .---- 曜日 (0 - 6) (日曜日 = 0 または 7) または sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * ユーザー名 実行するコマンド

Linux に Python クローラー スクリプトを展開し、スケジュールされたタスクを設定する上記の方法は、エディターが皆さんと共有する内容のすべてです。参考になれば幸いです。また、123WORDPRESS.COM をサポートしていただければ幸いです。

以下もご興味があるかもしれません:
  • Jenkins 構成 Python スクリプト タイミング タスク プロセス ダイアグラム
  • Python BlockingScheduler タイミングタスクおよびその他の実装
  • Python のタイムタスクツール APScheduler の使い方
  • Python スケジュールタスク APScheduler の例の詳細な説明
  • Python クローラーのスケジュールされたタスクの一般的な方法 (推奨)

<<:  JS WebSocket 切断理由とハートビートの仕組みの詳しい説明

>>:  MySQLのユーザー権限の確認と管理方法の詳細な説明

推薦する

docker pruneコマンドは、あまり使用されないデータを定期的にクリーンアップするために使用できます。

目次docker システム df docker システム プルーンNoneオブジェクトをクリーンアッ...

nginx+WordPressで個人ブログを構築するプロセス全体の詳細な説明

0x00 はじめにWordPress は、世界で最も人気のある CMS システムです。PHP と M...

MySQL 8.0.11 のインストールと設定方法のグラフィック チュートリアル (win10)

この記事ではMySQL 8.0.11のインストールと設定方法を参考までに記録します。具体的な内容は以...

WeChat アプレット uniapp は左スワイプによる削除効果を実現します (完全なコード)

WeChatアプレットuniappは左スワイプで削除効果を実現成果を達成する1. スワイプしてリス...

JavaScriptの知識ポイントの詳しい説明

目次1. JavaScriptの基礎2. 基本的なJavaScript構文3. JavaScript...

CentOS7.4 で JDK1.8 をインストールするためのグラフィカル チュートリアル

Linux インストール JDK1.8 手順1. CentOS に独自の openJDK があるかど...

HTML に画像が存在しない場合にデフォルトの画像を表示する方法の例

画像リンク <img src="" /> jsを使用してURLが有効...

Vue のキーボードイベント監視の概要

キー修飾子キーボード イベントをリッスンする場合、詳細なキーを確認する必要があることがよくあります。...

Raspberry Pi 4 に Ubuntu 19.10 をインストールするための詳細なチュートリアル

以前、raspbian で実行したときに opencv の一部の依存関係をパッケージ化できず、一部の...

Mysqlはストアドプロシージャを通じて文字列を配列に分割します

文字列を配列に分割するには、次の 3 つの MySQL 関数を使用する必要があります。 REVERS...

ページコンテンツ全体を中央に配置して、高さがコンテンツに合わせて自動的に拡張されるようにする方法

ページコンテンツ全体を中央に配置する方法と、コンテンツに合わせて高さを自動的に拡大縮小する方法。これ...

VMware ESXi 6.0 および仮想マシンのインストール チュートリアルの展開 (画像とテキスト)

社内には以前からアイドル状態だった、構成の整ったサーバーがあったので、EXSI 6.0 を使って複数...

LinuxでのDockerのインストールチュートリアル

Docker パッケージは、デフォルトの CentOS-Extras リポジトリにすでに含まれていま...

Ubuntu 基本チュートリアル: apt-get コマンド

序文apt-get コマンドは、Ubuntu システムのパッケージ管理ツールです。パッケージのインス...