英語の単語の出現頻度を数えるtrコマンドの魔法

英語の単語の出現頻度を数えるtrコマンドの魔法

置換を削除したり文字列を削除したりできる tr コマンドは、誰もがよく知っています。 英語では、英語に出現する単語の頻度を数える必要があることがよくあります。従来の方法を使用して計算機を設定し、1つずつ数えると、かなり時間がかかります。このとき、trコマンドを使用して、分割されたスペースを改行文字に置き換え、次にtrコマンドを使用して、いくつかの単語の後のピリオド、カンマ、感嘆符を削除します。まず、置き換えるthis.txtファイルを確認します

ティム・ピーターズ著『Pythonの禅』
美しいものは醜いものより良い。
明示的なものは暗黙的なものよりも優れています。
複雑なものよりシンプルなものの方が良いです。
複雑なものより複雑なものの方が良い。
フラットな方がネストされたよりも優れています。
密集よりも疎集の方が良いです。
読みやすさが重要です。
特別なケースは、ルールを破るほど特別ではありません。
実用性は純粋さに勝りますが。
エラーは決して黙って通過してはなりません。
明示的に沈黙させない限り。
曖昧な状況に直面しても、推測する誘惑を拒否してください。
それを実行する明白な方法が 1 つ (できれば 1 つだけ) あるはずです。
ただし、オランダ人でない限り、その方法は最初は明らかではないかもしれません。
今がやらないよりはましだ。
とはいえ、今より決して良いことはない場合が多いです。
実装を説明するのが難しい場合は、それは悪い考えです。
実装が簡単に説明できる場合は、良いアイデアかもしれません。
名前空間は素晴らしいアイデアです。もっと活用しましょう!

上記のテキストファイルで、テキスト内で最も多く出現する上位10個の単語をカウントしたい場合は、次のコマンドを使用できます。

[root@linux ~]# cat this.txt | tr ' ' '\n' | tr -d '[.,!]' | sort | uniq -c | sort -nr | head -10
10は
8 より良い
8 より
5から
5の
3の
3 しかし
3 決して
3 する
3 1つ

とても便利ですよ!

要約する

以上がこの記事の全内容です。この記事の内容が皆様の勉強や仕事に何らかの参考学習価値をもたらすことを願います。123WORDPRESS.COM をご愛顧いただき、誠にありがとうございます。これについてもっと知りたい場合は、次のリンクをご覧ください。

以下もご興味があるかもしれません:
  • Linux でファイルを削除するときに「操作は許可されていません」というプロンプトが表示される場合の対処方法
  • Linux シェルコマンドは重複排除後の列の値をカウントします
  • Linux で履歴レコードを表示し、タイムスタンプを追加するためのヒント
  • LinuxのバックグラウンドでPythonプログラムを実行するいくつかの方法
  • Linux シェルスクリプトの作成と実行
  • PythonはLinuxを操作するためにparamikoを使用する
  • 2つのLinuxサーバー間でファイルとフォルダを転送する手順
  • Linux で削除できないファイル/フォルダの解決方法
  • Linuxターミナルでシェルスクリプトを実行して現在実行中のアプリのログを直接出力するAndroidの実装方法
  • Linux シェル環境での Zabbix API の使用

<<:  データベースマルチテーブル接続クエリの実装方法の詳細説明

>>:  Vue3のサンドボックスの仕組みの詳しい説明

推薦する

Nginx のステータス監視とログ分析の詳細な説明

1. Nginx ステータス監視Nginx には、Nginx の全体的なアクセス ステータスを監視す...

JSON.parse と JSON.stringify の使い方の詳細な説明

目次JSON.パースJSON.parse 構文リバイバーパラメータJSON.parse の機能その他...

Linux md5sumコマンドの使い方

01. コマンドの概要md5sum - MD5検証コードを計算して検証するmd5sum コマンドは、...

Dockerイメージを素早くデプロイして実行する最新のIDEAプロセスの詳細な説明

背景docker とアイデアを使用して、Java Web の開発、展開、運用までのプロセス全体を実現...

XHTMLコードの一般的なアプリケーション問題をまとめる

時間が経つにつれて、多くの人が XHTML の使い方を知らないことに気づきました。普通の初心者だけで...

Vue 基本チュートリアル: 条件付きレンダリングとリストレンダリング

目次序文1.1 機能1.2 要素の可視性を制御する方法1.3 初期レンダリングの比較1.4 スイッチ...

IE6 および IE7 で DIV コンテナの固定高さを使用するためのヒント

IE6 と IE7 では CSS の解釈に多くの違いがあります。今日はそのうちの 1 つである高さに...

パフォーマンス負荷診断にMySQLシステムデータベースを使用する方法

ある達人がかつて、自分の妻のことを知るのと同じくらい、自分が管理するデータベースのことを知るべきだと...

複雑なウェブサイトのナビゲーションを簡素化

<br />ナビゲーション設計は構造設計における主要なタスクの 1 つです。ソフトウェア...

MySQL の高度な機能 - データ テーブル パーティショニングの概念とメカニズムの詳細な説明

目次パーティション分割メカニズムSELECTクエリINSERT操作DELETE操作更新操作パーティシ...

CSS3 はアニメーション属性を使用してクールな効果を実現します (推奨)

animation-name アニメーション名。複数のアニメーションがバインドされていることを示す...

CSS属性のデフォルト値width: autoとwidth: 100%の違いの詳細な説明

幅: 自動子要素(コンテンツ+パディング+境界線+余白を含む)は、親要素のコンテンツ領域全体を埋めま...

docker を使用してシンプルな C/C++ プログラムをデプロイする方法

1. まずhello-world.cppファイルを作成しますプログラムコードは次のとおりです。 #i...

MySQL 5.7.18 のインストール中に MySQL サービスの起動に失敗する問題の解決策

MySQL は非常に強力なリレーショナル データベースです。しかし、初心者の中には、インストールや設...

MySQL のデータ型とフィールド属性の原理と使用法の詳細な説明

この記事では、MySQL のデータ型とフィールド属性について説明します。ご参考までに、詳細は以下の通...