[解決済み] ソートせずに重複行を削除する[duplicate](重複)
2022-06-16 12:38:57
質問
Pythonでユーティリティスクリプトを作成しています。
#!/usr/bin/env python
import sys
unique_lines = []
duplicate_lines = []
for line in sys.stdin:
if line in unique_lines:
duplicate_lines.append(line)
else:
unique_lines.append(line)
sys.stdout.write(line)
# optionally do something with duplicate_lines
この単純な機能(
uniq
をソートする必要がなく、安定した順序付け) は、単純な UNIX ユーティリティとして利用可能なはずですよね? パイプ内のフィルタの組み合わせとか?
質問の理由: 私がどこからでもPythonを実行できないシステム上でこの機能を必要とします。
どのように解決するのですか?
UNIX Bashスクリプトのブログ を提案します。 :
awk '!x[$0]++'
このコマンドは awk にどの行を表示するかを指示しています。変数
$0
は行の内容全体を保持し、角括弧は配列のアクセスです。つまり、ファイルの各行に対して、配列のノードである
x
のノードがインクリメントされ、そのノードの内容が (
!
)でない場合は、その行を表示する。
関連
-
[解決済み】ログアウトと再ログインをせずに.bashrcの設定を再読み込みする方法とは?
-
[解決済み] テキストファイルから、特定の文字列を含むすべての行を削除するにはどうすればよいですか?
-
[解決済み] あるディレクトリにあるすべてのコード行を再帰的にカウントするにはどうすればよいですか?
-
[解決済み] エクスポートあり/なしの変数の定義
-
[解決済み] Bashスクリプトでカレントディレクトリ名(フルパスなし)を取得する
-
[解決済み] git リポジトリの行数をカウントする
-
[解決済み] ファイルの行の順番を逆にするにはどうすればよいですか?
-
[解決済み] シェルスクリプトからエコーを使わずにパスワードを取得する方法
-
[解決済み】ドキュメントの行数を数えるには?[クローズド]。
-
[解決済み] [Solved] data.frameで全てまたは一部のNA(欠損値)を含む行を削除する。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] sed が正規表現で終端がない代用品でエラーになる
-
[解決済み】Bashで複数行のコメントを作成する方法は?
-
[解決済み】ある名前に一致するプロセスをすべて終了させる方法は?
-
[解決済み】シェルスクリプトの終了時にバックグラウンドプロセスやジョブを強制終了するにはどうすればいいですか?
-
[解決済み] Visual Studio Codeで重複した行を削除するにはどうすればよいですか?
-
[解決済み] Unixでソートせずにファイル内の重複行を削除する方法
-
[解決済み] Dockerで依存する子イメージのリストを取得する方法は?
-
[解決済み] POSIX shで文字列が他の文字列を含んでいるかどうかを判断するにはどうすればよいですか?
-
[解決済み] バックグラウンドでコマンドを実行し、何も出力されないのはなぜですか?
-
[解決済み] ファイルの先頭に付けるシェルワンプライナー