1. ホーム
  2. スクリプト・コラム
  3. DOS/BAT(ドス・バット

単語頻度統計(繰り返し行数/各行繰り返し回数)用バッチコード

2022-01-01 13:35:11

バッチ処理で単語頻度をカウントすることは可能ですか?
4つの単語が並んでいる場合、4つの単語フレーズの頻度のみカウントされます。
例えば

ミツバチの丘
一糸乱れぬ
毛の一本もない
何も成し遂げていない
古いものにキスを
ワンビロケーションと
秋を知る一葉
秋を知るための一葉
光を見るための葉っぱ
目に映る葉っぱ
一歩前進

以下のように実装されています。

豆の丘1
キスマーク1個
髪の毛1本も生えていない 1
何もしていない 1
古いものにキスをする 1
別れと1
秋を知る一葉 2
目に優しい葉っぱ 2
一枚の葉を前にして 3

ソリューションコード

@echo off & setlocal enabledelayedexpansion
for /f "delims=" %%a in ('type "test.txt"') do set /a "#%%a#+=1"
for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b
pause

Win7以上

powershell -c "gc 'test.txt'|group $_|%%{$_.name+' '+$_.count}"
pause

バッチ統計ワード頻度実装コード(繰り返し行数/各行の再発回数の統計)上のこの記事はここに導入され、より関連バット統計ワード頻度コンテンツは、以前の記事のスクリプトのホームを検索したり、次の関連記事を閲覧し続けることを望むあなたは、スクリプトのホームよりサポートされます!.