1. ホーム
  2. バッシュ

[解決済み】bashの文字列の長さについて

2022-04-28 02:21:01

質問

変数に格納されている文字列の長さを取得し、それを別の変数に代入するにはどうすればよいでしょうか。

myvar="some string"
echo ${#myvar}  
# 11

出力に別の変数を設定する方法 11 ?

解決方法は?

UTF-8文字列の長さ

に加えて fedorquiさんの正解 を表示したい。 との違いは 文字列 長さと バイト 長さ :

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
LANG=$oLang LC_ALL=$oLcAll
printf "%s is %d char len, but %d bytes len.\n" "${myvar}" $chrlen $bytlen

がレンダリングされます。

Généralités is 11 char len, but 14 bytes len.

保存された文字列を見ることもできます。

myvar='Généralités'
chrlen=${#myvar}
oLang=$LANG oLcAll=$LC_ALL
LANG=C LC_ALL=C
bytlen=${#myvar}
printf -v myreal "%q" "$myvar"
LANG=$oLang LC_ALL=$oLcAll
printf "%s has %d chars, %d bytes: (%s).\n" "${myvar}" $chrlen $bytlen "$myreal"

が答えます。

Généralités has 11 chars, 14 bytes: ($'G\303\251n\303\251ralit\303\251s').

ノータ によると Isabell Cowanのコメント に設定を追加しました。 $LC_ALL とともに $LANG .

引数の長さ、動作例

引数の動作は通常の変数と同じ

showStrLen() {
    local bytlen sreal oLang=$LANG oLcAll=$LC_ALL
    LANG=C LC_ALL=C
    bytlen=${#1}
    printf -v sreal %q "$1"
    LANG=$oLang LC_ALL=$oLcAll
    printf "String '%s' is %d bytes, but %d chars len: %s.\n" "$1" $bytlen ${#1} "$sreal"
}

は次のように動作します。

showStrLen théorème
String 'théorème' is 10 bytes, but 8 chars len: $'th\303\251or\303\250me'

便利な printf 補正ツールです。

もし、あなたが

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
    printf " - %-14s is %2d char length\n" "'$string'"  ${#string}
done

 - 'Généralités' is 11 char length
 - 'Language'     is  8 char length
 - 'Théorème'   is  8 char length
 - 'Février'     is  7 char length
 - 'Left: ←'    is  7 char length
 - 'Yin Yang ☯' is 10 char length

そうでない場合 きれい を出力します。

そのための、ちょっとした関数を紹介します。

strU8DiffLen() {
    local charlen=${#1} LANG=C LC_ALL=C
    return $(( ${#1} - charlen ))
}

または1行で記述します。

strU8DiffLen() { local chLen=${#1} LANG=C LC_ALL=C;return $((${#1}-chLen));}

では、次に。

for string in Généralités Language Théorème Février  "Left: ←" "Yin Yang ☯";do
    strU8DiffLen "$string"
    printf " - %-$((14+$?))s is %2d chars length, but uses %2d bytes\n" \
        "'$string'" ${#string} $((${#string}+$?))
  done 

 - 'Généralités'  is 11 chars length, but uses 14 bytes
 - 'Language'     is  8 chars length, but uses  8 bytes
 - 'Théorème'     is  8 chars length, but uses 10 bytes
 - 'Février'      is  7 chars length, but uses  8 bytes
 - 'Left: ←'      is  7 chars length, but uses  9 bytes
 - 'Yin Yang ☯'   is 10 chars length, but uses 12 bytes

残念なことに、これは完璧ではありません

しかし、UTF-8には、ダブルスペース、ゼロスペース、逆置換など、単純にはいかない奇妙な動作が残っています...。

をご覧ください。 diffU8test.sh または diffU8test.sh.txt をご覧ください。