1. ホーム
  2. Python

pythonのstring()モジュール

2022-02-14 17:49:24
一般的な文字列操作
<スパン インポート文字列

1. 文字列定数(constants)
1)  の文字列を入力します。 アスキー・レター  を連結したものです。  アスキー_小文字  そして  アスキー・アッパーケース  定数を使用します。この値はロケールに依存しない。 印刷文字列.ascii_letters
abcdefghijklmnopqrstuvwx yzABCDEFGHIJKLMNOPQRSTUV WXYZ
2)  の文字列を入力します。 アスキー_小文字
 小文字の場合  <スパン 'abcdefghijklmnopqrstuvwx yz' . この値はロケールに依存しないため、変更されることはありません。
3) 文字列 アスキーアッパーケース  大文字のアルファベット  <スパン 'abcdefghijklmnopqrstuvwx YZ' . この値はロケールに依存せず、変更されることはない。 4) string.digits 10進数
 文字列 '0123456789' です。
5) string.hexdigits 16進数
 文字列 '0123456789abcdefABCDEF' です。
6) 文字列.文字
 後述の小文字と大文字の文字列を連結したもの。具体的な値はロケールに依存し、 locale.setlocale() が呼ばれたときに更新される。
文字列.文字を表示する
abcdefghijklmnopqrstuvwx yzABCDEFGHIJKLMNOPQRSTUV WXYZ
7) 文字列.小文字
 小文字とみなされるすべての文字を含む文字列。ほとんどのシステムでは、これは文字列 'abcdefghijklmnopqrstuvwx' になります。 yz'です。この定義を変更しないでください。ルーチン upper() と swapcase() への影響は未定義です。
8) string.octdigits 8進数
 文字列'01234567'。
9) string.punctuation Punctuation
 C ロケールでは句読点とみなされる ASCII 文字の文字列。
10) string.printable 数字、文字、句読点の空白を含む、印刷可能なすべての文字セット
 数字、文字、句読点、空白の組み合わせです。
印刷文字列.printable
0123456789abcdefghijklmn opqrstuvwxyzABCDEFGHIJKL MNOPQRSTUVWXYZ!"#$%&'()*+,-. /:;<=>? @[\]^_`{|}~
11) string.uppercase
 大文字とみなされるすべての文字を含む文字列。ほとんどのシステムでは、これは 'ABCDEFGHIJKLMNOPQRSTUVWX' という文字列になります。 YZ'です。この定義を変更しないでください。ルーチン lower() と swapcase() への影響は未定義です。
12) string.whitespace すべての空白文字が含まれる。
\t   時計職人の定式化
\⑭改行(ラインフィード)

\ʕ-̫͡-ʔ 

\ʕ-̫͡-ʔ
\この定義に影響を与えるstrip()とsplit()メソッドが定義されているので、変更しないでください。

 ホワイトスペースとみなされるすべての文字を含む文字列。ほとんどのシステムでは、スペース、タブ、ラインフィード、リターン、フォームフィード、 , および垂直タブが含まれる。ルーチンstrip()およびsplit()への影響は未定義です。
文字列の空白を表示する
2. 文字列 Method(メソッド)
以下は、8ビット文字列とUnicodeオブジェクトの両方がサポートする文字列メソッドの一覧です。これらのメソッドのどれもが、キーワード引数を取らないことに注意してください。
さらに、Pythonの文字列は Sequence Types - str, unicode, list, tuple で説明されているシーケンス型のメソッドをサポートしています。 整形された文字列を出力するには、テンプレート文字列か String Formatting Operations のセクションで説明されている % 演算子を使います。
str.capitalize()  文字列の最初の文字を大文字に、他の文字を小文字にする
 文字列の最初の文字だけを大文字にしたコピーを返します。
 8ビット文字列の場合、この方法はロケールに依存する。
str.center(width[, fillchar])
 長さ width の文字列の中央に配置されたものを返す。パディングは指定された fillchar (デフォルトはスペース) を使って行われる。
 バージョン2.4で変更: fillchar引数に対応しました。
str.count(sub[,start[,end]])。  サブ文字列の数を返す
 start, end]の範囲内で、重複しない部分文字列subの出現回数を返します。オプションの引数startとendはスライス表記と同様に解釈される。
str.decode([エンコーディング[, エラー])  デコード
 encoding はデフォルトの文字列エンコーディングです。errors を指定すると、異なるエラー処理スキームを設定できます。デフォルトは 'strict' で、エンコーディングのエラーは UnicodeError を発生させます。他の値としては、'ignore'、'replace'、その他 codecs.register_error() で登録されたものがあります(コーデックの基本クラス を参照)。
str.encode([エンコーディング[, エラー])  エンコーディング
 デフォルトエンコーディングは、現在のデフォルトの文字列エンコーディングです。 エラーを与えて、異なるエラー処理スキームを設定することができます。エラーに対するデフォルトは 'strict' で、エンコーディングのエラーは UnicodeError を発生させるという意味です。その他の値としては、'ignore'、'replace'、'xmlcharrefreplace'、'backslashreplace'、その他 codecs.register_error() で登録可能なもの、コーデックの基底クラス を参照してください。
str.endswith(suffix[,start[,end]])  文字列がsuffixで終わっているかどうかを調べ、終わっていればtrueを、終わっていなければfalseを返します。
 suffix には、検索するサフィックスのタプルを指定することもできます。

str.expandtabs([tabsize])
 現在の列と与えられたタブサイズに応じて、すべてのタブ文字を1つ以上のスペースに置き換えた文字列のコピーを返します。tabsizeが与えられていない場合、8文字のタブサイズが仮定される。これは、他の非印刷文字やエスケープシーケンスは理解しません。
str.find(sub[, start[, end]]) 文字列の中からsubを探し、見つかったらその位置を返し、見つからなかったら-1を返します。
 subが範囲[start, end]に含まれるような、文字列中の部分文字列subが見つかる最小のインデックスを返します。オプションの引数startとendはスライス表記と同様に解釈されます。subが見つからなければ-1を返す。
str.format(format_string, *args, **kwargs)
 文字列の書式設定操作を行う。format_string 引数には、リテラルテキストまたは中括弧 {} で区切られた置換フィールドを指定することができます。各置換フィールドは、位置引数の数値インデックス、またはキーワード引数の名前のいずれかを含みます。 各置換フィールドは、対応する引数の文字列値で置き換えられます。
 >> "1+2の和は{0}".format(1+2)
 「1+2の和は3である
 フォーマット文字列で指定できる様々なフォーマットオプションの説明については、「フォーマット文字列の構文」を参照してください。
 この文字列フォーマットの方法は Python 3.0 の新しい標準であり、新しいコードでは String Formatting Operations で説明されている % フォーマットよりも優先されるべきものです。
str.index(sub[,start[,end]])です。 見つからないときにエラーを返すことを除けば、findと似ている
 find() と同様ですが、部分文字列が見つからなかった場合に ValueError を発生させます。
str.isalnum() 出力された文字が英数字で構成されているかどうかを判定する
 文字列中のすべての文字が英数字であり、かつ少なくとも1つの文字が存在すればtrueを、そうでなければfalseを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.isalpha()
 文字列中のすべての文字がアルファベットで、かつ少なくとも1つの文字があればtrueを、そうでなければfalseを返します。
 8ビット文字列の場合、この方法はロケールに依存する。
str.isdigit()
 文字列中の全ての文字が数字であり、かつ少なくとも1つの文字があればtrueを、そうでなければfalseを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.islower()
 文字列中の全ての大文字が小文字で、かつ少なくとも1つの大文字があればtrueを、そうでなければfalseを返します。
 8ビット文字列の場合、この方法はロケールに依存する。
str.isspace()
 文字列の中に空白文字しかなく、かつ1文字でもあればtrueを、そうでなければfalseを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.istitle()
 文字列がタイトルケース付きの文字列で、少なくとも1つの文字がある場合に真を返します。例えば、大文字は、ケースなし文字にのみ続くことができます。
 8ビット文字列の場合、この方法はロケールに依存する。
str.isupper()
 文字列中の全ての大文字が大文字で、かつ少なくとも1つの大文字があればtrueを、そうでなければfalseを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.join(seq)
 シーケンス seq に含まれる文字列を連結した文字列を返す。要素間のセパレータは、このメソッドで指定した文字列を使用する。
str.ljust(width[, fillchar])
 長さwidthの文字列の中で左寄せにした文字列を返す。パディングは指定されたfillchar(デフォルトはスペース)を用いて行われる。widthがlen(s)よりも小さい場合は、元の文字列が返される。
 バージョン2.4で変更: fillchar引数に対応しました。
str.lower()
 小文字に変換された文字列のコピーを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.lstrip([chars])
 先頭の文字を削除した文字列のコピーを返す。chars引数は、除去する文字の集合を指定する文字列である。chars引数は接頭辞ではなく、その値のすべての組み合わせが取り除かれる。
 >>> '   広さ   '.lstrip()
 '広々   '
 >>> 'www.example.com'.lstrip('cmowz.')
 「example.com」。
 バージョン2.2.2で変更されました。chars 引数をサポートしました。
str.partition(sep)
 文字列をsepの最初の部分で分割し、セパレータの前の部分、セパレータ自身、セパレータの後の部分を含む3タプルを返す。 セパレータが見つからない場合は、文字列自身とその後に続く2つの空の文字列を含む3タプルを返す。
 バージョン2.5での新機能
str.replace(old, new[, count])
 部分文字列 old の出現回数をすべて new に置き換えた文字列のコピーを返します。オプションの引数countが与えられると、最初のcountの出現箇所だけが置換されます。
str.rfind(sub[,start[,end]])を実行します。
 subがs[start,end]に含まれるような、部分文字列subが見つかった文字列の最高値を返す。オプションの引数startとendは、スライス表記と同様に解釈される。
str.rindex(sub[,start[,end]])です。
 rfind() と同様ですが、substring sub が見つからない場合は ValueError を発生させます。
str.rjust(width[, fillchar])
 長さwidthの文字列の中で右寄せにした文字列を返す。パディングは指定された fillchar (デフォルトはスペース) を使って行われる。widthがlen(s)よりも小さい場合は、元の文字列が返される。
 バージョン2.4で変更: fillchar引数に対応しました。
str.rpartition(sep)
 文字列をsepの最後の部分で分割し、セパレータの前の部分、セパレータ自身、セパレータの後の部分を含む3タプルを返す。 セパレータが見つからない場合は、2つの空の文字列と、その後に文字列自身を含む3タプルを返します。
 バージョン2.5での新機能
str.rsplit([sep[, maxsplit]])
 sepを区切り文字列として、文字列中の単語のリストを返す。maxsplit が与えられた場合、最大で maxsplit 個の分割が行われ、右端のものが実行される。右からの分割を除いて、rsplit() の動作は、以下で詳細に説明する split() と同様である。
 バージョン2.4での新機能
str.rstrip([chars])
 文字列の末尾の文字を削除したコピーを返す。chars引数は、除去する文字の集合を指定する文字列である。chars引数はサフィックスではなく、その値のすべての組み合わせが取り除かれる。
 >>> '   広さ   '.rstrip()
 '   spacious'
 >>> 'mississippi'.rstrip('ipz')
 'mississ'
 バージョン2.2.2で変更されました。chars 引数をサポートしました。
str.split([sep[, maxsplit]])
 sepを区切り文字列として、文字列中の単語のリストを返す。maxsplit が与えられると、最大で maxsplit 個の分割が行われる (したがって、リストは最大で maxsplit+1 個の要素を持つことになる)。maxsplit が指定されない場合は、分割の数に制限はありません (可能なすべての分割が行われます)。
 sep が指定された場合、連続した区切り文字はグループ化されず、空の文字列を区切るとみなされます (例えば、'1,,2'.split(',') は ['1', ', '2'] を返します)。sep引数は複数の文字で構成することができます(例えば、'1<>2<>3'.split('<>') は ['1', '2', '3'] を返します)。空の文字列を指定したセパレータで分割すると [''] が返されます。
 sep が指定されないか None の場合、異なる分割アルゴリズムが適用されます。連続した空白文字は単一のセパレータとみなされ、文字列の先頭または末尾に空白文字がある場合、結果は先頭または末尾に空文字列を含まなくなります。その結果、空の文字列や空白文字だけからなる文字列を1つのセパレータで分割し、その文字列が先頭または末尾に空白文字を持つ場合、その結果には先頭または末尾に空白文字が含まれないようになります。その結果、空の文字列または空白文字だけの文字列を None separator で分割すると [] が返されます。
 例えば、' 1   2   3   '.split() は ['1', '2', '3'] を返し、'.   1   2   3   '.split(None, 1) returns ['1', '2   3   '].
str.splitlines([keepends])
 文字列中の行のリストを、行の境界で改行しながら返します。keependsが与えられ、かつtrueでない限り、改行は結果のリストに含まれない。
str.startswith(prefix[,start[,end]])とする。
 prefix には、検索するプレフィックスのタプルを指定することも可能です。
 バージョン2.5で変更: タプルを接頭辞として受け付けるようにした。
str.strip([chars])
 文字列の先頭と末尾の文字を削除したコピーを返す。chars引数は、除去する文字の集合を指定する文字列である。省略された場合、あるいは None の場合、chars 引数はデフォルトで空白を除去する。chars 引数はプリフィックスやサフィックスではなく、その値のすべての組み合わせが除去される。
 >>> '   広さ   '.strip()
 「広々としている
 >>> 'www.example.com'.strip('cmowz.')
 '例'
 バージョン2.2.2で変更されました。chars 引数をサポートしました。
str.swapcase()
 大文字を小文字に、またはその逆に変換した文字列のコピーを返します。
 8ビット文字列の場合、この方法はロケールに依存する。
str.title()
 単語は大文字で始まり、残りの文字はすべて小文字になります。
 8ビット文字列の場合、この方法はロケールに依存する。
str.translate(テーブル[, deletechars])
 オプションの引数 deletechars に含まれるすべての文字を削除し、残りの文字を与えられた翻訳テーブル(長さ256の文字列でなければならない)を通してマッピングした文字列のコピーを返す。
 文字列モジュールのmaketrans()ヘルパー関数を使って、翻訳テーブルを作成することができます。文字列オブジェクトの場合、文字を削除するだけの翻訳では、table 引数を None に設定します。
 >>> 'この短いテキストを読む'.translate(None, 'aeiou')。
 'rd ths shrt txt'
 バージョン 2.6 の新機能: None テーブル引数をサポート。
 Unicode オブジェクトの場合、translate() メソッドはオプションの deletechars 引数を受け取りません。その代わりに、すべての文字が与えられた変換テーブルを通してマッピングされた s のコピーを返します。変換テーブルは、Unicode 序数から Unicode 序数、Unicode 文字列、または None へのマッピングでなければなりません。None にマ ッ プ さ れた キ ャ ラ ク タ は削除 さ れます。注:より柔軟なアプローチとして、codecs モジュールを使用してカスタムの文字マッピング・コーデックを作成することができます(例として encodings.cp1251 を参照してください)。
str.upper()
 大文字に変換された文字列のコピーを返す。
 8ビット文字列の場合、この方法はロケールに依存する。
str.zfill(幅)
 長さ width の文字列のうち、ゼロで埋め尽くされた左側の数値文字列を返す。符号のプレフィクスは正しく処理される。widthがlen(s)よりも小さい場合は、元の文字列が返される。
 バージョン2.2.2での新機能
以下のメソッドは、unicodeオブジェクトにのみ存在します。
unicode.isnumeric()
 S に数値文字のみが存在する場合は True、それ以外の場合は False を返す。Unicodeの数値プロパティ、例えばU+2155, VULGAR FRACTION ONE FIFTHです。
unicode.isdecimal()
 S に 10 進文字しかない場合は True、そうでない場合は False を返す。10 進文字には、数字文字と、10 進-基数を形成するために使用できるすべての文字が含まれる。
<スパン 2. 文字列の書式設定
<スパン 2. 文字列のフォーマット(書式設定)
<スパン 2. 文字列のフォーマット(書式設定)

6. 文字列のフォーマット(書式設定)


クリックするとリンクが開きます