[解決済み] ファジー文字列比較のための良いPythonモジュール?[クローズド]。
2022-04-05 11:40:03
質問
<余談
<余談
クローズド
. この質問は
意見型
. 現在、回答は受け付けておりません。
クローズド
8年前
.
ロックされている
. この質問とその回答は
ロック
なぜなら、この質問はトピックから外れているものの、歴史的な意義があるからです。現在、新しい回答や交流は受け付けていません。
簡単なファジー文字列比較を行うことができるPythonモジュールを探しています。 具体的には、文字列がどれだけ似ているかのパーセンテージが欲しいのです。 私はこれが潜在的に主観的であることを知っているので、私は他のものの間で、位置の比較と同様に最も長い類似の文字列のマッチを行うことができるライブラリを見つけることを望んでいました。
基本的に、私は単一のパーセンテージを得るのに十分なほどシンプルでありながら、どのようなタイプの比較を行うかを指定できるほど設定可能なものを見つけたいと考えています。
どのように解決するのですか?
Levenshtein Python 拡張と C ライブラリ。
https://github.com/ztane/python-Levenshtein/
Levenshtein Python C 拡張モジュールは、高速な 計算 - レーベンシュタイン(編集)距離、および編集操作 - 文字列の類似性 - 文字列の中央値近似、および一般的な文字列の平均化 - 文字列の配列と集合の類似性 通常の文字列とUnicode文字列の両方をサポートしています。
$ pip install python-levenshtein
...
$ python
>>> import Levenshtein
>>> help(Levenshtein.ratio)
ratio(...)
Compute similarity of two strings.
ratio(string1, string2)
The similarity is a number between 0 and 1, it's usually equal or
somewhat higher than difflib.SequenceMatcher.ratio(), becuase it's
based on real minimal edit distance.
Examples:
>>> ratio('Hello world!', 'Holly grail!')
0.58333333333333337
>>> ratio('Brian', 'Jesus')
0.0
>>> help(Levenshtein.distance)
distance(...)
Compute absolute Levenshtein distance of two strings.
distance(string1, string2)
Examples (it's hard to spell Levenshtein correctly):
>>> distance('Levenshtein', 'Lenvinsten')
4
>>> distance('Levenshtein', 'Levensthein')
2
>>> distance('Levenshtein', 'Levenshten')
1
>>> distance('Levenshtein', 'Levenshtein')
0
関連
-
pythonを使ったオフィス自動化コード例
-
[解決済み] なぜパスワードにはStringではなくchar[]が好まれるのですか?
-
[解決済み] Pythonには文字列の'contains'サブストリングメソッドがありますか?
-
[解決済み] Pythonで文字列の部分文字列を取得するにはどうすればよいですか?
-
[解決済み] Pythonで文字列を小文字にするには?
-
[解決済み] Pythonのswitch文の代用品?
-
[解決済み] Pythonで文字列を反転させる
-
[解決済み] Pythonで整数から文字列に変換する
-
[解決済み] 大文字・小文字を区別しない文字列比較を行うには?
-
[解決済み] Python 3で文字列をバイトに変換する最良の方法?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
PythonによるLeNetネットワークモデルの学習と予測
-
python call matlab メソッドの詳細
-
Python カメの描画コマンドとその例
-
python implement mysql add delete check change サンプルコード
-
[解決済み】RuntimeWarning: invalid value encountered in double_scalars で numpy の除算ができない。
-
[解決済み】TypeError: unhashable type: 'numpy.ndarray'.
-
[解決済み】numpy: true_divide で無効な値に遭遇
-
[解決済み】Pythonでgoogle APIのJSONコードを読み込むとエラーになる件
-
[解決済み】Flask ImportError: Flask という名前のモジュールがない
-
[解決済み] 2つの文字列の間の類似度メトリックを求める