在用深度學習做自然語言學習的時候NLP,必須用到Levenshtein計算編輯距離
編輯距離:又稱Levenshtein距離,是指兩個字串之間,由一個轉成另一個所需的最少的編輯操作次數。編輯操作包括將一個字符替換成另一個字符,插入一個字符,刪除一個字符。一般來說,編輯距離越小,兩個串的相似度越大。
安裝方法如下
直接在python中安裝可以:
pip install python-Levenshtein
在anaconda中安裝用
conda install python-Levenshtein