比較兩個字符串的相似度


關於多個文本字符串的去重, 需要比較兩個字符串的相似度

兩個字符串相似度的比較,return 0-1

``` function string_same(str1, str2){ //計算兩個字符串的長度。 var len1 = str1.length, len2 = str2.length, dif = [],//建立上面說的數組,比字符長度大一個空間 temp,i,j,a; //賦初值,步驟B for (a = 0; a <= len1; a++) { dif[a] = []; dif[a][0] = a; } for (a = 0; a <= len2; a++) { dif[0][a] = a; } //計算兩個字符是否一樣,計算左上的值 //var temp; for (i = 1; i <= len1; i++) { for (j = 1; j <= len2; j++) { if (str1[i - 1] == str2[j - 1]) { temp = 0; } else { temp = 1; } dif[i][j] = Math.min(dif[i - 1][j - 1] + temp,dif[i][j - 1] + 1,dif[i - 1][j] + 1); } } //console.log("差異步驟:" + dif[len1][len2]); //計算相似度 //var similarity = 1 - dif[len1][len2] / Math.max(str1.length, str2.length); return 1 - dif[len1][len2] / Math.max(len1, len2); } ```

兩個字符串相似度的比較,比較過程中包含標點,位置,長度。返回一個小數為兩個字符串的相似度。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM