關於多個文本字符串的去重, 需要比較兩個字符串的相似度
兩個字符串相似度的比較,return 0-1
``` function string_same(str1, str2){ //計算兩個字符串的長度。 var len1 = str1.length, len2 = str2.length, dif = [],//建立上面說的數組,比字符長度大一個空間 temp,i,j,a; //賦初值,步驟B for (a = 0; a <= len1; a++) { dif[a] = []; dif[a][0] = a; } for (a = 0; a <= len2; a++) { dif[0][a] = a; } //計算兩個字符是否一樣,計算左上的值 //var temp; for (i = 1; i <= len1; i++) { for (j = 1; j <= len2; j++) { if (str1[i - 1] == str2[j - 1]) { temp = 0; } else { temp = 1; } dif[i][j] = Math.min(dif[i - 1][j - 1] + temp,dif[i][j - 1] + 1,dif[i - 1][j] + 1); } } //console.log("差異步驟:" + dif[len1][len2]); //計算相似度 //var similarity = 1 - dif[len1][len2] / Math.max(str1.length, str2.length); return 1 - dif[len1][len2] / Math.max(len1, len2); } ```兩個字符串相似度的比較,比較過程中包含標點,位置,長度。返回一個小數為兩個字符串的相似度。