假設某個目錄下有N個文件夾,每個文件夾下是某個人的項目代碼,一個人一個文件夾,代碼有可能文件名不同,但內容可能相同
程序執行時,通過指定路徑,分析出某個人和其他人的重復率,如:
被比較者姓名 比較者姓名1 重復率
張三 李四 90
張三 王五 30
重復率是所有文件比較完成后,每個文件的重復率平均值,在分析的過程中,要有分析的過程情況,如:
**************歡迎使用xxx查重系統*************************
此次查重總共需要分析【20】人
開始分析第【1】人張三
正在分析【張三】和【李四】,完成度【30%】,當前重復率【50%】
分析完成【張三】和【李四】,重復率為【90%】
開始分析第【2】人【王五】
。。。
最后輸出整體比對結果:
此次查重總共分析【20】人,用時【20分鍾】
結果如下:
被比較者姓名 比較者姓名1 重復率
張三 李四 90
張三 王五 30