字符串Hash學習筆記

本文轉載自查看原文 2019-05-06 11:48 195 筆記/ 學習筆記/ Hash

[toc]

# 以下內容作廢，太多錯誤了，等我有時間重寫

說一下什么是Hash，說白了就是把一大坨字符用一些神奇的數來表示，可以說是把字符加密了.

簡單一點就是一個像函數一樣的東西，你放進去一個值，它給你輸出來一個值。輸出的值就是Hash值。一般Hash值會比原來的值更好儲存(更小)或比較。

字符串hash的靈魂就是盡量讓不同的字符串對應唯一的hsah的值 .而要實現這一效果就要選對方法否則就咕咕咕了

舉個栗子：

如果我們的加密方法是把字符的ascal加起來，那就咕咕咕了.

比如：

ababa

babaa

加起來是一樣的，咕咕咕....

所以應該怎么hash?

用一種名為“BKDR Hash”的字符串Hash算法：

它的主要思路是選取恰當的進制，可以把字符串中的字符看成一個大數字中的每一位數字，不過比較字符串和比較大數字的復雜度並沒有什么區別(高精數的比較也是 $O (n)$

那么我們選擇什么進制比較好？

首先不要把任意字符對應到數字0，比如假如把a對應到數字0，那么將不能只從Hash結果上區分ab和b（雖然可以額外判斷字符串長度，但不把任意字符對應到數字0更加省事且沒有任何副作用），一般而言，把a-z對應到數字1-26比較合適。

關於進制的選擇實際上非常自由，大於所有字符對應的數字的最大值，不要含有模數的質因子(那還模什么)，比如一個字符集是a到z的題目，選擇27、233、19260817都是可以的。

模數的選擇（盡量還是要選擇質數）：

絕大多數情況下，不要選擇一個 $10^{9}$

最穩妥的辦法是選擇兩個 $10^{9}$

如果能背過或在考場上找出一個 $10^{1} 8$

偷懶的寫法就是直接使用unsigned long long，不手動進行取模，它溢出時會自動對 $2^{6} 4$

$2^{6} 4$

P3370 【模板】字符串哈希

題目描述

如題，給定N個字符串（第i個字符串長度為Mi，字符串內包含數字、大小寫字母，大小寫敏感），請求出N個字符串中共有多少個不同的字符串。

輸入輸出格式

$2^{6} 4$

第一行包含一個整數N，為字符串的個數。

接下來N行每行包含一個字符串，為所提供的字符串。

$2^{6} 4$

輸出包含一行，包含一個整數，為不同的字符串個數。

輸入輸出樣例

輸入樣例#1：復制

5
abc
aaaa
abc
abcc
12345

輸出樣例#1：復制

說明

時空限制：1000ms,128M

數據規模：

對於30%的數據：N<=10，Mi≈6，Mmax<=15;

對於70%的數據：N<=1000，Mi≈100，Mmax<=150

對於100%的數據：N<=10000，Mi≈1000，Mmax<=1500

代碼：

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cmath>
#include<queue>
#include<stack>
#include<vector>
#include<map>
#include<string>
#include<cstring>
#define ll long long int
#define mod 1000000007
using namespace std;
const long long int  maxn=99999999999999;
const int minn=-999999999;
long long  base=131;
long long  a[15010];
char s[15010];
int n,ans=1;
long long hash(char s[]) {
    int len=strlen(s);
    long long  ans=0;
    for (int i=0; i<len; i++)
        ans=ans*base+(long long )s[i];
    return ans%maxn;
}
int main() {
    scanf("%d",&n);
    for (int i=1; i<=n; i++) {
        scanf("%s",s);
        a[i]=hash(s);
    }
    sort(a+1,a+n+1);
    for (int i=2; i<=n; i++)
        if (a[i]!=a[i-1])
            ans++;
    printf("%d\n",ans);
}

送上取膜數對答案的影響：

改了一下mod為0x3f3f3f就

所以hsah最的最后一步：燒香拜佛保AC!

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 字符串Hash學習筆記字符串hash 字符串學習筆記一字符串學習總結（Hash & Manacher & KMP）各種字符串Hash函數字符串Hash總結淺談字符串Hash 字符串hash原理 C#字符串學習筆記 Swift學習筆記(4)--字符串及基本使用