1. 詞帶的簡單解釋:
每一個詞出現了多少次,缺點是不知道順序
2.seq2seq自然語言處理的核心
RNN:
一對一:輸入一個,輸出一個
一對多:輸入一個,輸出多個
多對一:輸入多個,輸出一個
多對多:輸入多個,輸出多個
原始數組:
改變一次的數組:
改變兩次的數組:
改變三次的數組
結果輸出:
greedy decoding 避免最佳的回答方式,使用其他的解碼方式
beam search decoding 從最佳回答中,選擇幾種方式,給出其他解決方案
二:入門自然語言處理
基本的技能用法:
字符串操作:1.空格處理:strip()函數默認是去重空格,而且是左右兩邊的空格一起去重
字符串的大小轉化
demo = " hello world! " ret1 = demo.upper() print(ret1) HELLO WORLD! ret2 = demo.lower() print(ret2) hello world!
字符串的反轉
demo = " hello world! " ret1 = demo[::-1] print(ret1) # 結果:!dlrow olleh
字符串子串的查找
demo = " hello world! " ret1 = demo.find("h") print(ret1)
# 結果:1 返回索引