內容介紹
本書分四個部分,第一部分主要介紹基礎知識,包括認識機器學習和自然語言處理、快速上手Python、線性代數、概率論和統計學;第二部分主要介紹自然語言處理技術,包括自然語言處理介紹、語料庫技術、中文分詞、數據預處理、馬爾科夫模型、條件隨機場、模型評估、剖析自然處理工具背后的原理;第三部分主要介紹機器學習技術,包括認識機器學習、常見機器學習算法、機器學習算法案例源碼實現。第四部分主要介紹工程項目實踐,包括Python項目實戰、自然語言處理項目實戰、機器學習結合自然語言處理綜合項目實戰。
作者介紹
- 唐聃,男,教授,中科院工學博士。現工作於成都信息工程大學軟件工程學院。研究方向包括自然語言處理、信息安全、數據分析。曾參與多項國家863項目和中科院知識創新工程項目、省科技廳和教育廳項目;2016年入選中國科學院西部之光人才計划(中國科學院西部青年學者)。
- 白寧超,男,碩士學位。現工作於四川省計算機研究院,自然語言處理工程師。研究方向主要包括自然語言處理和機器學習,自然語言處理和機器學習相關的系列博文曾被CSDN、阿里雲棲等多個平台轉載。曾參與多項四川省科技廳項目。
- 馮暄,男,高級工程師,碩士學位。現任四川省計算機研究院信息化工程研究所所長。研究方向包括物聯網、多源信息融合、軟件工程。主持或參與國家級、省級科研項目16項。獲得四川省科技進步獎二等獎2項、四川省科技進步獎三等獎1項。
- 文俊,男,碩士學位,現工作於成都廣播電視台橙視傳媒大數據中心,大數據算法工程師。研究方向主要包括數據挖掘、機器學習、自然語言處理、深度學習以及雲計算。
- 卿鴻賓,男,四川大學中文系在校生。研究方向包括應用語言學、計算語言學、韻律句法學等。常年從事文學創作與文字工作,2017年作品《黃昏速寫》發表於《子曰書院》微信公眾號,取得不錯的影響
專家推薦
眾所周知,自然語言處理是多學科交叉的一門學科,本書涵蓋知識面較廣且詳,較適合該技術領域讀者閱讀。
——— 王道順,清華大學教授、博士生導師
九層之台,起於壘土。基礎知識的掌握,原理的深度理解尤其重要。有益於快速准確解決問題,這也是這本書的特點。——— 周世傑,電子科技大學教授、博士生導師
市場同類書籍中對交叉學科基礎內容闡述較少,尤其是語言學部分;這是本書的亮點之一,對於NLP興趣者來說,非常適合閱讀。——— 崔喆,中國科學院研究員、博士生導師
萬事開頭難,做好一件事最重要的是清楚自己需要做好哪些准備。該書從基礎出發由點到面,深入淺出,循序漸進的講解如何學習人工智能自然語言處理的那些內容,是非常適合AI初學者的一本好書。
——— 潘耀峰,百度企業智能平台,大數據高級工程師
本書源碼下載:自然語言處理理論與實戰源碼 https://github.com/BaiNingchao/NLP-ML
自然語言處理、數據挖掘與深度學習的應用目前已成為互聯行業三大熱點,而自然語言處理結合數學、計算機科學、語言學一體,門檻較高。本書是作者總結多年在自然語言處理方面學習和研究的成果,理論結合實戰,由淺入深,是本適合初學者的領路書籍。




















