本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介 日常工作中經常需要通過SSH連接到多台遠程服務器來完成各種任務,當需要操作的服務器眾多,且要執行的任務涉及命令繁多 ...
一 簡介 shiny是R中專門用於開發輕量級web應用的框架,在本地寫一個shiny應用並調用非常方便,但如果你希望你的shiny應用能夠以遠程的方式提供給更多人來使用,就需要將寫好的shiny應用部署到服務器上,主要有兩種方式,第一種是將shiny應用發布在shinyapps上,第二種是將你的shiny應用部署到自己租用的服務器上,前者比較方便但遇到一些R包環境或中文顯示等問題時幾乎是無解的,而 ...
2019-08-09 16:43 0 436 推薦指數:
本文示例代碼及文件已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介 日常工作中經常需要通過SSH連接到多台遠程服務器來完成各種任務,當需要操作的服務器眾多,且要執行的任務涉及命令繁多 ...
穿透的方式,將任何可以聯網的電腦作為“服務器”向外臨時發布你的Dash應用。 而內網穿透作為一種臨 ...
學習 集成學習(ensemble learning)是指通過構建並結合多個學習器來完成學習任務, ...
一、簡介 接着幾個月之前的(數據科學學習手札31)基於Python的網絡數據采集(初級篇),在那篇文章中,我們介紹了關於網絡爬蟲的基礎知識(基本的請求庫,基本的解析庫,CSS,正則表達式等),在那篇文章中我們只介紹了如何利用urllib、requests這樣的請求庫來將我們的程序模擬成一個 ...
一、簡介 在實際的業務中,我們手頭的數據往往難以滿足需求,這時我們就需要利用互聯網上的資源來獲取更多的補充數據,但是很多情況下,有價值的數據往往是沒有提供源文件的直接下載渠道的(即所謂的API),這時我們該如何批量獲取這些嵌入網頁中的信息呢? 這時網絡數據采集就派上用處了,你通過瀏覽器 ...
作為Python中經典的機器學習模塊,sklearn圍繞着機器學習提供了很多可直接調用的機器學習算法以及很多經典的數據集,本文就對sklearn中專門用來得到已有或自定義數據集的datasets模塊進行詳細介紹; datasets中的數據集分為很多種,本文介紹幾類常用的數據集生成方法,本文總結 ...
😂,通過手動在程序中的關鍵位置書寫合適的打印語句,可以很快速地幫助我們了解到程序運行的過程,發現問題 ...
本文對應腳本及數據已上傳至我的Github倉庫https://github.com/CNFeffery/DataScienceStudyNotes 1 簡介 詞雲圖是文本挖掘中用來表征詞頻的數據可視化圖像,通過它可以很直觀地展現文本數據中地高頻詞: 圖1 詞雲圖 ...