一、爬蟲背后的法律風險
1、保護個人信息:
網絡產品、服務具有收集用戶信息功能的,其提供者應當向用戶明示並取得同意;涉及用戶個人信息的,還應當遵守本法和有關法律、行政法規關於個人信息保護的規定。2、合法收集使用個人信息:
網絡運營者收集、使用個人信息,應當遵循合法、正當、必要的原則,公開收集、使用規則,明示收集、使用信息的目的、方式和范圍,並經被收集者同意。不得收集與其提供的服務無關的個人信息,不得違反法律、行政法規的規定和雙方的約定收集、使用個人信息,並應當依照法律、行政法規的規定和與用戶的約定,處理其保存的個人信息。3、不得向他人提供個人信息:
網絡運營者不得泄露、篡改、毀損其收集的個人信息,未經被收集者同意,不得向他人提供個人信息,但經過處理無法識別特定個人且不能復原的除外。
1、搜集須經許可:未經用戶同意,不得搜集與用戶相關、能夠單獨或者與其他信息結合識別用戶的信息(“用戶個人信息”),但法律法規另有規定除外;
2、限定搜集范圍和用途:經用戶同意搜集用戶個人信息的,應當明確告知搜集和處理用戶個人信息的方式、內容和用途,不得收集其提供服務所必需以外的信息,不得將用戶個人信息用於其提供服務之外的目的;
3、用戶個人信息保障:互聯網信息服務提供者應當加強系統安全防護,妥善保管用戶個人信息,未經用戶同意,不得向他人提供用戶上載信息,但是法律法規另有規定的除外。
對於涉及法律風險的數據爬取要求,程序員最好在采集前和老板深聊一下,明確法律風險,或者事先和公司簽署一份免責協議。
1、如果你爬蟲獲取信息,是為了證明被爬公司的數據造假,其獲取的數據也都是通過公開渠道可以查詢的,那么,在獲取信息后公布於眾的行為並不違法,也不侵犯被爬公司的民事權益。但是,如果你爬取公開免費的信息,是用來進行違法操作,比如造假、誹謗等,就有隱患了。
2、如果你利用爬蟲獲取其他公司的公開信息數據,用於自身公司的經營。而被爬公司的信息是投入了大量人力、財力,經過常年積累獲得的,並且被爬公司本身也采取了反爬措施。這種情況下,雖然信息是公開的,但信息本身具有較高的商業價值,能夠給使用者帶來商業利益,此時的爬蟲也是違法的。
3、如果你未經平台授權,強行突破反爬措施,導致被爬網站的運行受到嚴重影響,這種行為明顯是違法的,這里涉及的就是我們上一個技術篇講到的破解犯罪了。
4、如果你是第三方應用,想要通過開放平台獲取用戶信息時,更要注意授權問題。從用戶對平台的授權、平台對第三方的授權、再到用戶對第三方的授權,三重關卡都要通過才合法。
- 接外包項目要謹慎
- 互聯網金融從業有風險
- 對於危險的爬蟲任務,敢於說不