在當今人們的日常生活中,手機占據了重要的角色。在大多數人的手機里,已經裝滿了各種五花八門的手機應用,無時無刻不在想着瓜分我們的時間。
很多時候,我們驚奇的發現,手機上的應用越用越聰明,智能手機真的越用越「智能」了。沒刷多久的短視頻,就似乎已經掌握了我們的愛好和興趣,不斷的推送相關的視頻和內容;每次打開淘寶,總能從一堆玲琅滿目的商品中推薦出自己心念念已久的好物;陪伴着我們無數個深夜的網抑雲,同樣也能推薦出一個又一個讓人循環不止的歌單。
似乎,這些應用總在不斷窺探着我們的內心,不斷着迎合着我們的興趣和喜好。那這到底是app
真的越來越智能了,還是說我們的隱私越來越不值錢了?
1
事實上,app
獲得用戶習慣的方式很簡單。無非就是埋坑、打點、上報、喂養、預測而已。
一款產品在更新迭代的過程中,除了需要前端、后端、客戶端以及測試這些我們比較熟知的角色外,還有一個角色對成熟的產品而言及其重要。每一個產品在功能需求層面上的決策,都離不開這種角色。
這就是所謂的數據分析師,俗稱DA(DATA Analysis)
。數據分析師是一群專門跟數據打交道的人,他們最擅長的是將現象、狀態等通過定性描述的東西定量化。定了量,就有了數據。
然后從數據分析行為,從量級推倒趨勢,從置信區間決策功能邏輯。聽起來怪神奇的。不過簡單來說,就是負責在app
里設計埋點的。
我們知道每一個app其實就像是一座冰山,我們能看到的和體驗到的也只是其中很小的一部分。一般來說,你沒辦法知道在app
上點了一個按鈕后,它在后台干了些什么。
可能它向某個服務器上傳了某個參數,可能它把你點擊按鈕的時間存入了數據庫,也可能什么都沒干,只是平白的告訴你「請求失敗」。
而埋點的行為,往往都在這些時候發生。埋點是所有商業應用必需的手段,用來收集app
使用者或者設備的信息。它實際上就相當於在代碼里做了標記,當程序運行到某個位置,就會自動標記上這個。常用的手段是通過將必要的參數上報給服務器。
比如某某產品的注冊量超過了6
億,它是怎么得到這個數據的呢?就是通過用戶在注冊時,上報這個埋點。最終在后台統一處理數據,就可以得到更多層次上的數據分析結果。
不誇張的說,現在隨隨便便一個主流app
上,都有成千上萬個埋點。這些埋點對用戶而言是無感知的,但是卻無情的暴露了用戶的使用習慣。
數據分析師會根據app
的核心指標以及應用場景,設計合適的埋點,並讓開發同學在合適的位置打下這些埋點,然后用戶就能夠在合適的時機上報這些埋點。
用戶的每一次點擊,每一個手勢,每一種行為,都會被不同的埋點記錄;甚至,用戶什么都不干的時候,也會被記錄下來,因為時間也能反映操作習慣。
這些點位沒有直接的侵入用戶的隱私,沒有獲得你的地理位置,沒有請求你的通訊錄,更沒有打開你的攝像頭和錄音機,只是單純的記錄下了用戶的操作路徑。如雁過留痕。
2
數據分析師往往鍾情於埋點數據,他們能從一堆埋點中找尋用戶操作的慣性,從而提煉出所謂的用戶心智。但這只能分析出用戶喜歡或者不喜歡某個功能或者某個頁面。離推薦,還有一定距離。
埋點的數據是很珍貴的用戶數據,除了數據分析師外,還有一群人會對這些數據進行一輪又一輪的處理和提煉。廣義上,這群人都可以被稱作算法工程師。
數據分析師看重的是群體效益,而算法的目標則是你的個性化推薦。 羊毛出在羊身上,想要推薦出你喜歡的東西,那就得知道你喜歡什么。
當你在抖音上看到一個美女換裝視頻,停留了許久,並且重復觀看了3次以上,大概率也能推測出你是個lsp
了。所以推薦算法會根據你觀看視頻時上報的埋點,比如觀看時長,點贊數等等量化數據來訓練針對你個人的喜好模型。隨后,不過是對症下葯。
所以為什么你會在短視頻平台上老是刷到看不完的妹子,不要先怪平台,先反省下自己。
到這,一個初級但是有效的獲取用戶習慣的流程已經走完。你在app
上花費的每一段時間,都以定量數據都形式存在了服務器的數據庫里,經歷着數據分析師的打磨,承受着推薦系統的洗禮。
最終,你的使用習慣被app
以及它背后無數個支撐它的系統學習並模仿,雖然直接並且粗暴,但是很有用。
3
但是事情總是沒那么完美。相同的內容看久了,始終會感到厭倦;那些被數據分析師認為數據正向的功能,也開始多了許多不好的反饋。數據是准確的,無情殘酷的,卻也是片面的。
每一份數據的產生、處理、以及持久化,都只能代表那一個狀態。數據的存在就意味着它是歷史性的,不是當下,更無法代表將來。 所以,由數據產生的預測誤差是無法避免的。
隨着人工智能的興起以及推薦算法的實際應用,「信息繭房」 這個詞越來越廣泛的出現在各種觀點中。所謂信息繭房,意味着個人所能接受的信息被束縛在一個狹窄的領域,個人的認知范圍被局限在自己的興趣愛好上。
這實際上就是推薦算法濫用,過度推測用戶的興趣和喜好。在很多深度學習的算法里,都會有一個對其 「泛化能力」 的評估標准。也就是說,有時候精准並不是一件好事,偶爾的擴展或許能獲得意想不到的收益。
當然,這里所說的只是針對用戶的偏主動行為產生的數據所做的分析和推測,而在實際的操作中,還會采用多方面多角度的數據收集手段。那些就跟隱私跟安全權限息息相關。
總的來說,雖說各種軟件應用不太會偷偷摸摸的去收集用戶行為習慣,但是只要你使用了,就難免會暴露你的用戶特征。
這些特征可能你自己都不曾意識到,但是經過一堆機器的大數據處理,你的某個下意識的操作就有了定量的描述。
現在真正能夠做大做強的軟件應用,都不再是為了提供某個功能,更多的是提供平台,提供服務。在這些空洞的平台中,需要大量的用戶行為分析數據作為填充,才能保證平台服務的正常運行,提供平台生態的健康發展。
這就是不可擋的趨勢。如果說科技的發展就是人類懶惰化的歷史,那么為了能夠變得更懶,就需要付出更多的隱私和空間。
不過這樣一來,有些東西就更加難能可貴了。