企業(yè) CDP 即企業(yè)客戶數(shù)據(jù)平臺,可以幫助企業(yè)實現(xiàn)全域用戶數(shù)據(jù)采集和數(shù)據(jù)管理,使企業(yè)能夠更加全面地洞察用戶行為、深入分析用戶需求,最終通過自動化營銷方式為用戶提供個性化體驗。
現(xiàn)階段,許多企業(yè)嘗試落地 CDP,但卻很難在短期內(nèi)看到應(yīng)有的 ROI 成效,初始投入與后期產(chǎn)出不對稱,這嚴重打擊了企業(yè)建設(shè) CDP 的信心。在中國數(shù)據(jù)市場,企業(yè) CDP 項目主要聚焦在數(shù)據(jù)治理上,致力于通過構(gòu)建 CDP,打破數(shù)據(jù)割裂、上下游系統(tǒng)數(shù)據(jù)口徑不一致、數(shù)據(jù)污染等困境,統(tǒng)一用戶數(shù)據(jù)標識是企業(yè) CDP 數(shù)據(jù)體系建設(shè)的關(guān)鍵問題。
神策數(shù)據(jù)《CDP 全域用戶關(guān)聯(lián)數(shù)據(jù)體系建設(shè)與實踐》白皮書中提到,企業(yè)要想真正落地 CDP 項目并產(chǎn)生業(yè)務(wù)價值,其用戶數(shù)據(jù)體系建設(shè)的終 極目標是全域用戶的標識唯 一化,即把來自不同渠道、生態(tài)、業(yè)務(wù)系統(tǒng)的用戶標識為同一個對象。本文將詳細介紹企業(yè)如何通過全域用戶關(guān)聯(lián)實現(xiàn)用戶標識唯 一化,整體可概括為以下五個步驟。
關(guān)注神策數(shù)據(jù)公眾號,回復(fù)關(guān)鍵字“CDP”即可免費下載完整版白皮書。
一、上下游業(yè)務(wù)系統(tǒng)數(shù)據(jù)現(xiàn)狀盤點
如何從零開始開展 CDP 的用戶數(shù)據(jù)基礎(chǔ)建設(shè)?企業(yè)的首要任務(wù)是理清 CDP 上下游的數(shù)據(jù)情況,以用戶為主體梳理數(shù)據(jù)應(yīng)用場景,比如業(yè)務(wù)數(shù)據(jù)如何收集、用戶數(shù)據(jù)在什么情況下輸出、用戶觸達場景有哪些等。全域用戶關(guān)聯(lián)作為 CDP 系統(tǒng)的基礎(chǔ)能力支撐,會對上游數(shù)據(jù)的收集以及下游業(yè)務(wù)系統(tǒng)造成影響,所以在方案設(shè)計之初需要盡可能對上下游相關(guān)的數(shù)據(jù)現(xiàn)狀進行盤點。
典型的數(shù)據(jù)現(xiàn)狀盤點流程包括:
1、數(shù)據(jù)源梳理:梳理各業(yè)務(wù)線涉及到的業(yè)務(wù)系統(tǒng)。
2、用戶主體 ID 梳理:梳理各業(yè)務(wù)系統(tǒng)中用于標記用戶主體和數(shù)據(jù)相關(guān)的 ID,比如設(shè)備 ID、企 微 ID、Union ID、Open ID、Cookie ID 等。
3、用戶屬性梳理:梳理各業(yè)務(wù)系統(tǒng)中用戶標識 ID 對應(yīng)的數(shù)據(jù)屬性,業(yè)務(wù) ID 對應(yīng)的用戶業(yè)務(wù)屬性有卡號、身份、微信號、手機號等。
4、識別用戶標識數(shù)據(jù)在源端存儲的質(zhì)量:例如在數(shù)據(jù)梳理的過程會發(fā)現(xiàn)一個手機號對應(yīng)多個證件號,這時候需要對數(shù)據(jù)源產(chǎn)生的原因進行分析,找到異常數(shù)據(jù)產(chǎn)生的原因,如何在用戶關(guān)聯(lián)過程中處理。
5、用戶 ID 應(yīng)用場景梳理:梳理圍繞 CDP 應(yīng)用的整個業(yè)務(wù)流程中,涉及用戶 ID 應(yīng)用的典型場景,比如 CDP 全域數(shù)據(jù)接入場景、用戶分群數(shù)據(jù)輸出場景等。
二、全域用戶 ID 關(guān)聯(lián)方案設(shè)計
輸出用戶 ID 關(guān)聯(lián)方案的首要步驟是明確各業(yè)務(wù)線中哪些 ID 參與用戶的關(guān)聯(lián),并確定 ID 的優(yōu)先級、數(shù)量、父節(jié)點等信息。
1、ID 優(yōu)先級:優(yōu)先級的設(shè)定是為了解決當一條數(shù)據(jù)中有多個 ID,又無法關(guān)聯(lián)時,數(shù)據(jù)歸屬的問題。按照設(shè)定,數(shù)據(jù)會歸屬優(yōu)先級更高的 ID 所對應(yīng)的用戶。
2、業(yè)務(wù)唯 一 ID:系統(tǒng)中唯 一標識一個用戶的 ID 類型,其優(yōu)先級最 高。以電商業(yè)務(wù)為例,用戶的登錄 ID 由于和用戶購物等行為直接產(chǎn)生關(guān)聯(lián)且可以通過很多途徑獲取到,往往可以作為「業(yè)務(wù)唯 一 ID」來定義。
3、數(shù)量:取決于實際業(yè)務(wù)中一個用戶可以擁有單個還是多個該類型的 ID,可以用來校驗關(guān)聯(lián)關(guān)系是否符合規(guī)則。
4、父節(jié)點:在一些業(yè)務(wù)生態(tài)中,ID 之間存在著父子關(guān)系。父節(jié)點的定義可以用于解綁時一并解綁子節(jié)點,比如在微信生態(tài)中,Union ID 是 Open ID 的父節(jié)點,如果要將 Union ID 進行解綁,則附屬的所有 Open ID 也將隨之被解綁掉。
圖 確定 ID 的優(yōu)先級、數(shù)量、父節(jié)點
完整梳理 ID 之后,就可以針對性地采用埋點、ETL 等方式,完成用戶關(guān)聯(lián)的持續(xù)落地了。通俗來講,就是明確將哪些業(yè)務(wù)系統(tǒng)中的哪些數(shù)據(jù)提取出來再導(dǎo)入 企業(yè) CDP 系統(tǒng)中。業(yè)務(wù)中每一個事件對應(yīng)的屬性和涉及的 ID 都需要在埋點和 ETL 方案中體現(xiàn),可以大大減少技術(shù)人員的理解成本。
三、用戶數(shù)據(jù)關(guān)聯(lián)的回溯修復(fù)
完成全域用戶關(guān)聯(lián)后,會在用戶數(shù)據(jù)中發(fā)現(xiàn)歷史關(guān)聯(lián)錯誤的數(shù)據(jù)。根據(jù)新的關(guān)聯(lián)結(jié)果,需要對這些錯誤數(shù)據(jù)進行解綁并綁定至正確的歸屬用戶,重新完善用戶全生命周期畫像,從而提升 CDP 的用戶數(shù)據(jù)質(zhì)量。
舉例來說,在用戶關(guān)聯(lián)過程中,基于同一個用戶的唯 一昵稱「A」同時對應(yīng)兩個用戶「張三 2020 年注冊」「李四 2021 年注冊」,由此識別為同一個用戶,需要對重復(fù)關(guān)聯(lián)數(shù)據(jù)進行合并。在這種情況下,可以參考最早觸達用戶的時間來完成用戶屬性的修復(fù):「張三」2020 年注冊早于「李四」2021 年注冊,因此選擇將數(shù)據(jù)關(guān)聯(lián)至「張三」下。
同理,當歷史數(shù)據(jù)中存在其他類似的「唯 一用戶 ID」并與當前產(chǎn)生沖突時,需要根據(jù)時間先后順序,將兩個「唯 一用戶 ID」進行合并,完成數(shù)據(jù)關(guān)聯(lián)的回溯。
四、用戶關(guān)聯(lián)屬性的沖突處理
企業(yè)在進行用戶 ID 關(guān)聯(lián)的過程中,會遇到用戶關(guān)聯(lián)同類屬性沖突的情況,在進行屬性合并的過程中,可以遵循以下四個規(guī)則:
第 一,預(yù)置規(guī)則:特殊類型屬性使用固定的預(yù)置規(guī)則來處理,比如按照訪問時間先后順序進行屬性合并。
第二,缺省規(guī)則:默認以數(shù)據(jù)生成最早的時間為準,如果沒有數(shù)據(jù)生成時間的相關(guān)字段就按照 ID 的優(yōu)先級進行合并。
第三,設(shè)置基準規(guī)則:設(shè)置某個來源的數(shù)據(jù)為基準,例如相比 CRM 銷售人員手動錄入的信息數(shù)據(jù)和業(yè)務(wù)系統(tǒng)自動獲取的訂單數(shù)據(jù),訂單數(shù)據(jù)的準確性和穩(wěn)定性顯然更高,則選擇以業(yè)務(wù)系統(tǒng)訂單數(shù)據(jù)為基準。
第四,設(shè)置首末次規(guī)則:以最 先接入數(shù)據(jù)的屬性為準或者保持最末次的屬性。
日常業(yè)務(wù)中會出現(xiàn)當前用戶關(guān)聯(lián)信息錯誤的情況,比如,用戶更換手機導(dǎo)致設(shè)備 ID 變更等,這種情況就需要將現(xiàn)有的綁定關(guān)系解綁;另一方面,我們也發(fā)現(xiàn),曾經(jīng)認為某個 ID 和用戶不相關(guān),但后來經(jīng)過人工等方式確認兩者是相關(guān)的,這種情況就需要能夠在自動關(guān)聯(lián)未成功的情況下,以手動的方式將一個獨立 ID 關(guān)聯(lián)到現(xiàn)有用戶上去。
五、全域用戶關(guān)聯(lián)數(shù)據(jù)校驗及測試驗收
以神策數(shù)據(jù)的 ID-Mapping 全域用戶關(guān)聯(lián)為例,數(shù)據(jù)校驗及測試驗收整體可以分為五個部分:
1、用戶關(guān)聯(lián)是否成功
完成全域用戶關(guān)聯(lián)的部署之后,首先應(yīng)檢查對應(yīng)數(shù)據(jù)埋點方案的上報邏輯是否生效,比如,搜索埋點方案中設(shè)計的對應(yīng)事件是否正常存在。
2、用戶關(guān)聯(lián)全端執(zhí)行情況
確認事件上報后,可以基于數(shù)據(jù)埋點事件確認不同 SDK 類型上報的關(guān)聯(lián) ID/綁定 ID 的總次數(shù)。在前后端都調(diào)用的情況下,如果不同 SDK 間上報次數(shù)相差很多,則需要排查調(diào)用時機是否出了問題。
3、用戶關(guān)聯(lián)報錯校驗
這一步驟旨在確認事件上報的準確性,使用 ID-Mapping 可以在「神策數(shù)據(jù)治理」→「數(shù)據(jù)質(zhì)量」→「埋點數(shù)據(jù)查詢」過程中,查看是否有大量用戶關(guān)聯(lián)的報錯,并確認錯誤數(shù)據(jù)量、錯誤分類、錯誤原因等細節(jié)信息。
4、ID 格式校驗
檢查業(yè)務(wù) ID 的格式、長度等是否符合預(yù)期。一般來說,業(yè)務(wù) ID 都會有相對固定的格式或長度,例如手機號一般都是 11 位,微信生態(tài)的 Union ID 和 Open ID 也都有固定的長度,驗收人員可以使用 SQL 檢查是否有不符合預(yù)期的數(shù)據(jù)。
5、ID 關(guān)聯(lián)情況排查
一般可以分為三種情況:
第 一,只有登錄 ID 的用戶:此類用戶的特征是業(yè)務(wù)意義上的登錄 ID 有值,其他 ID 均為空。查詢只有登錄 ID 用戶的數(shù)量占比,如果發(fā)現(xiàn)此類用戶占比過高,則可以推斷出用戶關(guān)聯(lián)可能出現(xiàn)問題,登錄用戶沒有與其他觸點的 ID 成功關(guān)聯(lián)上。
第二,只有某個特定觸點相關(guān) ID 的用戶:例如只有微信生態(tài) Union ID 或 Open ID 的用戶,其他業(yè)務(wù) ID 均為空。如果此類用戶占比過高,則表示該觸點可能沒有與其他觸點打通。
第三,只有設(shè)備 ID 的用戶:例如發(fā)現(xiàn)用戶表中存在大量只用 Android_id 的用戶,則標明對應(yīng) Android 的用戶關(guān)聯(lián)可能沒有做。
從業(yè)務(wù)邏輯上來說,一個用戶肯定是先有 xxx ID 再有 yyy ID,對此類用戶關(guān)聯(lián)情況進行排查時,可以進行 SQL 查詢,如果查詢結(jié)果不符合業(yè)務(wù)邏輯,則需要進一步排查是否確實沒有實現(xiàn)關(guān)聯(lián)的用戶,還是用戶關(guān)聯(lián)出現(xiàn)了問題,或者 ID 數(shù)據(jù)本身存在錯誤。
關(guān)注神策數(shù)據(jù)公眾號,回復(fù)關(guān)鍵字“CDP”即可免費下載完整版白皮書。
(推廣)