當前位置:首頁 » 網頁前端 » 前端大數據埋點
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

前端大數據埋點

發布時間: 2023-08-08 23:47:27

❶ 大數據系統的數據如何獲取

1、從資料庫導入


在大數據技術風靡起來前,關系型資料庫(RDMS)是主要的數據分析與處理的途徑。發展至今資料庫技術已經相當完善,當大數據出現的時候,行業就在考慮能否把資料庫數據處理的方法應用到大數據中,於是 Hive、Spark SQL 等大數據 SQL 產品就這樣誕生。


2、日誌導入


日誌系統將我們系統運行的每一個狀況信息都使用文字或者日誌的方式記錄下來,這些信息我們可以理解為業務或是設備在虛擬世界的行為的痕跡,通過日誌對業務關鍵指標以及設備運行狀態等信息進行分析。


3、前端埋點


為什麼需要埋點?現在的互聯網公司越來越關注轉化、新增、留存,而不是簡單的統計 PV、UV。這些分析數據來源通過埋點獲取,前端埋點分為三種:手工埋點、可視化埋點、自動化埋點。


4、爬蟲


時至至今, 爬蟲的數據成為公司重要戰略資源,通過獲取同行的數據跟自己的數據進行支撐對比,管理者可以更好的做出決策。而且越難爬蟲獲取競爭對手的數據,對於公司來說是越有價值。

❷ 前端埋點上報

本文所說的埋點上報,只包含兩種:點擊上報(click)、曝光上報(show)。

點擊上報: 使用 window.addEventListener('click') 做全局點擊的代理。

曝光上報:

bury.js

無論vue還是react,一定要在入口文件優先注冊這個類的實例。

react 的 index.js

Vue 的 main.js

現在給一個按鈕添加點擊和曝光的埋點,
點擊的時候上報 {a:1,b:2}
曝光的時候上報 {c:3,d:4}

寫法如下:

在入口文件中吐出數據。

❸ 關於大數據分析的四個關鍵環節

關於大數據分析的四個關鍵環節
隨著大數據時代的到來,AI 概念的火熱,人們的認知有所提高。為什麼說大數據有價值 這是不是只是一個虛的概念 大家怎麼考慮數據驅動問題 為什麼掌握更多的數據就會更有效 這些問題很難回答,但是,大數據絕不是大而空洞的。
資訊理論之父香農曾表示,信息是用來消除不信任的東西,比如預測明天會不會下雨,如果知道了今天的天氣、風速、雲層、氣壓等信息,有助於得出更准確的結論。所以大數據是用來消除不確定性的,掌握更多的有效數據,可以驅動企業進行科學客觀的決策。桑文鋒對大數據有著自己的理解,數據採集遵循「大」、「全」、「細」、「時」四字法則。「大」強調宏觀的「大」,而非物理的「大」。大數據不是一味追求數據量的「大」。比如每天各地級市的蘋果價格數據統計只有 2MB,但基於此研發出一款蘋果智能調度系統,就是一個大數據應用,而有些數據雖然很大,卻價值有限;「全」強調多種數據源。大數據採集講求全量,而不是抽樣。除了採集客戶端數據,還需採集服務端日誌、業務資料庫,以及第三方服務等數據,全面覆蓋,比如美國大選前的民意調查,希拉里有70%以上勝算,但是川普成為了美國總統,因為采樣數據有偏差,支持川普的底層人民不會上網回復。「細」強調多維度數據採集,即把事件的維度、屬性、欄位等都進行採集。如電商行業「加入購物車」的事件,除了採集用戶的 click 數據,還應採集用戶點擊的是哪個商品、對應的商戶等數據,方便後續交叉分析。「時」強調數據的時效性。顯然,具有時效性的數據才有參考價值。如國家指數,CPI 指數,月初收集到信息和月中拿到信息,價值顯然不同,數據需要實時拿到,實時分析。從另一個視角看待數據的價值,可以分為兩點,數據驅動決策,數據驅動產品智能。數據的最大價值是產品智能,有了數據基礎,再搭建好策略演算法,去回灌產品,提升產品本身的學習能力,可以不斷迭代。如今日頭條的新聞推薦,網路搜索的搜索引擎優化,都是數據驅動產品智能的體現。

數據分析四個關鍵環節 桑文鋒把數據分析分為四個環節,數據採集、數據建模、數據分析、指標。他提出了一個觀點,要想做好數據分析,一定要有自底向上的理念。很多公司的數據分析自頂向下推動,用業務分析指標來決定收集什麼數據,這是需求驅動工程師的模式,不利於公司長久的數據採集。而一個健康的自底向上模式,可以幫助公司真正建立符合自己業務的數據流和數據分析體系。 一、數據採集 想要真正做好大數據分析,首先要把數據基礎建好,核心就是「全」和「細」。 搜集數據時不能只通過 APP 或客戶端收集數據,伺服器的數據、資料庫數據都要同時收集打通,收集全量數據,而非抽樣數據,同時還要記錄相關維度,否則分析業務時可能會發現歷史數據不夠,所以不要在意數據量過大,磁碟存儲的成本相比數據積累的價值,非常廉價。 常見的數據採集方式歸結為三類,可視化/全埋點、代碼埋點、數據導入工具。

第一種是可視化/全埋點,這種方式不需要工程師做太多配合,產品經理、運營經理想做分析直接在界面點選,系統把數據收集起來,比較靈活。但是也有不好的地方,有許多維度信息會丟失,數據不夠精準。第二種是代碼埋點,代碼埋點不特指前端埋點,後端伺服器數據模塊、日誌,這些深層次的都可以代碼埋點,比如電商行業中交易相關的數據可以在後端採集。代碼埋點的優勢是,數據更加准確,通過前端去採集數據,常會發現數據對不上,跟自己的實際後台數據差異非常大。可能有三個原因:第一個原因是本身統計口徑不一樣,一定出現丟失;第二點是流量過大,導致數據丟失異常;第三點是SDK兼容,某些客戶的某些設備數據發不出去,導致數據不對稱。而代碼埋點的後台是公司自己的伺服器,自己核心的模擬可以做校準,基本進行更准確的數據採集。第三種是通過導入輔助工具,將後台生成的日誌、數據表、線下數據用實時批量方式灌到裡面,這是一個很強的耦合。數據採集需要採集數據和分析數據的人共同參與進來,分析數據的人明確業務指標,並且對於數據的准確性有敏感的判斷力,採集數據的人再結合業務進行系統性的採集。二、數據建模很多公司都有業務資料庫,裡面存放著用戶注冊信息、交易信息等,然後產品經理、運營人員向技術人員尋求幫助,用業務資料庫支持業務上的數據分析。但是這樣維護成本很高,且幾千萬、幾億條數據不能很好地操作。所以,數據分析和正常業務運轉有兩項分析,數據分析單獨建模、單獨解決問題。數據建模有兩大標准:易理解和性能好。數據驅動不是數據分析師、資料庫管理員的專利,讓公司每一個業務人員都能在工作中運用數據進行數據分析,並能在獲得秒級響應,驗證自己的新點子新思維,嘗試新方法,才是全員數據驅動的健康狀態。多維數據分析模型(OLAP)是用戶數據分析中最有效的模型,它把用戶的訪問數據都歸類為維度和指標,城市是維度,操作系統也是維度,銷售額、用戶量是指標。建立好多維數據分析模型,解決的不是某個業務指標分析的問題,使用者可以靈活組合,滿足各種需求。三、數據分析數據分析支持產品改進產品經理在改進產品功能時,往往是拍腦袋靈光一現,再對初級的點子進行再加工,這是不科學的。《精益創業》中講過一個理念,把數據分析引入產品迭代,對已有的功能進行數據採集和數據分析,得出有用的結論引入下一輪迭代,從而改進產品。在這個過程中大數據分析很關鍵。Facebook 的創始人曾經介紹過他的公司如何確定產品改進方向。Facebook 採用了一種機制:每一個員工如果有一個點子,可以抽樣幾十萬用戶進行嘗試,如果結果不行,就放棄這個點子,如果這個效果非常好,就推廣到更大范圍。這是把數據分析引入產品迭代的科學方法。桑文鋒在 2007 年加入網路時,也發現了一個現象,他打開郵箱會收到幾十封報表,將網路知道的訪問量、提問量、回答量等一一介紹。當網路的產品經理提出一個需求時,工程師會從數據的角度提出疑問,這個功能為什麼好 有什麼數據支撐 這個功能上線時如何評估 有什麼預期數據 這也是一種數據驅動產品的體現。數據驅動運營監控運營監控通常使用海盜模型,所謂的運營就是五件事:觸達是怎麼吸引用戶過來;然後激活用戶,讓用戶真正變成有效的用戶;然後留存,提高用戶粘性,讓用戶能停留在你的產品中不斷使用;接下來是引薦,獲取用戶這么困難,能不能發動已有的用戶,讓已有用戶帶來新用戶,實現自傳播;最後是營收,做產品最終要賺錢。要用數據分析,讓運營做的更好。數據分析方法互聯網常見分析方法有幾種,多維分析、漏斗分析、留存分析、用戶路徑、用戶分群、點擊分析等等,不同的數據分析方法適用於不同的業務場景,需要自主選擇。舉個多維分析的例子,神策數據有一個視頻行業的客戶叫做開眼,他們的軟體有一個下載頁面,運營人員曾經發現他們的安卓 APP 下載量遠低於 iOS,這是不合理的。他們考慮過是不是 iOS 用戶更願意看視頻,隨後從多個維度進行了分析,否定了這個結論,當他們發現某些安卓版本的下載量為零,分析到屏幕寬高時,看出這個版本下載按鈕顯示不出來,所以下載比例非常低。就這樣通過多維分析,找出了產品改進點。舉個漏斗分析的例子,神策數據的官網訪問量很高,但是注冊-登錄用戶的轉化率很低,需要進行改進。所以大家就思考如何把轉化漏斗激活地更好,後來神策做了小的改變,在提交申請試用後加了一個查看登錄頁面,這樣用戶收到賬戶名密碼後可以隨手登錄,優化了用戶體驗,轉化率也有了可觀的提升。四、指標如何定義指標 對於創業公司來說,有兩種方法非常有效:第一關鍵指標法和海盜指標法。第一關鍵指標法是《精益數據分析》中提出的理論,任何一個產品在某個階段,都有一個最需要關注的指標,其他指標都是這個指標的衍生,這個指標決定了公司當前的工作重點,對一個初創公司來說,可能開始關注日活,圍繞日活又擴展了一些指標,當公司的產品成熟後,變現就會成為關鍵,凈收入(GMV)會變成第一關鍵指標。

❹ 埋點,數據產品經理必備的技能

數據是數據產品的根基,而埋點是數據的起點;如果沒有埋點,那數據產品則是無源之水。

可以說埋點是互聯網行業里遇到的關鍵且無法繞過的問題。

以下是企業不同位置的同學內心OS:

業務同學對於埋點是什麼都不知道,也不清楚要埋什麼;所以往往會做了功能但是沒有做埋點,在需要進行數據分析的時候去找數據團隊要數據,數據團隊會反問:「你們埋點了嗎?」

數據產品,因為他們對於業務的認知並不深刻,所以經常會出現漏埋、錯埋的情況,導致最後無數可取的結果。

業務開發,本質上他們是解決業務相關問題,數據開發對他們來說一個比較額外的工作,所以他們的開發成本會隨著埋點需求而增加,也有可能伴隨項目延期的風險;其次過得的埋點開發需求也會導致代碼的冗餘。

數據分析,他們更多地是用數據,數據埋點的規則找不到,以至於無法很好的通過數據驅動進行分析。

外部數據的交互: 比如API數據的傳輸、 數據文件的傳輸等;目前某平台的大數據標簽系統就是通過這種方式傳輸補齊企業的人群標簽等。

而數據產品在整個數據鏈路上來說,基本可以劃分為以下流程:

首先數據採集我們要從不同的端採集不同的數據,然後進行數據清洗加工處理(ETL),然後匯總到數據倉庫中,供用戶分析、用戶畫像、精準營銷等使用;

我們知道數據採集、數據埋點的重要性後,在實際的業務功能需求提出的時候,一定是要提相關埋點需求的,那在做數據採集我們需要遵循怎麼樣的流程呢?

以上環節缺一不可,只有規范的流程,才可以在最後的分析中發現正確的現狀問題。

現在互聯網行業主流的埋點方案主要分為四種:

1. 第一種:代碼埋點,代碼埋點又分為前端埋點和後端埋點;前端埋點是通過前端的代碼埋點來監控用戶觸發某個頁面的數據採集

前端埋點的優點很明顯,但是缺點也很明顯,由於前端埋點的數據是通過延遲上報的機制,比如用戶點擊某個頁面按鈕它不會立刻上報,而是累計到一定的值以後才會按批上班,受限於當前網路情況,如果遇到網路堵塞等問題就會數據丟包,因此前端埋點丟失率比較高,一般在5%~10%。

而且前端埋點如果有漏埋和錯埋的情況,那就要通過app發版進行優化,而客戶端發版就要很久的時間。

優點是在每次用戶觸發這次請求,都會觸發埋點代碼進行數據統計,所以無需發版,及時觸發及時更新。

缺點是服務端埋點需要依賴服務請求,無法覆蓋所有前端交互,以及對於用戶路徑採集也比較弱。

3. 第三種:全埋點;是目前互聯網做用戶增資的企業提出的一種埋點思路,通過埋點SDK接入,針對頁面所有的採集頁面元素的瀏覽和點擊行為做統一的收集,不是按次和需求採集,而是提前全部採集

優點是開發成本高,SDK接入後後期維護成本也低,且埋點流程也很簡單;先採集後定義,在一定程度上能避免漏埋錯埋。

缺點是數據的冗餘,導致很多數據並無用處,且數據採集范圍僅僅是頁面可見元素,比如像曝光這種就無法採集到;數據准確性也有問題。

4. 第四種:可視化埋點;也是接入埋點SDK,但是並不是隨時隨地採集,而是按需採集,通過可視化圈選觸發埋點採集

優點是操作簡單,且按需埋點不會採集無效數據,開發成本比較低;並且數據埋點是可支持撤銷操作的,總體來說比全埋點數據量會小很多。

缺點: 歷史 數據是無法恢復的,因為在我們圈選動作之前的數據是無法進行採集的;統計范圍僅支持頁面前端的動作,比如曝光也是無法採集到的。

選擇埋點方案的參考主要基於三點:

比如我們可以根據業務發展階段來定,比如說現在業務發展較快,版本迭代速度快、開發投入成本高,那我們做客戶端埋點和服務端埋點是不太適合的,因為可能沒過多久版本就更新了,所以全埋點和可視化埋點比較適合;

那對於比較強的業務數據分析場景來說,需加上前端客戶端埋點;以及需要考慮分析深度,如果僅僅是想看用戶前端行為路徑的,那全埋點和可視化埋點就能滿足需求,但是如果分析業務全流程那一定是需要配合上代碼埋點。

我是比較推薦全埋點+代碼埋點組合,如何服務端能做,優先服務端做,這樣數據准確度會更高。

事件是埋點里最核心的要素,如果我們要清晰的定位埋點,就要從6個維度進行定義,我們可以總結為who、when、where、what、why、How;這幾個元素就構建了事件的基本要素。

那對於埋點事件主要可分為三類:

通過以上我們基本就可以判斷出我們需要記錄用戶什麼行為,採集什麼數據,for後續的什麼分析了。

寫在最後,在工作生涯中,過往的坑告訴我,一個好的埋點管理平台是多麼的重要。

首先流程線上化,我們往往在一封封埋點的郵件中迷失自我,但是如果是線上申請,那需求申請、處理、接入、驗證、測試就非常方便和快捷,規避信息溝通中的缺失;

其次可以管理規范,埋點都統一管理,信息集中管理,方便後期的分析和使用;

最重要的是監控實時化,減少漏埋、錯埋的問題。

當然如果沒有埋點管理平台,確定下規范的埋點流程,選擇適合當下業務的埋點方案,我相信你也一定也可以做好埋點以及通過數據完成豐富的場景分析!

作者:Goodnight;專注用戶、產品等運營領域。

題圖來自 Unsplash ,基於 CC0 協議

❺ 前端埋點和後端埋點,哪個更科學

ios埋點主要是為了採集數據,ab測試也需要在ios上埋點採集重點業務數據,這樣測試才能有的放矢,吆喝科技提供的AppAdhoc AB Testing可實現快速簡單的ios埋點。