欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

今日頭條秋招數(shù)據(jù)分析崗面試題與參考答案整理

  發(fā)布時間:2019-12-11 14:15:08   作者:稻蛙   我要評論
這篇文章主要介紹了今日頭條秋招數(shù)據(jù)分析崗面試題與參考答案,整理總結了今日頭條數(shù)據(jù)分析崗面試中的各種問題、參考答案與個人心得體會,需要的朋友可以參考下

1. 做自我介紹,著重介紹跟數(shù)據(jù)分析相關的經(jīng)驗,還有自己為什么要做數(shù)據(jù)分析

略。

2. 如果次日用戶留存率下降了 5%該怎么分析

    1)首先采用“兩層模型”分析:對用戶進行細分,包括新老、渠道、活動、畫像等多個維度,然后分別計算每個維度下不同用戶的次日留存率。通過這種方法定位到導致留存率下降的用戶群體是誰

    2)對于目標群體次日留存下降問題,具體情況具體分析。具體分析可以采用“內(nèi)部-外部”因素考慮,內(nèi)部因素分為獲客(渠道質(zhì)量低、活動獲取非目標用戶)、滿足需求(新功能改動引發(fā)某類用戶不滿)、提活手段(簽到等提活手段沒打成目標、產(chǎn)品自然使用周期低導致上次獲得的大量用戶短期內(nèi)不需要再使用等);外部因素采用PEST分析,政治(政策影響)、經(jīng)濟(短期內(nèi)主要是競爭環(huán)境,如對競爭對手的活動)、社會(輿論壓力、用戶生活方式變化、消費心理變化、價值觀變化等偏好變化)、技術(創(chuàng)新解決方案的出現(xiàn)、分銷渠道變化等)

3. 關于假設檢驗的問題,然而我并沒有答上來,面試官說沒關系

假設檢驗的基本原理是:全稱命題不能證明但可以被證偽。

令我們研究假設的相反假設為原假設,認為我們研究假設的發(fā)生是小概率事件。

如果我們的觀察值是研究假設,那么認為可以排除原假設,我們的研究假設并不是小概率事件。

4. 問了筆試中的題目為什么沒做,現(xiàn)場做

略。

5. 對今日頭條的看法

略。

6. 關于采樣的問題

略。

7. 賣玉米如何提高收益,價格提高多少才能獲取最大收益

收益 = 單價*銷售量,那么我們的策略是提高單位溢價或者提高銷售規(guī)模。

提高單位溢價的方法:品牌打造獲得長期溢價,但缺陷是需要大量前期營銷投入;加工商品占據(jù)價值鏈更多環(huán)節(jié),如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如禮品化等;價格歧視,根據(jù)價格敏感度對不同用戶采用不同定價。

銷售量=流量*轉(zhuǎn)化率,上述提高單位溢價的方法可能對流量產(chǎn)生影響,也可能對轉(zhuǎn)化率產(chǎn)生影響。

那么 收益 = 單價*流量*轉(zhuǎn)化率,短期內(nèi)能規(guī)?;捎玫膽撌沁M行價格歧視,如不同時間、不同商圈的玉米價格不同,采取高定價,然后對價格敏感的用戶提供優(yōu)惠券等。

8. 類比到頭條的收益,頭條放多少廣告可以獲得最大收益,不需要真的計算,只要有個思路就行

收益 = 出價*流量*點擊率*有效轉(zhuǎn)化率,放廣告的數(shù)量會在提高流量,但會降低匹配程度,因此降低點擊率。最大收益是找到這個乘積的最大值,是一個有約束條件的最優(yōu)化問題。

同時參考價格歧視方案,可以對不同的用戶投放不同數(shù)量的廣告。

9. 最后問頭條的使用感受

略。

10. 為什么做數(shù)據(jù)分析

略。

11. 自己的優(yōu)缺點

略。

12. APP激活量的來源渠道很多,怎樣對來源渠道變化大的進行預警

    1)如果渠道使用時間較長,認為渠道的app激活量滿足一個分布,比較可能是正態(tài)分布。求平均值和標準差,對于今日數(shù)值與均值差大于3/2/1個標準差的渠道進行預警

    2)對于短期的新渠道,直接與均值進行對比。

13. 用戶剛進來APP的時候會選擇屬性,怎樣在保證有完整用戶信息的同時讓用戶流失減少

采用技術接受模型(TAM)來分析,影響用戶接受選擇屬性這件事的主要因素有:

    1)感知有用性:

        a. 文案告知用戶選擇屬性能給用戶帶來的好處

    2)感知易用性:

        a. 關聯(lián)用戶第三方賬號(如微博),可以冷啟動階段匹配用戶更有可能選擇的屬性,推薦用戶選擇

    b. 交互性做好

    3)使用者態(tài)度:用戶對填寫信息的態(tài)度

        a. 這里需要允許用戶跳過,后續(xù)再提醒用戶填寫

        b. 告知用戶填寫的信息會受到很好的保護

    4)行為意圖:用戶使用APP的目的性,難以控制

    5)外部變量:如操作時間、操作環(huán)境等,這里難以控制

14. 男生點擊率增加,女生點擊率增加,總體為何減少

因為男女的點擊率可能有較大差異,同時低點擊率群體的占比增大。

如原來男性20人,點擊1人;女性100人,點擊99人,總點擊率100/120。

現(xiàn)在男性100人,點擊6人;女性20人,點擊20人,總點擊率26/120。

即那個段子“A系中智商最低的人去讀B,同時提高了A系和B系的平均智商。”

15. 立方體每面抽掉一層非棱角部分,面積和體積的變化

看不懂題意。

16. F檢驗是干嘛的

    1)F檢驗是檢驗兩個正態(tài)分布的樣本的方差是否存在顯著差異

    2)也可以用于對多組樣本之間比較

    3)計量中,F(xiàn)檢驗原假設所有自變量對因變量都沒有影響,排除原假設說明至少有一個自變量對因變量有影響

17. 如何識別作弊用戶(爬蟲程序, 或者渠道偽造的假用戶)

分類問題可以用機器學習的方法去解決,下面是我目前想到的特征:

    1)渠道特征:渠道、渠道次日留存率、渠道流量以及各種比率特征

    2)環(huán)境特征:設備(一般偽造假用戶的工作坊以低端機為主)、系統(tǒng)(刷量工作坊一般系統(tǒng)更新較慢)、wifi使用情況、使用時間、來源地區(qū)、ip是否進過黑名單

    3)用戶行為特征:訪問時長、訪問頁面、使用間隔、次日留存、活躍時間、頁面跳轉(zhuǎn)行為(假用戶的行為要么過于一致,要么過于隨機)、頁面使用行為(正常用戶對圖片的點擊也是有分布的,假用戶的行為容易過于隨機)

    4)異常特征:設備號異常(頻繁重置idfa)、ip異常(異地訪問)、行為異常(突然大量點擊廣告、點贊)、數(shù)據(jù)包不完整等

18. 如何學習新知識? (思路大概就是利用什么渠道,怎么獲取)

19. 行存儲和列存儲的區(qū)別

    1)行存儲:傳統(tǒng)數(shù)據(jù)庫的存儲方式,同一張表內(nèi)的數(shù)據(jù)放在一起,插入更新很快。缺點是每次查詢即使只涉及幾列,也要把所有數(shù)據(jù)讀取

    2)列存儲:OLAP等情況下,將數(shù)據(jù)按照列存儲會更高效,每一列都可以成為索引,投影很高效。缺點是查詢是選擇完成時,需要對選擇的列進行重新組裝。

“當你的核心業(yè)務是 OLTP 時,一個行式數(shù)據(jù)庫,再加上優(yōu)化操作,可能是個最好的選擇。

當你的核心業(yè)務是 OLAP 時,一個列式數(shù)據(jù)庫,絕對是更好的選擇”

相關文章

最新評論