1、選擇題
1、 一下哪個屬于離散變量
水稻畝產(chǎn)量 家庭收入 商品價格 汽車產(chǎn)量
2、 卡方分布的樣本方差分別是
n 1 2n 4n
3、 有個人買彩票,中獎概率為 1/10,每次花 200 元,連續(xù)買 5 次,如果中獎則獎金為 1000 元,問
不賠錢的概率是多少
4、 世界男女比例相當,黃種人比其他人種多的多,其他人種男的比女的多,以下那句是正確的
黃種人男人比黑種人女人多
黃種人女人比黑種人男人多
5、 關于聚類分析的題目 ,判斷哪句不正確
6、 均值>中位數(shù)>眾數(shù),問這個分布偏左還是偏右
7、 隨機無放回抽樣跟隨機有放回抽樣比較,哪個方差大,還是相等
8、 回歸分析 y=a+bx,如果存在自相關,問 b 的值如何,是正負還是 0,還有顯著性如何。
2、問答題
1、 SQL 語句,表 A 有 member_id, city,表 B 有 member_id, price 幾項,將 A 和 B 鏈接,且
指定城市和 price>10. Member_id 為主鍵.如果不會寫就給出數(shù)據(jù)分析的思想
2、數(shù)據(jù)清理中,處理缺失值的方法
3、回歸分析中出現(xiàn)的多重共線性問題是什么,如何處理
3、分析題
1、對不同價位區(qū)間的商品做活動,表 A 給活動出流連次數(shù)與總體瀏覽次數(shù),表 B 給出活動
商品轉換率和總體商品轉換率,分析現(xiàn)象
2、某電商推出一款新的產(chǎn)品,希望這個產(chǎn)品能大賣,讓你給這個主題取個名字,如果你是
數(shù)據(jù)分析師,設定哪些指標來判斷,給出指標的定義和意義,至少三個。