資源簡介
基于搜狗查詢數(shù)據(jù)500w條使用MapReduce做數(shù)據(jù)清洗,hive做離線分析的項目,詳細文檔附數(shù)據(jù)連接,搜狗實驗室的搜索數(shù)據(jù)下載后缺少了用戶ID字段的數(shù)據(jù),所以本分析采用的是完整的數(shù)據(jù),大家可以放心下載,如果下載數(shù)據(jù)的百度云鏈接失效無法下載,大家可以給我留言。
代碼片段和文件信息
評論
共有 條評論