餐饮外卖大数据挖掘
基于Spark 做数据处理、提取MongoDB 业务库到Hive 后,提供基本数据报表结果表。基于Hive+Presto
挖掘数据特征、通过Scala + Spark Core 做统计算法处理,对数据做预处理和规划标注内容,作为算法训
练集使用,使用Azkaban 做定时任务调度。
基于特征工程,提取画像标签用Neo4j 做数据画像存储,基于优惠活动内容信息、餐品信息、门店和品
牌信息做NLP,文本数据预处理做信息降维,计算因子权重,使用Spark ML 和 Scikit-Learn 机器学习,
基于线性回归和贝叶斯原理基础,包含使用随机森林、XGBoost、GBDT、AI 预测算法和推荐算法,包含
售罄预测、用户流量预测、销售预测、套餐搭配推荐、口味推荐。