All Posts
2021
2020
2019
- Mar 05 基于深度学习lstm算法生成音乐
- Feb 21 利用spark构建分布式电影协同过滤推荐系统
- Jan 25 实时大数据平台搭建flume+kafka+hdfs+sparkstreaming
- Jan 15 数据分析之利用arma算法对销售进行预测
- Jan 07 数据分析之利用apriori关联算法看看客户最喜欢买什么
2018
- Dec 25 Hive使用python编写的自定义函数udf进行etl
- Dec 23 跨数据库数据传输:利用odbc从mysql传输数据到sql server
- Dec 10 数据分析之利用深度学习和机器学习对餐饮客户进行分类
- Nov 25 数据分析之利用rfm模型对餐饮客户进行分析
- Nov 15 从本地sql server迁移到阿里云分析型数据库adb实践
- Oct 29 Bi自动化之python自动查询数据库生成excel并每天定时邮件发送
- Oct 19 Bi自动化之tableau自动导出pdf报表作为附件自动发送邮件
- Oct 15 Lambda架构:python+flume+kafka+hbase+sparkstreaming架构搭建
- Sep 25 Sparkstreaming使用sql
- Sep 10 Sparksteaming实时接收网络端口数据和hdfs做wordcount
- Aug 12 Kafka+flume实时采集数据
- Jul 15 Hive使用技巧
- Jul 01 Spark1.6.1和2.4读取csv文件,转为为dataframe和使用sql
- Mar 25 Python多进程爬取上海房价数据并画热力图
- Feb 21 Python分析微信朋友圈
- Jan 02 Python爬取前程无忧和拉勾数据分析岗位并分析
- Jan 01 爬取贝壳租房信息存储到mongodb
2017
- Nov 21 Python爬取前程无忧数据写入mysql
- Oct 22 验证码识别
- Sep 01 调用百度ai进行情感分析探索股票价格与股民情绪之间的关系
- Aug 15 企查查
- Jul 05 利用朴素贝叶斯进行垃圾邮件分类
- Jul 02 Python生成词云
- Jul 01 爬取猎取网药品说明书
- Jun 02 利用高德和百度获取经纬度和地址
- Jun 01 爬取药监局药品名录
- May 27 获取图吧地图终端信息
- May 02 markdow语法
- May 01 欢迎来到小站