项目地址: https://github.com/zhangsheng...
已完成项
- 使用爬虫爬取股民对于股票的评论。(目前是爬取雪球网上人们对于小米公司的评论)
- 对人们的评论做情感分析,得到评论的情感得分。(使用工厂模式获取情感分析模型,目前使用的是snownlp)
- 将爬取到的数据,以及情感得分,存入数据库。(使用工厂模式,目前对接的是monogodb)
未完成项
- 爬取每日股票的涨跌幅等,作为lable的数据。
- 将每个发言人id作为key,当天发言的平均情感得分作为value;按天为粒度,将所有id的得分打成一行存入数据库。
- 将前3天的数据拼成一行作为一条x,将历史数据放入时间序列预测模型(也可能采用传统机器学习,树模型xgboost之类的),预测第二天股票的涨跌幅。
- 对接微信公众号等(或微信机器人),支持用户订阅股票,每日开盘前自动推送预测结果。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。