本科毕业设计想做一个数据挖掘比赛,但是感觉数据处理再调库就可以了,不知道应该把重心放在哪里,老师还要求一定要突出工作量,那么这种工作量如何体现(一般代码量不多吧,我感觉确实比较简单,提取特征带入模型就可以了。) 也有可能理解有误,请指教~~~
我也是在学习之中,感觉在做数据挖掘中,处理数据会花很多时间。 主要费力的地方除了在数据处理中。应该在特征的提取和选择,以及怎么对特征进行优化和调整。包括特征筛选、特征清洗、特征空间的降纬。训练的模型的分类数量等。都是值得去深究和考量。