流式训练正统叫法online training,在线学习。意思是训练数据不是一次放入模型学习,而是不断加入的。这个典型是大数据场景,像电商,每天都有新的数据,每天都要让模型学习新的数据,所以不可能一次把数据学完。 Batch Training是指数据量太大(一般来说你已经获得了所有数据,后面不会新增了),全部一次学完计算量太大,电脑吃不消,就分批丢给模型训练,CPU和内存负载都会小很多。深度学习的mini batch就是典型应用。
流式训练正统叫法online training,在线学习。意思是训练数据不是一次放入模型学习,而是不断加入的。这个典型是大数据场景,像电商,每天都有新的数据,每天都要让模型学习新的数据,所以不可能一次把数据学完。
Batch Training是指数据量太大(一般来说你已经获得了所有数据,后面不会新增了),全部一次学完计算量太大,电脑吃不消,就分批丢给模型训练,CPU和内存负载都会小很多。深度学习的mini batch就是典型应用。