机器视觉学习相关入门推荐哪些框架比较好?

最近业务上可能需要涉及一些最基本的机器视觉学习场景:通过摄像头或者一些专业设备定时拍照然后通过机器学习分析变化之类的,但从来没接触过这方面的东西,然而现在机器学习的框架好多所以想问下:新手小白入门用哪个框架比较好(或者书籍)

阅读 1.3k
1 个回答
✓ 已被采纳新手上路,请多包涵

如果只是业务上的问题临时需要用到,建议先把任务的数学模型建立起来,确定这是哪一个大类的任务,然后使用对应的一些现成的代码库把实际问题解决了。例如,『通过摄像头或者一些专业设备定时拍照然后通过机器学习分析变化』这个需求,根据实际情况,可以分解为分割+后处理或者是检测+后处理任务。如果以分割的思路来做,又可以细分为几种具体的做法,比如一种简单做法是我们可以从输入的视频流中逐帧读取图像,对图像进行分割,然后对邻近帧的分割结果进行后处理(如逐像素比较分割类别),获取所需的变化信息(这种做法在遥感领域通常被称为『分类后检测法』)。确定了具体的做法之后,我们就可以在一些开源的仓库里寻找自己需要的解决方案,例如 PaddleSeg 这个仓库就集成了很多分割算法,我们只需要根据文档调用相应的 API 实现我们的想法就可以。

如果确实是想要入门,打算从基础知识开始从头学起,我觉得框架语法的学习其实倒是所有基础知识中最不重要的部分。建议将理论知识学习和代码实操『解耦』开来:一方面需要对机器学习这一领域(如相关的模式识别、图像处理等学科)有比较系统的了解;另一方面从一些简单但优质的开源项目入手,从改写别人的代码开始,夯实工程基础。当然,对于第一方面的工作而言,微积分、线性代数等数学知识必不可少;对于第二方面的工作而言,熟悉 Python、C++ 等机器学习常用的编程语言则十分关键。在学习的过程中,可以选择一门流行的框架入手。一般来说基于动态图的框架思路更直接,对新手更友好,我推荐 PyTorch 和 PaddlePaddle,前者是学术界最流行的深度学习框架( 能正面击败 Tensorflow 的,懂得都懂),后者是国产框架中文资料很多(如果洋文不好的话学习起来比较方便)。

推荐问题
logo
极客观点
子站问答
访问
宣传栏