引言:

PaddlePaddle作为国内首个深度学习框架,最近发布了更加强大的Fluid1.2版本, 增加了对windows环境的支持,全面支持了Linux、Mac、 windows三大环境。

PaddlePaddle在功能完备的基础上,也尽量秉承易学易用的特点,在Windows的安装方面,体现了一键式的特点,大部分情况下,只需要一条简单的命令就可以完成安装。

用户在使用的过程中可能会面对安装和编译方面的问题,下面就从这两个方面来分别说明。

一、安装

在深度学习框架上, python语言由于本身的易用性和丰富的类库,被众多深度学习框架作为了应用方面的首选,PaddlePaddle也将python语言作为了自己的应用语言,如下介绍在python下怎么安装PaddlePaddle。­­

  1. 系统检查

PaddlePaddle目前支持windows7,8,10系列的专业和企业版本,且只支持64位的操作系统。

PaddlePaddle目前支持的python版本覆盖了2.7,3.5,3.6,3.7版本,基本上包含了目前主流使用的所有python版本,可以通过如下方式检查操作系统和python版本情况

import platform

platform.architecture()

('64bit','WindowsPE') # 64 bits on windows 64 bits

platform.version()

'10.0.17134' # windows 10

platform.python_version()

'2.7.15' # python 2.7

如笔者自己的系统就显示了如上信息。

  1. 拉取安装包的方式

Paddlepaddle可以选择通过pip命令在线或离线安装,下面展示一下如何离线下载安装包。

PaddlePaddle的安装包已经放到了python官方支持的发布渠道上,打开PyPI官方网站,按图中所示输入Paddlepaddle,

用户将会得到当前所有的Paddlepaddle安装包,根据系统和python版本号选择对应版本即可

  1. 安装过程

如果是在线安装,用户直接输入 pip install paddlepaddle即可正常安装。

如果是离线安装,用户输入 pip install paddlepaddle_xxx.whl 包也可以完成安装。

通常情况下pip命令伴随python安装包一起已经得到安装,如果用户发现自己没有安装pip,可以到PyPA

Documentation,按照提示安装pip即可。

如果出现错误,用户可以检查

请使用管理员权限账户操作(比如Administrator账号),并确保使用64位python(查看系统检查章节)

[MO用1]

通过 控制面板 – 账号 – 管理用户账号 即可看到如上界面。

  1. 安装完成检查

安装完成后,用户可以打开python命令,输入如下语句,

import paddle.fluid

print(paddle.__version__)

1.2.0 # 当前paddle版本

如果出现错误,用户可以检查

  1. PaddlePaddle依赖python的动态库,如果当前python没有选择安装到环境变量,则可能出现找不到依赖库的情况,用户可以在如下图中加入环境路径,再次启动即可。

二、编译

不想自己做编译的用户可以直接跳过此节。

一、 前期准备

  1. 环境检查

当前paddle的编译只支持window10 专业/企业版本。

  1. 工具准备

2.1 请安装Visual Studio 2015 update3版本。

2.2 下载cmake 3.0及以上版本 安装

2.3 下载git安装

2.4 下载python安装,请注意当前支持版本为2.7,3.5,3.6,3.7

2.4.1 下载pip安装

2.4.2 请运行 pip install protobuf numpy wheel

二、编译过程

Paddlepaddle的编译过程需要保证网络可用,因为部分依赖包需要通过网络环境获取。Paddlepaddle编译需要访问GitHub。

  1. 用户需要到 GitHub PaddlePaddle 下载源代码,选择 release 1.2 分支,下载zip包或者 通过命令

a. git clone https://github.com/paddlepadd...

b. cd paddle

c. git checkout release /1.2

  1. 在源代码目录下,建一个build子目录并进入
  2. 运行cmake .. -G "Visual Studio 14 2015 Win64" -DPYTHON_INCLUDE_DIR=${PYTHON_INCLUDE_DIRS} -DPYTHON_LIBRARY=${PYTHON_LIBRARY} -DPYTHON_EXECUTABLE=${PYTHON_EXECUTABLE} -DWITH_FLUID_ONLY=ON -DWITH_GPU=OFF -DWITH_TESTING=OFF -DCMAKE_BUILD_TYPE=Release

a. 其中PYTHON_INCLUDE_DIRS指的是python的include目录,比如 c:Python35include\

b. 其中PYTHON_LIBRARY指定是pythonxx.lib所在的目录,比如c:Python35libs\

c. 其中PYTHON_EXECUTABLE指的是python.exe,比如c:Python35 python.exe

d. 其中DWITH_FLUID_ONLY=ON指的是paddlepaddle在windows下只支持fluid版本

e. 其中WITH_GPU=OFF指的是paddlepaddle当前只支持CPU

f. 其中WITH_TESTING=OFF指的是关闭测试

g. 其中CMAKE_BUILD_TYPE=Release指的是只支持Release编译

h. 其中-G "Visual Studio 14 2015 Win64"指的是只支持VS2016的64bit编译

  1. 目录下会生成paddle.sln文件,用Visual Studio 2015打开,选择64位Release模式,开始编译。

三、编译完成检查

  1. 检查方法

如果编译过程不出错则表明编译成功,用户可以到 buildpythondist 目录下查找对应的生成 whl 文件。

  1. 常见编译问题

【问】为什么我的paddle.sln文件没有生成?

【答】请按编译过程要求检查是安装了指定的软件和版本

【问】编译过程中为什么出现ssl一类的网络错误?

【答】编译过程需要访问网络,请检查系统代理和网络连通情况。

【问】whl文件为什么没有生成?

【答】请按编译过程要求检查python的变量是否正确设置。

三、训练模型检测

  1. 导入网络

PaddlePaddle在使用方面为了贴合用户需求,尽量做到了将复杂的概念简化,深度学习用户将网络结构会理解为多个层结构的叠加,相对应的,PaddlePaddle也对应的有了层的封装。

在定义网络方面,用户可以统一使用fluid.layers里面定义好的结构,来方面的构建一个神经网络结构,比如

Include libraries.

import paddle

import paddle.fluid as fluid

import numpy

Configure the neural network.

def net(x, y):

y_predict = fluid.layers.fc(input=x, size=1, act=None)

cost = fluid.layers.square_error_cost(input=y_predict, label=y)

avg_cost = fluid.layers.mean(cost)

return y_predict, avg_cost

  1. 定义训练和预测函数

训练和预测方面,可以统一成为输入,计算和输出三个大的方面,用户可以使用fluid.layers.data来定义输入数据,对应在具体在执行层面,executor的run函数中,使用feed来接受输入数据。

下面可以定义预测函数和训练函数,示例

Define train function.

def train(save_dirname):

x = fluid.layers.data(name='x', shape=[13], dtype='float32')

y = fluid.layers.data(name='y', shape=[1], dtype='float32')

y_predict, avg_cost = net(x, y)

sgd_optimizer = fluid.optimizer.SGD(learning_rate=0.001)

sgd_optimizer.minimize(avg_cost)

train_reader = paddle.batch(

paddle.reader.shuffle(paddle.dataset.uci_housing.train(), buf_size=500),

batch_size=20)

place = fluid.CPUPlace()

exe = fluid.Executor(place)

def train_loop(main_program):

feeder = fluid.DataFeeder(place=place, feed_list=[x, y])

exe.run(fluid.default_startup_program())

PASS_NUM = 1000

for pass_id in range(PASS_NUM):

total_loss_pass = 0

for data in train_reader():

avg_loss_value, = exe.run(

main_program, feed=feeder.feed(data), fetch_list=[avg_cost])

total_loss_pass += avg_loss_value

if avg_loss_value < 5.0:

if save_dirname is not None:

fluid.io.save_inference_model(

save_dirname, ['x'], [y_predict], exe)

return

print("Pass %d, total avg cost = %f" % (pass_id, total_loss_pass))

train_loop(fluid.default_main_program())

Infer by using provided test data.

def infer(save_dirname=None):

place = fluid.CPUPlace()

exe = fluid.Executor(place)

inference_scope = fluid.core.Scope()

with fluid.scope_guard(inference_scope):

[inference_program, feed_target_names, fetch_targets] = (

fluid.io.load_inference_model(save_dirname, exe))

test_reader = paddle.batch(paddle.dataset.uci_housing.test(), batch_size=20)

test_data = test_reader().next()

test_feat = numpy.array(map(lambda x: x[0], test_data)).astype("float32")

test_label = numpy.array(map(lambda x: x[1], test_data)).astype("float32")

results = exe.run(inference_program,

feed={feed_target_names[0]: numpy.array(test_feat)},

fetch_list=fetch_targets)

print("infer results: ", results[0])

print("ground truth: ", test_label)

  1. 执行训练和预测

接着可以简单调用上面定义函数,训练过程会产生输出,用户可以自定义输出目录,在后面的预测过程中,加载训练输出的模型

Run train and infer.

if name == "__main__":

save_dirname = "fit_a_line.inference.model"

train(save_dirname)

infer(save_dirname)

程序将输出预测结果,比如在笔者的环境中输出为(仅作参考,用户环境可能有出入)

非常欢迎您为PaddlePaddle贡献文档,我们的文档在PaddlePaddle/FluidDoc (GitHub PaddlePaddle专区中的FluidDoc) 中统一管理,如您对PaddlePaddle有任何问题,也非常欢迎您在此Repo提交Issue,您的反馈是我们进步的动力


深度学习之桨
3 声望2 粉丝