BootstrapTensorFlow图像分类教程


磨练:将标志好的数额(图像)提须要模型。有一个工具将随意抓取一批图像,使用模型揣测每种花的花色,测试臆度的准头,重复执行,直到使用了绝超过半数训练多少为止。最终一批未被应用的图像用于统计该磨炼模型的准确性。

训练模型

在容器中运作下述命令,对教练多少进行下载和完整性检查。

curl -O
http://download.tensorflow.org/example\_images/flower\_photos.tgz

echo ‘db6b71d5d3afff90302ee17fd1fefc11d57f243f  flower_photos.tgz’ |
sha1sum -c

一经没有阅览“flower_photos.tgz”音讯:表达文件不科学。如若上诉curl
或sha1sum步骤失利,请手动下载磨练多少包并解压(SHA-1
校验码:db6b71d5d3afff90302ee17fd1fefc11d57f243f)到地方主机的local目录下。

近日把陶冶多少放好,然后对再训练脚本进行下载和完整性检查。

mv flower_photos.tgz local/

cd local

curl -O
https://raw.githubusercontent.com/tensorflow/tensorflow/10cf65b48e1b2f16eaa82

6d2793cb67207a085d0/tensorflow/examples/image_retraining/retrain.py

echo ‘a74361beb4f763dc2d0101cfe87b672ceae6e2f5  retrain.py’ | sha1sum -c

肯定retrain.py有不易的内容,你应该看到retrain.py: OK.。

末尾,初叶攻读!运行再磨练脚本。

python retrain.py –image_dir flower_photos –output_graph
output_graph.pb

–output_labels output_labels.txt

即使蒙受如下错误,忽略它:

TypeError: not all arguments converted during string formatting Logged
from file

tf_logging.py, line 82.

随着retrain.py 的运行,练习图像会活动的分批次陶冶、测试和认证数据集。

在出口上,大家愿意有较高的“操练精度”和“验证精度”,以及较低的“交叉熵”。有关这个术语的详实分解,请参考“怎么样就新图片类型再陶冶Inception的末尾一层”。在眼前的硬件上的磨炼约30分钟。

请小心控制台出口的终极一行:

INFO:tensorflow:Final test accuracy = 89.1% (N=340)

那声明我们早已取得了一个模子:给定一张图像,10次中有9次可科学猜出是五种花朵类型中的哪一类。由于提须要练习进程的擅自数不一致,分类的精确度也会有所差异。


标注:管理陶冶多少。例如花卉,将雏菊的图像放到“雏菊”目录下,将玫瑰放到“玫瑰”目录下等等,将尽量多的两样类其余花朵依照种类分裂放在不一样的目录下。假若我们不标注“蕨类植物”,那么分类器永远也不会回来“蕨类植物”。那必要种种品种的不少样书,由此这一步很重大,并且很耗时。(本文使用预先标记好的数码以升高成效)

安装

率先,在所选的阳台上安装Docker。

在见怪不怪TensorFlow教程中初阶且唯一依赖的就是Docker(应该申明那是个合理的起来)。我也更欣赏那种设置TensorFlow的法门,因为不需求安装一层层的依赖项,那足以保证主机(台式机或桌面)比较彻底。

Bootstrap TensorFlow

设置Docker后,我们准备启动一个练习和分类的TensorFlow容器。在硬盘上创设一个2GB空闲空中的办事目录,创造一个名为local的子目录,并记下完整路径。

docker run -v /path/to/local:/notebooks/local –rm -it –name tensorflow

tensorflow/tensorflow:nightly /bin/bash

上面是命令解析:

-v
/path/to/local:/notebooks/local将刚创制的local目录挂载到容器中适当的职位。假若应用RHEL、Fedora或其余支持SELinux的连串,添加:Z允许容器访问目录。

–rm 退出时令docker删除容器

-it 连接输入输出,已毕相互之间。

–name
tensorflow将容器命名为tensorflow,而不是sneaky_chowderhead或任何Docker定义的肆意名字。

tensorflow/tensorflow:nightly从Docker Hub
(公共图像存储库)运行tensorflow/tensorflow的nightly
图像,而不是前卫的图像(默许为近期树立/可用图像)。使用nightly图像而不是latest图像,是因为(在写入时)latest包涵的一个bug会破坏TensorBoard,那是大家稍后须要的一个数额可视化工具。

/bin/bash指定运行Bash shell,而不运行体系默许命令。

本学科目的在于把一个事先被内置训练过的品类里的图片,通过运行一个限令以识别该图像具体属于哪个品种。步骤如下图所示:

陶冶和分类

本课程将训练一个用来识别差距品类花朵的图像分类器。深度学习须要大量的练习多少,由此,大家需求多量已分类的繁花图像。值得庆幸的是,别的一个模型在图像收集和归类这上面做得格外可观,所以我们运用那么些包含脚本的已分类数据集,它有现成且完全练习过的图像分类模型,重新陶冶模型的结尾几层以高达大家想要的结果,那种技能称为迁移学习。

咱俩重新陶冶的模型是Inception
v3,最初是在二零一五年1三月刊出的舆论“重新思考总结机视觉的Inception架构”中有做论述。

直至大家做了这一个约20分钟的教练,Inception才领会哪些辨别雏菊和郁金香,那就是深浅学习中的“学习”部分。

本种类文章直接切入关键的一些,只须求对命令行和Python有最宗旨的打听,就足以在家飞速地成立一些令你激动不已的类型。本文不会浓密探讨TensorFlow的劳作规律,如若你想精晓更加多,我会提供多量额外的参考资料。本种类具有的库和工具都是免费开源的软件。

在那些由两片段组成的不可胜举中,我将讲述怎样快速的创造一个行使于图像识其他卷积神经网络。TensorFlow计算步骤是相互的,可对其配备进行逐帧视频分析,也可对其扩大进行时间感知录像分析。

纵深学习算法与电脑硬件性能的上扬,使研商人口和商号在图像识别、语音识别、推荐引擎和机械翻译等世界得到了英雄的上进。六年前,视觉形式识别领域取得了第四个超凡的成果。两年前,谷歌(Google)大脑团队开支了TensorFlow,并将深度学习巧妙的应用于各种领域。现在,TensorFlow则超过了重重用来深度学习的复杂性工具。

动用TensorFlow,你能够拿走具有强有力能力的扑朔迷离成效,其有力的基本来自于TensorFlow的易用性。

干活原理


分类:在新的图像上接纳模型。例如,输入:IMG207.JPG,输出:雏菊。那个手续疾速简单,且衡量的代价小。

分类

再添加一个小本子,就可以将新的繁花图像添加到模型中,并出口测试结果。那就是图像分类。

将下述脚本命名为 classify.py保存在本土local目录:

import tensorflow as tf, sys

image_path = sys.argv[1]

graph_path = ‘output_graph.pb’

labels_path = ‘output_labels.txt’

# Read in the image_data

image_data = tf.gfile.FastGFile(image_path, ‘rb’).read()

# Loads label file, strips off carriage return

label_lines = [line.rstrip() for line

    in tf.gfile.GFile(labels_path)]

# Unpersists graph from file

with tf.gfile.FastGFile(graph_path, ‘rb’) as f:

    graph_def = tf.GraphDef()

    graph_def.ParseFromString(f.read())

    _ = tf.import_graph_def(graph_def, name=”)

# Feed the image_data as input to the graph and get first prediction

with tf.Session() as sess:

    softmax_tensor =
sess.graph.get_tensor_by_name(‘final_result:0’)

    predictions = sess.run(softmax_tensor,

    {‘DecodeJpeg/contents:0’: image_data})

    # Sort to show labels of first prediction in order of confidence

    top_k =
predictions[0].argsort()[-len(predictions[0]):][::-1]

    for node_id in top_k:

        human_string = label_lines[node_id]

        score = predictions[0][node_id]

        print(‘%s (score = %.5f)’ % (human_string, score))

为了测试你协调的图像,保存在local目录下并取名为test.jpg,运行(在容器内)
python classify.py test.jpg。输出结果如下:

sunflowers (score = 0.78311)

daisy (score = 0.20722)

dandelion (score = 0.00605)

tulips (score = 0.00289)

roses (score = 0.00073)

数量证实了全体!模型确定图像中的花朵是向日葵的准确度为78.311%。数值越高申明匹配度越高。请留心,只可以有一个匹配类型。多标签分类则必要别的一个不一的主意。

更加多详细新闻,请点击那里查阅classify.py的详尽表明。

分拣脚本中的图表加载代码已经被破坏,在此地,我用graph_def =
tf.GraphDef()等作为图表加载代码。

动用零基础知识和一部分代码,我们建了一个极度好的花卉图像分类器,在现有的台式机电脑上每秒差不多可以拍卖5张图像。

    希望你可见持续关怀本博客的文山会海博文。

上述为译文。

正文由阿里云云栖社区协会翻译。

小说原标题《Learn how to classify images with
TensorFlow》,译者:Mags,审校:袁虎。

相关文章