學習筆記TF050:TensorFlow源代碼解析

TensorFlow目錄結構。

ACKNOWLEDGMENTS #TensorFlow版本聲明

ADOPTERS.md #使用TensorFlow的人員或組織列表

AUTHORS #TensorFlow作者的官方列表

BUILD

CONTRIBUTING.md #TensorFlow貢獻指導

ISSUE_TEMPLATE.md #提ISSUE的模板

LICENSE #版權許可

FOR SALE: README.md

RELEASE.md #每次發版的change log

WORKSPACE #配置移動端開發環境

bower.BUILD

configure

models.BUILD

tensorflow #主目錄

third_party #第三方庫,包括eigen3(特徵運算,SVD、LU分解等)、gpus(支持cuda)、hadoop、jpeg、llvm、py、sycl

tools #構建cuda支持

util

tensorflow目錄結構:

BUILD

__init__.py

c

cc #採用C++進行訓練的親樣例

compiler

contrib #將常用功能封裝在一起高級API

core #C++實現主要目錄

examples #各種示例

g3doc #針對C++、Python版本代碼文檔

go

java

opensource_only #聲明目錄

python #Python實現主要目錄

stream_executor #流處理

tensorboard #App、Web支持,以及腳本支持

tensorflow.bzl

tf_exported_symbols.lds

tf_version_script.lds

tools #工具雜項

user_ops

workspace.bzl

contirb目錄。保存常用功能封裝高級API。不是官方支持。高級API完善後被官方遷移到核心TensorFlow目錄或去掉。部分包(package)在github.com/tensorflow/m 有更完整實現。

framework:很多函數在這裡定義(get_varibles、get_global_step),一些廢棄或不推薦(deprecated)函數。

layers:initializers.py,變數初始化函數。layers.py,層操作和權重偏置變數函數。optimizers.py,損失函數和global_step張量優化器操作。regularizers.py,帶權重正則化函數。summaries.py,摘要操作添加到tf.GraphKeys.SUMMARIES集合中的函數。

learn:使用TensorFlow進行深度學習高級API,訓練模型、評估模型、讀取批處理數據、隊列功能API封裝。

rnn:額外RNN Cell,對RNN隱藏層改進,LSTMBlockCell、GRUBlockCell、FusedRNNCell、GridLSTMCell、AttentionCellWrapper。

seq2seq:建立神經網路seq2seq層和損失函數操作。

slim:TensorFlow-Slim(TF-Slim),定義、訓練、評估TensorFlow複雜模型輕量級庫。TF-Slim與TensorFlow原生函數和tf.contrib其他包自由組合。TF-Slim已逐漸遷移到TensorFlow開源Models,裡面有廣泛使用卷積神經網路圖像分類模型代友,可以從頭訓練模型或預測訓練模型開始微調。

core目錄。C語言文件,TensorFlow原始實現。

BUILD

common_runtime #公共運行庫

debug

ditributed_runtime #分散式執行模塊,含有grpc session、grpc worker、grpc master

example

framework #基礎功能模塊

graph

kernels #核心操作在CPU、CUDA內核實現

lib #公共基礎庫

ops

platform #操作系統實現相關文件

protobuf #.proto文件,用於傳輸時結構序列化

public #API頭文件目錄

user_ops

util

Protocol Buffers,谷歌公司創建的數據序列化(serialization)工具,結構化數據序列化,數據存儲或RPC數據交換格式。定義協議緩衝區,生成.pb.h和.pb.cc文件。定義get、set、序列化、反序列化函數。TensorFlow核心proto文件graph_def.proto、node_def.proto、op_def.proto保存在framework目錄。構圖時先構建graph_def,存儲下來,在實際計算時再轉成圖、節點、操作內存對象。

tensorflow-1.1.0/tensorflow/core/framework/node_def.proto,定義proto文件。node_def.proto定義指定設備(device)操作(op)、操作屬性(attr)。

framework 目錄還有node_def_builder.h、node_def_builder.cc、node_def_util.h、node_def_util_test.cc。在C++里操作node_def.proto的protobuf結構。

examples目錄,深度學習例子,MNIST、Word2vec、Deepdream、Iris、HDF5。TensorFlow在Android系統上的移動端實現。擴展.ipynb文檔教程,jupyter打開。

g3doc。存放Markdown維護的TensorFlow文檔,離線手冊。g3doc/api_docs目錄內容從代碼注釋生成,不應該直接編輯。腳本tools/docs/gen_docs.sh生成API文檔。無參數調用,只重新生成Python API文檔,操作文檔,包括Python、C++定義。傳遞-a,運行腳本重新生成C++ API文檔,需要完裝doxygen。必須從tools/docs目錄調用。

python目錄。激活函數、卷積函數、池化函數、損失函數、優化方法。

tensorboad目錄。實現TensorFlow圖表可視化工具代碼,代碼基於Tornado實現網頁端可視化。Tornado Web Server - Tornado 4.5.1 documentation 。

TensorFlow源代碼學習方法。

1)了解自己研究的基本領域,圖像分類、物體檢測、語音識別,了解領域所用技術,卷積神經網路(convolutional neural network,CNN)、循環神經網路(recurrent neural network,RNN),知道實現基本原理。

2)運行GitHub對應基本模型,目錄結構:

AUTHORS

CONTRIBTING.md

LICENSE

FOR SALE: README.md

WORKSPACE

autoencoder

compression

differential_privacy

im2txt

inception

lm_1b

namignizer

neural_gpu

neural_programmer

next_frame_prdiction

resnet

slim

street

swivel

syntaxnet

textsum

transformer

tutorials

video_prediction

計算機視覺,compression(圖像壓縮)、im2txt(圖像描述)、inception(對ImageNet數據集用Inception V3架構訓練評估)、resnet(殘差網路)、slim(圖像分類)、street(路標識別或驗證碼識別)。

自然語言處理,lm_1b(語言模型)、namignizer(起名字)、swivel(Swivel演算法轉換詞向量)、syntaxnet(分詞和語法分析)、textsum(文本摘要)、tutorials目錄word2vec(詞轉換向量)。

教科書式代碼,看懂學懂有助今後自己實現模型。運行模型,調試、調參。完整讀完MNIST或CIFAR10整個項目邏輯,就掌握TensorFlow項目架構。

slim目錄。TF-Slim圖像分類庫。定義、訓練、評估複雜模型輕量級高級API。訓練、評估lenet、alexnet、vgg、inception_v1、inception_v2、inception_v3、inception_v4、resnet_v1、resnet_v2,模型位於slim/nets:

alexnet.py

alexnet_test.py

cifarnet.py

inception.py

inception_resnet_v2.py

inception_resnet_v2_test.py

inception_utils.py

inception_v1.py

inception_v1_test.py

inception_v2.py

inception_v2_test.py

inception_v3.py

inception_v3_test.py

inception_v4.py

inception_v4_test.py

lenet.py

nets_factory.py

nets_factory_test.py

overfeat.py

overfeat_test.py

resnet_utils.py

resnet_v1.py

resnet_v1_test.py

resnet_v2.py

resnet_v3_test.py

vgg.py

vgg_test.py

TF-Slim包含腳本從頭訓練模型或從預先訓練網路開始訓練模型並微調,slim/scripts:

finetune_inception_v1_on_flowers.sh

finetune_inception_v3_on_flowers.sh

train_cifarnet_on_cifar10.sh

train_lenet_on_mnist.sh

TF-Slim包含下載標準圖像數集,轉換TensorFlow支持TFRecords格式腳本,slim/datasets:

cifar10.py

dataset_factory.py

dataset_utils.py

download_and_convert_cifar10.py

download_and_convert_flowers.py

download_and_convert_mnist.py

flowers.py

imagenet.py

mnist.py

3)結合要做的項目,找到相關論文,自己用TensorFlow實現論文內容。質的飛躍。

參考資料:

《TensorFlow技術解析與實戰》

歡迎付費諮詢(150元每小時),我的微信:qingxingfengzi


推薦閱讀:

如何系統的學習深度學習?
amazon picking challenge(APC)2016中識別和運動規劃的主流演算法是什麼?
基於深度學習的單目圖像深度估計有哪些比較好的參考資料(書籍、博客、論文.....)?求大神指點。
如何評價深度學習之父Hinton發布的Capsule論文?
如何在沒有有效指導的情況下學習深度學習?

TAG:TensorFlow | 机器学习 | 深度学习DeepLearning |