爬取tensorflow的所有API
02-02
現在Tensorflow的python版API已經比較穩定了。下面幾行代碼就可以爬取並轉換成對應函數名類名的pdf。
import urllibnimport renimport pdfkitnnpage = urllib.urlopen("https://www.tensorflow.org/api_docs/python/").read()nkeywords = re.findall(""(https://www.tensorflow.org/api_docs/python/[/w]+)"", page)nfor keyword in keywords:n pdfnamegp=re.search("(?<=https://www.tensorflow.org/api_docs/python/)[/w]+",keyword)n pdfname=pdfnamegp.group(0).replace("/", ".")+".pdf"n pdfkit.from_url(keyword, pdfname)n
推薦閱讀:
※c++里如何理解vector是動態數組,而這個單詞本義是向量?為什麼這麼叫?
※圖的鄰接矩陣/關聯矩陣的秩有什麼直觀的幾何意義嗎?
※有哪些信息安全方面的經典書籍?
※計算機網路該如何深入學習?
※JVM里的符號引用如何存儲?
TAG:计算机科学 |