ZONGHAN's NOTES

Compiling TensorFlow 0.6.0 with Python 3.5 on a platform with cuda capability 3.0

發表留言 Posted by Zong-han, Xie 於 2016 年 03 月 16 日

Environment introduction

My environment and hardware capability refer to this article except I’ve reinstalled my cuda SDK back to cuda-7.0.

Therefore, I build 0.6.0 with GPU enabled on an environment with ubuntu 14.04, cuda-7.0 and Python 3.5.

My Java installation is Oracle JDK8 using HotSpot virtual machine.

TensorFlow needs a cuda deep neural network library called “cudnn",TensorFlow 0.6.0 version requires cudnn 6.5 V2, I had it installed in my cuda-7.0 directory.

閱讀全文

未分類

Install CUDA-7.5 and pycuda on Ubuntu 14.04

3 則迴響 Posted by Zong-han, Xie 於 2015 年 11 月 24 日

Environment description

The hardware I used is ASUS N550jv, the NVIDIA device in it is Geforce GT 750M. The CUDA capability of this device is listed as following.


Device 0: "GeForce GT 750M"
CUDA Driver Version / Runtime Version 7.5 / 7.5
CUDA Capability Major/Minor version number: 3.0
Total amount of global memory: 2048 MBytes (2147352576 bytes)
( 2) Multiprocessors, (192) CUDA Cores/MP: 384 CUDA Cores
GPU Max Clock rate: 1085 MHz (1.09 GHz)
Memory Clock rate: 900 Mhz
Memory Bus Width: 128-bit
L2 Cache Size: 262144 bytes
Maximum Texture Dimension Size (x,y,z) 1D=(65536), 2D=(65536, 65536), 3D=(4096, 4096, 4096)
Maximum Layered 1D Texture Size, (num) layers 1D=(16384), 2048 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(16384, 16384), 2048 layers
Total amount of constant memory: 65536 bytes
Total amount of shared memory per block: 49152 bytes
Total number of registers available per block: 65536
Warp size: 32
Maximum number of threads per multiprocessor: 2048
Maximum number of threads per block: 1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch: 2147483647 bytes
Texture alignment: 512 bytes
Concurrent copy and kernel execution: Yes with 1 copy engine(s)
Run time limit on kernels: No
Integrated GPU sharing Host Memory: No
Support host page-locked memory mapping: Yes
Alignment requirement for Surfaces: Yes
Device has ECC support: Disabled
Device supports Unified Addressing (UVA): Yes
Device PCI Domain ID / Bus ID / location ID: 0 / 1 / 0
Compute Mode:
&amp;lt; Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) &amp;gt;

Install CUDA-7.5 toolkit

The repo of the CUDA toolkit I installed was acquired from the official web page and I used the package from “deb(network)" link.

After the package was acquired, type following commands in the terminal.

閱讀全文

C++, CUDA, Python, 未分類

[C語言] 測試一下如果使用array當作function參數會怎樣？

發表留言 Posted by Zong-han, Xie 於 2015 年 10 月 14 日

雖然C語言是沒有array這種function參數的，但是我還是想試一下如果把function參數設成多維陣列會怎樣。

#include &amp;amp;lt;stdio.h&amp;amp;gt;
#include &amp;amp;lt;stdlib.h&amp;amp;gt;

void foo(char a[][5]){
 printf("%u\n", sizeof(a));
 printf("%p\n", &amp;amp;amp;a[0]);
 printf("%p\n", &amp;amp;amp;a[1]);
 printf("%p\n", &amp;amp;amp;a[2]);
}

void foo2(char a[][5][3]){
 printf("%u\n", sizeof(a));
 printf("%p\n", &amp;amp;amp;a[0]);
 printf("%p\n", &amp;amp;amp;a[1]);
 printf("%p\n", &amp;amp;amp;a[2]);
 printf("%p\n", &amp;amp;amp;a[1][0]);
 printf("%p\n", &amp;amp;amp;a[1][1]);
}

int main(int argc, const char *argv[])
{
 char a[2][5];
 foo(a);
 char b[2][5][3];
 foo2(b);
 return 0;
}

故意用char，因為char只佔一個byte，然後array長度選3, 5這種數，如果sizeof印出來是4很可能就是pointer型態。

在我的Raspberry Pi2 上用 raspbian付的 gcc 4.6編譯。

編譯下 gcc -Wall -std=c99 a.c，沒有warnings。

輸出結果：

4
0x7ee8b6f4
0x7ee8b6f9
0x7ee8b6fe
4
0x7ee8b6d4
0x7ee8b6e3
0x7ee8b6f2
0x7ee8b6e3
0x7ee8b6e6

由foo()印出來的結果知道，a型態是char (*)[5]，是一個指向5個char的指標，每一次陣列取值會跳5個char。

由foo2()印出來的結果知道，a型態是char (*)[5][3]，是一個指向5個char的指標，每一次陣列取值會跳15個char。而a[1][0]是一個指向3個char的指標，每一次陣列取值會跳3個char。

未分類

Test using std::tuple

發表留言 Posted by Zong-han, Xie 於 2015 年 01 月 29 日


#include &amp;lt;iostream&amp;gt;
#include &amp;lt;vector&amp;gt;
#include &amp;lt;tuple&amp;gt;
#include &amp;lt;complex&amp;gt;

using namespace std;

int main()
{
auto a = make_tuple(2, &amp;quot;xxx&amp;quot;, 5.0, vector&amp;lt;double&amp;gt;(1,2.0), complex&amp;lt;double&amp;gt;(3.3,3.4));
cout &amp;lt;&amp;lt; get&amp;lt;4&amp;gt;(a) &amp;lt;&amp;lt;endl;
cout &amp;lt;&amp;lt; get&amp;lt;3&amp;gt;(a)[1] &amp;lt;&amp;lt;endl;
cout &amp;lt;&amp;lt; get&amp;lt;1&amp;gt;(a) &amp;lt;&amp;lt;endl;
return 0;
}

References：http://www.cplusplus.com/reference/tuple/

C++

測試blitz library的copy constructor方式

發表留言 Posted by Zong-han, Xie 於 2015 年 01 月 29 日

確定一下blitz::blitz::TinyVector、blitz::TinyMatrix與blitz::Array的傳遞方式。

#include <iostream>
#include <blitz/array.h>
using namespace std;

template<typename T>
void foo(T mat){
 mat(1)=3.0;
}

int main()
{
 blitz::TinyVector<double, 3>vec;
 vec(2) = 5.123;
 blitz::TinyMatrix<double, 2,2> mat;
 blitz::Array<double,2> mat2;
 mat2.resize(2,2);
 mat(0,0) = 1;
 mat2(0,0) = 1;
 foo(vec);
 cout << "check TinyVector" << endl;
 std::cout << vec << std::endl;
 foo<blitz::TinyVector<double, 3>& >(vec);
 std::cout << vec << std::endl;
 cout << "check matrix" << endl;
 foo(mat); //TinyMatrix copy data
 foo(mat2); //Aray copy reference
 std::cout << mat <<std::endl;
 std::cout << mat2 <<std::endl;
 foo<blitz::TinyMatrix<double, 2,2>& >(mat);
 std::cout << mat <<std::endl; //passing reference with blitz::TinyMatrix<double, 2,2>
 return 0;
}

由上面code測試可以知道，只有Array會copy reference，其他兩個是copy data。
此外，如果對於一個Matrix使用類似mat(1)去改值，則只會改到(1,1)這個element。

參考：

http://blitz.sourceforge.net/resources/blitz-0.9.pdf

Blitz++, C++

[讀書心得摘要]如何閱讀一本書

1 則迴響 Posted by Zong-han, Xie 於 2015 年 01 月 26 日

為了在台南的創業聚會BJ4分享如何閱讀一本書，我花了一個禮拜硬是把這一本書啃下去。

在聚會上報告的摘要投影片在這裡。

這一本書是一本經典，從1972出版第二版之後就沒有再改版過。

中文版由現任大塊文化董事長郝明義先生與都會女作家朱依女士翻譯。

書名雖然是如何閱讀一本書，但是主要內容集中在如何閱讀有論述內容的理論或實用型讀物。

其他類書籍像是想像文學、哲學、科學甚或社會科學作品則是分別以專章討論。

本書是關於閱讀的藝術,是為了主動閱讀的人所寫的。

所謂主動閱讀指的是以增強理解力（理解書本內容至與作者相同level）為目標而閱讀。

作者以四個問題（摘自原書）來貫穿本書，這四個問題被作者認為是理解一本書所需要的集中心力去回答的四個問題。

整體來說,這本書到底在談些什麼？要想辦法找出這本書的主題，作者如何依次發展這個主題，如何逐步從核心主題分解出從屬的關鍵議題來。
作者細部說了什麼,怎麼說的？要想辦法找出主要的想法、聲明與論點。這些組合成作者想要傳達的特殊訊息。
這本書說得有道理嗎？是全部有道理,還是部分有道理？等你瞭解了一本書，如果你又讀得很認真的話，你會覺得有責任為這本書做個自己的判斷。光是知道作者的想法是不夠的。
這本書跟你有什麼關係？如果這本書給了你一些資訊，你一定要問問這些資訊有什麼意義。為什麼這位作者會認為知道這件事很重要？你真的有必要去瞭解嗎？如果這本書不只提供了資訊，還啟發了你，就更有必要找出其他相關的、更深的含意或建議，以獲得更多的啟示。

閱讀依次分為四個層次（摘自原書）：

基礎閱讀:基本閱讀能力。認單字、句子到讀文章就算，高中生就具備。
檢視閱讀:粗淺的閱讀，抓住這本書的想要表達的主題與部份內容，讓你判斷是否要進行更進階的分析閱讀。
分析閱讀:理解作者想要傳達的內容，並可以禮貌的、公正的評斷一本書。
主題閱讀:跨越單一書本，針對一個自己想閱讀的主題閱讀，並綜合各家見解做分析，這是屬於論文寫作的能力階段。

檢視閱讀除了利用序、目錄、索引、參考文獻和找幾頁選讀來看看這本書大約要傳達哪些主題與可能有哪些內容之外（這叫做略讀），也有所謂粗讀。粗讀就是把書一直讀下去，不要回頭。粗讀會讓讀者大約只有理解近50%或可能更少的內容，但是卻可以讓讀者決定是否要進花更多時間進入分析閱讀，或者是不是要購買一本書。

根據書中的說法，在1972年作者寫作這本書的時空背景下他認為大約只有1%~0.01%的書值得進入分析閱讀的領域。其他的書粗淺的讀一下就好了。

一旦進入分析閱讀，就要精準的抓出書本的主旨、大綱與綱要架構以及有談論到的論述及主題。透過對於每一部分用詞的理解到關鍵據再到對於一整個論述的完整理解來了解大綱架構下各部份內容。然後，假設讀者已經完全理解了這一本書，就要能評論（誠實的）這一本書。這樣也是一種自省的方式，沒有看懂的地方就在回去看，直到看懂為止。

這一本書我大致上掃過一次（大約就是略讀）。光是略讀我所得到的知識就可以讓你今後讀任何書籍時更有方向感而不是蠢蠢的從第一行讀到最後一行。

參考：

Discussion, 未分類