English Version go here.
By Alva Chien
Part I: Basics of the Microsoft .NET Framework
Chapter 1: The Architecture of the .NET framework Development Platform
1. .Net中的common language runtime (CLR) 是一個(gè)可以被多個(gè)不同語(yǔ)言使用的runtime. 不管使用哪種編譯器,所生成的結(jié)果都是一個(gè)managed module. 一個(gè)managed module是一個(gè)標(biāo)準(zhǔn)的Windows Portable executable (PE) 文件,這個(gè)文件必須由CLR來(lái)執(zhí)行.
一個(gè)managed module的組成:
Part |
Description |
PE Header |
標(biāo)準(zhǔn)的 Windows PE header, 類似于Common Object File Format (COFF) header. 這個(gè)header包含了文件類型: GUI, CUI, or DLL, 它同樣包含了一個(gè)文件創(chuàng)建時(shí)的時(shí)間戳. 對(duì)只包含IL代碼的的modules,PE header中的大部分信息被忽略. 對(duì)包含native CPU代碼的module,這個(gè)header包含了關(guān)于native CPU代碼的信息. |
CLR Header |
包含了一個(gè)managed module所必須的信息(由CLR和其工具解析) . 這個(gè)header包含了所需的CLR版本和一些狀態(tài)標(biāo)志位, managed module的入口方法(Main方法,一個(gè)MethodDef metadata token), metadata的位置/大小, 資源, strong name, 一些標(biāo)志位和其他信息. |
Metadata |
每個(gè)managed module都包含metadata表. 這些表有兩種類型: 定義types和members的的表和定義Referenced的type和members的表. |
Intermediate language (IL) code |
由編譯器編譯的代碼,真正執(zhí)行時(shí)候CLR會(huì)將IL代碼編譯為native CPU instructions. |
2. 一個(gè) assembly是一個(gè)或多個(gè)managed modules/資源文件的邏輯組合, 它是最小的可重用,擁有版本信息和安全信息的單元. PE文件包含一塊叫做manifest的數(shù)據(jù)塊. 一個(gè)manifest是另一個(gè)metadata tables的集合. 這些tables定義了組成一個(gè)assembly的文件, 由這些文件定義的exported types, 跟這個(gè)assembly關(guān)聯(lián)的資源或數(shù)據(jù)文件. 一個(gè)典型的例子: 把一些較少使用的types或資源定義在assembly的一個(gè)獨(dú)立文件中,這個(gè)文件只會(huì)在其中的type或資源被使用的時(shí)候才被加載.
3. 可以通過查找MSCorEE.dll 文件來(lái)判斷.NET是否被安裝,這個(gè)文件位于%windir%\system32 文件夾中. 但是,一臺(tái)機(jī)器允許同時(shí)安裝幾個(gè)版本的.Net Framewor.可以通過查看一下注冊(cè)表的鍵值來(lái)判斷當(dāng)前.NET的版本: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\.NETFramework\policy
4. 如何裝載 CLR:
- 當(dāng)創(chuàng)建一個(gè)EXE assembly, 編譯器/鏈接器在生成的assembly’s PE file header嵌入一些特別的信息在.text section.
- 當(dāng)創(chuàng)建一個(gè)DLL assembly, 如果一個(gè)unmanaged程序調(diào)用LoadLibrary 裝載它, 這個(gè)DLL’s 入口函數(shù)知道如果裝載CLR來(lái)正確處理assembly中的代碼.
5. 當(dāng)創(chuàng)建一個(gè)EXE assembly, 一個(gè)的6字節(jié)的x86 sub function被嵌入到.text section: JMP _CoreExeMain. 這個(gè)_CoreExeMain函數(shù)從MSCorEE.dll導(dǎo)入, 這個(gè)MSCoreEE.dll (Microsoft Component Object Runtime Execution Engine) 在assembly file’s .idata section定義了引用. 所以當(dāng)assembly像正常程序一樣啟動(dòng)時(shí), MSCoreEE.dll被導(dǎo)入到這個(gè)進(jìn)程的地址空間, 這時(shí)_CorExemain 函數(shù)的地址被獲取,同時(shí)JMP instruction被執(zhí)行. 這個(gè)函數(shù)將初始化CLR并且查找這個(gè)可執(zhí)行assembly’s CLR header的可執(zhí)行入口方法,這個(gè)方法的IL代碼將被編譯為native CPU instructions, 隨后CLR跳轉(zhuǎn)這個(gè)native code, 這時(shí),程序已經(jīng)啟動(dòng).
6. 當(dāng)創(chuàng)建一個(gè)DLL assembly, 一個(gè)類似的6字節(jié)長(zhǎng)的x86 stub function被嵌入到.text section: JMP _CorDllMain. _CorDllMain 函數(shù)同樣從MSCorEE.dll中引入, 這個(gè)DLL’s .idata section 中包含MSCorEE.dll的引用定義. 所以, 當(dāng)LoadLibrary 執(zhí)行時(shí), _CorDllMain 被調(diào)用來(lái)初始化CLR并返回給應(yīng)用程序來(lái)繼續(xù)執(zhí)行.
7. 這個(gè)6字節(jié)的stub function僅僅在非Windows XP系統(tǒng)中被添加. 在Windows XP以及以后版本中, OS loader檢查嵌入managed code的文件的PE file header的directory entry 14. (IMAGE_DIRECTORY_ENTRY_COM_DESCRIPTOR定義在WinNT.h) 如果這個(gè)directory entry存在并且擁有一個(gè)非0值, OS loader忽略這個(gè)文件的導(dǎo)入 (.idata) section并且自動(dòng)裝載MSCorEE.dll到進(jìn)程的地址空間并直接跳轉(zhuǎn)到對(duì)應(yīng)的函數(shù).
8. 最后一個(gè)關(guān)于managed PE文件的注意點(diǎn): 他們總是使用32位PE文件格式, 而不是64位PE文件格式. 在64位系統(tǒng)上, OS loader檢查這個(gè)managed 32位PE文件并知道如何去創(chuàng)建一個(gè)64位地址空間.
9. 至于知識(shí)產(chǎn)權(quán)保護(hù), 對(duì)于所有的編譯位IL的代碼并且IL代碼能被很容易被Disassembler程序reverse, 可以使用一個(gè)第三方提供的obfuscator工具. 這些工具“scramble” managed module’s metadata中所有private symbols的名稱. 另外,可以把一些代碼編譯為unmanaged DLL并在assembly中調(diào)用它.
10. 所有的高級(jí)語(yǔ)言都只是提供了CLR的一個(gè)功能子集. 但是,IL提供了CLR所有的功能.
11. 如果Assembly中的一個(gè)方法第一次被調(diào)用,它的IL代碼需要被編譯為native CPU代碼, 這部分功能由CLR’s JIT (just-in-time)完成. JIT編譯器在內(nèi)存中保存了native CPU instructions, 所以當(dāng)應(yīng)用程序終止時(shí)候,編譯的代碼都將失效. 另外一個(gè)值得記住的重點(diǎn)是JIT編譯過程當(dāng)中有一個(gè)專門的優(yōu)化編譯代碼的過程.
12. Microsoft .Net framework提供了一個(gè)名為NGen.exe的工具; 這個(gè)工具編譯一個(gè)assembly的全部IL代碼為native CPU代碼并將結(jié)果保存到一個(gè)硬盤文件.
13. IL是一個(gè)stack-based的語(yǔ)言, 所有的IL instructions會(huì)把operands壓棧,并將結(jié)果彈出. IL沒有提供操作CPU寄存器的指令.