English Version go here.
By Alva Chien
Part I: Basics of the Microsoft .NET Framework
Chapter 1: The Architecture of the .NET framework Development Platform
1. .Net中的common language runtime (CLR) 是一個可以被多個不同語言使用的runtime. 不管使用哪種編譯器,所生成的結果都是一個managed module. 一個managed module是一個標準的Windows Portable executable (PE) 文件,這個文件必須由CLR來執行.
一個managed module的組成:
Part |
Description |
PE Header |
標準的 Windows PE header, 類似于Common Object File Format (COFF) header. 這個header包含了文件類型: GUI, CUI, or DLL, 它同樣包含了一個文件創建時的時間戳. 對只包含IL代碼的的modules,PE header中的大部分信息被忽略. 對包含native CPU代碼的module,這個header包含了關于native CPU代碼的信息. |
CLR Header |
包含了一個managed module所必須的信息(由CLR和其工具解析) . 這個header包含了所需的CLR版本和一些狀態標志位, managed module的入口方法(Main方法,一個MethodDef metadata token), metadata的位置/大小, 資源, strong name, 一些標志位和其他信息. |
Metadata |
每個managed module都包含metadata表. 這些表有兩種類型: 定義types和members的的表和定義Referenced的type和members的表. |
Intermediate language (IL) code |
由編譯器編譯的代碼,真正執行時候CLR會將IL代碼編譯為native CPU instructions. |
2. 一個 assembly是一個或多個managed modules/資源文件的邏輯組合, 它是最小的可重用,擁有版本信息和安全信息的單元. PE文件包含一塊叫做manifest的數據塊. 一個manifest是另一個metadata tables的集合. 這些tables定義了組成一個assembly的文件, 由這些文件定義的exported types, 跟這個assembly關聯的資源或數據文件. 一個典型的例子: 把一些較少使用的types或資源定義在assembly的一個獨立文件中,這個文件只會在其中的type或資源被使用的時候才被加載.
3. 可以通過查找MSCorEE.dll 文件來判斷.NET是否被安裝,這個文件位于%windir%\system32 文件夾中. 但是,一臺機器允許同時安裝幾個版本的.Net Framewor.可以通過查看一下注冊表的鍵值來判斷當前.NET的版本: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\.NETFramework\policy
4. 如何裝載 CLR:
- 當創建一個EXE assembly, 編譯器/鏈接器在生成的assembly’s PE file header嵌入一些特別的信息在.text section.
- 當創建一個DLL assembly, 如果一個unmanaged程序調用LoadLibrary 裝載它, 這個DLL’s 入口函數知道如果裝載CLR來正確處理assembly中的代碼.
5. 當創建一個EXE assembly, 一個的6字節的x86 sub function被嵌入到.text section: JMP _CoreExeMain. 這個_CoreExeMain函數從MSCorEE.dll導入, 這個MSCoreEE.dll (Microsoft Component Object Runtime Execution Engine) 在assembly file’s .idata section定義了引用. 所以當assembly像正常程序一樣啟動時, MSCoreEE.dll被導入到這個進程的地址空間, 這時_CorExemain 函數的地址被獲取,同時JMP instruction被執行. 這個函數將初始化CLR并且查找這個可執行assembly’s CLR header的可執行入口方法,這個方法的IL代碼將被編譯為native CPU instructions, 隨后CLR跳轉這個native code, 這時,程序已經啟動.
6. 當創建一個DLL assembly, 一個類似的6字節長的x86 stub function被嵌入到.text section: JMP _CorDllMain. _CorDllMain 函數同樣從MSCorEE.dll中引入, 這個DLL’s .idata section 中包含MSCorEE.dll的引用定義. 所以, 當LoadLibrary 執行時, _CorDllMain 被調用來初始化CLR并返回給應用程序來繼續執行.
7. 這個6字節的stub function僅僅在非Windows XP系統中被添加. 在Windows XP以及以后版本中, OS loader檢查嵌入managed code的文件的PE file header的directory entry 14. (IMAGE_DIRECTORY_ENTRY_COM_DESCRIPTOR定義在WinNT.h) 如果這個directory entry存在并且擁有一個非0值, OS loader忽略這個文件的導入 (.idata) section并且自動裝載MSCorEE.dll到進程的地址空間并直接跳轉到對應的函數.
8. 最后一個關于managed PE文件的注意點: 他們總是使用32位PE文件格式, 而不是64位PE文件格式. 在64位系統上, OS loader檢查這個managed 32位PE文件并知道如何去創建一個64位地址空間.
9. 至于知識產權保護, 對于所有的編譯位IL的代碼并且IL代碼能被很容易被Disassembler程序reverse, 可以使用一個第三方提供的obfuscator工具. 這些工具“scramble” managed module’s metadata中所有private symbols的名稱. 另外,可以把一些代碼編譯為unmanaged DLL并在assembly中調用它.
10. 所有的高級語言都只是提供了CLR的一個功能子集. 但是,IL提供了CLR所有的功能.
11. 如果Assembly中的一個方法第一次被調用,它的IL代碼需要被編譯為native CPU代碼, 這部分功能由CLR’s JIT (just-in-time)完成. JIT編譯器在內存中保存了native CPU instructions, 所以當應用程序終止時候,編譯的代碼都將失效. 另外一個值得記住的重點是JIT編譯過程當中有一個專門的優化編譯代碼的過程.
12. Microsoft .Net framework提供了一個名為NGen.exe的工具; 這個工具編譯一個assembly的全部IL代碼為native CPU代碼并將結果保存到一個硬盤文件.
13. IL是一個stack-based的語言, 所有的IL instructions會把operands壓棧,并將結果彈出. IL沒有提供操作CPU寄存器的指令.