C語言中的名字空間, 較少被提及. 下面的寫法乍看之下是會讓人吃驚的:
#include <stdio.h>
struct Foo
{
int table_id;
signed int length:4;
} ;
typedef struct Foo Foo;
int main()
{
Foo Foo;
printf("size: %lld ", (long long) sizeof(Foo));
// Foo t1 = {0};
return 0;
}
Foo 首先是一個struct的tag名字, 其次又被typedef定義了一個同名的別名. 然后, 在main函數中,
以Foo Foo; 定義了該類型的一個變量, 同樣名為Foo.
這樣的程序竟然是符合標準的. 原因就在于C語言中有4個名字空間, 當標識符在不同的上下文情境下位于不同的名字空間時, 可同時出現而不會引起沖突.
我查看了C語言標準, 6.2.3 Name Spaces and Identifiers
其中定義的4個名字空間如下:
1. label 單獨位于一個名字空間, 由于goto有害論, label受到牽連, 現今其重要性極低.
2. struct, union , enum的名字, 在C標準中用tag一詞指代, 它們的名字位于一個名字空間, 也就是說, 如果你已經
struct Foo { ... };
就不能再
enum Foo {... };
了
3. struct, 或union 的成員, 位于由相應的struct或union 聲明范圍內的一個密閉名字空間, 兩個不同的struct, 或struct與union 的成員, 可以有同樣的名字, 這一規則可以遞歸地施行于struct / union 的子成員. 如果它們本身也是一個struct或union 的話.
4. 所有其它的一切東西, 比如函數名, 變量名等等.
根據這4條, 上面的程序該如何解釋? Foo 重復出現了3次:
struct Tag.
typedef 或
main內的變量名.
根據上面的定義, 作為typedef定義出來的類型名和main內的變量名同屬于"其它"類, 應該會出現沖突. 但實際上這樣的用法是允許的. 因為在main內通過
Foo Foo;
定義變量Foo時, 第一個Foo的語意只能是typedef定義出來的Foo才合理, 此時作為變量的Foo還沒定義完成, 所以沒有沖突.
那一行注釋起來的
// Foo t1...
如果去掉注釋, 就會引起編譯錯誤,
test.c:15: error: expected ';' before 't1'
gcc的這條錯誤并沒提供多少有用的信息.
因為在此時的上下文中, 就有了兩個identifier位于同一個名字空間. 而printf中的sizeof(Foo) 究竟是作為typedef定義出來的別名Foo, 還是變量名Foo.
雖然無法從程序運行結果上知道, 但可以確定應該是變量名Foo, 簡單的實驗加推理可以證實這一點:
將Foo Foo改為char Foo;
此時大小變為1.
推理:
typdef定義的別名其作為域在最外層, 而在main內, 變量Foo暫時性地遮蔽了外層Foo的意義.
對上面程序作如下修改, 得到的結果可以證實:
int main()
{
{
char Foo;
int a = 4, b = a;
printf("size: %lld ", (long long)sizeof(Foo) );
}
printf("size: %lld ", (long long)sizeof(Foo) );
struct Foo t1 = {0};
return 0;
}
另一個需要注意的地方是, C語言中定義的結構的可見性, 是平坦的,
struct Foo
{
struct Bar { ... };
};
熟悉C++類型系統的人可能會懷疑是否能直接使用結構Bar, 要不要Foo::, C里面Bar的可用性跟Foo是平級的.本篇文章