8. 格式
程式碼風格和格式確實比較隨意, 但一個專案中所有人遵循同一風格是非常容易的. 個體未必同意下述每一處格式規則, 但整個專案服從統一的程式撰寫風格是很重要的, 只有這樣才能讓所有人能很輕鬆的閱讀和理解程式碼.
另外, 我們寫了一個 emacs 配置文件 來幫助你正確的格式化程式碼.
8.1. 行長度
Tip
每一行程式碼字符數不超過 80.
我們也認識到這條規則是有爭議的, 但很多已有程式碼都已經遵照這一規則, 我們感覺一致性更重要.
優點:
提倡該原則的人主張強迫他們調整編輯器窗口大小很野蠻. 很多人同時並排開幾個程式碼窗口, 根本沒有多餘空間拉伸窗口. 大家都把窗口最大尺寸加以限定, 並且 80 列寬是傳統標準. 為什麼要改變呢?
缺點:
反對該原則的人則認為更寬的程式碼行更易閱讀. 80 列的限制是上個世紀 60 年代的大型機的古板缺陷; 現代設備具有更寬的顯示屏, 很輕鬆的可以顯示更多程式碼.
結論:
80 個字符是最大值.
特例:
- 如果一行註解包含了超過 80 字符的命令或 URL, 出於複製粘貼的方便允許該行超過 80 字符.
- 包含長路徑的
#include
語句可以超出80列. 但應該盡量避免.- 標頭檔保護 可以無視該原則.
8.2. 非 ASCII 字符
Tip
盡量不使用非 ASCII 字符, 使用時必須使用 UTF-8 編碼.
即使是英文, 也不應將使用者界面的文本硬編碼到源程式碼中, 因此非 ASCII 字符要少用. 特殊情況下可以適當包含此類字符. 如, 程式碼分析外部數據文件時, 可以適當硬編碼數據文件中作為分隔符的非 ASCII 字符串; 更常見的是 (不需要本地化的) 單元測試程式碼可能包含非 ASCII 字符串. 此類情況下, 應使用 UTF-8 編碼, 因為很多工具都可以理解和處理 UTF-8 編碼.
十六進制編碼也可以, 能增強可讀性的情況下尤其鼓勵 —— 比如 "\xEF\xBB\xBF"
在 Unicode 中是 零寬度 無間斷 的間隔符號, 如果不用十六進制直接放在 UTF-8 格式的源文件中, 是看不到的.
(Yang.Y 注: "\xEF\xBB\xBF"
通常用作 UTF-8 with BOM 編碼標記)
用 u8
前綴以把帶 uXXXX
轉義序列的字符串字面值編碼成 UTF-8. 不要用在本身就帶 UTF-8 字符的字符串字面值上,因為如果編譯器不把源程式碼識別成 UTF-8, 輸出就會出錯。
別用 C++11 的 char16_t
和 char32_t
, 它們和 UTF-8 文本沒有關係,wchar_t
同理,除非你寫的程式碼要呼叫 Windows API, 後者有用到 wchar_t
擴展。
8.3. 空格還是製表位
Tip
只使用空格, 每次縮排 2 個空格.
我們使用空格縮排. 不要在程式碼中使用制符表. 你應該設置編輯器將制符表轉為空格.
8.4. 函式宣告與定義
Tip
返回類型和函式名在同一行, 參數也盡量放在同一行,如果放不下就對形參分行。
函式看上去像這樣:
ReturnType ClassName::FunctionName(Type par_name1, Type par_name2) { DoSomething(); ... }
如果同一行文本太多, 放不下所有參數:
ReturnType ClassName::ReallyLongFunctionName(Type par_name1, Type par_name2, Type par_name3) { DoSomething(); ... }
甚至連第一個參數都放不下:
ReturnType LongClassName::ReallyReallyReallyLongFunctionName( Type par_name1, // 4 空格縮排 Type par_name2, Type par_name3) { DoSomething(); // 2 空格縮排 ... }
注意以下幾點:
- 如果返回類型和函式名在一行放不下,分行。
- 如果返回類型那個與函式宣告或定義分行了,不要縮排。
- 左圓括號總是和函式名在同一行;
- 函式名和左圓括號間沒有空格;
- 圓括號與參數間沒有空格;
- 左大括號總在最後一個參數同一行的末尾處;
- 如果其它風格規則允許的話,右大括號總是單獨位於函式最後一行,或者與左大括號同一行。
- 右大括號和左大括號間總是有一個空格;
- 函式宣告和定義中的所有形參必須有命名且一致;
- 所有形參應盡可能對齊;
- 缺省縮排為 2 個空格;
- 換行後的參數保持 4 個空格的縮排;
如果有些參數沒有用到, 在函式定義處將參數名註解起來:
// 介面中形參恆有命名。 class Shape { public: virtual void Rotate(double radians) = 0; } // 宣告中形參恆有命名。 class Circle : public Shape { public: virtual void Rotate(double radians); } // 定義中註解掉無用變數。 void Circle::Rotate(double /*radians*/) {}Warning
// 差 - 如果將來有人要實作,很難猜出變數是幹什麼用的。 void Circle::Rotate(double) {}
8.5. Lambda 表達式
Tip
其它函式怎麼格式化形參和函式體,Lambda 表達式就怎麼格式化;捕獲列表同理。
若用引用捕獲,在變數名和 &
之間不留空格。
int x = 0;
auto add_to_x = [&x](int n) { x += n; };
短 lambda 就寫得和內聯函式一樣。
std::set<int> blacklist = {7, 8, 9};
std::vector<int> digits = {3, 9, 1, 8, 4, 7, 1};
digits.erase(std::remove_if(digits.begin(), digits.end(), [&blacklist](int i) {
return blacklist.find(i) != blacklist.end();
}),
digits.end());
8.6. 函式呼叫
Tip
要麼一行寫完函式呼叫,要麼在圓括號裡對參數分行,要麼參數另起一行且縮排四格。如果沒有其它顧慮的話,盡可能精簡行數,比如把多個參數適當地放在同一行裡。
函式呼叫遵循如下形式:
bool retval = DoSomething(argument1, argument2, argument3);
如果同一行放不下,可斷為多行,後面每一行都和第一個實參對齊,左圓括號後和右圓括號前不要留空格:
bool retval = DoSomething(averyveryveryverylongargument1,
argument2, argument3);
參數也可以放在次行,縮排四格:
if (...) { ... ... if (...) { DoSomething( argument1, argument2, // 4 空格縮排 argument3, argument4); }
把多個參數放在同一行,是為了減少函式呼叫所需的行數,除非影響到可讀性。有人認為把每個參數都獨立成行,不僅更好讀,而且方便編輯參數。不過,比起所謂的參數編輯,我們更看重可讀性,且後者比較好辦:
如果一些參數本身就是略複雜的表達式,且降低了可讀性。那麼可以直接創建臨時變數描述該表達式,並傳遞給函式:
int my_heuristic = scores[x] * y + bases[x];
bool retval = DoSomething(my_heuristic, x, y, z);
或者放著不管,補充上註解:
bool retval = DoSomething(scores[x] * y + bases[x], // Score heuristic.
x, y, z);
如果某參數獨立成行,對可讀性更有幫助的話,就這麼辦。
此外,如果一系列參數本身就有一定的結構,可以酌情地按其結構來決定參數格式:
// 通過 3x3 矩陣轉換 widget.
my_widget.Transform(x1, x2, x3,
y1, y2, y3,
z1, z2, z3);
8.7. 列表初始化格式
Tip
你平時怎麼格式化函式呼叫,就怎麼格式化:ref:braced_initializer_list。
如果列表初始化伴隨著名字,比如類型或變數名,你可以當名字是函式、{} 是函式呼叫的括號來格式化它。反之,就當它有個長度為零的名字。
// 一行列表初始化示範。
return {foo, bar};
functioncall({foo, bar});
pair<int, int> p{foo, bar};
// 當不得不斷行時。
SomeFunction(
{"assume a zero-length name before {"},
some_other_function_parameter);
SomeType variable{
some, other, values,
{"assume a zero-length name before {"},
SomeOtherType{
"Very long string requiring the surrounding breaks.",
some, other values},
SomeOtherType{"Slightly shorter string",
some, other, values}};
SomeType variable{
"This is too long to fit all in one line"};
MyType m = { // 注意了,你可以在 { 前斷行。
superlongvariablename1,
superlongvariablename2,
{short, interior, list},
{interiorwrappinglist,
interiorwrappinglist2}};
8.8. 條件語句
Tip
傾向於不在圓括號內使用空格. 關鍵字 if
和 else
另起一行.
對基本條件語句有兩種可以接受的格式. 一種在圓括號和條件之間有空格, 另一種沒有.
最常見的是沒有空格的格式. 哪種都可以, 但 保持一致性. 如果你是在修改一個文件, 參考當前已有格式. 如果是寫新的程式碼, 參考目錄下或專案中其它文件. 還在徘徊的話, 就不要加空格了.
if (condition) { 圓括號裡沒空格緊鄰。 ... // 2 空格縮排。 } else { // else 與 if 的右括號同一行。 ... }
如果你更喜歡在圓括號內部加空格:
if ( condition ) { // 圓括號與空格緊鄰 - 不常見 ... // 2 空格縮排。 } else { // else 與 if 的右括號同一行。 ... }
注意所有情況下 if
和左圓括號間都有個空格. 右圓括號和左大括號之間也要有個空格:
Warning
if(condition) // 差 - IF 後面沒空格。 if (condition){ // 差 - { 前面沒空格。 if(condition){ // 變本加厲地差。if (condition) { // 可 - IF 和 { 都與空格緊鄰。
如果能增強可讀性, 簡短的條件語句允許寫在同一行. 只有當語句簡單並且沒有使用 else
子句時使用:
if (x == kFoo) return new Foo(); if (x == kBar) return new Bar();
如果語句有 else
分支則不允許:
Warning
// 不可以這樣子 - 當有 ELSE 分支時 IF 塊卻只有一行 if (x) DoThis(); else DoThat();
通常, 單行語句不需要使用大括號, 如果你喜歡用也沒問題; 複雜的條件或循環語句用大括號可讀性會更好. 也有一些專案要求 if
必須總是使用大括號:
if (condition) DoSomething(); // 2 空格縮排。 if (condition) { DoSomething(); // 2 空格縮排。 }
但如果語句中某個 if-else
分支使用了大括號的話, 其它分支也必須使用:
Warning
// 不可以這樣子 - IF 有大括號 ELSE 卻沒有。 if (condition) { foo; } else bar; // 不可以這樣子 - ELSE 有大括號 IF 卻沒有。 if (condition) foo; else { bar; }// 只要其中一個分支用了大括號,兩個分支都要用上大括號。 if (condition) { foo; } else { bar; }
8.9. 循環和開關選擇語句
Tip
switch
語句可以使用大括號分段,以表明 cases 之間不是連在一起的。在單語句循環裡,括號可用可不用。空循環體應使用 {}
或 continue
.
switch
語句中的 case
塊可以使用大括號也可以不用, 取決於你的個人喜好. 如果用的話, 要按照下文所述的方法.
如果有不滿足 case
條件的列舉值, switch
應該總是包含一個 default
匹配 (如果有輸入值沒有 case 去處理, 編譯器將報警). 如果 default
應該永遠執行不到, 簡單的加條 assert
:
switch (var) { case 0: { // 2 空格縮排 ... // 4 空格縮排 break; } case 1: { ... break; } default: { assert(false); } }
在單語句循環裡,括號可用可不用:
for (int i = 0; i < kSomeNumber; ++i) printf("I love you\n"); for (int i = 0; i < kSomeNumber; ++i) { printf("I take it back\n"); }
空循環體應使用 {}
或 continue
, 而不是一個簡單的分號.
while (condition) { // 反覆循環直到條件失效。 } for (int i = 0; i < kSomeNumber; ++i) {} // 可 - 空循環體。 while (condition) continue; // 可 - contunue 表明沒有邏輯。Warning
while (condition); // 差 - 看起來僅僅只是 while/loop 的部分之一。
8.10. 指標和引用表達式
Tip
句點或箭頭前後不要有空格. 指標/地址操作符 (*, &
) 之後不能有空格.
下面是指標和引用表達式的正確使用範例:
x = *p; p = &x; x = r.y; x = r->y;
- 注意:啊
- 在訪問成員時, 句點或箭頭前後沒有空格.
- 指標操作符
*
或&
後沒有空格.
在宣告指標變數或參數時, 星號與類型或變量名緊挨都可以:
// 好樣的,空格前置。 char *c; const string &str; // 好樣的,空格後置。 char* c; // 但別忘了 "char* c, *d, *e, ...;"! const string& str;Warning
char * c; // 差 - * 兩邊都有空格 const string & str; // 差 - & 兩邊都有空格。
在單個文件內要保持風格一致, 所以, 如果是修改現有文件, 要遵照該文件的風格.
8.11. 布爾表達式
Tip
如果一個布爾表達式超過 標準行寬, 斷行方式要統一一下.
下例中, 邏輯與 (&&
) 操作符總位於行尾:
if (this_one_thing > this_other_thing && a_third_thing == a_fourth_thing && yet_another & last_one) { ... }
注意, 上例的邏輯與 (&&
) 操作符均位於行尾. 這格式在 Google 裡很常見,你要把所有操作符放在開頭也可以。可以考慮額外插入圓括號, 合理使用的話對增強可讀性是很有幫助的. 此外直接用符號形式的操作符,比如 &&
和 ~
, 不要用詞語形式的 and
和 compl
.
8.12. 函式返回值
Tip
return
表達式裡時沒必要都用圓括號。
假如你寫 x = epr
時本來就會加上括號,那 return expr;
也可如法炮製。
函式返回時不要使用圓括號:
return result; // 返回值很簡單,沒有圓括號。 // 可以用圓括號把複雜表達式圈起來,改善可讀性。 return (some_long_condition && another_condition);Warning
return (value); // 畢竟你從來不會寫 var = (value); return(result); // return 可不是函式!
8.13. 變數及陣列初始化
Tip
用 =
, ()
和 {}
均可.
你可以用 =
, ()
和 {}
, 以下都對:
int x = 3; int x(3); int x{3}; string name("Some Name"); string name = "Some Name"; string name{"Some Name"};
請務必小心列表初始化 {...} 用 std::initializer_list
建構子初始化出的類型。非空列表初始化就會優先呼叫 std::initializer_list
, 不過空列表初始化除外,後者原則上會呼叫默認建構函式。為了強制禁用 std::initializer_list
構造函式,請改用括號。
vector<int> v(100, 1); // A vector of 100 1s. vector<int> v{100, 1}; // A vector of 100, 1.
此外,列表初始化不允許整數類型的四捨五入,這可以用來避免一些類型上的程式撰寫失誤。
int pi(3.14); // 可 -- pi == 3. int pi{3.14}; // Compile error: narrowing conversion.
8.14. 前處理指令
Tip
前處理指令不要縮排, 從行首開始.
即使前處理指令位於縮排程式碼塊中, 指令也應從行首開始.
// 可 - directives at beginning of line if (lopsided_score) { #if DISASTER_PENDING // 正確 -- 行開頭起。 DropEverything(); #endif BackToNormal(); }Warning
// 差 - indented directives if (lopsided_score) { #if DISASTER_PENDING // 錯了! "#if" 應該放在行開頭 DropEverything(); #endif // 錯了! "#endif" 不要縮排 BackToNormal(); }
8.15. 類格式
Tip
訪問控制塊的宣告依次序是 public:
, protected:
, private:
, 每次縮排 1 個空格.
類宣告 (對類註解不瞭解的話, 參考 類註釋) 的基本格式如下:
class MyClass : public OtherClass { public: // 注意有 1 空格縮排! MyClass(); // 照常,2 空格縮排。 explicit MyClass(int var); ~MyClass() {} void SomeFunction(); void SomeFunctionThatDoesNothing() { } void set_some_var(int var) { some_var_ = var; } int some_var() const { return some_var_; } private: bool SomeInternalFunction(); int some_var_; int some_other_var_; DISALLOW_COPY_AND_ASSIGN(MyClass); };
注意事項:
- 所有父類別名應在 80 列限制下盡量與子類名放在同一行.
- 關鍵詞
public:
,protected:
,private:
要縮排 1 個空格.- 除第一個關鍵詞 (一般是
public
) 外, 其他關鍵詞前要空一行. 如果類比較小的話也可以不空.- 這些關鍵詞後不要保留空行.
public
放在最前面, 然後是protected
, 最後是private
.- 關於宣告順序的規則請參考 宣告順序 一節.
8.16. 建構子初始值列表
Tip
建構子初始值列表放在同一行或按四格縮排並排幾行.
下面兩種初始值列表方式都可以接受:
// 當全放在一行合適時: MyClass::MyClass(int var) : some_var_(var), some_other_var_(var + 1) {
或
// 如果要斷成多行,縮排四格,冒號放在第一行初始化句: MyClass::MyClass(int var) : some_var_(var), // 4 空格縮排 some_other_var_(var + 1) { // 對準 ... DoSomething(); ... }
8.17. 命名空間格式化
Tip
命名空間內容不縮排.
命名空間 不要增加額外的縮排層次, 例如:
namespace { void foo() { // 正確。命名空間內沒有額外的縮排。 ... } } // namespace
不要縮排命名空間:
Warning
namespace { // 錯,縮排多餘了。 void foo() { ... } } // namespace
宣告嵌套命名空間時,每命名空間都獨立成行。
namespace foo { namespace bar {
8.18. 水平留白
Tip
水平留白的使用因地制宜. 永遠不要在行尾添加沒意義的留白.
常規:
void f(bool b) { // 左大括號前恆有空格。 ... int i = 0; // 分號前不加空格。 int x[] = { 0 }; // 大括號內部可與空格緊鄰也不可,不過兩邊都要加上。 int x[] = {0}; // 繼承與初始化列表中的冒號前後恆有空格。 class Foo : public Bar { public: // 至於內聯函式實作,在大括號內部加上空格並編寫實作。 Foo(int b) : Bar(), baz_(b) {} // 大括號裡面是空的話,不加空格。 void Reset() { baz_ = 0; } // 用括號把大括號與實作分開。 ...添加冗余的留白會給其他人編輯時造成額外負擔. 因此, 行尾不要留空格. 如果確定一行程式碼已經修改完畢, 將多餘的空格去掉; 或者在專門清理空格時去掉(確信沒有其他人在處理). (Yang.Y 注: 現在大部分程式碼編輯器稍加設置後, 都支持自動刪除行首/行尾空格, 如果不支持, 考慮換一款編輯器或 IDE)
循環和條件語句:
if (b) { // if 條件語句和循環語句關鍵字後均有空格。 } else { // else 前後有空格。 } while (test) {} // 圓括號內部不緊鄰空格。 switch (i) { for (int i = 0; i < 5; ++i) { switch ( i ) { // 循環和條件語句的圓括號裡可以與空格緊鄰。 if ( test ) { // 圓括號,但這很少見。總之要一致。 for ( int i = 0; i < 5; ++i ) { for ( ; i < 5 ; ++i) { // 循環裡內 ; 後恆有空格,; 前可以加個空格。 switch (i) { case 1: // switch case 的冒號前無空格。 ... case 2: break; // 如果冒號有程式碼,加個空格。
操作符:
// 賦值操作系統前後恆有空格。 x = 0; // 其它二元操作符也前後恆有空格,不過對 factors 前後不加空格也可以。 // 圓括號內部不緊鄰空格。 v = w * x + y / z; v = w*x + y/z; v = w * (x + z); // 在參數和一元操作符之間不加空格。 x = -5; ++x; if (x && !y) ...
樣板和轉換:
// 尖叫括號(< and >) 不與空格緊鄰,< 前沒有空格,>( 之間也沒有。 vector<string> x; y = static_cast<char*>(x); // 在類型與指標操作符之間留空格也可以,但要保持一致。 vector<char *> x; set<list<string>> x; // 在 C++11 程式碼裡可以這樣用了。 set<list<string> > x; // C++03 中要在 > > 裡留個空格。 // 你或許可以在 < < 裡加上一對對稱的空格。 set< list<string> > x;
8.19. 垂直留白
Tip
垂直留白越少越好.
這不僅僅是規則而是原則問題了: 不在萬不得已, 不要使用空行. 尤其是: 兩個函式定義之間的空行不要超過 2 行, 函式體首尾不要留空行, 函式體中也不要隨意添加空行.
基本原則是: 同一屏可以顯示的程式碼越多, 越容易理解程式的控制串流. 當然, 過於密集的程式碼塊和過於疏鬆的程式碼塊同樣難看, 取決於你的判斷. 但通常是垂直留白越少越好.
空行心得如下:
- 函式體內開頭或結尾的空行可讀性微乎其微。
- 在多重 if-else 塊裡加空行或許有點可讀性。
譯者 (YuleFox) 筆記
- 對於程式碼格式, 因人, 系統而異各有優缺點, 但同一個專案中遵循同一標準還是有必要的;
- 行寬原則上不超過 80 列, 把 22 寸的顯示屏都占完, 怎麼也說不過去;
- 盡量不使用非 ASCII 字符, 如果使用的話, 參考 UTF-8 格式 (尤其是 UNIX/Linux 下, Windows 下可以考慮寬字符), 盡量不將字符串常數耦合到程式碼中, 比如獨立出資源文件, 這不僅僅是風格問題了;
- UNIX/Linux 下無條件使用空格, MSVC 的話使用 Tab 也無可厚非;
- 函式參數, 邏輯條件, 初始化列表: 要麼所有參數和函式名放在同一行, 要麼所有參數並排分行;
- 除函式定義的左大括號可以置於行首外, 包括函式/類/結構體/列舉宣告, 各種語句的左大括號置於行尾, 所有右大括號獨立成行;
.
/->
操作符前後不留空格,*
/&
不要前後都留, 一個就可, 靠左靠右依各人喜好;- 前處理指令/命名空間不使用額外縮排, 類/結構體/列舉/函式/語句使用縮排;
- 初始化用
=
還是()
依個人喜好, 統一就好; return
不要加()
;- 水平/垂直留白不要濫用, 怎麼易讀怎麼來.
- 關於 UNIX/Linux 風格為什麼要把左大括號置於行尾 (
.cc
文件的函式實作處, 左大括號位於行首), 我的理解是程式碼看上去比較簡約, 想想行首除了函式體被一對大括號封在一起之外, 只有右大括號的程式碼看上去確實也舒服; Windows 風格將左大括號置於行首的優點是匹配情況一目瞭然.
譯者(acgtyrant)筆記
- 80 行限制事實上有助於避免程式碼可讀性失控,比如超多重嵌套塊,超多重函式呼叫等等。
- Linux 上設置好了 Locale 就幾乎一勞永逸設置好所有開發環境的編碼,不像奇葩的 Windows.
- Google 強調有一對 if-else 時,不論有沒有嵌套,都要有大括號。Apple 正好`有栽過跟頭 <http://coolshell.cn/articles/11112.html>`_.
- 其實我主張指標/地址操作符與變數名緊鄰,
int* a, b
vsint *a, b
, 新手會誤以為前者的b
是int *
變量,但後者就不一樣了,高下立判。 - 在這風格指南裡我才剛知道 C++ 原來還有所謂的 Alternative operator representations, 大概沒人用吧。
- 注意建構子初始值列表(Constructer Initializer List)與列表初始化(Initializer List)是兩碼事,我就差點混淆了它們的翻譯。
- 事實上,如果你熟悉英語本身的書寫規則,就會發現該風格指南在格式上的規定與英語語法相當一脈相承。比如普通標點符號和單詞後面還有文本的話,總會留一個空格;特殊符號與單詞之間就不用留了,比如
if (true)
中的圓括號與true
. - 本風格指南沒有明確規定 void 函式里要不要用 return 語句,不過就 Google 開源專案 leveldb 並沒有寫;此外從 Is a blank return statement at the end of a function whos return type is void necessary? 來看,
return;
比return ;
更約定俗成(事實上 cpplint 會對後者報錯,指出分號前有多餘的空格),且可用來提前跳出函式棧。