把軟件做對的那條線：從 Boundary Conditions 出發的系統化設計與測試詳情 - 邊界條件,ico,字段,軟件研發,私藏項目實操分享華山劍宗風清揚博客

在計算機軟件設計裏，boundary conditions 通常譯作邊界條件或邊界情形。這個詞並不神秘，它指的是系統輸入、狀態、資源或時間軸上那些臨近極限、容易出錯、但又必須被清晰定義和妥善處理的點。寫程序的人都懂一個樸素經驗：大多數 bug 藏在邊上，而不是在中間。測試領域把這套經驗系統化，發展出邊界值分析，強調沿着輸入域的臨界值去找茬；工程實踐則進一步要求我們在接口、數據結構、併發、數值計算、國際化文本和資源配額等維度明確邊界、守住邊界、驗證邊界。(GeeksforGeeks)

和數學、物理裏的邊界條件相比，軟件裏的邊界更像是一張風險地圖：哪裏可能溢出，哪裏會下溢，哪裏會出現空指針，哪裏會卡在超時，哪裏會因為字符分割不準而把一個表情符號切成兩半。每一個點都可能引發數據損壞、安全漏洞或服務不可用。把這些點梳理清楚，再用設計、約束和測試把它們圍起來，系統就穩了。

`Boundary conditions` 究竟覆蓋哪些維度

為了讓這張風險地圖更可操作，可以把邊界分解為幾個常被忽略、卻最容易出問題的維度。下面的劃分不是教科書式的定義，更像是日常工程裏反覆被驗證過的問題清單。

1) 輸入域與協議約束的邊界

這是測試教科書最常講的一類：數值的最小/最大、字符串長度的上下限、枚舉的合法集合、日期時間的閉開區間、分頁的 offset/limit、id 的取值範圍、文件大小限制等等。邊界值分析的策略通常會圍繞着min-1、min、min+1、max-1、max、max+1，以及空值/單元素/超大輸入這些樣例去構造用例。這樣做的依據很直接：錯誤常常發生在臨界處。(GeeksforGeeks)

2) 數據結構與算法的邊界

off-by-one（差一錯誤）是程序員的老對手：循環多迭代一次或少一次、數組下標跑到 n 或 -1、切片半開半閉邊界寫反、區間交併集的端點處理。off-by-one 在安全領域甚至有專門的弱點編號 CWE-193，很多緩衝區溢出都由此而起。(Wikipedia)

經典的二分查找 bug 曾經在 Java 標準庫裏潛伏多年，根源是mid = (low + high) / 2 在極端大數組時會導致整數溢出，從而把中點算錯。修正方式是用low + (high - low) / 2。這就是算法實現裏的數值邊界與索引邊界互相勾連的一個生動例子。(DEV Community)

3) 數值計算與浮點語義的邊界

浮點數並不是實數。IEEE 754 定義了 NaN、+∞、-∞、帶符號的零、舍入模式、例外標誌 等一整套語義。很多比較、排序、聚合、去重邏輯，一旦遇到 NaN 就會跑偏；+0.0 和 -0.0 的相等性、除零的返回值、1e308 * 1e10 的上溢、1e-308 / 1e10 的下溢，都屬於邊界範疇。如果不用斷言或衞語句明確防守，生產故障會非常隱蔽。(Wikipedia)

4) 系統資源與運行時的邊界

句柄上限、線程池容量、隊列長度、連接數、文件描述符、堆/棧大小、實時系統裏延遲預算，這些不是寫業務邏輯時第一個想到的東西，卻是雪崩效應的導火索。NASA JPL 的Power of 10 規則建議在對安全性要求高的代碼裏避免運行中動態內存分配、限制循環上界、每個函數放足夠的斷言，目的就是讓運行時邊界明確、可驗證。(spinroot.com)

5) 併發與時序的邊界

TOCTOU（檢查與使用之間的時間窗）是一類經典競態：你在時刻 t1 檢查了資源狀態，以為它安全；到了 t2 使用時，世界已經變了。文件創建、權限檢查、緩存更新、分佈式鎖，稍不留神就會被窗口期偷襲。把原子性搬進接口、用不可分操作或冪等寫入來收口，是一種可靠的降風險方式。(Wikipedia)

6) 文本國際化的邊界

長度等於字符數這件事，在 Unicode 世界裏並不成立。用户感知的一個字符（比如一個帶膚色修飾的表情）可能由多個碼點組成。Unicode UAX #29 明確了字素簇（grapheme cluster）、單詞、句子的分割規則，如果後端對長度限制作了錯誤假設，會把一個表情切成兩半，或者把用户輸入截斷在錯誤位置。(unicode.org)

7) 空值與缺省的邊界

null 的發明者 Tony Hoare 在 2009 年把它稱為價值十億美元的錯誤，因為它導致了無數的空指針異常、空引用安全漏洞與混亂的分支。工程上的應對包括引入Option/Maybe 類型、為外部輸入設定非空契約、在序列化層統一 null 與缺字段 的語義。(InfoQ)

用設計把邊界畫出來：契約、斷言與防禦

Design by Contract（契約式設計）提供了一種把邊界條件寫進接口定義的方式：前置條件、後置條件與不變式。前置條件講清楚調用者必須滿足什麼，後置條件承諾被調方完成之後世界應當怎樣，不變式定義對象的生命期裏什麼必須一直成立。契約不是替代測試，而是給測試提供基準；在調試與集成階段，可以通過斷言把契約激活，早早地在邊界附近爆雷，而不是把問題留到生產環境。(Wikipedia)

把契約與Power of 10 這類工程規則結合使用，能把邊界風險進一步收口：循環必須有明確上界、運行中不做動態內存分配、函數裏放夠斷言，這些都能直接降低邊界被突破的可能性。(spinroot.com)

用測試把邊界踩一遍：邊界值分析的可操作清單

測試層面的要點可以落成一張樣例矩陣，每項都映射到容易踩坑的邊：

區間型輸入：min-1、min、min+1、中間值、max-1、max、max+1
計數型輸入：0、1、N-1、N、N+1
集合/列表：空、單元素、重複元素、極長列表
文本：空白、全空格、不可見字符、組合用表情、右到左字符
數值：NaN、±∞、±0、極大/極小、溢出/下溢
資源與時序：剛好觸頂、超過上限一個單位、超時邊緣值
序列化：缺字段、字段為 null、非法枚舉、超長嵌套

這種清單化的思路，正是邊界值分析與等價類劃分的實用化表達。(GeeksforGeeks)

真實世界裏最常見的邊界坑

差一錯誤與二分查找的中點

循環的<=與<互換、[]切片的半開區間理解錯誤，是新人和老手都會犯的事。二分查找的中點溢出是一個歷史教訓：mid = (low + high) // 2 在 32 位整型上可能溢出，正確寫法是low + (high - low) // 2。(DEV Community)

整數溢出導致的分配錯誤

length * element_size 的乘法溢出，會讓你分配到比需要更小的緩衝區，後續寫入輕易越界。CWE-190 把這類問題分門別類總結出來，很多安全漏洞都由此起步。(cwe.mitre.org)

浮點的`NaN` 與`-0.0`

NaN 不與任何值相等（包括它自己），排序或去重時如果沒處理好，集合語義可能被破壞；-0.0 與 +0.0 在比較上相等，但在某些函數（如符號函數、反正切）裏會暴露符號差異。把這些特殊值當作邊界輸入來驗證，是數值代碼的必修課。(Wikipedia)

`TOCTOU` 與臨界窗口

檢查文件不存在 → 創建文件 這個兩步走如果不是原子操作，競爭對手可以在你兩步之間插入創建動作，把你引向一個已經存在的路徑。這就是TOCTOU。防禦手段是使用O_CREAT | O_EXCL 這一類不可分操作。(Wikipedia)

`Unicode` 的字素邊界

拿len(s) 當用户眼裏字符數，會把表情和合字拆壞；對數據庫字段做字節級截斷時，更可能出現亂碼。UAX #29 給出的是字素簇的邊界規則，工程上應優先使用符合該標準的庫或運行時能力，例如 Intl.Segmenter 與各語言的分詞庫。(unicode.org)

`null` 的語義統一

外部接口的缺字段、顯式為 null、空字符串經常被混用。參考契約式設計的做法，在接口層聲明可空/不可空並統一序列化語義，能極大減少運行期空指針異常。Tony Hoare 的那段反思提醒我們：把空當作邊界場景，像對待錯誤一樣認真地設計處理路徑。(InfoQ)

可運行的演示：把幾類典型邊界寫成可測代碼

下面這份 Python 腳本，演示了幾種常見的邊界處理：32 位整型溢出檢測、年齡輸入的健壯解析與校驗、浮點特殊值防禦、安全的二分查找、利用原子標誌避免 TOCTOU。全部使用標準庫，可以直接運行。

説明：代碼裏只使用單引號，避免英文雙引號；註釋儘量把中文與 English 的混排做了空格分隔。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import math
import os
import errno
import tempfile
from typing import Optional, List

# -------------------------------
# 1) 32 位整型加法的邊界與溢出檢查
# -------------------------------

INT32_MIN = -2**31
INT32_MAX =  2**31 - 1

def int32_add_checked(a: int, b: int) -> int:
    '''
    對 32 位整型加法做溢出檢查。
    返回值在 [INT32_MIN, INT32_MAX] 區間內；溢出則拋出 OverflowError。
    '''
    # 將 a, b 限定為 Python int 並進行範圍預判
    if a < INT32_MIN or a > INT32_MAX:
        raise OverflowError('a out of int32 range')
    if b < INT32_MIN or b > INT32_MAX:
        raise OverflowError('b out of int32 range')

    result = a + b
    # 使用範圍判斷而不是依賴 Python 大整數自動擴展
    if result < INT32_MIN or result > INT32_MAX:
        raise OverflowError('int32 addition overflow')
    return result

# -------------------------------
# 2) 年齡輸入的健壯解析與邊界校驗
# -------------------------------

def parse_age(raw) -> Optional[int]:
    '''
    接受用户輸入的年齡，容忍字符串、前後空白、全角空格。
    規則：空字符串或 None 返回 None；非數字拋出 ValueError。
    合法區間 [0, 150]。
    '''
    if raw is None:
        return None
    if isinstance(raw, str):
        s = raw.strip().replace('\u3000', '')  # 去全角空格
        if s == '':
            return None
        if not s.isdecimal() and not (s.startswith('-') and s[1:].isdecimal()):
            raise ValueError('age must be integer-like text')
        val = int(s)
    elif isinstance(raw, (int,)):
        val = raw
    else:
        raise ValueError('unsupported age type')

    if not (0 <= val <= 150):
        raise ValueError('age out of [0, 150]')
    return val

# -------------------------------
# 3) 浮點的特殊值與比較邊界
# -------------------------------

def safe_mean(values: List[float]) -> float:
    '''
    計算均值，對 NaN 或無限大輸入做防禦。
    規則：任何 NaN 直接拋錯；存在無限大也拋錯；空列表拋錯。
    '''
    if not values:
        raise ValueError('empty list')
    total = 0.0
    count = 0
    for x in values:
        if math.isnan(x):
            raise ValueError('NaN encountered')
        if math.isinf(x):
            raise ValueError('infinite encountered')
        total += x
        count += 1
    return total / count

def almost_equal(a: float, b: float, eps: float = 1e-12) -> bool:
    '''
    演示浮點比較：同時考慮絕對與相對誤差。
    '''
    if math.isnan(a) or math.isnan(b):
        return False
    diff = abs(a - b)
    return diff <= eps or diff <= eps * max(abs(a), abs(b))

# -------------------------------
# 4) 安全的二分查找
# -------------------------------

def binary_search(arr: List[int], target: int) -> int:
    '''
    在排序數組 arr 中查找 target。
    邊界要點：
      - 使用 mid = low + (high - low) // 2，避免中點計算溢出
      - 明確循環條件與收縮區間的閉開約定：這裏用 [low, high]
    返回下標，未找到返回 -1。
    '''
    low = 0
    high = len(arr) - 1
    while low <= high:
        mid = low + (high - low) // 2
        if arr[mid] == target:
            return mid
        if arr[mid] < target:
            low = mid + 1
        else:
            high = mid - 1
    return -1

# -------------------------------
# 5) 用原子標誌避免 TOCTOU：安全創建文件
# -------------------------------

def safe_create_file(dir_path: str, name: str) -> str:
    '''
    在目錄 dir_path 下原子性地創建文件 name。
    使用 O_CREAT | O_EXCL 避免 TOCTOU。
    返回創建的絕對路徑。
    '''
    path = os.path.join(dir_path, name)
    flags = os.O_CREAT | os.O_EXCL | os.O_WRONLY
    # 模式 0o644
    try:
        fd = os.open(path, flags, 0o644)
        try:
            os.write(fd, b'hello\n')
        finally:
            os.close(fd)
        return path
    except OSError as e:
        if e.errno == errno.EEXIST:
            raise FileExistsError('file already exists: ' + path)
        raise

# -------------------------------
# 6) 簡單的自測
# -------------------------------

def _self_test():
    # int32 溢出邊界
    assert int32_add_checked(1, 2) == 3
    try:
        int32_add_checked(INT32_MAX, 1)
        raise AssertionError('should overflow')
    except OverflowError:
        pass

    # age 解析與邊界
    assert parse_age(' 18 ') == 18
    assert parse_age('') is None
    assert parse_age(None) is None
    try:
        parse_age('-1')
        raise AssertionError('age below 0 not allowed')
    except ValueError:
        pass

    # 浮點邊界
    assert almost_equal(0.1 + 0.2, 0.3, eps=1e-9)
    try:
        safe_mean([1.0, float('nan')])
        raise AssertionError('NaN should be rejected')
    except ValueError:
        pass

    # 二分邊界
    data = list(range(0, 100))
    assert binary_search(data, 0) == 0
    assert binary_search(data, 99) == 99
    assert binary_search(data, 50) == 50
    assert binary_search(data, 100) == -1

    # TOCTOU 安全創建
    with tempfile.TemporaryDirectory() as d:
        p1 = safe_create_file(d, 'x.txt')
        assert os.path.exists(p1)
        try:
            safe_create_file(d, 'x.txt')
            raise AssertionError('should not create an existing file')
        except FileExistsError:
            pass

if __name__ == '__main__':
    _self_test()
    print('boundary demos passed')

這段代碼覆蓋了幾類典型的邊界風險點，並給出了一套可執行的防守動作。它並不能替代你的業務邏輯，但能當作寫代碼時的邊界清單：每寫完一個模塊，都問問自己，這幾類邊界在我的代碼裏是否有對應的斷言、條件分支或不可分操作。

把邊界搬進接口與系統：從單函數到整條鏈路

軟件很少只有一個函數。邊界條件真正的難度，一半在定義，一半在傳播：入口處如何收斂輸入域，內部如何維持不變式，出口如何把語義清楚地交給下游。

入口收斂：在 API 網關、控制器或用例層，先把外部世界的混亂變成內部世界的整潔。例如把所有空/缺字段統一成 Python 的 None，對數值做範圍投影或直接拒絕，對文本做正規化（NFC/NFKC），對列表做去重與上限裁剪。
內部不變式：領域對象只接受強約束的構造，暴露最小必要的修改操作，讓非法狀態根本無法構造出來。
出口語義：把內部強約束對象，按照契約串行化成對外協議能理解的形態，明確地輸出缺省/空值語義與數值精度。
跨服務傳播：在 gRPC/REST 層寫下機器可讀的約束（比如 protobuf 的required/oneof 與 jsonschema 的minimum/maximum），並在客户端生成的 SDK 中保留這些約束。

這些動作與契約式設計相得益彰：契約寫出來，測試自然能寫得更尖鋭；契約寫不出來，説明邊界還沒想清楚。(Wikipedia)

關於文本與國際化：`長度`從來不是一個數字那麼簡單

很多系統在數據庫裏給暱稱留了 20 個字符的限制，看起來合理。但用户輸入一個帶膚色和變體選擇符的表情時，20 個字符可能對應的是少於 20 個用户感知字符，也可能被錯誤地切成了19.5 個。這不是笑話，是真實的線上事故來源。解決方案是遵循 Unicode UAX #29 的分割規則，或者直接使用運行時裏提供的段落/單詞/字素簇分割能力。Perl、Java 的新版本、ICU 等都提供了不同層次的支持。(unicode.org)

關於空值：讓`空`成為顯式的域元素

面對 null，最怕模稜兩可。在接口上明確可空/不可空，在數據層明確缺字段與顯式 null 的序列化策略，在業務上明確空是否等價於未知或不適用。如果語言支持 Option/Maybe/Optional，把它當作邊界的一部分寫進類型系統；如果語言不支持，就用契約 + 斷言去保證。Tony Hoare 的那段反思之所以有穿透力，正因為空是最易忽略卻最常見的邊界。(InfoQ)

關於數值：把`IEEE 754` 當用户協議，而不是底層細節

做數據平台或金融計算，NaN 與 ±∞ 的傳播規則會直接影響報表；-0.0 的符號性會在某些可視化與導出中暴露。工程上可以採用兩層防守：一層是在輸入/中間計算/輸出的關鍵點，用斷言攔截 NaN/∞；另一層是在算法設計裏使用穩定的數值方法，比如卡漢求和、分塊聚合等。把這些都當作邊界條件來管理，才能把小數點後的地震控制在可預期範圍內。(Wikipedia)

關於併發與文件系統：把`原子性`寫進接口

與其在業務層做存在性檢查，不如在系統調用層面一次性完成檢查 + 創建的原子操作；與其自己實現分佈式鎖，不如選擇提供明確租約、心跳、過期語義的服務（比如 etcd 的 lease 機制），讓失效邊界由協議保證。對於本地文件系統，O_CREAT | O_EXCL 是避免 TOCTOU 的通用做法；對於分佈式存儲，使用冪等寫入 + 條件更新（如前置版本號）是普遍可行的策略。(Wikipedia)

把邊界落成團隊習慣：一份可落地的核對錶

我們是否列出了每個接口的輸入域與輸出域，並明確了閉開區間與單位？
我們是否在代碼裏放了與契約對應的斷言，並在集成測試或預發環境開啓？(Wikipedia)
我們是否在性能與穩定性相關路徑遵循了Power of 10 風格的規則，比如循環有上界、不在運行中做動態分配、函數短小？(spinroot.com)
我們是否對文本使用了符合 UAX #29 的分割/計數策略？(unicode.org)
我們是否對null/缺省/空字符串在接口與數據層做了統一定義？(InfoQ)
我們是否對數值處理中的NaN/∞/±0進行過斷言與單測覆蓋？(Wikipedia)
我們是否用原子操作替代了檢查 → 使用兩步走，避免了 TOCTOU？(Wikipedia)
我們是否在安全測試中覆蓋了 CWE-190 與 CWE-193 等高頻邊界弱點？(cwe.mitre.org)

結語：邊界不是小題，而是系統的骨架

boundary conditions 的工作，往往不像新功能那樣耀眼，卻決定了系統的可靠性與可維護性。把邊界當成第一公民，堅持契約化定義 + 斷言化實現 + 用例化驗證，在資源、時序、數值、文本與安全多個維度把坑填平，系統就會從能跑走向能長期穩定地跑。當你在團隊裏推動這件事時，不妨把上面的代碼與核對表發給大家，作為每日編程的隨身筆記：任何一行看似普通的代碼，都可能正踩在某個邊界上。

參考與延伸閲讀

Boundary Value Analysis 的概念與實踐脈絡，可參考 ISTQB 與業界教程。(GeeksforGeeks)
Off-by-one 的陷阱與安全影響，以及 CWE 的弱點庫條目。(Wikipedia)
Integer Overflow 與內存分配的聯動風險。(cwe.mitre.org)
IEEE 754 浮點標準的特殊值與比較語義。(Wikipedia)
Java 二分查找的歷史 bug 與修正思路。(DEV Community)
Design by Contract 的方法與歷史。(Wikipedia)
TOCTOU 競態的定義與典型案例。(Wikipedia)
Unicode UAX #29 關於字素、單詞、句子的分割規則。(unicode.org)
Power of 10：NASA JPL 的安全關鍵代碼規則。(spinroot.com)

——邊界之上，系統不會更花哨；邊界之內，系統會更可靠。

華山劍宗風清揚博客

華山劍宗風清揚博客

博客 / 詳情