本文旨在整理一些集合論中的基礎概念與定理,主要出處見參考文獻。
本文只列出特別簡單的證明,略去復雜的證明。
1 集合論基礎
首先,我們介紹Cartesian product(笛卡爾積、直積)\(A\times B\),就是從\(A\)中、\(B\)中各取一個元素組成的有序數對。如果是\(n\)個集合,它們的Cartesian product就是一個\(n\)-tuples:
所謂Relation(關系),是\(A\times A\)的任一子集,就叫a relation \(R\) on set \(A\)。如果\((x,y)\in R\),則可寫為\(xRy\)。\(R\)可能的性質有:
- Reflexive(自反性):\(xRx\);
- Symmetric(對稱性):若\(xRy\)則必有\(yRx\);
- Antisymmetric(反對稱):若\(xRy\)且\(yRx\),則必有\(x=y\);
- Transitive(傳遞性):若\(xRy\)且\(yRz\),則必有\(xRz\)。
Equivalence relation(等價關系),就是自反、對稱、傳遞的關系。
給定\(A\)上的一個equivalence relation \(R\),那么\(A\)中的元素\(x\)的equivalence class(等價類),就是集合\(E_x = \{y\in A:xRy\}\)。若\(E_x\)和\(E_y\)是\(x\)和\(y\)的等價類,那么必有\(E_x\cap E_y=\empty\)或\(E_x=E_y\)。
自反、反對稱、傳遞的relation,就叫partial ordering(偏序),可以用符號\(\geq\)或\(\leq\)表示。對於任意partial ordering,如果將其中的\((x,x)\)元素剔除,就變成了strict ordering,用符號\(\gt\)或\(\lt\)表示,這種relation不再是自反的和反對稱的,但依舊有傳遞性。如果對於集合\(A\),每一對\((x,y)\in A\times A\)都滿足\(x\lt y\)、\(x\gt y\)或\(x=y\)這三種中的一種,那么稱\(A\)是linearly ordered。再進一步,定義集合\(A\)的最小元素為\(a\in A\),它滿足\(\forall x\in A, a\leq x\)(最大元素可類似定義),那么,如果linearly ordered\(A\)的每一個子集都有一個最小元素,則稱\(A\)是well-ordered。
一個mapping/transformation/function定義為\(T:X\mapsto Y\),這是一種將\(X\)中的每個元素與\(Y\)中唯一一個元素聯系起來的規則。\(X\)稱為domain(定義域),\(Y\)為codomain(到達域),集合\(G_T=\{(x,y):x\in X,y=T(x)\}\subseteq X\times Y\)稱為graph of \(T\)。集合\(T(A)=\{T(x):x\in A\}\subseteq Y\)稱為\(A\)在\(T\)下的image,對於\(B\subseteq Y\),集合\(T^{-1}(B)=\{x:T(x) \in B\}\subseteq X\)稱為\(B\)在\(T\)下的inverse image。集合\(T(X)\)稱為\(T\)的range(值域),若\(T(X)=Y\)則稱該mapping為from \(X\) onto \(Y\),中文叫滿射,否則是into \(Y\)。若每個\(y\)都是唯一的\(x\in X\)的image,則該mapping是one-to-one,或記為\(1\)-\(1\),中文叫單射。
當\(X\)中的每個元素與\(Y\)中不一定唯一的元素對應起來的規則,稱為correspendence,\(T^{-1}\)就是一個correspendence,但未必是mapping。若mapping是\(1\)-\(1\)且是onto的,則稱該mapping為one-to-one correspendence。如果在\(X\)和\(Y\)上都定義了partial ordering,那么如果對於一個mapping,\(T(x_1)\leq T(x_2)\)當且僅當\(x_1\leq x_2\),就稱該mapping為order-preserving。若\(X\)是partial ordered,用\(\leq\)表示,那么一個\(1\)-\(1\) mapping可以induce(誘導)在codomain上的一個partial ordering。若這個mapping還是onto,那么\(X\)上的linear ordering可以induce一個\(Y\)上的linear ordering。
集合中的元素個數稱為集合的cardinality或cardinal number(基數)。若\(A\)與\(B\)之間存在\(1\)-\(1\) correspondence,那么兩個集合equipotent(等勢)。
2 可數集合
將正自然數集合\(N^+\)的cardinal number記為\(\aleph\)。如果一個無限集合中的元素,與\(N^+\)中的元素存在\(1-1\) correspondence,那么稱該集合為countable或denumerable(可數的)。
整數集\(Z\)是可數的,因為對於任意\(n\in N^+\),讓它對應於\(\lfloor n/2\rfloor (-1)^n\in Z\)即可。
定理:有理數集\(Q\)可數。
定理:The union of a countable collection of countable sets is a countable set.
注:Collection有的地方翻譯為“搜集”,可理解為允許有重復元素的集合。
3 實數連續統
定理:實數集\(R\)是不可數的。
記\(R\)的cardinal number為\(c\),則有\(\aleph<c\)。
定理:任意開區間不可數。
定理:任意開區間與\(R\)是equipotent的。
對於開區間\((a,b)\),將任意\(x\in R\)映射為\(y=\dfrac{a+b}{2}+\dfrac{(b-a)x}{2(1+|x|)}\)可證。
定理:實數平面\(R^2=R\times R\)與\(R\)是equipotent的。
定理:任意開區間都包含至少一個有理數。
對於開區間\((a,b)\),不妨假設\(a\geq 0\),取\(q\)為比\(1/(b-a)\)大的最小整數,取\(p\)為比\(qb\)大的最小整數,則必有\((p-1)/q \in (a,b)\),而\((p-1)/q \in Q\)。
推論:Every collection of disjoint open intervals is countable.
因為每個開區間都至少包含一個有理數,這些不相連的開區間的collection可用其中每個開區間中的任一有理數建立對應關系,而有理數集是可數的。
下面再介紹一些有關集合的定義。集合\(A\subset R\)的supremum,如果存在,就是對於任意\(x\in A\)都滿足\(x\leq y\)的最小的\(y\),可寫為\(\sup A\);反之可定義集合\(A\)的infimum,寫為\(\inf A\)。對於\(R\)的某個子集,如果有上界,必有supremum,如果有下界,必有infimum。若定義extended real line \(\bar R=R\cup \{-\infty,+\infty\}\)(即將無窮大也看作一個元素),那么所有集合都有supremum和infimum。另外記\(\bar R^+=R\cup\{+\infty\}\)。
4 集合的序列
Monotone sequence(單調序列)就是non-decreasing(指\(\forall n, A_n\subseteq A_{n+1}\))或non-increasing指\(\forall n, A_{n}\supseteq A_{n+1}\))的序列,也有嚴格的單調序列,即將包含關系換成嚴格包含關系\(\subset\)和\(\supset\)。
序列的limit(極限)\(A\),就是對於non-decreasing序列的\(A=\cup_{n=1}^{\infty}A_n\),或對於non-increasing序列的\(A=\cap_{n=1}^{\infty}A_n\),分別可寫為\(A_n\uparrow A\)和\(A_n\downarrow A\),或一般地,\(\lim\limits_{n\to\infty}A_n = A\),或\(A_n\to A\)。
對於任意集合序列\(\{A_n\}\),集合\(B_n=\cup_{m=n}^{\infty}A_m\)必為non-increasing序列,因此\(B=\lim\limits_{n\to\infty}B_n\)存在,稱它為\(\{A_n\}\)的superior limit,寫為\(\limsup_n A_n\)。反之,non-decreasing序列\(C_n=\cap_{m=n}^{\infty}A_m\)的極限\(C\),就是\(\{A_n\}\)的inferior limit,寫為\(\liminf_n A_n\)。正式定義為
由De Morgan' s laws,\(\liminf_n A_n = \left(\limsup_n A_n^c \right)^c\)。
\(\limsup_n A_n\)其實就是infinitely many(無窮多)個\(A_n\)中都含有的元素的集合,\(\liminf_n A_n\)就是all but a finite number(除有限)個\(A_n\)外,其他\(A_n\)中都含有的元素的集合。
以上概念提供了一種集合序列的收斂准則:\(\liminf_n A_n\subseteq \limsup_n A_n\),若兩個集合不相等,則說明\(\{A_n\}\)不收斂。
5 子集的類
所有\(X\)的子集的集合成為\(X\)的power set(冪集),記為\(2^X\)。對於一個countable set,認為它的power set有\(2^\aleph\)個元素。
定理:\(2^\aleph = c\)。
接下來,要研究的是給定集合的子集的一些性質。Power set一般對研究的問題來說會顯得太大了,以下的一系列定義,目的是要定義出\(2^X\)的某個子集,使得該子集對於研究的問題來說足夠大,而其性質又讓我們可以容易地處理。一般方法是,先選出一些已知性質的集合,組成一個基本的collection,再用一些特定操作,創造出新的集合加入其中。
定義 Ring(環):由集合\(X\)的子集組成的非空類(nonempty class)\(\mathscr{R}\),若滿足如下性質則為ring:
- \(\empty\in\mathscr{R}\);
- 若\(A\in\mathscr{R}\)且\(B\in\mathscr{R}\),則\(A\cup B\in \mathscr{R}\),\(A\cap B\in \mathscr{R}\),\(A- B\in \mathscr{R}\)。
Ring對於union、intersection、difference的操作是closed(閉的)。但ring中不一定含有全集\(X\)自身,若加入\(X\),就成了field(或algebra)定義:
定義 Field(域):由\(X\)的子集組成的class\(\mathscr{F}\),若滿足如下性質則為field:
- \(X\in\mathscr{F}\);
- 若\(A\in\mathscr{F}\),則\(A^c\in\mathscr{F}\);
- 若\(A\in\mathscr{F}\)且\(B\in\mathscr{F}\),則\(A\cup B\in \mathscr{F}\)。
如果給定了一個collection\(\mathscr{C}\),將它理解為“種子”,去生成field,那么稱最小的含有\(\mathscr{C}\)的field為field generated by \(\mathscr{C}\)。
Ring和field的概念在概率論中應用起來還是會有些限制,因此引入以下定義:
定義 Semi-ring:由集合\(X\)的子集組成的非空類(nonempty class)\(\mathscr{S}\),若滿足如下性質則為semi-ring:
- \(\empty\in\mathscr{S}\);
- 若\(A\in\mathscr{S}\)且\(B\in\mathscr{S}\),則\(A\cap B\in \mathscr{S}\);
- 若\(A\in\mathscr{S}\)、\(B\in\mathscr{S}\)且\(A \subseteq B\),則\(\exist n\lt \infty\),使得\(B-A=\cup_{j=1}^{n} C_j\),其中\(C_j\in\mathscr{S}\)且對於\(j\neq j'\)來說\(C_j\cap C_{j'}=\empty\)。
其中的第三個性質,簡單來說就是\(\mathscr{S}\)中任意兩個集合的的差,可以分解為有限個\(\mathscr{S}\)中集合的union。
再在semi-ring中加入\(X\)自身,就變成了semi-algebra。
6 Sigma fields
上一節說到field對complement和finite union的操作是closed,我們接着將它的finite union操作擴展到極限處,這就有了如下概念。
定義 \(\sigma\)-field(sigma-algebra):由\(X\)的子集組成的class\(\mathscr{F}\),若滿足如下性質則為sigma-field:
- \(X\in\mathscr{F}\);
- 若\(A\in\mathscr{F}\),則\(A^c\in\mathscr{F}\);
- 若\(\{A_n,n\in N^+\}\)為\(\mathscr{F}\)中的集合的序列,則\(\cup_{n=1}^{\infty} A_n\in \mathscr{F}\)。
\(\sigma\)-field對於complement和countable union是closed。若給定一個collection\(\mathscr{C}\),所有含有\(\mathscr{C}\)的\(\sigma\)-field的交集,就叫\(\sigma\)-field generated by \(\mathscr{C}\),可記為\(\sigma(\mathscr{C})\)。
定理:若\(\mathscr{C}\)是一個finite collection,則\(\sigma(\mathscr{C})\)也是finite,否則\(\sigma(\mathscr{C})\)總是uncountable。
若取\(X=R\),\(\mathscr{C}=\{(-\infty,r]: r\in Q\}\),則\(\sigma(\mathscr{C})\)就叫Borel field of \(R\),一般可記為\(\mathscr{B}\)。許多不同的collection都可以生成出\(\mathscr{B}\)。若給定一個實區間\(I\),則\(\mathscr{B}_I = \{B\cap I: B\in\mathscr{B}\}\)稱為the restnctlon of \(\mathscr{B}\) to \(I\),或Borel field on \(I\)。事實上,\(\mathscr{B}_I\)可由\(\mathscr{C}=\{(-\infty,r]\cap I: r\in Q\}\)生成。
對於兩個\(\sigma\)-field的union不一定是\(\sigma\)-field,將最小的包含了兩個\(\sigma\)-field\(\mathscr{F}\)和\(\mathscr{G}\)中所有元素的\(\sigma\)-field記為\(\mathscr{F}\vee\mathscr{G}\)。但對於兩個\(\sigma\)-field的intersection\(\mathscr{F}\cap\mathscr{G}=\{A:A\in \mathscr{F} \quad\text{and} \quad A \in\mathscr{G}\}\),它必定是\(\sigma\)-field,為了統一符號,可以寫為\(\mathscr{F}\wedge\mathscr{G}\),它就是保證元素同時屬於\(\mathscr{F}\)和\(\mathscr{G}\)的最大的\(\sigma\)-field。這兩個概念都可以推廣到可數多個的情形。
概率論和測度論中,大量的工作都是在證明某個class of sets是\(\sigma\)-field。對於證明來說,\(\sigma\)-field定義中的三條性質,前兩條都很容易驗證,但最后一條要驗證卻很困難。為此我們定義一種monotone class(單調類)\(\mathscr{M}\),它也是由一些集合組成:若\(\{A_n\}\)是monotone sequence,有極限\(A\),且\(\forall n, A_n\in\mathscr{M}\),則\(A\in \mathscr{M}\),稱這樣的\(\mathscr{M}\)為monotone class。利用它和下面的定理,可以方便地證明一些class是\(\sigma\)-field。
定理:\(\mathscr{F}\)是\(\sigma\)-field,當且僅當\(\mathscr{F}\)是field且它是一個monotone class。
利用這個定理,在考慮一個class是不是\(\sigma\)-field時,我們只需要考慮monotone sequences的極限是否屬於它即可。
另一個常用的技巧是Dynkin's \(\pi\)-\(\lambda\) Theorem。對此需要先介紹兩個概念做鋪墊。
定義 \(\pi\)-system:有一個class\(\mathscr{P}\),若\(A\in\mathscr{P}\)且\(B\in\mathscr{P}\),則\(A\cap B \in \mathscr{P}\),那么\(\mathscr{P}\)就是\(\pi\)-system。
定義 \(\lambda\)-system:有一個class\(\mathscr{L}\),若它滿足以下性質,那么\(\mathscr{L}\)就是\(\lambda\)-system:
- \(X\in \mathscr{L}\);
- 若\(A\in\mathscr{L}\)、\(B\in\mathscr{L}\)且\(B\subseteq A\),則\(A-B\in\mathscr{L}\);
- 若\(\{A_n\in\mathscr{L}\}\)是non-decreasing sequence,且\(A_n\uparrow A\),則\(A\in\mathscr{L}\)。
前兩個條件說的是\(\lambda\)-system對於complement是closed。並且由於第二條意味着\(\forall n, B_n=A_{n+1}-A_n\in\mathscr{L}\),所以第三條也說明了,\(\mathscr{L}\)中的disjoint sets的countable union依然在\(\mathscr{L}\)中。利用這點,有以下定理。
定理:一個class\(\mathscr{L}\)是\(\lambda\)-system,當且僅當:
- \(X\in \mathscr{L}\);
- 若\(B\in\mathscr{L}\),則\(B^c\in\mathscr{L}\);
- 若\(\{A_n\in\mathscr{L}\}\)是disjoint sequence,則\(\cup_n A_n\in\mathscr{L}\)。
\(\sigma\)-field必定是\(\lambda\)-system,同時是\(\pi\)-system和\(\lambda\)-system的class必定是\(\sigma\)-field。
下面的定理用到了這些定義。
定理 Dynkin's \(\pi\)-\(\lambda\) Theorem:若\(\mathscr{P}\)是一個\(\pi\)-system,\(\mathscr{L}\)是一個\(\lambda\)-system,且\(\mathscr{P}\subseteq \mathscr{L}\),則\(\sigma(\mathscr{P})\subseteq \mathscr{L}\)。
參考文獻
- Davidson, J., 1994. Stochastic limit theory: An introduction for econometricians. OUP Oxford.