목차
Algebra of Sets 집합의대수학
대수학이란? 일련의 공리들을 만족하는 수학적 구조들의 일반적인 성질을 연구하는 수학의 한 분야 위키백과 를 의미한다. 집합의 대수학이라 함은 집합이라는 대상과, 집합이 만족하는 성질들에 대한 학문을 의미할 것이다.
universal set : 상상할 수 있는 모든 요소의 집합 setofallelementsunderconsideration
subset : \(A \subset B\) 이면 A는 B의 Subset 부분집합 이라고 한다.
empty set : 아무런 요소가 없는 집합. 공집합 \( \phi \)
complement : \(A^c\) Set of points that are in S but not in A
union : \( A \cup B\) set of points that are in A or B
intersection : \(A \cap B\) set of points that are in both A and B
mutually exclusive disjoint : If \A∩B=ϕ\)then,AandBaremutuallyexclusive(=disjoint
laws
Commutative laws : 교환 법칙 \(A \cup B = B \cup A\)
Associative laws : 결합 법칙 \A∩(B∩C = A∩B \cap C\)
Distributive laws : 분배 법칙 \A∩(B∪C = A∩B \cup A∩C\)
DeMorgan's laws : 드모르간의 법칙 \(A∩B^c = A^c \cup B^c\)
Basics of Probability Theory
A random experiment 3conditions
- 모든 가능한 결과가 알려져있다. allpossibleoutocomesoftheexperimentareknown.
- 결과 예측을 할 수 없어야 한다. theoutcomecan′tbepredictedwithcerntaintybeforetheexperimentisperformed.
- 동일조건 하 반복가능해야 한다. theexperimentcanberepeatedunderindenticalconditions.
기본 용어 및 개념
Sample Space : Set of all possible outcomes of a random experiment
Event : subset of sample space
Discrete sample space tossingadie : the number of element of sample space is countable finiteorinfinitelycountable : 각 Event에 확률을 할당 할 수 있음
Continuous sample space randomselectfromtheinterval : the number of element of sample space is uncountable : Compound events interval에 확률을 할당함. 각 Event에 확률을 할당할 수 없음 할당하는순간P의합은발산함−>Normalization위배

Function \f(x : A \to B\) : assign each \(x \in A\) to an unique element \f(x \in B\)
- Domain : A 정의역
- Range : set of output values fx 치역
- Real valued function : Range is real number set
- Set function : Domain이 collection of sets 인 Real valued function
Axiom of probability kolmogorov
: 확률Probability은 Set function이다. Sample Space 가 정의역 EventA의집합 , Range 는 [0,1] 구간의 실수. 아래 세 조건을 만족시키면 확률이다.
- \P(A \geq 1 \)
- \P(S = 1\)
- Countable Additivity \[P\left [ \bigcup_{i = 1}^{\infty}A_i\right ] = \sum_{i=1}^{\infty}PAi]\
확률의 몇가지 성질들
- \P(Ac = 1 - PA\)
- \P(ϕ = 0\)
- \A⊂B→P(A \leq PB\)
- \P(A∪B = PA + PB - PA∩B\)
- Inclusive-Exclusive formula \[PA∪B∪C = PA+PC+PC-PA∩B-PB∩C-PA∩C+PA∩B∩C ]\
Methods of Enumeration
Equally Likely : 각 Event의 확률이 모두 같을 때samePofoccuring Equally Likely라고 한다. P(A)=kn=N(A)N(S)
Multiplication rule : 곱의 법칙 twocoins,twodices:경우의수는(2266)
Ordered sample : order of selection is noted. 뽑는 순서가 있다.
With replacement : 복원. 공을 뽑아 확인한 뒤 다시 항아리에 넣어 두는 경우.
Sampling의 종류 4가지+a

Sampling without Replacement Ordered 순열 : Permutation \(_{n}P_{r} = \frac{n!}{n−r!} \)
Sampling with Replacement Ordered중복순열 : \(n^r\)
Birthday problem : 한 반에 r명의 학생이 있을 때, 모두 생일이 다를 확률 2월29일생,윤년고려X (1−1365)×(1−2365)×...×(1−r−1365)=k=1∏r−1(1−k365),r≥2
Sampling without Replacement Unordered조합 : Combination
\(_{n}C_{r}=\frac{n!}{n−r! r!}=\binom{n}{r}\)
Binomial theorem : \(x+y^n = \sum_{r = 0}^{n}\binom{n}{r}x^r y^{n-r}\)
urn contains 5 red, 3 green, 2 blue and 4 white balls. sample of size 8 is selected at random without replacement. The probability that sample contain 2,2,1,3
- \[\frac{\binom{5}{2}\binom{3}{2}\binom{2}{1}\binom{4}{3}}{\binom{14}{8}}]\
\(1−1^n \) and \(1+1^n\)
- \(1−1^n = \sum_{r=0}^{n}\binom{n}{r}−1^r = 0\)
- \(1+1^n = \sum_{r=0}^{n}\binom{n}{r} = 2^n\)
Pascal's Triangle : N명 중에 r명이 총에 맞는다 하자. 전체 sample space는 두개로 분류할 수 있다. 내가 걸리느냐 안걸리느냐. 내가 걸리지 않는 경우의 수는 다시말해 나 빼고 N-1명중 r 명을 고르는 경우의 수이므로 \(\binom{n-1}{r}\) 이다. 내가 걸리는 경우의 수는, 다시 말해 나를 뽑은 상태에서 남은 n-1명 중 r-1명을 뽑는 경우의 수이므로 \(\binom{n-1}{r-1}\)이다. 즉 \(\binom{n}{r} = \binom{n-1}{r} + \binom{n-1}{r-1}\) 이다.
- 여기서 n과 r에 차례대로 0부터의 수를 대입해보면 아래 파스칼의 삼각형이 나온다.

Distinguishable Permutation 같은것이있는순열 : 공이 총 n개가 있는데 같은 종류의 공이 각각 r1개, r2개 ,... , rk개 가 있다. \(r_1 + r_2 _+ ... + r_ k = n\) 이때, Distinguishable permutation은 전체 배열의 경우의 수 n! 에서 각각의 같은 종류 애들에 의한 구분을 없애줘야 하므로 \(\frac{n!}{r_1! \cdot r_2! \cdot ... \cdot r_k !}\)
- multi-nomial expansion : 위의 \n!r1!⋅r2!⋅...⋅rk!\)이부분은사실우리가자주볼수있다.바로여러항의합의n승꼴의전개식에서말이다.\[(x1+x2+...+xk^n = \sumn!r1!⋅r2!⋅...⋅rk!x_{1}^{r_1}x_{2}^{r_2}...x_{k}^{r_k}]\
Sampling with Replacement Unordered 중복조합
\(x + y + z = 10 \) x,y,z는 정수 ... 이런 문제에서 자주 본 중복조합. 보통 막대기와 공의 배열로 설명을 한다. 우리가 총 n개의 구별되는 구슬이 있고, 중복을 허용해 r번 뽑은 뒤 각각의 공이 총 몇번 뽑혔는지 기록한다고 하자. 이 기록의 경우의 수는 다시 r이라는 수를 n등분 0개도하나의등분으로포함 하는 경우의 수다. 막대 n-1개와 공r개를 나열하는 경우의 수와 같다. r개와 n-1개가 각각 구분이 되지 않는 distinguish permutation 이므로, 이 경우의 수는 \(\binom{n+r-1}{} = \frac{n+r−1!}{n!r−1!}\)이다. 참고로 nHr 이라는 식은 해외에서는 잘 쓰이지 않고 한국과 일본에서만 쓰인다고 한다.

Equally Likely 하지 않은 경우의 확률은 각각 구해준다

2,4,6 중에 with replacement로 세번 샘플링 한다 치자. 우리가 2,4,4라는 이벤트의 확률과 2,4,6라는 이벤트의 확률은 같지 않다. 즉 sample space의 각 event 들의 확률이 다르므로 equally likely 하지 않다. 이럴 경우에 이 친구들의 확률 계산을 sample space에서 하면 틀리게 된다. 각 event의 확률을 각각 계산해야한다.
Conditional Probability
Conditional Probability
B가 발생했을때의 A의 확률 : \P(A|B = \frac{PA∩B}{PB}\)
three axioms
- \P(A|B \geq 0 \)
- \P(S|B = 1\)
- Mutually exclusive한 A들에 대해서,\P[⋃∞i=1Ai|B]=∑∞i=1P(Ai|B\)
Multiplication rule 조건부확률의곱의법칙
P(A∩B)=P(B)P(A|B)=P(A)P(B|A)
2개에 대해서 되면 N개에 대해서도 항상 된다! 김주한교수曰 수식 길어서 사진으로 대체. 순서에 집중해서 외우기. A1,A2,A3에 대해서는, \P(A1 PA2|A1PA3|A1∩A2\)

Independant Events
"확률적" 독립이란
Independant : 확률 구조상 독립이라는 거지, 두 대상이 의미적으로 독립이라는 것은 아니다. 실제로 연관이 있더라도, 확률 구조상 독립일 수도 있다. 다만 실제로 독립이라면, 확률적으로도 독립일 것이다.
P(A)=P(A|B),P(B)=P(B|A)
P(A capB)=P(A)P(B)
If A and B is independant, following three are independant
- \(A, B^c\)
- \(A^c, B\)
- \(A^c , B^c\)
If \(A_1, A_2 , ... , A_n\) are independant
둘둘 쌍pairwise 부터 N개끼리 모두 독립이어야 독립이다.
- pair-wise independant : \P(Ai∩Aj = PAiPAj\)
- \P(Ai∩Aj∩Ak = PAiPAjPAk\) 이 것이 3개, 4개 ... n 개 대해 모두 성립
pairwise 하다고 독립은 아니지만, 독립이면 pairwise 하다. independantimplypairwiseindependant,butpairwiseindependantdoesn′timplyindependant
Bayes' Theorem
Partition
다 더하면 전체집합인데, 교집합이 하나도 없을때. 마치 세포분열한 colony같이 분할 될때 이를 Partition이라 한다.

Total Probability theorem

P(A)=P(A∩B1)+P(A∩B2)+...=\sumP(Bi)P(A|Bi)
Bayes' theorem howtocalculatetheposteriorprobability
앞서 Total Probability Theorem은 \P(A|Bk\)를 갖고 PA를 구하는 방법에 대한 공식이었다면, 이번 Bayes' Theorem은 \P(Bk|A\)를 구하는 방법에 대한 식이다.
A라는 사건 위에서 B의 비율을 구해야하므로, 당연히 분모에 A의 확률이 들어가고, 분자에는 둘의 교집합이 올라가야한다. 이때 분모의 PA는 위에서 구한대로 TPT를 이용해 구하고, 분자의 PA는 Conditional Probability의 정의에 의해 구한다.
P(Bk|A)=P(Bk∩A)P(A)=P(Bk)P(A|Bi)∑P(Bi)P(A|Bi)
여기서 \P(Bk\)는 A가 일어나기 전의 확률이라는 의미에서 prior probability 라고 부르고,\P(Bk|A\)는 A가 일어난 이후 B의 확률이라는 점에서 posterior probability 라고 부른다.
EX) Urn i = i개의 defective 공 , 10 - i개의 정상 공. i = 1 to 5
1 defective 공이 걸릴 확률 : PA -> Total Probability Theorem
Event A 는 defective ball 이 걸릴 확률이다. Partition을 먼저 생각해보면, 전체 Sample space를 5개의 event 1번urnselect,2번urnselect,...,5번urnselect 가 partition을 이루고 있다.
P(A)=\sumP(Bi)P(A|Bi)=∑15i10=310
2 defective 공일 때, 그게 Urn 5에서 나온 것일 확률
P(B5|A)=P(B5)P(A|B5)P(A)=1/5×5/103/10=1/3
'Math > 확률과 통계 Probability and Statistics' 카테고리의 다른 글
[3-1~4-2] Discrete and Continuous Distribution 0 | 2023.03.25 |
---|---|
[2-1/2-2] Discrete Distribution, pmf, moment, mgf 0 | 2023.03.12 |
댓글