Linear Regression ์ ๊ด์ฌ
์ง๋ ์๊ฐ์ ์์๋ดค๋ Linear Regression ์ Cost ํจ์๋ ๋ค์๊ณผ ๊ฐ๋ค.
์ฐ๋ฆฌ์ ๊ด์ฌ์ , ์ฐ๋ฆฌ๊ฐ ์กฐ์ ๊ฐ๋ฅํ W ๊ฐ(x ์ ๊ธฐ์ธ๊ธฐ)๊ณผ b ๊ฐ(y ์ ํธ)์ ์กฐ์ ํ์ฌ Cost ํจ์ ๊ฐ์ด ๊ฐ์ฅ ์ ๊ฒ ๋์ค๋ ๋ชจ๋ธ์ ๊ฒฐ์ ํ๋ ๊ฒ์ด๋ค.
Gradient Descent Algorithm
์ฐ์ ์ง๋ ๋ฒ ์์๋ก ์ดํด๋ณด์๋ ๋ฐ์ดํฐ๋ฅผ ๋ณด์
X | Y |
1 | 1 |
2 | 2 |
3 | 3 |
๋ํ ๊ฐ์ค ํจ์ H(x) = Wx ๋ผ๊ณ ํ๋ฉด, (b ๊ฐ์ 0์ด๋ผ๊ณ ํ์) ๋ค์๊ณผ ๊ฐ์ Cost ํจ์๊ฐ ํํ๋๋ค.
์ด ํจ์(Cost ํจ์)์ ๋ชจํ์ ๊ทธ๋ ค๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
W ๊ฐ์ ๋ฐ๋ผ Cost ํจ์๊ฐ์ด ๋ฌ๋ผ์ง๋ ๊ฒ์ ํ์ธํ ์ ์๋ค. W๊ฐ 0์ผ ๋๋ Cost ๊ฐ์ด 0.4667์ด๊ณ , 1๋ก ๊ฐ์๋ก ์ ์ ์ค์ด๋ค์ด 0์ด ๋๋ฉฐ, ๊ทธ ์ดํ๋ถํฐ๋ ์ ์ ๋ค์ ์ฆ๊ฐํ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
์ฆ, ์ด ๋ฐ์ดํฐ์์ Cost ํจ์๋ฅผ ๊ฐ์ฅ ์ค์ผ ์ ์๋ W ๊ฐ์ 1์ด๋ผ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
์ด์ฒ๋ผ Cost ๊ฐ ์ต์ํ๋๋ ์ง์ ์ ๊ธฐ๊ณ์ ์ผ๋ก ์ฐพ์ ๋ ์ ์ฉํ๋ Algorithm์ด ๋ฐ๋ก Gradient Descent Algorithm์ด๋ค. ๋ง์ฝ, ํน์ ํ ์ ์์ ๊ธฐ์ธ๊ธฐ๊ฐ ์์์ด๊ฑฐ๋, ์์๋ผ๋ฉด ๊ธฐ์ธ๊ธฐ๊ฐ 0์ด ๋๋ ๋ณ๊ณก์ ์ผ๋ก ์ฐพ์๊ฐ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
Gradient Descent Algorithm์ Cost Function์ ์ต์ํํ๋๋ฐ ๋ง์ด ์ฌ์ฉ๋๋ฉฐ, ์ต์ํ ๋ฌธ์ ์ ๋ง์ด ์ฌ์ฉ๋๋ค.
๊ธฐ๋ณธ์ ์ธ ์๋ ์๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ๋ค.
1. ์์์ ์์์ ์์ ์ถ๋ฐํ๋ค.
2. Cost ํจ์๊ฐ ์ค์ด๋ค ์ ์๊ฒ, W ๊ฐ๊ณผ b๊ฐ์ ์กฐ๊ธ ๋ฐ๊พผ๋ค.
3. ํด๋น ์ง์ ์์์ ๊ฒฝ์ฌ๋๋ฅผ ๊ณ์ฐํ๊ณ , cost ํจ์๊ฐ ์ค์ด๋๋ ๊ฒฝ์ฌ๋ ๋ฐฉํฅ์ ์ ํํ๋ค.
4. Local Minimum์ ๋๋ฌํ ๋๊น์ง 2,3 ๋ฒ ๊ณผ์ ์ ๋ฐ๋ณตํ๋ค.
์์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ 2์ฐจ ํจ์ Cost ํจ์์์๋ Gradient Algorithm์ ์ ์ฉํ๋ฉด ํญ์ Local Minimum์ด Global Minimum์ด ๋๊ฒ ๋๋ค. ๋ฐ์ค์น ๊ฒฝ์ฌ๋ ๊ณ์ฐ์ ๋ฏธ๋ถ์ ํตํด ์งํ๋๊ฒ ๋๋ค.
๊ฒฐ๊ตญ ์ต์ ํ๋ W ๊ฐ์ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํด์ง๊ฒ ๋๋ค.
์ด๋ ๊ฒ ์ต์ ํ๋ W ๊ฐ์ ๊ณ์ ๊ฐฑ์ ํ๋ค๋ณด๋ฉด, Cost ํจ์ ๊ฐ์ด Minimum์ด ๋๋ W ๊ฐ์ ๊ตฌํ ์ ์๊ฒ ๋๋ค.
Convex Function
์์์ Local Minimum์ด๋ผ๋ ํํ์ ์ฌ์ฉํ๋ค. ์ด๋ค ํจ์์์๋ Local Minimum๊ณผ Global Minimum์ด ๋ค๋ฅธ ๊ฒฝ์ฐ๋ ์กด์ฌํ๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๋ฌํ Cost function ๋ชจํ์ด ์กด์ฌํ๋ค๊ณ ํ ๋, ์์์ ์ ๋ฐ๋ผ Gradient ๊ฐ์ด 0์ด ๋๋ ์ง์ ์ด ๋ฌ๋ผ, ํญ์ Cost Fuction์ด ์ต์๊ฐ ๋๋ ์ ์ ๊ตฌํ ์ ์๋ ๋ฌธ์ ๊ฐ ์๊ธฐ๊ฒ ๋๋ค. ๊ทธ๋ฌ๋ฏ๋ก, Gradient Algorithm์ ์ ์ฉํ๊ธฐ ์ํด์๋ ์ฐ๋ฆฌ์ Cost Function์ ๋ชจํ์ด Convex Function (๋ณผ๋กํจ์)์ธ์ง๋ฅผ ํ์ธํด๋ณด์์ผ ํ๋ค.
Convex Function์์๋ ์ด๋ ์ ์์ ์์ํ๋์ง ๋์ฐฉํ๋ ์ ์ด Cost Function์ด ์ต์๊ฐ ๋๋ ์ง์ ์ ๋์ฐฉํ๊ณ , Gradient Descent Algorithm์ด ํญ์ ๋ต์ ์ฐพ์ ์ ์๋ค.
'DataScience > Machine Learning Basic' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Multivariable linear regression (0) | 2022.02.21 |
---|---|
Tensorflow Linear Regression Implementation (1) | 2022.01.26 |
Linear Regression (0) | 2022.01.25 |
Tensorflow ๊ธฐ๋ณธ Operation (0) | 2022.01.21 |
Tensorflow in Pycharm ๊ทธ๋ฆฌ๊ณ Google Colab (0) | 2022.01.21 |