์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- DST fewshot learning
- ๋ฐฑ์ค
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์ฑ ์ถ์ฒ
- ๋ชจ๋์๋ฅ๋ฌ๋
- Leveraging Slot Descriptions for Zero-Shot Cross-Domain Dialogue State Tracking
- ํ์ด์ฌ์ ํ์ด์ฌ๋ต๊ฒ
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์ํฉ๊ฒฉํ๊ธฐ
- classification text
- ์์ฐ์ด์ฒ๋ฆฌ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ
- ํ๋ก๊ทธ๋๋จธ์ค
- Python
- ๊ฒ์์์ง
- ๋ฅ๋ฌ๋๊ธฐ์ด
- How Much Knowledge Can You Pack Into the Parameters of a Language Model?
- few shot dst
- ๋ค์ด๋๋ฏน ํ๋ก๊ทธ๋๋ฐ
- SUMBT:Slot-Utterance Matching for Universal and Scalable Belief Tracking
- Zero-shot transfer learning with synthesized data for multi-domain dialogue state tracking
- fasttext text classification ํ๊ธ
- DST zeroshot learning
- dialogue state tracking
- nlp๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- Few Shot Dialogue State Tracking using Meta-learning
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์
- From Machine Reading Comprehension to Dialogue State Tracking: Bridging the Gap
- til
- MySQL
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์์ ๋น
- ๋ฐ์ดํฐ ํฉ์ฑ
- 2020์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌํ๊ธฐ
- Today
- Total
๋ชฉ๋ก๋ฅ๋ฌ๋ (7)
๐ฒ์๋ผ๋๋์ฒญ๋
๋ชจ๋์ ๋ฅ๋ฌ๋ RNN ๊ฐ์(Lec 12) https://www.youtube.com/watch?v=-SHPG_KMUkQ&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=42&t=0s ๋ชจ๋์๋ฅ๋ฌ๋rnn rnn์ ๊ธฐ๋ณธ์ ์ธ ๋์ ์๋ฆฌ๋ ์๋์ ๊ฐ๋ค. old state ์ new input์ด ํ์ฌ์ output์ ์ํฅ์ ๋ผ์น๊ฒ ๋๋ค. ๋ฐ๋ผ์ ์ด์ ์ ๊ฒ์ด ๋ค์์ ๊ฒ์ ์ํฅ์ ๋ผ์น๋ ์ธ์ด, ์์ ๋ฑ์ sequentialํ ๋ถ์ผ์ ์ฐ์ผ ์ ์๋ค. ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ rnn๋ชจ๋ธ์ธ vanilla๋ชจ๋ธ์ด๋ค. ์์์ ์ค๋ช ํ๋๋ก, ์ด์ ์ input๋ค๊ณผ ํ์ฌ์ input์ด ํ์ฌ์ output์ ์ํฅ์ ๋ผ์น๋ค. ์ค๋ช ํ๋ ๋ชจ๋ธ : character level language model example ๊ฒ์..
์ค๋ฒํผํ ์ด ์ผ์ด๋๋ ๊ฒฝ์ฐ- ๋งค๊ฐ๋ณ์๊ฐ ๋ง๊ณ ํํ๋ ฅ์ด ๋์ ๋ชจ๋ธ(์ธต์ด ๋ง์ ๋ชจ๋ธ)-ํ๋ จ๋ฐ์ดํฐ๊ฐ ์ ์ ๋ชจ๋ธ ์ค๋ฒํผํ -ํ๋ จ๋ฐ์ดํฐ๋ ์ ๊ตฌ๋ณํด ๋ด์ง๋ง ๋ค๋ฅธ ๋ฐ์ดํฐ์๋ ์ฑ๋ฅ์ด ์ข์ง ๋ชปํ๊ฒ ์ค๋ฒํผํ ์ ๋ฐฉ์งํ๋ ๋ฐฉ๋ฒ ๊ฐ์ค์น ๊ฐ์-๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๊ฐ์ด ํด๋ ๊ฐ์ค์น์ ๊ฐ์ ์ค์ด๋ ๊ฒ ๋๋กญ ์์-์๋์ธต์ ๋ด๋ฐ์ ์์๋ก ์ญ์ a๋ ์ผ๋ฐ์ ๊ฒฝ๋ง b๋ ๋๋กญ์์์ ์ ์ฉํ ์ ๊ฒฝ๋ง ์ฒซ๋ฒ์งธ ๊ทธ๋ํ๋ ์ผ๋ฐ ์ ๊ฒฝ๋ง, ๋๋ฒ์งธ ๊ทธ๋ํ๋ ๋๋กญ์์์ ์ ์ฉํ ์ ๊ฒฝ๋ง
๋ฐฐ์น์ ๊ทํ : ๊ฐ์ธต์ ํ์ฑํ ๊ฐ ๋ถํฌ๊ฐ ์ ๋นํ ํผ์ง๋๋ก '๊ฐ์ ' ์ฅ์ -ํ์ต์ ๋นจ๋ฆฌ ์งํํ ์ ์๋ค.-์ด๊น๊ฐ์ ํฌ๊ฒ ์์กดํ์ง ์๋๋ค.-์ค๋ฒํผํ ์ ์ต์ ํ๋ค. ๋ฐฐ์น์ ๊ทํ๊ฐ ํ๋ ์ผํ์ต์ ๋ฏธ๋๋ฐฐ์น๋ฅผ ๋จ์๋ก ์ ๊ทํ.๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ํ๊ท ์ด 0, ๋ถ์ฐ์ด 1์ด ๋๋๋ก ์ ๊ทํ
๋ค์๊ณผ ๊ฐ์ ํ๋ฅ ๊ณต๊ฐ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ฒกํฐ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ๋ค. ์ด์ ์ ์ฌ์ฉํ๋ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD)๋ ์๋์ ๊ฐ์ ์์ง์์ ๊ฐ์ง๋ค ๋ชจ๋ฉํ v ๋ ์๋์ ํด๋น. ์์ ์์ ๊ธฐ์ธ๊ธฐ ๋ฐฉํฅ์ผ๋ก ํ์ ๋ฐ์ ๋ฌผ์ฒด๊ฐ ๊ฐ์๋๋ ๊ฒ์ ๋ํ๋avํญ์ ๋ฌผ์ฒด๊ฐ ์๋ฌด ํ์ ๋ฐ์ง ์์๋, ์์ํ ํ๊ฐ์ํค๋ ์ญํ (์ง๋ฉด๋ง์ฐฐ, ๊ณต๊ธฐ์ ํญ. ์ด๋์ ์ค์ธ๋ค) AdaGrad ํ์ต์ ์งํํ ์๋ก ํ์ต๋ฅ ์ ์ค์ด๊ธฐAdam์์์๋์จ ๋ชจ๋ฉํ ๊ณผ AdaGrad๋ฅผ ํฉ์น๊ฒ
์ค์ฐจ์ญ ์ ํ๋ฒ์ ์ฌ์ฉํ๋ ์ด์ -๋ฏธ๋ถ์ ํจ๊ณผ์ ์ผ๋ก ํ ์์๋ค. affine๊ณ์ธต softmax-with-loss๊ณ์ธต์ํํธ๋งฅ์คํจ์ ๋ ๊ต์ฐจ์ํธ๋กํผ ์ค์ฐจ์ฌ์ฉ ํญ๋ฑํจ์์ ์์คํจ์๋ก ํ๊ท ์ ๊ณฑ์ค์ฐจ ์ฌ์ฉ =>๊ฒฐ๊ณผ๊ฐ์ด ๊น๋
์ ๊ฒฝ๋ง ํ์ต์ ์์ ์ ์ฒด์ ๊ฒฝ๋ง์๋ ์ ์ ๊ฐ๋ฅํ ๊ฐ์ค์น์ ํธํฅ์ด ์๊ณ , ์ด ๊ฐ์ค์น์ ํธํฅ์ ํผ๋ จ๋ฐ์ดํฐ์ ์ ์ํ๋๋ก ์กฐ์ ํ๋ ๊ณผ์ ์ ํ์ต์ด๋ผ๊ณ ํ๋ค.๋ค์๊ณผ ๊ฐ์ด 4๋จ๊ณ๋ก ์งํํ๋ค. 1๋จ๊ณ - ๋ฏธ๋๋ฐฐ์นํ๋ จ ๋ฐ์ดํฐ์ค ์ผ๋ถ๋ฅผ ๋ฌด์์๋ก ๊ฐ์ ธ์จ๋ค.(์ ์ฒด๋ฅผ ํ๋ฉด ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ) 2๋จ๊ณ - ๊ธฐ์ธ๊ธฐ ์ฐ์ถ๋ฏธ๋๋ฐฐ์น์ ์์ค ํจ์๊ฐ์ ์ค์ด๊ธฐ ์ํด ๊ฐ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๋ค.๊ธฐ์ธ๊ธฐ๋ ์์คํจ์์ ๊ฐ์ด ์ ์ด์ง๋๋ก ํ๋ ๊ฐ์ ์ ์ํ๋ค. 3๋จ๊ณ - ๋งค๊ฐ๋ณ์ ๊ฐฑ์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์๋ฅผ ๊ธฐ์ธ๊ธฐ ๋ฐฉํฅ์ผ๋ก ์์ฃผ ์กฐ๊ธ ๊ฐฑ์ ํ๋ค. 4๋จ๊ณ -๋ฐ๋ณต1~3๋จ๊ณ๋ฅผ ๋ฐ๋ณตํฉ๋๋ค. ๊ฒฝ์ฌํ๊ฐ๋ฒ์ผ๋ก ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐฑ์ ํ๊ณ , ์ด๋ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋๋ฐฐ์น๋ก ๋ฌด์์๋ก ์ ์ ํ๊ธฐ ๋๋ฌธ์ "ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ = SGD" ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
์ ๊ฒฝ๋ง์ ๋ถ๋ฅ์ ํ๊ธฐ ๋ชจ๋์ ์ฌ์ฉํ ์ ์์ต๋๋ค. ๋ค๋ง ๋์ค ์ด๋ค ๋ฌธ์ ๋์ ๋ฐ๋ผ ์ถ๋ ฅ์ธต์์ ์ฌ์ฉํ๋ ํ์ฑํ ํจ์๊ฐ ์ฌ๋ผ์ง๋๋ค. ๊ธฐ๊ณํ์ต ๋ฌธ์ ๋ ๋ณดํต ๋๊ฐ์ง 1. ๋ถ๋ฅ, 2. ํ๊ธฐ ๋ก ๋๋์ด ์ง๋๋ค.1. ๋ถ๋ฅ : ๋ฐ์ดํฐ๊ฐ ์ด๋ class์ ๋ค์ด๊ฐ์ง ์์ธกํ๋ ๋ฌธ์ , ex ) ์ธ๋ฌผ์ ์ฑ๋ณ์ ๊ตฌ๋ณํ๋ ๋ฌธ์ 2. ํ๊ธฐ : ์ฐ์์ ์ธ ์์น ๊ณ์ฐ๋ฌธ์ : ex ) ์ธ๋ฌผ์ ๋ชธ๋ฌด๊ฒ ์์ธก ์ผ๋ฐ์ ์ผ๋ก ๋ถ๋ฅ์๋ ์ํํธ๋งฅ์ค ํจ์๋ฅผ, ํ๊ท์๋ ํญ๋ฑํจ์๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ๊ธฐ์์ ์ฌ์ฉํ๋ ํญ๋ฑํจ์๋ ๋ง ๊ทธ๋๋ก ์ ๋ ฅ๊ฐ = ์ถ๋ ฅ๊ฐ์ธ ํจ์์ ๋๋ค.1234 def identity_function(X): return X cs ๋ถ๋ฅ์์ ์ฌ์ฉํ๋ ์ํํธ ๋งฅ์ค ํจ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.exp()๋ ์ง์ํจ์๋ฅผ ์๋ฏธํ๊ณ , n์ ์ถ๋ ฅ์ธต์ ๋ด๋ฐ ์, k๋ n๊ฐ์ค ..