์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- til
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์ํฉ๊ฒฉํ๊ธฐ
- Leveraging Slot Descriptions for Zero-Shot Cross-Domain Dialogue State Tracking
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์์ ๋น
- ๋ฐฑ์ค
- ํ์ด์ฌ์ ํ์ด์ฌ๋ต๊ฒ
- ๋ชจ๋์๋ฅ๋ฌ๋
- nlp๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์ฑ ์ถ์ฒ
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์
- 2020์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌํ๊ธฐ
- ์์ฐ์ด์ฒ๋ฆฌ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ
- SUMBT:Slot-Utterance Matching for Universal and Scalable Belief Tracking
- DST zeroshot learning
- How Much Knowledge Can You Pack Into the Parameters of a Language Model?
- ๋ฅ๋ฌ๋๊ธฐ์ด
- fasttext text classification ํ๊ธ
- ๊ฒ์์์ง
- ๋ค์ด๋๋ฏน ํ๋ก๊ทธ๋๋ฐ
- few shot dst
- Zero-shot transfer learning with synthesized data for multi-domain dialogue state tracking
- ํ๋ก๊ทธ๋๋จธ์ค
- ๋ฐ์ดํฐ ํฉ์ฑ
- MySQL
- From Machine Reading Comprehension to Dialogue State Tracking: Bridging the Gap
- dialogue state tracking
- DST fewshot learning
- Python
- Few Shot Dialogue State Tracking using Meta-learning
- classification text
- Today
- Total
๋ชฉ๋ก์ ์ฒด ๊ธ (127)
๐ฒ์๋ผ๋๋์ฒญ๋
์ค๋ฒํผํ ์ด ์ผ์ด๋๋ ๊ฒฝ์ฐ- ๋งค๊ฐ๋ณ์๊ฐ ๋ง๊ณ ํํ๋ ฅ์ด ๋์ ๋ชจ๋ธ(์ธต์ด ๋ง์ ๋ชจ๋ธ)-ํ๋ จ๋ฐ์ดํฐ๊ฐ ์ ์ ๋ชจ๋ธ ์ค๋ฒํผํ -ํ๋ จ๋ฐ์ดํฐ๋ ์ ๊ตฌ๋ณํด ๋ด์ง๋ง ๋ค๋ฅธ ๋ฐ์ดํฐ์๋ ์ฑ๋ฅ์ด ์ข์ง ๋ชปํ๊ฒ ์ค๋ฒํผํ ์ ๋ฐฉ์งํ๋ ๋ฐฉ๋ฒ ๊ฐ์ค์น ๊ฐ์-๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๊ฐ์ด ํด๋ ๊ฐ์ค์น์ ๊ฐ์ ์ค์ด๋ ๊ฒ ๋๋กญ ์์-์๋์ธต์ ๋ด๋ฐ์ ์์๋ก ์ญ์ a๋ ์ผ๋ฐ์ ๊ฒฝ๋ง b๋ ๋๋กญ์์์ ์ ์ฉํ ์ ๊ฒฝ๋ง ์ฒซ๋ฒ์งธ ๊ทธ๋ํ๋ ์ผ๋ฐ ์ ๊ฒฝ๋ง, ๋๋ฒ์งธ ๊ทธ๋ํ๋ ๋๋กญ์์์ ์ ์ฉํ ์ ๊ฒฝ๋ง
๋ฐฐ์น์ ๊ทํ : ๊ฐ์ธต์ ํ์ฑํ ๊ฐ ๋ถํฌ๊ฐ ์ ๋นํ ํผ์ง๋๋ก '๊ฐ์ ' ์ฅ์ -ํ์ต์ ๋นจ๋ฆฌ ์งํํ ์ ์๋ค.-์ด๊น๊ฐ์ ํฌ๊ฒ ์์กดํ์ง ์๋๋ค.-์ค๋ฒํผํ ์ ์ต์ ํ๋ค. ๋ฐฐ์น์ ๊ทํ๊ฐ ํ๋ ์ผํ์ต์ ๋ฏธ๋๋ฐฐ์น๋ฅผ ๋จ์๋ก ์ ๊ทํ.๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ํ๊ท ์ด 0, ๋ถ์ฐ์ด 1์ด ๋๋๋ก ์ ๊ทํ
๊ฐ์ค์น๋ 0.01*np.rnadom,randn(10,100) =>ํ์คํธ์ฐจ๊ฐ 0.01์ธ ์ ๊ท๋ถํฌ์ฒ๋ผ ๋๋คํ ๊ฐ์ ํด์ผํ๋ค ์ด์ : ์ค์ฐจ์ญ์ ํ๋ฒ์ ์ ํ์ฉํ๊ธฐ ์ํด ๊ฐ์ค์น์ ์ถ์ฒ ์ด๊ธฐ๊ฐ sigmoid, tahnhn๊ฐ๋ผ๋ฉด ํ์คํธ์ฐจ๊ฐ (1/n)^1/2 ์ธ ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋๊ฑธ ์ถ์ฒ relu n๊ฐ๋ผ๋ฉด ํ์คํธ์ฐจ๊ฐ (2/n)^1/2 ์ธ ๋ถํฌ๋ฅผ ์ฌ์ฉํ๋๊ฑธ ์ถ์ฒ(He ์ด๊น๊ฐ์ด๋ผ๊ณ ํจ)
๋ค์๊ณผ ๊ฐ์ ํ๋ฅ ๊ณต๊ฐ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ฒกํฐ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ๋ค. ์ด์ ์ ์ฌ์ฉํ๋ ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD)๋ ์๋์ ๊ฐ์ ์์ง์์ ๊ฐ์ง๋ค ๋ชจ๋ฉํ v ๋ ์๋์ ํด๋น. ์์ ์์ ๊ธฐ์ธ๊ธฐ ๋ฐฉํฅ์ผ๋ก ํ์ ๋ฐ์ ๋ฌผ์ฒด๊ฐ ๊ฐ์๋๋ ๊ฒ์ ๋ํ๋avํญ์ ๋ฌผ์ฒด๊ฐ ์๋ฌด ํ์ ๋ฐ์ง ์์๋, ์์ํ ํ๊ฐ์ํค๋ ์ญํ (์ง๋ฉด๋ง์ฐฐ, ๊ณต๊ธฐ์ ํญ. ์ด๋์ ์ค์ธ๋ค) AdaGrad ํ์ต์ ์งํํ ์๋ก ํ์ต๋ฅ ์ ์ค์ด๊ธฐAdam์์์๋์จ ๋ชจ๋ฉํ ๊ณผ AdaGrad๋ฅผ ํฉ์น๊ฒ
์ค์ฐจ์ญ ์ ํ๋ฒ์ ์ฌ์ฉํ๋ ์ด์ -๋ฏธ๋ถ์ ํจ๊ณผ์ ์ผ๋ก ํ ์์๋ค. affine๊ณ์ธต softmax-with-loss๊ณ์ธต์ํํธ๋งฅ์คํจ์ ๋ ๊ต์ฐจ์ํธ๋กํผ ์ค์ฐจ์ฌ์ฉ ํญ๋ฑํจ์์ ์์คํจ์๋ก ํ๊ท ์ ๊ณฑ์ค์ฐจ ์ฌ์ฉ =>๊ฒฐ๊ณผ๊ฐ์ด ๊น๋
two layer์ธ ์ ๊ฒฝ๋ง์ ๋ง๋๋ ์ฝ๋์ ๋ ฅ - hidden- ์ถ๋ ฅ์ธต์ผ๋ก ๊ตฌ์ฑ๋์ด์๋ค. ๊ฐ์ค์น ์ด๊ธฐํ ํจ์12345678 def __init__(self, input_size, hidden_size, output_size, weight_init_std=0.01): # ๊ฐ์ค์น ์ด๊ธฐํ self.params = {} self.params['W1'] = weight_init_std * np.random.randn(input_size, hidden_size) self.params['b1'] = np.zeros(hidden_size) self.params['W2'] = weight_init_std * np.random.randn(hidden_size, output_size) self.params['b2'] = np..
์ ๊ฒฝ๋ง ํ์ต์ ์์ ์ ์ฒด์ ๊ฒฝ๋ง์๋ ์ ์ ๊ฐ๋ฅํ ๊ฐ์ค์น์ ํธํฅ์ด ์๊ณ , ์ด ๊ฐ์ค์น์ ํธํฅ์ ํผ๋ จ๋ฐ์ดํฐ์ ์ ์ํ๋๋ก ์กฐ์ ํ๋ ๊ณผ์ ์ ํ์ต์ด๋ผ๊ณ ํ๋ค.๋ค์๊ณผ ๊ฐ์ด 4๋จ๊ณ๋ก ์งํํ๋ค. 1๋จ๊ณ - ๋ฏธ๋๋ฐฐ์นํ๋ จ ๋ฐ์ดํฐ์ค ์ผ๋ถ๋ฅผ ๋ฌด์์๋ก ๊ฐ์ ธ์จ๋ค.(์ ์ฒด๋ฅผ ํ๋ฉด ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ) 2๋จ๊ณ - ๊ธฐ์ธ๊ธฐ ์ฐ์ถ๋ฏธ๋๋ฐฐ์น์ ์์ค ํจ์๊ฐ์ ์ค์ด๊ธฐ ์ํด ๊ฐ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๋ค.๊ธฐ์ธ๊ธฐ๋ ์์คํจ์์ ๊ฐ์ด ์ ์ด์ง๋๋ก ํ๋ ๊ฐ์ ์ ์ํ๋ค. 3๋จ๊ณ - ๋งค๊ฐ๋ณ์ ๊ฐฑ์ ๊ฐ์ค์น ๋งค๊ฐ๋ณ์๋ฅผ ๊ธฐ์ธ๊ธฐ ๋ฐฉํฅ์ผ๋ก ์์ฃผ ์กฐ๊ธ ๊ฐฑ์ ํ๋ค. 4๋จ๊ณ -๋ฐ๋ณต1~3๋จ๊ณ๋ฅผ ๋ฐ๋ณตํฉ๋๋ค. ๊ฒฝ์ฌํ๊ฐ๋ฒ์ผ๋ก ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐฑ์ ํ๊ณ , ์ด๋ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋๋ฐฐ์น๋ก ๋ฌด์์๋ก ์ ์ ํ๊ธฐ ๋๋ฌธ์ "ํ๋ฅ ์ ๊ฒฝ์ฌํ๊ฐ๋ฒ = SGD" ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค.
'์์คํจ์'์ ๊ฐ์ ์ด์ฉํด์ '๋ฏธ๋ถ'์ ํด์ ๋ฏธ๋ถ๊ฐ์ด 0 ์ด ๋๋ ์ง์ ์ ์ฐพ์ ์กฐ๊ธ์ฉ ๊ฐ์ค์น๋ฅผ ์กฐ์ ํ๊ธฐ ์ํด ๋ฏธ๋ถ์ด ํ์ํ๋ค. ๊ณ ๋ฑํ๊ต๋ ๋ฐฐ์ด ๋ฏธ๋ถ์ ๊ทนํ์ ๊ฐ์ด ๋ค์ด๊ฐ๋๋ฐ ์ด๊ฒ์ ์ปดํจํฐ๊ฐ ์ฐ์ฐ์ ํ ์ ์๋ค. ๋ฐ๋ผ์ ์์์ ๋ณด์ด๋ 0์ผ๋ก ์๋ ดํ๋ ๊ฐ h ๋์ ์ ์์ฃผ์์์ด๋ค๊ฐ์ ์ฌ์ฉํ๊ฒ ๋๊ณ , ์ด๊ฒ์ ์ฝ๊ฐ์ ์ค์ฐจ๊ฐ ์๊ธฐ๊ธด ํ์ง๋ง,,์ด์ฉ์์๋ค. ํธ๋ฏธ๋ถ ์์ ๋ฏธ๋ถ์ด ๊ณ์๊ฐ ํ๊ฐ์ผ๋ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ผ๋ฉด, ํธ๋ฏธ๋ถ์ ๊ณ์๊ฐ ํ๊ฐ ์ด์์ผ ๋ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ค.ํธ๋ฏธ๋ถ์ ๋ด๊ฐ์ง๊ธ ์ด์ ์ ๋ง์ถ๊ณ ์๋ ๊ณ์ ๋ง๊ณ ๋๋จธ์ง๋ ์์์ฒ๋ผ ์ทจ๊ธ์ ํ๊ณ ๋ฏธ๋ถ์ ํ๋ฉด ๋๋ค. ๊ธฐ์ธ๊ธฐ ๋ชจ๋ ํธ๋ฏธ๋ถ์ ๋ฒกํฐ๋ก ์ ๋ฆฌํ ๊ฒ ๊ฒฝ์ฌ๋ฒ-๊ฒฝ์ฌํ๊ฐ๋ฒ๊ฐ์ฅ ์ค์ฐจ๊ฐ ์์์ ์ ์ฐพ๊ธฐ ์ํด์ ๊ธฐ์ธ๊ธฐ๋ฅผ ์ด์ฉํ๋ค. ์๋์๋ ๊ฐ์ค์น์์ ์ผ๋งํผ ์ด๋ํด์ผ(๊ฐ์ ๋ณํ์์ผ์ผ)ํ..