์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- From Machine Reading Comprehension to Dialogue State Tracking: Bridging the Gap
- ๋ฅ๋ฌ๋๊ธฐ์ด
- ๋ฐ์ดํฐ ํฉ์ฑ
- ๊ฒ์์์ง
- Zero-shot transfer learning with synthesized data for multi-domain dialogue state tracking
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์
- ํ๋ก๊ทธ๋๋จธ์ค
- ๋ฐฑ์ค
- How Much Knowledge Can You Pack Into the Parameters of a Language Model?
- SUMBT:Slot-Utterance Matching for Universal and Scalable Belief Tracking
- DST zeroshot learning
- 2020์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌํ๊ธฐ
- nlp๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- MySQL
- Leveraging Slot Descriptions for Zero-Shot Cross-Domain Dialogue State Tracking
- ๋ค์ด๋๋ฏน ํ๋ก๊ทธ๋๋ฐ
- ์์ฐ์ด์ฒ๋ฆฌ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์ํฉ๊ฒฉํ๊ธฐ
- ํ์ด์ฌ์ ํ์ด์ฌ๋ต๊ฒ
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์ฑ ์ถ์ฒ
- classification text
- few shot dst
- dialogue state tracking
- fasttext text classification ํ๊ธ
- til
- DST fewshot learning
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์์ ๋น
- Python
- Few Shot Dialogue State Tracking using Meta-learning
- ๋ชจ๋์๋ฅ๋ฌ๋
- Today
- Total
๐ฒ์๋ผ๋๋์ฒญ๋
[๋ ผ๋ฌธ๋ฆฌ๋ทฐ]Few Shot Dialogue State Tracking using Meta-learning(2021) ๋ณธ๋ฌธ
[๋ ผ๋ฌธ๋ฆฌ๋ทฐ]Few Shot Dialogue State Tracking using Meta-learning(2021)
JihyunLee 2021. 8. 26. 16:12์ ๋ชฉ : Few Shot Dialogue State Tracking using Meta-learning
์ ์ : Saket Dingliwal, Shuyang Gao, Sanchit Agarwal, Chien-Wei Lin, Tagyoung Chung, Dilek Hakkani-T¨ur
๋ฐํ๋ ๋ : 2021
paper : https://arxiv.org/abs/2101.06779
code : https://github.com/saketdingliwal/Few-Shot-DST
Review
dialogue state tracking(DST)๊ฐ ํน์ ๋ชฉ์ ์ ๊ฐ์ง chatbot์ ๋ง๋ค๊ธฐ ์ํด ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ด์ง๋ง, dst๋ฅผ ๋ง๋ค๊ธฐ ์ํด์๋ ์ annotation ๋ ๋ฐ์ดํฐ๊ฐ ํ์ํ๋ค. ๊ทธ๋ฌ๋ annotation์ด ์ธ๋ ฅ์ด ๋ง์ด ๋ค์ด๊ฐ๋ ๋ฐฉ๋ฒ์ด๊ธฐ์, zero shot/few shot ์ ๋ฐฉ์์ dst๊ฐ ํ์์ ์ด๋ค. ์ด ๋ ผ๋ฌธ์ D-REPTILE์ด๋ผ๋ meta learning ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ์ฌ, zeroshot/fewshot ํ๊ฒฝ์์๋ ์ ์ ์ฉ๋๋ meta-learning dst ์์คํ ์ ๋ง๋ค์๋ค.
๊ฒฐ๊ณผ๋ถํฐ ๋ณด๋ฉด x์ถ์ ํ์ตํ dialogue, ์ธ๋ก์ถ์ joint goal accuracy ๋ฅผ ๋ํ๋ด๋๋ฐ, zero/few shot ํ๊ฒฝ์์๋ ์ฑ๋ฅ์ด ์ด๋์ ๋ ์ ๋์ค๊ณ ์๋๊ฒ์ ๋ณผ ์ ์๋ค.
meta-learning?
learning to learn์ด๋ผ๊ณ ํ๋ฉฐ, ์ ์ ๋ฐ์ดํฐ๋ก๋ ์ผ๋ฐํ๊ฐ ๊ฐ๋ฅํ๋๋ก ํ์๋ ๋ชฉ์ ์ ๊ฐ์ง๊ณ ์๋ค.
๊ฐ๋
์ด ํฌํจํ๊ณ ์๋ ๋ด์ฉ์ด ๋ฐฉ๋ํด์, ๋
ผ๋ฌธ์ ๋์จ ๋ด์ฉ๋ง ์ ๋ฆฌํ์๋ฉด, ๋
ผ๋ฌธ์์๋ REPTILE(2018) ์ด๋ผ๋ few shot learning ์๊ณ ๋ฆฌ์ฆ์ ๋ณํํ์ฌ ์ฌ์ฉํ์๋ค. meta learning ์ ์ฌ๋ฌ ๋ฐฉ์ ์ค, Optimization ๋ฐฉ์์ ๋ณํํด์ few shot learning ์ด ๊ฐ๋ฅํ๋๋ก ํ ๋
ผ๋ฌธ์ด๊ณ ์ด์ ๋ฐฉ์(MAML - model agnostic meta learning)์ ๋นํด ์ฐ์ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์์ ์ด์ ์ด ์๋ ๋ฐฉ๋ฒ์ด๋ค.
์์ธํ ๋ณด๋ฉด ๋ด๊ฐ ์ดํดํ๊ธฐ๋ก , ์ ์ฒด task(data)๋ฅผ samplingํ์ฌ loss๋ฅผ ๊ตฌํด ํ๊ท ์ ๋ธ ๋ค ์
๋ฐ์ดํธ ํ๋ ๋ฐฉ์์ ์ฌ๋ฌ๋ฒ ์ ์ฉํ๋ ๋ฏ ํ๋ฐ, ์ด๊ฒ ์ด๋ป๊ฒ ์ ๋๋์ง๋ ์๋ฌธ์ด๋ค. ๊ทธ๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด ์ ๋๋ค๊ณ ํ๋ ์ค๋ช
์ด ๋ง์์, ๋ค์์ ๋ ๊ณต๋ถ๋ฅผ ํด๋ด์ผ๊ฒ ๋ค.
์๋ ๊ทธ๋ฆผ์ MAML์ ์๋ ๊ทธ๋ฆผ์ด๋ค. Meta learning์ ์๋์ ๊ฐ์ด ์ ์ ๋ฐ์ดํฐ sample์ ๋ํด loss๋ฅผ ์ฌ๋ฌ๊ฐ ๊ตฌํด์ ํ๊ท ๋ด์ ํ๋ฒ์ ์ด๋ํ๋ค๊ณ ์ดํดํ๋ค.
Methodology
๋ฉํ ๋ฌ๋์ ์๊ณ ๋ฆฌ์ฆ ์ค REPTILE์ ๋ณ๊ฒฝ์ํจ D-REPTILE์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ค
input์ธ D๋ domain์ ์๋ฏธํ๋ฉฐ paramter๋ meta๋ชจ๋ธ์ ํ์ต์ํค๋๋ฐ ํ์ํ ํ์ดํผ ํ๋ผ๋ฏธํฐ, ๊ทธ๋ฆฌ๊ณ ๊ฒฐ๊ณผ ๊ฐ์ผ๋ก ํ์ต๋ meta model์ด ๋์จ๋ค.
๊ณผ์ ์ ๋ณด๋ฉด ๊ฐ domain(hotel.area, hotel.stars)์ ํ์ต์์ผ ์ป์ ์๋ก์ด state๋ฅผ ๊ธฐ์กด state์ ์ฐจ๋ฅผ ๊ตฌํ๊ณ , ์ด๋ฅผ ๋๋ฉ์ธ๋ณ๋ก ํ๊ท ๋ธ ๊ฐ์ meta model์ ์ ์ฉํ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.(๊ธฐ์กด REIPTILE๊ณผ ๊ฑฐ์ ๋์ผ)
์ผ๋ถ๋ง tagging๋ ๋ฐ์ดํฐ์๋ ์ ์ฉ์ด ๊ฐ๋ฅํ๋ค๊ณ ํ๋, ์ค์ ํ์ค ๋ฐ์ดํฐ์ ์ ์ฉํด์ ์คํํด ๋ณผ ๋ง ํ๋ค๋ ์๊ฐ์ด ๋ ๋ค.
reference
๋ฉํ๋ฌ๋ : https://talkingaboutme.tistory.com/entry/DL-Meta-Learning-Learning-to-Learn-Fast๋ ผ๋ฌธ : https://arxiv.org/abs/2101.06779