์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- ํ๋ก๊ทธ๋๋จธ์ค
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์ฑ ์ถ์ฒ
- til
- ๋ฐฑ์ค
- nlp๋ ผ๋ฌธ๋ฆฌ๋ทฐ
- DST zeroshot learning
- fasttext text classification ํ๊ธ
- MySQL
- dialogue state tracking
- Leveraging Slot Descriptions for Zero-Shot Cross-Domain Dialogue State Tracking
- ๊ฒ์์์ง
- Python
- Zero-shot transfer learning with synthesized data for multi-domain dialogue state tracking
- ์์ฐ์ด์ฒ๋ฆฌ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ
- ๋ฐ์ดํฐ ํฉ์ฑ
- 2020์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌํ๊ธฐ
- SUMBT:Slot-Utterance Matching for Universal and Scalable Belief Tracking
- From Machine Reading Comprehension to Dialogue State Tracking: Bridging the Gap
- Few Shot Dialogue State Tracking using Meta-learning
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ ์์ ๋น
- ๋ชจ๋์๋ฅ๋ฌ๋
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์ํฉ๊ฒฉํ๊ธฐ
- ํ์ด์ฌ์ ํ์ด์ฌ๋ต๊ฒ
- ๋ค์ด๋๋ฏน ํ๋ก๊ทธ๋๋ฐ
- few shot dst
- How Much Knowledge Can You Pack Into the Parameters of a Language Model?
- ๋ฅ๋ฌ๋๊ธฐ์ด
- DST fewshot learning
- ์ ๋ณด์ฒ๋ฆฌ๊ธฐ์ฌ์ ๊ณต์
- classification text
Archives
- Today
- Total
๐ฒ์๋ผ๋๋์ฒญ๋
๋ฅ๋ฌ๋ ๊ฐ์ 1์ผ์ฐจ ๋ณธ๋ฌธ
๋ฐ์ํ
Intro to DeepLearning
Motivation
- ์ถฉ๋ถํ ๋ฐ์ดํฐ๊ฐ ์์ผ๋ฉด ์ฌ๋๋ณด๋ค ๋ฅ๋ฌ๋ ๊ฒฐ๊ณผ๊ฐ ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๊ธฐ ์์
- object detection(yolo)
- ์์ค ์ฐฝ์ AI
- deeparts(ํํ ๋ณํ)
- super resolution (ํ๋ฆฟํ ์ด๋ฏธ์ง๋ฅผ ํ ๋๋ก ํด์๋๊ฐ ์ข์ ์ด๋ฏธ์ง๋ฅผ ์์ธกํ๊ธฐ
what is learning
- Bayesian์ ๊ด์ ์์ : ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ธฐ ์ ๊ณผ ๋ณด๊ธฐ ์ดํ์ knowledge๊ฐ ๋ฌ๋ผ์ง๋ ๊ฒ
- data-> knowledge+data ->knowledge + data ->knowledge
- ๋จธ์ ๋ฌ๋
- simple model : ๋ณ์๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช
ํ๋ ์์๋ฅผ ์ฐพ๊ธฐ(y = ax +b ์ ์์์ a ์ b ์ฐพ๊ธฐ)
- complex model : ์์ ํจ์๋ณด๋ค ๋ณต์กํ ํจ์
- simple model : ๋ณ์๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช
ํ๋ ์์๋ฅผ ์ฐพ๊ธฐ(y = ax +b ์ ์์์ a ์ b ์ฐพ๊ธฐ)
- ๋ฅ๋ฌ๋์ด ๊ทธ์ ๊ณผ ๋ค๋ฅธ๊ฒ : ์ ๋ฌธ๊ฐ์ ์๊ฒฌ์ ํ์๋ก ํ์ง ์๋๋ค. ๋ฐ์ดํฐ๋ง ๊ฐ์ง๊ณ ์ผํจ.(๋ฐ์ดํฐ๊ฐ ๋ง๋ค๊ณ ๊ฐ์ ํ ๋)
- components of ML
- data : ๋ฐ์ดํฐ๋ฅผ ์ ๋ฆฌํ๋ ์ผ
- model : ์ ํ, NN ๋ฑ๋ฑ ์ ํ๊ธฐ
- objective : cross-entropy ,RMSE ์ ํ๊ธฐ
- MSE : mean sqared error(regression)
- cross-entropy (classfication)
- optimize : ์ต์ ํ ํ๋ ํจ์ ์ ํ๊ธฐ
- ๋ฏธ๋ถ์ ํตํด ์ค์ฐจ๋ฅผ ๊ฐ์ฅ ์๊ฒ ๋ง๋๋ ํจ์, ์ฌ๋ฌ๊ฐ์ง ์ข ๋ฅ๊ฐ ์์
- ๋ณ์๊ฐ ๋ง์๋, ๋ค๋ฅธ ๋ณ์๋ ์์์ฒ๋ผ ์๊ฐํ๊ณ ๋ฏธ๋ถํ๊ธฐ ๋๋ฌธ์ ๋ณ์๋ผ๋ฆฌ ๋ ๋ฆฝ๋ณ์๋ผ๊ณ ์๊ฐํ๊ณ ๋ฏธ๋ถ
- shallow vs deep
- shallow๋ layer๊ฐ 1๊ฐ, deep์ layer๊ฐ ์ฌ๋ฌ๊ฐ
- deep์ ๋์ผํ ํ๋ผ๋ฏธํฐ ์๋ฅผ ๊ฐ์ง๊ณ ๋ณต์กํ ๋ ์ด์ด๋ฅผ ๋ง๋ค ์ ์๋ค. (๋ต์ผ๋ก ๊ฐ๋ ๊ธธ์ด ๋ง์์ง๋ค)
- ์ด๋ก ์ ์ผ๋ก๋ shallow๋ ์ข์ง๋ง, deep๊ณผ ๊ฐ์ ์ฑ๋ฅ์ ๋ง๋ค๊ธฐ์๋ ํ๋ค๋ค!(ํจ์ฌ ๋นํจ์จ์ )
- representation
- ๋ฐ์ดํฐ๋ฅผ ์ ๋๋ ์ ์๋ '์ถ๋ณํ'์ ํ๊ธฐ
- manifold in multiple level
- ์ธต์ด ์ฌ๋ผ๊ฐ ์๋ก, ์ถ์์ ์ธ ๋ ๋ฒจ(์ด๋ฏธ์ง -> ์ฌ์๋ผ๋ ๊ฐ๋ )์ผ๋ก abstract representation์ด ๋๋ค.
- knowledge transfer
- A๋ฅผ ์ํ๋ ์ฌ๋์ A' ๋ ์ํ ์ ์๋ค.๋ผ๋ ๊ฐ๋
- ํ์ต๋ ๋ ์ด์ด๋ฅผ ์ฌ์ฌ์ฉ ํ ์ ์๋ค.
- ํธ๋์ด๋ ํ ๋ผ๋ ๋ฐ์ดํฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ์ ๊ตฌ๋ถํ๋๋ฐ ๊ณ ์์ด์ ๊ฐ๋ฅผ ๊ตฌ๋ถํ๊ณ ์ถ์๋ฐ ๋ฐ์ดํฐ๊ฐ ์๋ค
-> ์ด๋ด๋ knowledge trasfer๋ฅผ ํ ์ ์๋ค. - ์ผ๋ฐ์ ์ผ๋ก ๋งจ ๋ง์ง๋ง ๋ ์ด์ด๋ฅผ ์ ์ธํ๊ณ ๋ค ๊ฐ์ ธ์จ๋ค.
- techniques
- batch normalization
- residual network
Algorithms
- discrimitive model : ์ธ์, ํ๋ณ(cnn , rnn...)
- CNN - convolution layer + pooling layer
- RNN, LSTM
- generative model : ์๋ก ๋ฌด์ธ๊ฐ๋ฅผ ๋ง๋ค์ด ๋ด๋ ๋ชจ๋ธ(DBN, GAN, DBM, GSN,๊ธ์ฐ๊ธฐ..)
๋ฐ์ํ