input sequence, output sequence의 토큰 개수가 다를 경우에 대한 대응
<sos>, <eos> 토큰을 둔다.
encoder을 활용하여 input sequence에 대한 정보를 은닉층에 집약한다.
집약한 은닉층을 <sos> 토큰과 함께 디코더의 첫 입력에 입력한다.
input sequence 전체를 은닉층에 넣어서 정보 손실이 발생하며, 어텐션 메커니즘 등장의 계기가 되었다.
'미분류' 카테고리의 다른 글
바다나우 어텐션 (0) | 2024.03.29 |
---|---|
어텐션 메커니즘 대충 (0) | 2024.03.27 |
Tokenizer은 어떻게 만들어졌는가? (0) | 2024.03.26 |
huggingface의 AutoModel 클래스 (0) | 2024.03.20 |
GraphCodeBERT 메모 (0) | 2024.03.20 |