Q1. 왜 이 논문이 필요한가? 어떤 문제가 있었는가?A. 기존 NLP 시스템의 한계 때문임.기존 NLP 모델은 일반적으로 각 태스크(task)에 대해 별도 학습이 필요했음.대규모 레이블 데이터를 필요로 함 → 많은 도메인에서 적용이 어려움.예: 질의응답, 감성 분석, 문장 유사도 계산 등 서로 다른 구조를 필요로 함.따라서 일반화된 사전 학습(pretraining) 모델이 NLP에서 절실함.Q2. 기존의 방식들과 무엇이 달랐는가?A. 이전에는 Discriminative 방식이 주류였으나, 이 논문은 Generative 방식을 사용함.이전 방식: classification 기반 (예: BOW + softmax, CNN/RNN encoder 등)이 논문: 언어모델(Language Model)을 통해 텍스트..