코딩 메모장

  • 홈
  • 태그
  • 방명록

Review 2

[Paper review] Large Language Models Can be Lazy Learners

이번 논문은 Large Language Models의 취약점에 대해 설명하는 논문에 대해 리뷰해 보겠습니다. Large Language Models Can be Lazy Learners: Analyze Shortcuts in In-Context Learning https://arxiv.org/abs/2305.17256 Introduction Fine-tuning Pre-trained Language Model(PLM)을 특정 Task에 맞게 Parameter를 조정 Fine-tuning 과정은 Dataset에 대해 특정한 편향을 증폭시키는 경향, Task의 특정 단어에 의존하는 경향이 발생( e.g., "is", "not" and "can not"과 같은 단순한 단어를 통해 Task를 추론) ⇒ Task..

Paper 2024.02.08

[paper review] GPT-1 : Improving Language Understanding by Generative Pre-Training

- reference Link_here 0. Abstract 현재의 문제점은 unlabeled text corpora는 풍부하지만, 특정한 task을 위해 train data(labeled data)는 부족해 모델을 적절하게 훈련시키는 것이 현재의 문제점입니다. 저자들은 Large unlabeled text 통해 model을 generative 하게 언어 모델을 학습시키고, 특정 task에서 fine-tuning 한다면, 큰 향상을 이룰 수 있다고 말합니다. 이전 접근법과 달리, model Aritecture을 크게 수정하지 않고 fine-tuning 합니다. 이를 위해 fine-tuning 중에는 input을 변환합니다. 이러한 접근법은 밑에 보이는 NLP task에서 task만을 위해 설계된 모델들을..

Paper 2023.10.08
이전
1
다음
더보기
250x250
프로필사진

코딩 메모장

  • 분류 전체보기 (149)
    • Paper (25)
      • Metric (6)
      • Model (3)
    • AI & DL (23)
      • Pytorch (6)
      • Hugging Face (7)
      • Pytorch Lightning (8)
      • Lang Chain (0)
    • Coding (35)
      • Python (25)
      • Numpy (5)
      • Clean Code (3)
      • SQL (1)
    • Algorithm (45)
      • BOJ (25)
      • 프로그래머스 (17)
    • Django (1)
    • Cloud (1)
      • GCP (1)
    • Program (7)
      • Docker (5)
      • VSCode (2)
    • AI API (3)
      • OpenAI (2)
      • Gemini (1)
    • Project (1)
    • 활동 (7)
      • 교내활동 (4)
      • 대외활동 (2)
      • 잡동사니 (1)

Tag

PyTorch Lightning, BOJ, 백준, DataSet, paper, 오블완, pytorch, docker, c++, Python, Metric, ESconv, nlp, huggingface, Silver, numpy, LEVEL 2, 프로그래머스, 실버, 파이썬,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바