[Metric Review] ROUGE Metric 분석

Paper/Metric

[Metric Review] ROUGE Metric 분석

Giliit 2024. 7. 18. 13:31

728x90

논문 링크

https://aclanthology.org/W04-1013/

ROUGE

Rouge은 Recall-Oriented Understudy for Gisting Evaluation의 약자이다. ROUGE는 사람이 만든 참조 요약과 컴퓨터가 생성한 요약 사이의 일치 정도를 측정한다. 이 논문은 ROUGE가 포함된 네 가지 다른 ROUGE 메트릭, 즉 ROUGE-N, ROUGE-L, ROUGE-W, ROUGE-S를 소개합니다. 각 메트릭은 요약의 다른 측면을 평가한다.

ROUGE-N: 이 메트릭은 N-gram 기반으로 평가한다. 이는 요약에서 사용된 단어의 연속적인 나열이 참조 요약과 얼마나 일치하는지를 측정하여, 텍스트의 어휘적 정확성을 평가한다. N이 클수록, 문맥적 일관성과 정확성을 더 자세히 분석한다.
ROUGE-L: 가장 긴 공통 부분 문자열(LCS)을 기반으로 하여, 요약문과 참조 요약문 사이에 나타나는 최장 공통 부분문을 찾아냄으로써 요약의 문장 구조적 유사성을 평가한다.
ROUGE-W: 가중치가 있는 가장 긴 공통 부분 문자열을 사용한다. 이는 LCS의 기본 아이디어에 가중치를 추가하여, 더 긴 일치하는 구문을 더 높게 평가함으로써 요약의 문맥적 심도와 정보의 중요성을 평가한다.
ROUGE-S: ‘skip-bigram’을 사용하여, 요약 내 단어들 사이의 임의의 간격에도 불구하고 겹치는 단어 쌍을 찾아내어 요약의 유연성과 단어 간 관계를 평가한다. 이 메트릭은 요약이 원문의 중요한 개념들을 얼마나 포괄적으로 포함하고 있는지를 측정한다.

Formula

ROUGE-N

여기서 $ Count_{match}(gram_n)$은 생성된 요약과 참조 요약에서 발견된 겹치는 n-gram의 수이며, $Count(gram_n)$은 참조 요약에서 n-gram의 수이다.

$$\text{ROUGE-N} = \frac{\sum_{s \in \{ \text{참조 요약} \}} \sum_{gram_n \in s} \text{Count}_{\text{match}}(gram_n)}{\sum_{s \in \{ \text{참조 요약} \}} \sum_{gram_n \in s} \text{Count}(gram_n)}$$

예시 1: (ROUGE-1 사용)

참조 요약: "그녀는 학교에 간다."
생성된 요약: "그녀는 집에 간다."
일치하는 unigram: "그녀는", "간다"
계산: $\frac{2}{3} ≈ 0.67$ (3개 중 2개 일치)

예시 2: (ROUGE-2 사용)

참조 요약: "고양이는 소파에서 잔다."
생성된 요약: "고양이는 소파에서 놀고 있다."
일치하는 bigram: "고양이는 소파에서"
계산: $\frac{1}{2} = 0.5$(2개 중 1개 일치)

ROUGE-L

$$\text{ROUGE-L} = \frac{\text{LCS}(X, Y)}{\max(\text{len}(X), \text{len}(Y))}$$

예시 1:

참조 요약: "그는 그녀에게 책을 준다."
생성된 요약: "그는 책을 그녀에게 준다."
LCS 길이: 4 (단어 순서 다름)
계산: $\frac{4}{5} = 0.8$

예시 2:

참조 요약: "아침에 커피를 마신다."
생성된 요약: "커피를 마신다."
LCS 길이: 2
계산:$\frac{2}{3} ≈ 0.67 $

ROUGE-W

$$\text{ROUGE-W} = \frac{\text{WLCS}(X, Y)}{\max(\text{len}(X), \text{len}(Y))}$$

예시 1:

참조 요약: "아침에 커피를 마시고 신문을 읽는다."
생성된 요약: "아침에 커피를 마시고 뉴스를 본다."
WLCS 계산은 LCS에 가중치를 추가해야 하지만 간단히 LCS를 사용하고 장문 일치에 더 큰 가중치 부여
계산: 긴 일치 부분, 추정 가중치 추가 후 계산 필요

예시 2:

참조 요약: "그는 아침 조깅을 한 후에 샤워를 했다."
생성된 요약: "그는 샤워를 한 후에 조깅을 했다."
WLCS: 가중치가 있는 LCS 계산, 여기서도 실제 가중치 계산을 위해서는 추가 데이터 필요

ROUGE-S

$$\text{ROUGE-S} = \frac{\sum_{\text{skip-bigram} \in \{ \text{참조 요약} \}} \text{Count}_{\text{match}}(\text{skip-bigram})}{\sum_{\text{skip-bigram} \in \{ \text{참조 요약} \}} \text{Count}(\text{skip-bigram})}$$

예시 1:

참조 요약: "그녀는 시장에서 과일을 샀다."
생성된 요약: "그녀는 과일을 시장에서 구입했다."
일치하는 skip-bigram: "그녀는-과일을", "과일을-시장에서", "그녀는-시장에서"
계산: $\frac{3}{3} = 1.0$

예시 2:

참조 요약: "아침에 커피를 마시고 신문을 읽는다."
생성된 요약: "신문을 읽으며 커피를 마신다."
일치하는 skip-bigram: "커피를-신문을", "아침에-커피를"
계산: $\frac{2}{4} = 0.5 $

이 예시를 통해 도움이 되시기를 바랍니다. 감사합니다

저작자표시 (새창열림)

'Paper > Metric' 카테고리의 다른 글

[Metric Review] Distinct-n Review (0)	2024.08.22
[Metric Review] Vector Extrema : Boostrapping Dialog Systems with Word Embeddings Review (0)	2024.08.13
[Metric Review] CIDEr Metric 분석 (0)	2024.04.01
[Metric Review] BLEU Metric 분석 (0)	2024.03.31
[Metric review] METEOR Metric 분석 (1)	2024.03.29

현재글[Metric Review] ROUGE Metric 분석

250x250

코딩 메모장

백준, DataSet, Python, nlp, 파이썬, huggingface, 프로그래머스, Silver, numpy, 실버, LEVEL 2, docker, PyTorch Lightning, pytorch, BOJ, 오블완, Metric, c++, ESconv, paper,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

코딩 메모장