일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- Python
- Converting
- pandas
- evaluation
- GitLab
- pytorch
- AI
- enV
- Mac
- PostgreSQL
- git
- judge
- CUDA
- TORCH
- list
- file
- Laravel
- Windows
- Container
- Database
- Paper
- docker
- curl
- Linux
- Flask
- KAKAO
- LLM
- format
- numpy
- DB
Archives
- Today
- Total
목록2024/03/05 (1)
Daily Develope
[Paper] Evaluating Large Language Models: A Comprehensive Survey
아래는 본 논문의 내용 중 관심있는 일부 Section에 대해서만 번역/의역한 내용입니다. Paper - Evaluating Large Language Models: A Comprehensive Survey Figure. An overview of studies on knowledge and capability evaluation for LLMs. 3. Knowledge and Capability Evaluation 모델의 규모와 능력이 발전함에 따라 LLM의 지식과 능력을 평가하는 것은 하나의 중요한 연구로 자리잡았다. LLM이 다양한 분야에 응용되고 배포됨에 따라 task별로 모델의 능력과 한계를 세밀히 평가하는 것 또한 중요해졌다. 따라서 3절에서는 LLM 평가방법 및 벤치마크와 관련한 전반적인 소..
AI
2024. 3. 5. 15:13