#evaluation

2개의 글이 있습니다.

llm
4 min read
LLM 품질은 문장 튜닝이 아니라 데이터셋, 평가 기준, 온라인 피드백, 회귀 감지 루프로 관리해야 안정화된다.
벡터 검색 평가 지표 설계 cover image
2 min read
Recall@K, MRR, NDCG를 서비스 맥락에 맞게 해석해 검색 품질을 관리하는 기준