8S
8SPACE TECH BLOG
Engineering The Future
Home
Posts
Tags
About
Privacy
RSS
Home
Posts
Tags
About
Privacy
#evaluation
2개의 글이 있습니다.
llm
2026년 3월 3일
·
4 min read
Part 2. 품질은 Prompt가 아니라 평가 루프에서 나온다
LLM 품질은 문장 튜닝이 아니라 데이터셋, 평가 기준, 온라인 피드백, 회귀 감지 루프로 관리해야 안정화된다.
llm
agent
system-design
evaluation
observability
quality-engineering
Read article
2026년 2월 6일
·
2 min read
벡터 검색 평가 지표 설계
Recall@K, MRR, NDCG를 서비스 맥락에 맞게 해석해 검색 품질을 관리하는 기준
Vector DB
AI
Search
Evaluation
Read article