[논문 리뷰] Do Language Models Need Sleep? — 긴 컨텍스트를 잠자는 동안 정리하는 법
LLM이 긴 컨텍스트를 계속 들고 있는 대신, 오프라인 recurrent pass로 fast weights에 기억을 정리하면 온라인 추론 지연을 늘리지 않고 깊은 reasoning 성능을 높일 수 있다는 논문을 정리한다.
Series · 논문 리뷰 · #11
SeongYeon · AI Engineer
LLM · 논문 리뷰 · 프로젝트 회고를 쓰고 공유합니다.
📍Now ·최근엔 “[논문 리뷰] Do Language Models Need Sleep? — 긴 컨텍스트를 잠자는 동안 정리하는 법”에 대해 쓰고 있어요LLM이 긴 컨텍스트를 계속 들고 있는 대신, 오프라인 recurrent pass로 fast weights에 기억을 정리하면 온라인 추론 지연을 늘리지 않고 깊은 reasoning 성능을 높일 수 있다는 논문을 정리한다.
Series · 논문 리뷰 · #11
Xiaomi 연구진의 HarnessX 논문을 바탕으로, 프롬프트·도구·메모리·제어 흐름으로 구성된 에이전트 하네스를 1급 객체로 만들고 실행 트레이스로 자동 진화시키는 방법을 정리한다.
Loop Engineering은 에이전트에게 한 번 더 좋은 프롬프트를 쓰는 일이 아니라, 발견·계획·실행·검증·반복 사이클을 시스템으로 설계하는 일이다.
GitHub의 third-party coding agent 보안 검증을 계기로, 코딩 에이전트 도입 전 필요한 권한·검증·감사 게이트를 정리한다.