All Posts
65 articles published
[논문 리뷰] HarnessX — 에이전트 하네스를 실행 트레이스로 진화시키기
Xiaomi 연구진의 HarnessX 논문을 바탕으로, 프롬프트·도구·메모리·제어 흐름으로 구성된 에이전트 하네스를 1급 객체로 만들고 실행 트레이스로 자동 진화시키는 방법을 정리한다.
루프 엔지니어링 — 프롬프트가 아니라 검증 루프를 설계하는 일
Loop Engineering은 에이전트에게 한 번 더 좋은 프롬프트를 쓰는 일이 아니라, 발견·계획·실행·검증·반복 사이클을 시스템으로 설계하는 일이다.
외부 코딩 에이전트를 붙이기 전에 보안 게이트부터 설계하자
GitHub의 third-party coding agent 보안 검증을 계기로, 코딩 에이전트 도입 전 필요한 권한·검증·감사 게이트를 정리한다.
MinSync — 파일이 바뀐 만큼만 다시 인덱싱하기
MinSync는 git 없이 파일 변경을 추적하고, 바뀐 텍스트만 다시 chunking·embedding해서 로컬 vector index를 최신 상태로 유지한다.
[논문 리뷰] HyperTool — 에이전트의 도구 호출 단위를 다시 설계하기
HyperTool은 반복적인 step-wise tool call을 하나의 실행 가능한 도구 단위로 묶어 에이전트의 정확도와 효율을 높인다.
AI에게 기억을 주다: 장기기억 메모리 시스템의 진화
AI 모델의 문맥 길이 한계를 극복하는 3가지 메모리 솔루션 — Supermemory, Mem0, Turbo-graph의 설계 철학과 실무 적용 방법.
AI 엔지니어 필독 논문 10개 — ③ 실무 적용과 학술의 속도 (RAG, LoRA, PEFT)
대형 언어 모델 시대, 학술은 이제 Nature가 아닌 arXiv에서 일어난다. RAG와 PEFT가 어떻게 실무 AI 엔지니어의 필수 무기가 되었는지, 논문 3편으로 정리하기.
AI 엔지니어 필독 논문 10개 — ② NLP 혁명과 멀티모달 (BERT, GPT, ViT, DDPM)
BERT와 GPT로 시작된 언어 모델 시대. 그리고 Transformer를 이미지와 생성 모델로 확장한 ViT와 DDPM이 어떻게 AI 업계를 바꿨는지.
AI 엔지니어 필독 논문 10개 — ① 기초 아키텍처 (Attention, VAE, GANs)
AI 면접 단골 논문 10개를 정리한 시리즈 첫 편. Attention Is All You Need, VAE, GANs가 어떻게 현대 AI의 기초를 다졌는지 이해한다.
RPG 포트폴리오 만들기 — Kaboom.js 픽셀 RPG 단일 페이지
Kaboom.js로 픽셀 RPG 형식의 인터랙티브 이력서를 만들고, NDA를 보호하며 공개하는 프로젝트 만들기
AI 엔지니어 필독 논문 10개 — ③ 실무 적용과 학술의 속도 (RAG, LoRA, PEFT)
큰 모델을 효율적으로 운영하고, 환각을 줄이고, 제한된 리소스에서 학습하는 3가지 실무 기술. 그리고 AI 논문이 Nature/Science를 무시하고 arXiv에서 업계로 직결되는 이유.
[논문 리뷰] DeepSeek-V4 — 1M Context에서 KV Cache 10% 수준으로 압축한 Hybrid Attention
DeepSeek-V4는 기존 Multi-Head Attention의 개념을 바탕으로, Compressed Sparse Attention(CSA)와 Heavily Compressed Attention(HCA)을 결합한 Hybrid Attention으로 1M token context를 지원하면서도 KV cache를 90% 감축했다. 이전 Attention 이해하기 시리즈의 Q/K/V와 Multi-Head Attention 개념을 이어 DeepSeek-V4가 어떻게 구현했는지 살펴본다.
merge냐 rebase냐 — 히스토리를 어떻게 그릴 것인가
merge는 기록, rebase는 재서술. 두 명령의 동작과 황금률(공유 브랜치 rebase 금지), 그리고 팀 규약 패턴 세 가지를 정리한다.
[논문 리뷰] A-RAG: Agentic RAG가 2026년의 기본기가 된 이유
단일 retriever→generator 파이프라인이 한계를 보이는 가운데, 질의 분해·병렬 검색·검증·합성을 에이전트가 분담하는 A-RAG의 계층적 검색 인터페이스를 살펴본다.
[논문 리뷰] EnterpriseRAG-Bench: 사내 지식 RAG 벤치마크
위키·뉴스 데이터에 치우쳐 있던 RAG 벤치마크의 한계를 지적하고, Slack·Gmail·Jira 등 9종 사내 소스를 모사한 50만 문서 규모의 합성 코퍼스와 500개 질문셋을 제안한 논문.
SSH·SCP·Rsync — 원격 접속과 파일 동기화 한 묶음
원격 서버 접속, 키 인증, ~/.ssh/config로 별명 만들기, 포트 포워딩, 그리고 파일 옮기는 scp/rsync까지. 실전에서 매일 쓰는 패턴 위주로 정리.
파일 검색 명령어 정리 — find, grep, fd, ripgrep
터미널에서 '그 파일 어디 있더라'와 '이 단어 어느 파일에 있더라'를 빠르게 해결하는 네 가지 도구 — find, grep, fd, ripgrep을 한 번에 정리한다.
man이 너무 길 때 — tldr로 리눅스 명령어 빠르게 익히기
man 페이지를 끝까지 읽지 않고도 자주 쓰는 옵션 한두 개만 빠르게 확인하고 싶을 때, tldr이 가장 편하다. 설치부터 실전 활용까지 정리.
Markdown 정복기 (2) — 코드, 표, 이미지
Markdown 시리즈 2편. 자주 쓰지만 자주 깨지는 영역 — 코드 블록(언어 지정, 라인 강조), 표(정렬), 이미지(크기·캡션)를 정리한다.
Markdown 정복기 (1) — 기본 문법 한 번에 정리
Markdown 시리즈 1편. 헤딩, 강조, 리스트, 링크, 인용 등 어떤 환경에서도 통하는 기본 문법을 한 번에 정리한다.
[NLP] Transformer 3가지 Attention 자세히 보기 (Encoder/Decoder Self-Attention, Cross-Attention, Multi-Head)
이전 글에서 등장한 Transformer의 3가지 Attention(Encoder Self-Attention, Decoder Masked Self-Attention, Encoder-Decoder Attention)이 각각 어떻게 동작하는지, 그리고 Multi-Head Attention이 왜 필요한지 정리한다.