카파시, 클로드의 17000 단어 시스템 프롬프트서 영감 받은 새 AI 학습법 제안

시스템 프롬프트 학습: 앙드레 카르파티가 제시하는 AI 훈련의 차세대 패러다임 비전

AI 개발 분야의 선두 주자이자 테슬라의 전 AI 책임자였던 앙드레 카르파티는 최근 겉보기에는 단순한 아이디어로 논쟁에 불을 지폈습니다. 그 아이디어는 바로 우리가 거대 언어 모델(LLM)이 학습하는 방식에서 하나의 패러다임 전체를 놓치고 있었을지도 모른다는 것입니다. 그의 제안인 "시스템 프롬프트 학습(System Prompt Learning)"은 더 많은 데이터나 더 깊은 네트워크를 사용하는 것이 아니라, 인간의 기억과 추론을 닮은 편집 가능한 지침을 사용하여 모델을 더 똑똑하게 안내하는 방식을 말합니다.

무대에서 발표하는 앙드레 카르파티, 테슬라와 OpenAI에서의 작업으로 알려져 있다. (ytimg.com)

무차별적인 사전 학습과 비싼 미세 조정을 넘어선 돌파구에 AI 투자가 좌우되는 세상에서, 클로드의 17,000 단어 시스템 프롬프트 뒤에 숨겨진 메커니즘에서 영감을 얻은 이 아이디어는 AI를 더 효율적이고 책임감 있게 확장하는 방법에 대한 중요한 질문을 던집니다.

사전 학습, 미세 조정… 그리고 그 다음은?

현재 AI 훈련 방식은 두 가지 주요 전략이 지배적입니다:

사전 학습: LLM은 방대한 양의 텍스트를 흡수하여 언어와 세상에 대한 일반적인 이해를 발전시킵니다.
미세 조정: 지도 학습 예제나 강화 학습(종종 인간 피드백 기반 강화 학습, RLHF와 연계됨)을 통해 특정 행동이 강화됩니다.

인간 피드백 기반 강화 학습(RLHF)은 AI 모델, 특히 거대 언어 모델을 인간의 선호도에 더 잘 맞추도록 훈련하는 다단계 과정입니다. 이는 인간 피드백(종종 다양한 모델 출력 순위 지정 방식 사용)을 사용하여 보상 모델을 생성하고, 이 보상 모델이 강화 학습을 통해 AI 학습을 안내하는 방식입니다.

두 접근 방식 모두 모델의 내부 매개변수를 변경합니다. 하지만 카르파티는 이러한 방법들이 간과하는 인간 학습 특성을 지적합니다. 우리는 학습할 때 종종 뇌의 구조를 '재배선'하지 않습니다. 우리는 메모를 하고, 명시적인 알림을 스스로에게 남깁니다. 우리는 핵심 구조가 아닌 내부 지침을 변경함으로써 적응합니다.

시스템 프롬프트 학습은 이러한 원칙을 차용합니다. 그래디언트를 사용한 가중치 편집 대신, 작업 전반에 걸쳐 모델의 행동을 형성하는 지속적인 지침 세트인 모델의 시스템 프롬프트를 편집할 것을 제안합니다. 이 프레임워크 내에서 LLM은 이론적으로 개인 노트북을 사용하는 것처럼 자체 문제 해결 전략을 작성하고, 다듬고, 업데이트할 수 있습니다.

클로드의 17,000 단어 매뉴얼: 변화의 불꽃

카르파티의 제안은 이론에 그치지 않았습니다. 이는 실제 사례, 즉 시스템 프롬프트가 거의 17,000 단어에 달하는 앤트로픽의 클로드 모델에 의해 촉발되었습니다. 이 초대형 프롬프트는 도덕적 경계(예: 저작권 있는 노래 가사 피하기)부터 질문에 답하는 상세한 전략(예: strawberry와 같은 단어의 글자 수 세는 법)까지 모든 것을 담고 있습니다. 클로드 전체 시스템 프롬프트는 여기에서 볼 수 있습니다.

표 1: 클로드 시스템 프롬프트 특징 및 구성 요소

특징	세부 내용
크기	약 16,739 단어 (110kb)
토큰 길이	보고된 바에 따르면 약 24,000 토큰
비교	OpenAI의 o4-mini보다 훨씬 큼 (2,218 단어, 15.1kb)
핵심 구성 요소
현재 정보	대화 시작 시 날짜 및 문맥 정보 제공
행동 지침	응답 형식 및 상호 작용 스타일에 대한 지침
역할 정의	클로드의 정체성 및 운영 매개변수 설정
도구 정의	가장 큰 구성 요소; MCP 서버에서 도구 사용 지침
안전 매개변수	잠재적으로 유해한 요청 처리 지침
기술 지침	단어/글자 수 세기 및 형식 지정 지침
목적	LLM이 사용자와 상호 작용하는 방식에 대한 "설정" 역할
개발	사용자 피드백 및 설계 개선에 따라 주기적으로 업데이트됨

앤트로픽은 비효율적이고 유연하지 않으며 비용이 많이 들 수 있는 가중치에 지식을 하드코딩하는 대신, 시스템 프롬프트를 동적인 지침 세트로 사용하고 있는 것으로 보입니다. 카르파티에 따르면, 이는 인간이 "X가 발생하면 Y 방법을 시도하라"고 명시적으로 말함으로써 조정하는 방식과 유사합니다.

이러한 변화는 시스템 프롬프트를 정적인 행동 지침에서 살아있는 문서로 재구성합니다. 즉, LLM이 일반화된 전략을 저장하고 시간이 지남에 따라 수정할 수 있는 공간입니다. 결과적으로 이는 AI를 단순히 더 똑똑하게 만드는 것이 아니라 더 가르치기 쉽게 만들자는 제안입니다.

왜 이것이 투자자와 개발자에게 중요한가

시스템 프롬프트 학습의 매력은 단순히 학문적인 데 그치지 않습니다. 이는 현재 AI 활용의 핵심 문제점을 직접적으로 다루고 있습니다:

1. 운영 비용 절감

모델을 미세 조정하는 것, 특히 RLHF를 사용하는 것은 비용이 많이 들고 느립니다. 그러나 시스템 프롬프트를 업데이트하는 것은 거의 무료이며 즉각적입니다. 핵심 행동을 가중치를 재훈련하는 대신 지침을 업데이트하여 변경할 수 있다면, 배포는 더 빠르고 저렴해집니다.

AI 모델 업데이트 방법: 미세 조정/RLHF vs. 시스템 프롬프트 편집

방법	비용 및 노력	구현 시간	주요 특징
미세 조정 / RLHF	높음: 컴퓨팅 자원, 데이터, ML 전문 지식 필요	김 (몇 일~몇 주)	작업/도메인 정확도를 위한 모델 가중치 업데이트; 훈련 후 유연성 저하
프롬프트 편집	낮음: 주로 프롬프트 설계/테스트	짧음 (몇 시간~몇 일)	지침을 통한 행동 조정; 빠르고 유연하며 재훈련 불필요
일반 참고 사항	비용은 모델 크기, 토큰, 인프라에 따라 다름	지속적인 유지보수	목표, 자원, 필요한 성능에 따라 선택; 결합하여 사용 가능

2. 더 민첩한 AI 제품

도메인별 에이전트(법률 챗봇, 의료 보조 봇, 고객 서비스 도구)를 개발하는 스타트업은 빠른 반복이 필요합니다. 시스템 프롬프트를 사용하면 모델을 재훈련하지 않고도 신속하게 변경할 수 있어 운영 환경에서의 적응성이 높아집니다.

3. 데이터 효율성 및 피드백 루프

전통적인 미세 조정은 대규모 데이터셋을 필요로 합니다. 시스템 프롬프트 학습은 더 고차원적인 피드백 채널을 제공합니다. 스칼라 보상을 위해 최적화하는 대신, 인간이 지침을 주는 방식과 더 유사한 더 풍부하고 텍스트 기반 피드백을 가능하게 합니다.

전문가들의 의견

이 아이디어는 AI 커뮤니티 내에서 엇갈린 반응을 얻었습니다:

지지자들은 시스템 프롬프트를 기본 지침을 정의하는 문서화된 토라에 비유하며, 새로운 사례는 구전 토라처럼 상호 작용 학습을 통해 적응하고 확장된다고 말합니다.
비판론자들은 확장성과 복잡성에 대해 우려합니다. 프롬프트가 커지면서 취약해지거나, 일관성이 없거나, 모순될 위험이 있습니다. 이는 중요한 애플리케이션에서 신뢰성을 훼손할 수 있습니다.
일부는 하이브리드 접근 방식을 지지합니다: 시스템 프롬프트 지식을 가중치로 주기적으로 "증류"하여, 인간이 그러하듯 AI가 시간이 지남에 따라 명시적인 지식에서 습관적인 지식으로 이동하도록 하는 방식입니다.
다른 이들은 메모리 계층 구조를 실험하고 있습니다. 모델이 문제 해결 사례를 색인화하고 필요할 때만 프롬프트 컨텍스트로 가져오는 방식인데, 이를 검색 증강 생성(RAG) 및 계획 도구와 결합합니다.

검색 증강 생성(RAG)은 거대 언어 모델(LLM)이 생성하는 답변을 개선하기 위해 설계된 AI 아키텍처입니다. 먼저 외부 지식 소스에서 관련 정보를 검색한 다음, 이 컨텍스트를 LLM에 제공하여 더 정확하고 관련성 있으며 최신 상태인 응답을 생성합니다.

잠재력에도 불구하고, 일부는 시스템 프롬프트 학습을 패러다임 전환이 아닌 점진적인 진화로 봅니다. 그러나 앤트로픽, OpenAI, 구글과 같은 회사들이 시스템 프롬프트 크기에서 극명하게 차이를 보인다는 점(클로드의 16,739 단어 vs. OpenAI의 약 2,218 단어)을 고려할 때, 프롬프트가 새로운 개척지가 되고 있음은 분명합니다.

앞으로의 발전 방향

만약 LLM이 학습한 내용, 테스트된 전략, 개선된 작업을 문서화하며 자체 시스템 프롬프트를 자율적으로 작성하고 업데이트할 수 있다면, 우리는 새로운 AI 학습 아키텍처의 탄생을 목격할 수 있습니다:

자체 매뉴얼을 수정하며 운영 환경에서 진화하는 자체 개선 에이전트
새로운 도메인을 위해 광범위한 재훈련이 필요 없는 작업 전문 모델
프롬프트 기반 지식이 선택적으로 장기 가중치로 이동하여 유연성 손실 없이 성능을 개선하는 반자동 증류

이는 기업의 요구사항, 즉 해석 가능하고, 추적 가능하며, 최소한의 가동 중단 시간으로 점진적으로 학습 가능한 모델과 잘 부합할 수 있습니다.

기계를 위한 노트북

카르파티의 아이디어가 추상적으로 들릴 수 있지만, 이는 깊은 직관을 활용합니다: 지능은 우리가 무엇을 아는지에 관한 것만이 아니라, 그 지식을 사용하기 위해 어떻게 구조화하는지에 관한 것입니다. 시스템 프롬프트 학습은 LLM이 더 큰 뇌뿐만 아니라 더 나은 노트북이 필요하다는 것을 시사합니다.

더 많은 AI 회사들이 사전 학습과 미세 조정 사이의 이 중간 지대를 탐구함에 따라, 프롬프트 엔지니어링은 곧 그 자체의 학문인 프롬프트 아키텍처로 발전할 것으로 예상됩니다. 이것이 다음 패러다임이 될지 아니면 강력한 보조 수단이 될지는 아직 지켜봐야 합니다.

하지만 한 가지는 분명합니다: 더 스마트하고, 저렴하며, 더 제어 가능한 AI를 구축하기 위한 경쟁에서, 모델에게 학습 방법을 가르치는 것이 그들이 무엇을 아는지보다 곧 더 중요해질 수 있습니다.