언어 모델보다 더 중요한 트렌드? – AI Agent

AI는 최근 들어 많은 발전을 이루었습니다. 기존의 AI는 간단하고 반복적인 작업을 보조하는 역할을 수행했지만, 더 복잡한 업무에 필요한 능력은 부족했습니다. AI Agent는 한 단계 더 발전한 AI로 위와 같은 차이를 줄여줄 수 있는 역할을 합니다. 이번 포스트에서는 이런 AI Agent에 대해 알아보겠습니다.
Nov 08, 2024
언어 모델보다 더 중요한 트렌드? – AI Agent

1. AI 에이전트(AI Agent)란?

AI 에이전트는 사용자의 개입이 거의 없거나 전혀 없이 복잡한 워크플로우를 이해하고, 목표를 추구하도록 설계된 AI 시스템입니다. AI 에이전트는 자연어로 제공된 명령을 파악하고 직접 목표 설정을 합니다.

또한 LLM과 RAG를 포함한 다양한 기술을 활용해 추론 및 실제 행동을 수행할 수 있습니다. 즉, 기존의 AI가 채팅창에서만 이루어졌다면, 직접 사용자를 대신하여 행동할 수 있는 AI입니다.

1-1. 구성 요소

AI Agent의 구성요소
출처 : https://www.superannotate.com/blog/llm-agents

에이전트/브레인 : 각 에이전트의 핵심에는 LLM이 있으며, 프롬프트를 통해 특정 역할과 목표, 사용할 도구 등을 지시받습니다.

메모리 : 단기 메모리는 현재 대화의 맥락 정보를, 장기 메모리는 과거 대화 기록 및 학습 정보를 저장합니다.

계획 : 복잡한 작업을 작은 하위 작업으로 분할하고, 각 하위 작업에 대한 계획을 수립하고 실행하며, 필요에 따라 계획을 수정합니다.

도구 활용 : DB, API, 코드 실행 환경, 웹 검색 엔진 등 외부 도구를 활용하여 작업을 수행합니다.

2. 에이전트 워크플로우

앤드류 응 (Andrew Ng) 교수는 올해 초 한 컬럼을 통해 에이전트 워크플로우의 중요성에 대해 언급하고, 차세대 기반 모델보다 더 중요한 트렌드가 될 것을 예상했습니다. 해당 컬럼을 중심으로 에이전트 워크플로우의 개념과 이점을 살펴보겠습니다.

2-1. 개념

오늘날 우리는 대부분 제로샷으로 LLM을 사용하여 모델이 작업을 수정하지 않고 바로 최종 결과물을 생성하도록 합니다. 이는 마치 누군가에게 에세이 작성을 하는 동안 처음부터 끝까지 백스페이스를 허용하지 않고 고품질의 결과물을 기대하는 것과 비슷합니다. 이러한 어려움에도 불구하고 LLM은 이 작업을 놀라울 정도로 잘 해냅니다.

하지만 에이전트 워크플로우를 사용하면 LLM에게 문서를 여러 번 반복하도록 요청할 수 있습니다.

예를 들어 다음과 같은 일련의 단계가 필요합니다.

1. 개요를 계획합니다.

2. 더 많은 정보를 수집하기 위해 어떤 웹 검색이 필요한지 결정합니다.

3. 초안을 작성합니다.

4. 초안을 다시 읽어보고 근거 없는 주장이나 관련 없는 정보를 찾아냅니다.

5. 발견된 약점을 고려하여 초고를 수정합니다.

6. 이 과정을 반복합니다.

이러한 반복적인 과정은 대부분의 인간 작가가 좋은 글을 쓰기 위해 꼭 필요한 과정입니다. AI를 사용하면 이러한 반복적인 워크플로우를 통해 한 번에 작성하는 것보다 훨씬 더 나은 결과를 얻을 수 있습니다.

에이전트 워크플로우는 AI 에이전트가 스스로 계획, 실행, 자기반성, 수정 등의 단계를 거치며 작업을 수행하는 방식입니다. 인간의 사고방식과 유사한 방식으로 AI 에이전트가 직접 계획을 세우고 툴을 활용하여 작업을 수행하며 반복적인 수정 작업을 통해 더욱 정확도 높은 결과물을 도출할 수 있습니다.

2-2. 이점

더 낮은 모델로도 더 높은 수준의 결과물 도출

AI Agent-더 낮은 모델로도 더 높은 수준의 결과물 도출
출처 : https://www.deeplearning.ai/the-batch/how-agents-can-improve-llm-performance/

앤드류 응 교수의 컬럼에 따르면 GPT-3.5 (제로샷)을 활용한 작업에는 48.1%의 정확도를 보이며, GPT-4(제로샷)을 활용한 작업에는 67.0%의 정확도를 보였습니다. 그러나 에이전트 워크플로우를 활용한 GPT-3.5에서는 최대 95.1%의 정확도를 보이며, GPT-3.5 모델로도 GPT-4보다 더 높은 수준의 결과물을 얻을 수 있다는 연구 결과를 제시했습니다.

다양한 회사의 모델 활용

여러 에이전트의 작업에 각각 최적화된 다양한 회사의 모델을 조합해서 활용이 가능합니다. 예를 들어, 전체 관리는 GPT-4, 한국어 글쓰기는 네이버 하이퍼클로바, 평가는 Claude 모델을 사용하는 방법으로 작업의 정확도를 더 높일 수 있습니다.

3. 멀티 에이전트 LLM 시스템

AI Agent-멀티 에이전트 LLM 시스템
출처 : https://www.superannotate.com/blog/llm-agents

3-1. 개념

멀티 에이전트 LLM 시스템은 특정 역할을 전문으로 수행하도록 설계된 여러 LLM 에이전트들이 협력하여 복잡한 문제를 해결하는 시스템입니다. 각 에이전트는 특정 작업에 최적화되어 있으며, 필요에 따라 정보를 교환하고 작업을 조율하며 공동의 목표 달성을 위해 협력합니다.

에이전트 워크플로우와 멀티 에이전트 LLM 시스템은 유사해 보이지만 차이가 있습니다. 간단히 말해 에이전트 워크플로우는 AI 에이전트가 작업을 수행하는 방식을 의미하고, 멀티 에이전트 LLM 시스템은 여러 AI 에이전트가 협력하여 작업을 수행하는 시스템 자체를 의미합니다.

에이전트 워크플로우는 인간의 사고방식과 유사한 방식으로, 반복적으로 AI 에이전트가 작업을 수행하는 방식이며, 기존 LLM의 단일 프롬프트에 대한 즉각적인 응답 대신, 계획, 실행, 자기반성, 수정 등의 단계를 거쳐 작업을 수행합니다. 이에 반해 멀티 에이전트 LLM 시스템은 여러 AI 에이전트가 각자의 역할과 전문성을 가지고 협력하여 작업을 수행하는 시스템이라는 특징이 있습니다. 각 에이전트 간 서로 정보를 교환하고 서로 피드백하여 공동 목표를 달성하죠.

에이전트 워크플로우는 멀티 에이전트 LLM 시스템에서 각 에이전트가 작업을 수행하는 방식으로 활용될 수 있습니다.

3-2. 작동 방식

1. 사용자는 멀티 에이전트 LLM 시스템에 작업을 요청합니다.
2. 시스템은 작업을 분석하고 여러 하위 작업으로 분할합니다.
3. 각 하위 작업을 해당 작업에 특화된 에이전트에게 할당합니다.
4. 각 에이전트는 LLM을 사용하여 하위 작업을 수행하고 결과를 생성합니다.
5. 에이전트들은 필요에 따라 다른 에이전트와 정보를 교환하고 작업을 조율합니다.
6. 모든 하위 작업이 완료되면 시스템은 결과를 통합하여 사용자에게 제공합니다.

3-3. 활용 사례

AI가 음악산업에 미칠 영향에 대한 칼럼 작성

"AI가 음악 산업에 미칠 영향"에 대한 글을 작성하는 경우 다음과 같은 에이전트들이 협업할 수 있습니다.

A. 전체 관리자 AI 에이전트 : 전체 작업 계획 수립 및 관리, 다른 에이전트들에 작업 할당 및 감독

B. 작성자 AI 에이전트 : 주어진 주제에 대한 글 작성 및 수정

C. 평가자 AI 에이전트 : 작성된 글에 대한 평가 및 개선점 제안

Image-to-Music

이미지를 입력받아 음악을 생성하는 AI 시스템 구축에 에이전트 워크플로우를 적용할 수 있습니다. 각 에이전트는 아래와 같이 역할이 할당될 수 있습니다.

A. 이미지 분석 에이전트 : 이미지를 분석하여 텍스트 형태로 설명 생성

B. 프롬프트 생성 에이전트 : 텍스트 설명을 바탕으로 음악 생성 AI 모델에 입력할 프롬프트 생성

C. 음악 생성 에이전트 : 프롬프트를 기반으로 음악 생성

3-4. 단일 에이전트 LLM 대비 이점

  • 정확성 향상 및 환각 현상 감소: 여러 에이전트가 상호 검증을 통해 결과물의 정확성을 높이고 환각 현상을 줄일 수 있습니다.

  • 확장된 맥락 처리: 작업을 분담하여 처리함으로써 단일 에이전트 LLM의 제한적인 컨텍스트 창 문제를 극복할 수 있습니다.

  • 효율성 및 멀티태스킹: 병렬 처리를 통해 여러 작업을 동시에 수행하여 효율성을 향상시킵니다.

  • 협업 능력: 다양한 전문성을 가진 에이전트들의 협업을 통해 복잡하고 다면적인 문제 해결에 효과적입니다.

3-5. 주요 프레임워크

  • AutoGen (Microsoft): 다양한 대화 패턴을 가진 AI 에이전트 구축을 위한 프레임워크

  • LangChain: 다양한 AI 구성 요소를 연결하여 복잡한 AI 애플리케이션을 구축하기 위한 프레임워크

  • LangGraph (LangChain): 순환적인 LLM 워크플로우 생성에 특화된 프레임워크

  • CrewAI: 실제 운영 환경에 적합한 AI 에이전트 팀 구축을 위한 프레임워크

  • AutoGPT: 장기간 지속되는 작업에 적합하며, 컨텍스트 이해 및 메모리 관리 기능이 뛰어난 프레임워크

  • MindSearch: GPT, Claude, InternLM 등 다양한 LLM을 활용하여 자체 검색 엔진 구축을 위한 오픈소스 프레임워크

  • Hierarchical multi-agent RL: 계층적 구조를 가진 작업에서 에이전트 간 조정 학습에 효과적인 강화 학습 프레임워크

  • Haystack: 질문 답변, 의미 검색 등 자체 데이터 분석에 특화된 프레임워크

4. 결론

에이전트 워크플로우와 멀티 에이전트 LLM 시스템은 AI 분야의 게임 체인저가 될 가능성이 있습니다. 기업은 이러한 기술들을 활용하여 하이퍼오토메이션을 구현하고 업무 효율성을 획기적으로 향상시킬 수 있습니다.

또한 저희 고객DX솔루션팀에서 서비스 중엔 RPA 솔루션 AntBot과 AI 에이전트를 결합하면 더욱 강력한 자동화 솔루션을 제공할 수 있을 것으로 예상됩니다. RPA와 AI 에이전트, 이 두 가지 기술의 융합이 일상과 업무에 어떤 변화를 가져올지 기대하며 글을 마칩니다.

Share article
Subscribe to our newsletter

More articles

See more posts

ICT사업본부 블로그