Technology

LRM

LRM은 대화형 AI 서비스의 운영 비용을 혁신적으로 절감하는 핵심 기술입니다.

Function Calling

필요한 맥락만 선별해
토큰을 최소화합니다

함수 호출 방식을 통해 사용자와의 대화 맥락을 RAG로 자동 처리하여, 긴 대화에서도 최소한의 토큰만 사용하도록 최적화합니다. 기존 방식에서는 대화가 길어질수록 이전 맥락을 모두 유지하기 위해 토큰 사용량이 기하급수적으로 증가했지만, LRM은 필요한 맥락만 선별적으로 유지하여 비용을 대폭 절감합니다.

이는 챗봇, 모델스토어, 봇스토어, POUL 챗봇 등 모든 대화형 서비스에서 직접적인 비용 절감으로 이어져, 더 경쟁력 있는 가격 정책과 높은 수익 마진을 동시에 확보하게 합니다.

Before — 토큰 누적기존 방식: 컨텍스트가 누적되며 토큰 사용량이 폭증하는 모습
After — 선별 유지LRM: 중요한 토큰만 선별 유지하는 모습
Token Usage

대화가 길어져도 토큰은 가볍게

대화 턴이 누적될 때 토큰 사용량이 어떻게 달라지는지 비교했습니다.

Before · 기존 방식

매 턴마다 전체 맥락을 다시 전달 — 토큰 사용량이 누적되어 급증

1
2
3
4
After · LRM

필요한 맥락만 선별 유지 — 대화가 길어져도 토큰을 일정하게 절제

1
2
3
4
Cost Saving

비용 절감 효과

대량 사용자일수록 큰 효과

대량의 사용자를 보유한 서비스일수록 비용 절감 효과가 기하급수적으로 증가합니다.

가격 경쟁력 강화

직접적인 비용 절감으로 더 경쟁력 있는 가격 정책과 높은 수익 마진을 동시에 확보합니다.

고객 경험 향상

동일한 예산으로 더 많은 AI 서비스를 이용하거나, 더 저렴한 비용으로 고품질 AI 경험을 누립니다.

POUL

AI에 편리함을 더하다. 클라우드가 아닌 당신의 기기에서 작동하는 온디바이스 AI 플랫폼.

POUL Inc.

사업자 등록번호
742-87-00901
전화
+82 (0)70 4175 6239
팩스
+82 (0)31 221 3838
운영시간
09:00 – 18:00 (점심 12:30 – 13:30)

© 2025 POUL Inc. All rights reserved.

GitHubNotionInstagramYouTube
POUL | On-Device AI Platform