AWS에서 2025년 12월 발표한 Amazon Nova 2 Lite는 Amazon Bedrock 기반의 빠르고 비용 효율적인 추론(reasoning) 모델입니다. 본 문서는 모델 설정부터 Bedrock 연동, 실제 API 호출까지 실무에서 바로 적용 가능한 기술 가이드를 중심으로 구성했습니다.

1. Nova 2 Lite 개요
Nova 2 Lite는 아래 특징을 가진 경량형 reasoning 모델입니다.
- 빠른 추론 속도 및 비용 효율을 목표로 최적화됨.
- 기본적으로 단계별 reasoning(Extended Thinking) 기능 비활성화 상태로 빠르게 응답함. 필요 시 활성화해 분석 깊이/비용/속도 균형 조정 가능.
- 텍스트, 이미지, 비디오, 문서 입력을 지원하며, 1,000,000 토큰 규모의 컨텍스트 창을 제공합니다.
- Web grounding과 Code interpreter 같은 도구 도입 지원으로 활용 범위를 확장할 수 있습니다.
- 문서 처리, 챗봇, 자동화 등 일상 AI 워크로드에 적합합니다.
2. 사전 준비
2.1 AWS Bedrock 접근 권한 확보
Nova 2 Lite는 Amazon Bedrock 서비스를 통해 사용할 수 있습니다. 따라서 다음 작업이 필요합니다:
- Bedrock 사용 권한이 있는 IAM 사용자/역할 생성
- AmazonBedrockReadOnly 및 AmazonBedrockFullAccess 등 Bedrock API 호출 권한 포함.
- AWS SDK(예: Boto3) 사용 환경 설치
- Python 예시: pip3 install boto3
- AWS CLI 설정 완료 (aws configure)
- Bedrock은 일부 리전에서만 활성화되어 있음을 사전에 확인합니다.
2.2 Bedrock 콘솔에서 모델 확인
- AWS 콘솔 로그인 → Amazon Bedrock 서비스 선택
- Chat/Text Playground 접근
- 모델 목록 중 amazon.nova-2-lite-v1:0 선택
이 단계에서 간단한 프롬프트를 입력해 응답을 확인함으로써 Bedrock과 Nova 2 Lite 설정이 정상적인지 먼저 확인합니다.
3. AWS SDK를 통한 호출 가이드
3.1 파이썬 예제 코드
AWS Python SDK(Boto3)를 활용해 Nova 2 Lite 모델을 호출하는 기본 예제입니다:
import boto3
import json
AWS_REGION = "us-east-1"
MODEL_ID = "amazon.nova-2-lite-v1:0"
bedrock = boto3.client("bedrock-runtime", region_name=AWS_REGION)
response = bedrock.converse(
modelId=MODEL_ID,
messages=[{
"role": "user",
"content": [{"text": "서울에서 부산까지 가장 빠른 경로를 추천해줘"}]
}],
additionalModelRequestFields={
"reasoningConfig": {
# 기본 상태는 비활성. 활성화 시 low/medium/high 중 선택 가능
"type": "enabled",
"maxReasoningEffort": "low"
}
}
)
# 응답 처리
for block in response["output"]["message"]["content"]:
if "text" in block:
print("답변:\n", block["text"])
핵심 포인트:
- additionalModelRequestFields.reasoningConfig로 추론 포인트(extended thinking) 제어가 가능.
- low, medium, high 설정에 따라 심층 분석 수준 및 비용/속도가 달라집니다.
4. Extended Thinking 설정 이해
Nova 2 Lite는 Extended Thinking 모드를 통해 multi-step reasoning이나 task decomposition을 수행할 수 있습니다. 기본적으로 비활성화 상태로 빠른 응답을 제공하고, 필요 시 활성화하여 다음과 같은 선택이 가능합니다.
| 설정 | 값 설명 |
| disabled | 기본 응답 중심, 빠른 응답 지향 |
| low | 가벼운 multi-step reasoning |
| medium | 중간 수준 reasoning |
| high | 깊은 reasoning 및 복잡한 작업 분석 |
이 설정을 통해 속도/정확도/비용 간 밸런스를 조정할 수 있습니다.
5. Bedrock Playground 활용
Bedrock Chat/Text Playground를 활용하면 별도 코드 없이 모델을 테스트할 수 있습니다:
- 모델 선택: amazon.nova-2-lite-v1:0
- 프롬프트 입력
- Extended Thinking 옵션 설정
- Web grounding, Code interpreter 도구 사용 여부 선택
Playground에서 빠르게 실험하여 어떤 설정이 실제 워크로드에 맞는지 먼저 파악합니다.
6. 활용 시나리오
6.1 챗봇 및 고객 상담
Nova 2 Lite는 빠르고 비용 효율적인 추론 모델 특성 상 고객 대응 자동화 챗봇에 적합합니다:
- 사용자가 입력한 질문 → 빠른 응답 생성
- 필요 시 reasoning depth를 low/medium으로 조절
6.2 문서 처리 및 분류
텍스트/문서 입력 기반 파이프라인에서:
- 문서 요약
- 핵심 단어 추출
- 분류/태깅
같은 전처리/후처리 작업에 적용 가능하며, 1M 토큰 컨텍스트 창 덕분에 긴 문서도 한 번에 처리할 수 있습니다.
6.3 코드 생성 및 분석 보조
Nova 2 Lite에는 Code interpreter 도구 지원이 있어 단순 코드 생성 외에도:
- 코드 분석
- 간단한 디버깅 가이드
- 패턴 기반 코드 생성
같은 개발 생산성 보조에도 활용 가능합니다.
7. 성능/비용 고려
Nova 2 Lite는 경량 reasoning 모델로서 가격 대비 성능을 최적화한 옵션입니다. 벤치마크 기준으로 여타 경쟁 모델과 비교했을 때 높은 가성비를 보인다고 AWS가 설명하고 있습니다.
- 빠른 응답 및 비용 효율 최적화
- AWS Bedrock 내에서 직접 사용
- Web grounding·Code interpreter 같은 부가 기능 제공
8. 테스트 및 검증
8.1 응답 속도 및 정확도
실제 응답 테스트를 통해 다음 점을 검증합니다:
- Extended Thinking On/Off에 따른 응답 시간 변화
- 복잡 질문에 대한 reasoning 블록 포함 응답
- 코드 예제 생성을 통한 정확도 확인
8.2 권한 및 보안
- Bedrock 권한 설정
- IAM 역할이 Bedrock API 호출 가능 여부
- VPC / 프라이빗 환경 요구 여부 확인