top of page

SAMSUNG Galaxy S25 vs S26 온디바이스 AI 벤치마크

최종 수정일: 24시간 전


Galaxy S25 vs S26: 온디바이스 AI 성능 반전 결과!

(Snapdragon 8 Elite Gen 1 vs Gen 2)


최신 스마트폰의 AI 성능, 숫자가 높다고 무조건 빠를까요? TecAce에서 진행한 실측 데이터를 통해 Galaxy S25와 S26의 온디바이스 LLM 성능을 전격 비교해 보았습니다.


테스트 개요

  • 비교 기기: Galaxy S25 (Snapdragon 8 Elite) vs Galaxy S26 (Snapdragon 8 Elite Gen 2)


  • 테스트 모델:

    • Gemma3 1B (INT4): 반응 속도 중심의 초경량 모델

    • Qwen2.5 1.5B (Q8): 높은 정밀도의 복잡한 추론 모델

  • 테스트 규모: 총 108회 테스트 (27종 프롬프트, 11개 카테고리 수행)


한눈에 보는 핵심 성능 지표

단순히 S26이 모든 면에서 우세할 것이라는 예상과 달리, 두 기기는 서로 다른 강점을 보였습니다.

지표 (Gemma3 1B 기준)

Galaxy S25

Galaxy S26

결과

평균 레이턴시

5.4s

7.4s

S25 승 (-37.4%) 

첫 토큰 응답 (TTFT)

280ms

238ms

S26 승 (+15.0%) 

텍스트 생성 (Decode TPS)

66.5 tok/s

49.6 tok/s

S25 승 (-25.4%) 

프롬프트 이해 (Prefill TPS)

83.0 tok/s

97.3 tok/s

S26 승 (+17.2%) 

핵심 인사이트: S26은 질문을 이해하는 속도(Prefill)는 압도적으로 빠르지만, 실제 답변을 써 내려가는 속도(Decode)는 S25가 더 빠릅니다.

주요 발견 및 실무 권장 사항

  1. S26의 진짜 강점은 '입력 처리'


특히 Qwen2.5 모델에서 S26의 성능 도약이 두드러졌습니다.

  • 프롬프트 이해 속도: S25 대비 64.2% 향상 

  • 첫 응답 시간(TTFT): 670ms에서 375ms로 44% 단축 

  • 결론: 긴 문장을 입력하거나 복잡한 지시를 내릴 때 S26이 훨씬 쾌적한 반응성을 보여줍니다.


  1. 리소스 사용량은 대동소이


  • 메모리: 두 기기 모두 400MB 내외로 안정적으로 운용 가능합니다.

  • 초기화 시간: S25가 S26보다 약 4~5% 더 빠르게 앱이 실행되는 결과를 보였습니다.


  1. 사용 시나리오별 추천 조합


  • 빠른 채팅/인터랙티브 챗봇: Galaxy S25 + Gemma3 1B 조합이 전체 응답 속도 면에서 가장 유리합니다.

  • 오프라인 고품질 추론: Galaxy S26 + Qwen2.5 1.5B 조합이 긴 컨텍스트 입력과 정밀한 처리에 적합합니다.


최종 결론

"Galaxy S26은 단순히 더 빠른 S25가 아닙니다."  프롬프트 이해는 더 빠르고, 텍스트 생성은 더 느린 고유의 특성을 가지고 있습니다. 사용하려는 서비스의 목적(속도 vs 처리량)에 맞춰 디바이스와 모델을 선택하는 것이 핵심입니다.


자세한 사항은 리포트를 통해 확인해보세요.



댓글


bottom of page