주간 기술 뉴스 2026. 04. 25

· 4분 읽기
목차

K8s v1.36 GA | Istio — AI 추론 트래픽을 서비스 메시로 | Claude Design — 텍스트 → 동작하는 UI | 중국 로봇, 인간 하프마라톤 세계기록 돌파 | Gateway API 전환 가속

주간 기술 뉴스 2026년 4월 25일 커버 이미지

지난 주 K8s v1.36 릴리스 임박을 전하고 DRA·HPA Scale-to-Zero 예고편을 다뤘다. 이번 주 그 릴리스가 실제로 나왔다. 같은 주에 Istio는 AI 추론 트래픽 라우팅을 서비스 메시 안으로 끌어들였고, Anthropic은 텍스트 설명만으로 동작하는 UI를 생성하는 도구를 내놨으며, 중국 휴머노이드 로봇은 인간의 하프마라톤 세계기록을 깼다. 인프라 레이어와 AI 도구 레이어 양쪽에서 “개념 검증”에서 “실제 배포”로 전선이 이동하는 주였다.

K8s v1.36 GA — DRA·HPA Scale-to-Zero, 예고에서 현실로

4월 22일 K8s v1.36이 공식 출시됐다.

DRA GA — Dynamic Resource Allocation이 정식 API가 됐다. GPU·TPU 등 이종 자원을 선언적으로 할당하는 메커니즘이다. 같은 시기 NVIDIA가 CNCF에 기부한 GPU DRA 드라이버와 연결되면 GPU 속성(VRAM, 모델명, MIG 프로필) 기반 세밀 스케줄링이 K8s 네이티브로 가능해진다. 지난 주 “NVIDIA DRA 드라이버 CNCF 기증”이 K8s GA와 맞물려 실사용 가능한 조합이 됐다.

HPA Scale-to-Zero 기본 활성화 — 유휴 AI 추론 파드를 0까지 줄일 수 있다. GPU 인스턴스 비용이 핵심인 서빙 환경에서 KServe 같은 프레임워크와 결합하면 모델별 비용 효율 차이가 커진다. 단, Scale-to-Zero는 콜드 스타트 지연을 수반하므로 지연에 민감한 추론 엔드포인트에는 적용 전 확인이 필요하다.

OCI VolumeSource GA — OCI 아티팩트를 볼륨으로 직접 마운트할 수 있다. 모델 파일, 설정 패키지 등을 레지스트리 기반으로 관리하는 흐름과 맞물린다.

Ingress NGINX 공식 은퇴 — Gateway API로의 전환이 공식화됐다. 아직 마이그레이션 계획이 없는 팀은 타임라인을 잡아야 한다. 전환 비용(학습 곡선, 기존 어노테이션 마이그레이션)은 실제로 적지 않으므로 점진적 전환 경로를 먼저 검토하는 것이 현실적이다.

CNCF 경고 — “K8s 단독으로는 LLM 워크로드 보안 불충분”이라는 포지션 페이퍼가 나왔다. 컨테이너 격리 수준으로는 추론 트래픽 격리, 모델 무결성 검증, 런타임 정책을 커버하지 못한다는 내용이다. K8s 보안 경계가 컨테이너에서 추론 트래픽 레벨로 이동하고 있다는 신호다.

Istio — AI 추론 트래픽을 서비스 메시 제어 영역 안으로

KubeCon CloudNativeCon Europe 2026에서 Istio가 AI 인프라 레이어 확장을 발표했다.

Gateway API Inference Extension 베타 — AI 추론 트래픽 라우팅과 관찰을 K8s 네이티브 API로 처리한다. 외부 AI 게이트웨이를 별도로 운영하는 대신, 이미 운영 중인 서비스 메시가 추론 트래픽의 로드밸런싱·정책·가시성을 함께 담당하는 구조다. 아직 베타이므로 프로덕션 도입 전 API 안정성 확인이 필요하다.

Ambient 멀티클러스터 베타 — 사이드카 없이 멀티클러스터 메시를 구성할 수 있다. 클러스터 간 AI 추론 워크로드 분산 시나리오에서 네트워크 오버헤드를 줄이는 방향이다.

agentgateway 실험적 통합 — AI 에이전트 트래픽 전용 게이트웨이 레이어. 아직 실험 단계지만, 서비스 메시가 사람-서비스 트래픽에서 에이전트-서비스 트래픽까지 포괄하는 방향을 보여준다.

AI Agent & LLM

인프라 레이어가 AI 워크로드를 흡수하는 방향으로 움직이는 동안, 그 위에서 동작하는 AI 도구들도 같은 주에 움직였다.

Claude Design (Anthropic Labs) — Opus 4.7 기반으로 텍스트 설명만으로 디자인 시안, 프로토타입, 슬라이드, 실제 동작하는 UI까지 생성한다. v0나 Figma AI 등 기존 도구들이 디자인 시안 수준에 머물던 것에 비해, 동작하는 UI 출력까지 범위를 넓혔다. Gated preview 단계이므로 아직 광범위한 검증이 필요하다.

Claude Mythos (Anthropic) — 사이버보안 특화 모델. 취약점 분석, 위협 탐지에 최적화됐다. 범용 모델을 보안 도메인에 프롬프트로 특화하는 방식과 달리, 사전 훈련 단계부터 보안 도메인에 집중한 모델이다. Gated preview.

OpenAI Codex CLI Realtime V2 — 백그라운드 에이전트 스트리밍을 지원한다. 터미널에서 에이전트가 실행하는 작업을 실시간으로 모니터링할 수 있다. 에이전트 작업이 “블랙박스”에서 “관찰 가능한 프로세스”로 이동하는 흐름이다.

중국 휴머노이드 로봇 하프마라톤 — Honor “Lightning”이 21km를 50분 26초에 완주했다는 보도가 나왔다. 인간 하프마라톤 세계기록(남성 기준 57분대)보다 빠른 수치다. 몇 가지 맥락을 함께 두는 것이 적절하다: 독립 기관의 검증 여부가 불명확하고, 로봇 경기는 인간 대회와 에너지 보충·지형 조건이 다르며, 이 성능이 “AI 소프트웨어 발전”에서 비롯했는지 하드웨어 설계에서 비롯했는지는 구체적 근거가 제시되지 않았다. 단순 속도 수치를 넘어 어떤 기술이 이 결과를 만들었는지는 추가 정보가 필요하다.

Docker & Container

Docker Model Runner 3엔진 체계 — llama.cpp(기본), vLLM(NVIDIA GPU), Diffusers(이미지 생성) 3엔진 구도가 자리잡았다. docker model run 한 줄로 엔진을 선택해 로컬 LLM을 실행하고, OCI 레지스트리 기반 모델 배포와 OpenAI 호환 API를 제공한다. Ollama가 “간편한 로컬 LLM”을 타겟으로 한다면, Docker Model Runner는 “이미 Docker 워크플로우를 쓰는 팀”을 타겟으로 한다. 컨테이너 이미지와 모델을 동일한 레지스트리에서 관리할 수 있다는 점이 차별점이다.

DevOps & GitOps

AI 기반 K8s 운영 자동화 확산 — 이상 감지 → 자동 치유(self-healing) 방향의 도구가 늘고 있다. Pulumi Neo의 자연어 선언, HolmesGPT의 이상 감지 등 AI 운영 보조 레이어가 K8s 클러스터 운영에 통합되는 속도가 빨라지고 있다. 운영자의 역할이 “직접 설정”에서 “AI 생성 설정의 검증”으로 이동하는 흐름이다.

Pulumi Kubernetes Operator 2.0 GA + Pulumi Neo — 자연어 선언으로 K8s 리소스를 관리하는 AI 지원 인프라 도구다. “선언적 인프라”의 입력 형식이 YAML에서 자연어로 확장되는 방향이다.

Gateway API 전환 가속 — Ingress NGINX 은퇴 + Gateway API Inference Extension 베타 출시가 같은 주에 겹쳤다. 기존 Ingress 기반 팀의 전환 압박이 커졌고, AI 추론 트래픽 라우팅까지 Gateway API 범위에 들어왔다. 다만 AWS ALB Ingress, Traefik, HAProxy 등 다른 Ingress 구현체들이 Gateway API를 어떻게 지원하는지, 구현체 간 상호운용성이 얼마나 성숙했는지는 팀별로 확인이 필요하다. “표준화”보다는 “전환 방향이 명확해진 주”로 읽는 것이 현실적이다.

하이라이트

  • K8s v1.36 GA — DRA·HPA Scale-to-Zero가 정식 API로 나왔다. 지난 주 예고된 것들이 실제 배포 가능한 기능이 됐다. Scale-to-Zero 도입 전 콜드 스타트 지연 검토 필요
  • Istio + AI 추론 통합 — Gateway API Inference Extension 베타로 AI 트래픽이 서비스 메시 제어 영역 안으로 들어왔다. 별도 AI 게이트웨이를 운영 중인 팀은 통합 검토 시점이다
  • Claude Design — 텍스트 설명 하나로 동작하는 UI까지 생성한다. Gated preview지만 개발 사이클에서 디자인 단계의 역할이 재정의되는 시작점이다
  • 로봇 피지컬 인텔리전스 — 중국 휴머노이드 로봇이 인간 하프마라톤 세계기록을 돌파했다는 보도. AI 소프트웨어가 하드웨어 퍼포먼스로 전환되는 속도를 보여주는 사례다
  • K8s 보안 경계 이동 — CNCF가 “컨테이너 격리만으로 LLM 워크로드 보안 불충분”을 공식화했다. 추론 트래픽 레벨의 정책·관찰이 새 보안 과제로 부상하고 있다

이어서 읽기