주간 기술 뉴스 2026. 04. 11

· 5분 읽기
목차

Microsoft Agent Framework 1.0 | Velero CNCF Sandbox 편입 | KServe + llm-d 통합 아키텍처 | Claude Code 소스코드 유출 | Okta for AI Agents | Meta KernelEvolve

주간 기술 뉴스 2026년 4월 11일 커버 이미지

AI 에이전트 생태계의 각 레이어에 전문 도구가 등장하기 시작했다. 지난 주 K8s가 AI 인프라 컨트롤 플레인으로 수렴하는 흐름을 전한 바 있는데, 이번 주는 그 위에서 실행되는 에이전트 레이어와 인프라 거버넌스 양쪽에서 움직임이 있었다. Microsoft가 Semantic Kernel과 AutoGen을 하나의 SDK로 통합하고, Okta가 에이전트를 독립 ID 엔티티로 관리하기 시작했으며, Velero와 KServe+llm-d 같은 인프라 도구들은 커뮤니티 거버넌스로 이동하고 있다. 개발(Agent Framework), 보안(Okta), 관측(AgentMon), 런타임(Dapr Agents) — 에이전트를 프로덕션에서 돌리기 위한 퍼즐 조각이 채워지고 있지만, 대부분이 Sandbox나 1.0 초기 단계라는 점은 감안해야 한다.

Microsoft Agent Framework 1.0: Semantic Kernel + AutoGen 통합

Microsoft가 그동안 분산되어 있던 에이전트 도구를 하나로 모았다. Semantic Kernel(엔터프라이즈 LLM 오케스트레이션)과 AutoGen(멀티 에이전트 리서치)을 단일 오픈소스 SDK로 통합한 Agent Framework 1.0을 4월 7일 출시했다.

두 프로젝트가 각각의 커뮤니티를 갖고 있었기 때문에 통합은 쉬운 결정이 아니었을 것이다. 하지만 실무에서 “오케스트레이션은 Semantic Kernel, 에이전트 간 대화는 AutoGen”으로 나눠 쓰는 비용이 컸다. 1.0은 안정적인 API 표면과 엔터프라이즈급 멀티 에이전트 오케스트레이션을 단일 진입점으로 제공한다.

이전에 다룬 LangGraph의 멀티 에이전트 패턴과 비교하면 흥미로운 지점이 있다. LangGraph는 그래프 기반 상태 머신으로 에이전트를 조합하는 반면, Agent Framework는 SK의 커넥터 생태계 위에 AutoGen의 대화 패턴을 올린 구조다. 접근 방식은 다르지만, “멀티 에이전트를 프레임워크 수준에서 관리한다”는 방향은 동일하다.

Velero CNCF Sandbox 편입: Broadcom의 VMware 자산 정리가 커뮤니티에 이득

Broadcom이 VMware 인수 후 Velero를 CNCF에 기부했다(4/2 발표). K8s 백업/복구/마이그레이션의 사실상 표준 도구가 벤더 종속에서 커뮤니티 거버넌스로 전환된 것이다.

Broadcom의 VMware 인수 이후 오픈소스 자산 정리가 이어지고 있는데, Velero의 CNCF 기부는 커뮤니티 입장에서 긍정적인 결과다. 벤더 한 곳의 제품 전략에 도구의 로드맵이 좌우되는 리스크가 줄어들었다. 지난 주 NVIDIA가 GPU DRA 드라이버와 KAI Scheduler를 CNCF에 기증한 것과 같은 맥락으로, 핵심 도구들이 커뮤니티 거버넌스 아래로 모이는 흐름이 이어지고 있다.

다만 Sandbox 단계이므로 거버넌스 구조가 완전히 안착하기까지는 시간이 필요하다. 기존 VMware 엔지니어들의 기여 지속 여부도 지켜봐야 할 변수다.

KServe + llm-d: K8s 네이티브 LLM 추론 표준의 윤곽

KServe(CNCF Incubating)와 지난 주 Sandbox에 합류한 llm-d의 통합 아키텍처가 구체화되고 있다. KServe가 모델 서빙 컨트롤 플레인, llm-d가 분산 스케줄링 레이어를 담당하는 구조다.

핵심은 LLMInferenceService CRD 하나로 선언적 LLM 배포가 가능하다는 점이다. KV-cache 인지 스케줄링, prefill-decode 분리, OpenAI 호환 엔드포인트가 기본 제공된다. GPU 팜을 운영하는 팀이라면 기존 vLLM 단독 배포 대비 스케줄링 효율을 상당히 개선할 수 있다.

물론 llm-d가 아직 Sandbox 초기인 만큼, 프로덕션 적용은 시기상조다. vLLM 단독 배포, SGLang, BentoML 같은 기존 스택이 이미 검증된 프로덕션 레퍼런스를 갖고 있으며, K8s 없는 환경이라면 이들이 더 현실적인 선택이다. KServe+llm-d의 가치는 “이미 K8s를 운영하는 팀”이 추론 워크로드를 선언적으로 관리하고 싶을 때 나타난다. K8s 위에서 LLM 추론을 어떻게 표준화할 것인가에 대한 방향성은 이 조합에서 가장 선명하게 보인다.

Okta for AI Agents: 에이전트를 독립 ID 엔티티로 관리

Okta가 4월 30일 GA를 예고한 AI Agent 전용 ID 관리 기능이 주목할 만하다. AI 에이전트를 사람과 동등한 독립 ID 엔티티로 등록하고, XAA(Cross App Access) 프로토콜로 에이전트-앱 간 OAuth를 확장한다.

Okta가 인용한 배경 수치에 따르면 88% 조직이 에이전트 관련 보안 사고를 경험했지만, 에이전트를 ID로 관리하는 조직은 22%에 불과하다. 다만 이 수치는 Okta 자체 설문 기반이며, “보안 사고”의 정의(실제 침해 vs 시도)와 표본 규모가 공개되지 않았다. 그럼에도 대부분의 에이전트가 서비스 계정이나 개인 API 키로 동작하고 있다는 현실은 실무에서도 체감되는 문제다.

에이전트가 프로덕션에서 자율적으로 동작하려면, 인증/인가가 사람 수준으로 정교해져야 한다. Okta가 이 영역의 첫 번째 엔터프라이즈 솔루션을 내놓았지만, 기존 IAM + 서비스 계정 가드레일이나 SPIFFE/SPIRE 같은 오픈소스 ID 프레임워크도 대안이 될 수 있다. XAA 프로토콜이 업계 표준으로 자리잡을지, Okta 생태계 안에서만 유효할지는 지켜봐야 한다.

Meta KernelEvolve: AI가 AI 인프라를 최적화하는 재귀 루프

Meta가 공개한 KernelEvolve는 AI가 GPU/가속기 커널을 자동 최적화하는 에이전틱 시스템이다. LLM 합성기, Monte Carlo 트리 탐색, RAG를 결합하여 NVIDIA, AMD, MTIA, CPU까지 대응한다.

성과 수치가 인상적이다. Andromeda 광고 모델 추론 60% 향상, MTIA 학습 25% 이상 개선. 기존에 전문 엔지니어가 수 주 걸리던 최적화를 수 시간으로 압축했다.

“AI가 AI를 최적화한다”는 재귀 루프가 현실화되고 있다. 인프라 엔지니어의 역할이 “커널을 직접 튜닝하는 것”에서 “AI 최적화 파이프라인을 설계하고 검증하는 것”으로 전환되는 신호다. 다만 KernelEvolve가 최적화한 커널의 정합성 검증과 회귀 테스트 방법론은 아직 공개되지 않았다.

Claude Code 소스코드 유출: 차세대 기능의 청사진

3월 31일 npm 패키징 오류로 Claude Code 전체 소스가 노출되었다. 512K 라인, 1,900 파일이 공개되면서 미공개 기능과 내부 아키텍처가 드러났다.

발견된 주요 기능들이 흥미롭다.

  • KAIROS — always-on 데몬 모드. autoDream이라는 메모리 정리 메커니즘 포함
  • BUDDY — 터미널 다마고치(상호작용형 터미널 컴패니언)
  • UltraPlan — 고급 계획 수립 기능
  • 음성 모드 — 음성 인터페이스 지원
  • 내부 모델 코드네임 — Capybara(Claude 4.6), Fennec(Opus 4.6)

Claude Code의 ARR이 $2.5B에 달한다는 정보도 함께 노출되었다. AI 코딩 도구 시장의 규모를 가늠할 수 있는 수치다.

KAIROS의 always-on 데몬 모드는 현재의 “요청-응답” 패턴에서 “상시 실행 에이전트” 패턴으로의 전환을 시사한다. 이번 주 다른 뉴스들(Agent Framework, Okta for AI Agents, AgentMon)과 맞물려 읽으면, 에이전트가 일회성 호출이 아니라 장시간 실행되는 프로세스로 진화하는 방향이 업계 전반에서 확인된다.

Nutanix NKP Metal과 Dapr Agents: 엣지에서 에이전트까지

짧게 짚고 넘어갈 두 가지 뉴스가 있다.

Nutanix NKP Metal (4/7) — 베어메탈에서 직접 K8s를 배포하는 기능이다. 하이퍼바이저 없이 GPU 밀집 AI 훈련 워크로드를 운영하거나 엣지 환경에서 K8s를 쓸 때 유용하다. Early Access 단계이며 2026 하반기 GA 예정.

Dapr Agents v1.0 GA지난 주 KubeCon EU에서 전한 바 있는 Dapr Agents가 이번 주 공식 GA에 도달했다. Virtual Actor 모델로 프로세스 크래시에도 상태를 유지하고, scale-to-zero를 지원한다. NVIDIA 협업도 확인되었다. 다만 현재 Python SDK만 지원하며, C#/Java SDK는 미정이다.

Codenotary AgentMon: 에이전트 전용 모니터링의 등장

에이전트가 프로덕션에서 돌기 시작하면 모니터링도 달라져야 한다. Codenotary의 AgentMon은 AI 에이전트 전용 모니터링 도구로, 토큰 사용량, 파일 접근 패턴, 프롬프트 인젝션 시도, 자격증명 유출을 실시간으로 추적한다.

기존 APM(Datadog, New Relic 등)이 HTTP 요청과 인프라 메트릭에 집중하는 반면, AgentMon은 “에이전트가 무엇을 하고 있는가”에 초점을 맞춘다. 프롬프트 인젝션 탐지와 자격증명 유출 모니터링은 에이전트 운영에서 가장 우선순위가 높은 보안 관심사다.

이번 주 실무 체크포인트

  • 확인할 것: Microsoft Agent Framework 1.0 공식 문서. Semantic Kernel이나 AutoGen을 사용 중이라면 마이그레이션 경로 확인. Okta for AI Agents GA(4/30) 전에 에이전트 인증 현황 점검
  • 시도할 것: KServe + llm-d 아키텍처 문서에서 LLMInferenceService CRD 스펙 살펴보기. 현재 vLLM 단독 배포라면 향후 마이그레이션 포인트 파악
  • 지켜볼 것: Claude Code KAIROS/autoDream이 공식 기능으로 출시되는 시점. Meta KernelEvolve의 커널 검증 방법론 공개 여부. Agent Framework의 비-Python 언어 지원 로드맵

이어서 읽기