related iamge

Quamba2: 강력하고 확장 가능한 사후 훈련 양자화 프레임워크

Quamba2는 상태 공간 모델(SSM)의 효율적인 양자화를 위한 혁신적인 프레임워크로, 다양한 플랫폼에서 SSM 배포의 가능성을 크게 높입니다. 오프라인 양자화 기법을 통해 속도 향상과 메모리 감소를 달성하면서 정확도 저하는 최소화하여 성능과 효율성을 모두 만족시킵니다.

related iamge

혁신적인 AI 추론 가속화: GammaTune의 등장

Aayush Gautam, Susav Shrestha, Narasimha Reddy 연구팀이 개발한 GammaTune은 토큰 허용률 기반의 적응형 추측 길이 조절 알고리즘으로, LLM 추론 속도를 평균 15% 향상시키는 놀라운 성과를 보였습니다. 훈련이 필요 없는(training-free) 특징과 SpecBench 평가에서의 우수한 성능으로 실제 AI 시스템에 적용 가능성이 매우 높습니다.

related iamge

RobuNFR: 대규모 언어 모델의 비기능적 요구사항(NFR) 인식 코드 생성의 강건성 평가

RobuNFR은 대규모 언어 모델(LLM)의 비기능적 요구사항(NFR) 인식 코드 생성에 대한 강건성을 평가하는 새로운 프레임워크입니다. 프롬프트 변화, 회귀 테스트, 다양한 워크플로우를 통해 LLM의 NFR 처리에 대한 취약점을 밝혀냄으로써, 더욱 안정적이고 신뢰할 수 있는 LLM 기반 소프트웨어 개발에 기여할 것으로 기대됩니다.

related iamge

Gen-AI 기반 자연어 하드웨어 합성: NLS의 등장

Kaiyuan Yang 등 연구팀이 개발한 NLS(Natural-Level Synthesis)는 Gen-AI를 활용하여 자연어를 HDL 코드로 변환하는 혁신적인 하드웨어 합성 기술입니다. 이는 하드웨어 개발 과정을 간소화하고 엔지니어 간 협업을 증진시키며, 성능, 전력, 면적 측면에서 효율성을 높입니다. Visual Studio Code 확장 기능을 통해 Gen-AI 기반 HDL 생성 및 시스템 통합을 지원하여 미래 AI 기반 EDA 도구 개발의 기반을 마련했습니다.

related iamge

정보 이득만으로는 충분하지 않다: 자율 탐사 로봇의 새로운 탐험 전략

본 기사는 자율 탐사 로봇의 효율적인 탐험 전략에 대한 최신 연구 결과를 소개합니다. 정보 이득 극대화가 항상 최선의 전략이 아님을 밝히고, 새로운 휴리스틱 기법을 통해 탐사 경로를 단축하는 방법을 제시합니다.