related iamge

짧은 영상 플랫폼의 저작권 침해, 이제는 AI가 해결한다!

오민우, 박민수, 박은일 연구원팀이 개발한 새로운 딥러닝 파이프라인은 음악 소스 분리 및 크로스 모달 비디오-음악 검색 기술을 활용하여 짧은 영상 플랫폼의 저작권 침해 문제를 해결합니다. OASD-20K 및 OSVAR-160 데이터셋을 통해 검증된 이 기술은 배경 음악을 제거하고 원본 사운드트랙을 복원하여 콘텐츠의 무결성을 보장합니다.

related iamge

혁신적인 10-DOF 바퀴 달린 이족보행 로봇, Whleaper 등장!

중국 연구진이 개발한 10-DOF 바퀴 달린 이족보행 로봇 Whleaper는 혁신적인 힙 관절 설계와 다중 모드 동작 제어 알고리즘을 통해 안정성과 유연성을 극대화했습니다. 실제 환경에서의 다양한 동작 수행 능력을 보여주며, 미래 로봇 기술 발전에 크게 기여할 것으로 기대됩니다.

related iamge

해양 오염, 이제 AI 드론이 책임진다! 획기적인 에지 컴퓨팅 기술 개발

Mohamed Moursi, Norbert Wehn, Bilal Hammoud 연구팀이 드론과 압축된 U-Net 모델을 이용한 해양 오염 모니터링 시스템을 개발했습니다. FPGA 기반 에지 컴퓨팅을 통해 실시간으로 기름 유출을 감지하고 두께를 측정하며, 모델 크기는 기존 대비 269배 감소했지만 IoU는 79%에 달하는 높은 정확도를 보였습니다.

related iamge

GDI-Bench: 시각 및 추론 분리 기반의 범용 문서 지능 벤치마크 등장!

본 기사는 시각 및 추론 분리 기반의 범용 문서 지능 벤치마크인 GDI-Bench의 개발 및 그 성능 평가 결과를 소개합니다. GDI-Bench는 1900개 이상의 이미지와 19개의 문서 특수 작업을 포함하며, 모델의 시각 및 추론 능력을 개별적으로 평가하여 약점을 파악하고 개선 방향을 제시합니다. 연구 결과 GPT-4o 모델은 추론 능력은 뛰어나지만 시각적 능력은 부족한 것으로 나타났으며, 연구진은 파국적 망각 문제를 해결하는 GDI 모델을 제시하였습니다. GDI-Bench와 GDI 모델은 모두 오픈소스로 공개될 예정입니다.

related iamge

딥 강화 학습으로 혼합 현실의 미래를 설계하다: 적응형 3D UI 배치의 혁신

본 기사는 딥 강화 학습을 활용한 혼합 현실(MR) 환경에서의 적응형 3D UI 배치 기술에 대한 최신 연구 결과를 소개합니다. 연구진은 강화 학습을 통해 사용자의 자세와 주변 환경을 고려한 동적인 콘텐츠 배치의 가능성을 보여주었으며, 향후 개인 맞춤형 MR 경험 구축을 위한 중요한 발걸음이 될 것으로 예상됩니다.