여행판매원 문제의 혁신: 밴딧 기반 동적 후보 간선 선택 알고리즘


본 논문은 여행판매원 문제(TSP) 해결을 위한 혁신적인 알고리즘을 제시합니다. 멀티암 밴딧 모델을 활용하여 동적으로 후보 간선을 선택함으로써 기존 알고리즘의 한계를 극복하고, 다양한 TSP 벤치마크에서 우수한 성능을 보였습니다. 이 연구는 AI 기반 최적화 알고리즘 개발에 중요한 기여를 할 것으로 예상됩니다.

related iamge

최근 Long Wanga, Jiongzhi Zheng, Zhengda Xiong, ChuMin Li, Kun He 연구팀이 발표한 논문 "Bandit based Dynamic Candidate Edge Selection in Solving Traveling Salesman Problems"은 여행판매원 문제(TSP) 해결에 혁신적인 접근 방식을 제시합니다. TSP는 여러 도시를 방문하고 다시 출발 도시로 돌아오는 최단 경로를 찾는 고전적인 최적화 문제입니다. 기존의 TSP 알고리즘들은, 특히 Lin-Kernighan-Helsgaun (LKH) 알고리즘은, 탐색 과정 내내 고정된 후보 간선 집합만을 사용하는 경향이 있습니다. 이러한 고정된 접근 방식은 알고리즘이 지역적 최적해에 갇히게 만들어 최적의 해를 찾지 못하는 경우가 많았습니다.

연구팀은 이러한 문제를 해결하기 위해 멀티암 밴딧 모델을 도입하여 동적으로 후보 간선을 선택하는 새로운 알고리즘을 제안했습니다. 이는 마치 여러 개의 팔을 가진 밴딧 머신에서, 각 팔(후보 간선)을 당겨(선택하여) 가장 큰 보상(최적 경로에 가까운 선택)을 얻는 전략과 유사합니다. 알고리즘은 각 반복마다 밴딧 모델을 사용하여 가장 유망한 후보 간선을 선택하고, 이를 통해 LKH 알고리즘의 탐색 효율성과 최적해 도달 확률을 크게 높였습니다.

핵심은 고정된 후보 간선이 아닌, 동적으로 변화하는 후보 간선 집합을 사용하여 더 넓은 탐색 공간을 확보하고, 지역적 최적해에 빠지는 것을 방지하는 데 있습니다.

연구팀은 다양한 TSP 벤치마크 데이터셋을 사용하여 실험을 진행했으며, 그 결과 제안된 알고리즘이 기존 LKH 알고리즘보다 훨씬 우수한 성능을 보임을 확인했습니다. 더 나아가, TSP의 여러 변형 문제에 적용되는 LKH-3 알고리즘에도 이 밴딧 기반 방법을 적용하여 성능 향상을 확인했습니다. 이는 제안된 방법의 범용성과 효과를 보여주는 중요한 결과입니다.

이 연구는 TSP 뿐만 아니라 다른 최적화 문제에도 적용 가능한 잠재력을 가지고 있으며, 향후 AI 기반 최적화 알고리즘 개발에 중요한 기여를 할 것으로 기대됩니다. 특히, 동적 후보 선택이라는 새로운 관점을 제시함으로써, 최적화 알고리즘 설계에 대한 새로운 패러다임을 제시했다는 점에서 큰 의미를 지닙니다.


*이 기사는 AI가 생성한 내용으로, 일부 정보가 실제와 다를 수 있습니다. 정확한 확인을 위해 추가적인 검증을 권장드립니다.

Reference

[arxiv] Bandit based Dynamic Candidate Edge Selection in Solving Traveling Salesman Problems

Published:  (Updated: )

Author: Long Wanga, Jiongzhi Zheng, Zhengda Xiong, ChuMin Li, Kun He

http://arxiv.org/abs/2505.15862v1