
인간의 시각 시스템은 한눈에 사물을 인식하고, 복잡한 환경에서도 중요한 정보를 빠르게 선별하는 능력을 갖고 있다.
이에 비해 AI의 합성곱 신경망(CNN)은 작은 정사각형 필터로 이미지를 쪼개 분석하는 구조로, 적은 연산으로도 잘 작동하지만 넓게 파악하거나 서로 떨어진 정보의 관계를 이해하는 데 한계가 있다.
또 이를 보완한 비전 트랜스포머는 막대한 연산량과 대규모 데이터세트가 필요해 실용성에 제한이 있다.
뇌 시각처리 모방한 AI 이미지 인식기술
기초과학연구원(IBS) 이창준 인지및사회성연구단장 연구팀이 연세대 송경우 교수팀과 공동으로 뇌의 시각피질이 시각정보를 선별해 처리하는 방식을 응용, 인공지능(AI)의 이미지 인식능력을 향상시키는 기술을 개발했다.
공동연구팀은 뇌의 시각피질이 시각정보를 선택적으로 처리하는 방식에 주목했다.
인간의 시각피질은 모든 정보를 똑같이 처리하지 않고 눈에 띄는 특징이나 중요한 부분에 집중해 선택적으로 반응하는데, 이 과정에서 뉴런은 넓은 범위를 부드럽게 감지하면서 꼭 필요한 정보에만 선택적으로 반응하는 구조를 갖는다.
연구팀은 이 방식을 AI에 적용해 CNN 모델의 성능을 크게 높이는 ‘Lp-컨볼루션’ 기술을 제안했다.

Lp-컨볼루션은 AI가 이미지를 분석할 때 사람처럼 핵심 정보를 우선 파악토록 설계된 기술이다.
여기에 적용된 지도형태의 필터 ‘마스크(Mask)’는 시각피질의 뉴런처럼 이미지의 중요한 영역을 강조하고, 덜 중요한 부분은 자연스럽게 배제한다.
이 기능은 넓은 수용영역에서도 핵심 정보를 놓치지 않도록 가중치를 공간적으로 다르게 분포시켜 CNN의 한계를 효과적으로 개선, 학습 과정에서 스스로 형태를 조정하며 다양한 환경에서 일관되게 중요한 특징에만 집중할 수 있도록 한다.
연구팀은 이 기술을 다양한 CNN 모델에 적용한 결과 Lp-컨볼루션 적용 모델이 기존 CNN 모델보다 이미지 분류 정확도가 크게 향상됨을 확인했다.
아울러 한 번에 더 넓은 영역을 볼 수 있도록 필터 크기를 확대해도 성능저하 없이 안정적으로 작동했고, 정확도도 향상되는 결과를 얻었다.
이는 일반적으로 분석 범위를 넓히면 계산량이 증가해 정확도는 떨어지는 것과 반대현상으로, Lp-컨볼루션이 이 같은 한계를 효과적으로 극복한 것으로 풀이된다.
또 연구팀은 Lp-컨볼루션이 실제 뇌의 정보처리 방식과 얼마나 유사한지를 확인하는 실험을 진행했다.
연구팀은 생쥐에게 다양한 이미지를 보여주며 시각피질 뉴런의 활동을 기록하고, 이를 바탕으로 AI 모델이 각 이미지에 대해 뉴런이 어떻게 반응할지 예측토록 학습시켰다.
이렇게 훈련된 모델의 반응과 실제 뉴런 반응을 비교한 결과, Lp-컨볼루션을 적용한 모델은 기존 CNN 모델보다 뉴런 반응을 더 정밀하게 예측했고, 예측 오차도 감소했다.
이는 Lp-컨볼루션이 단순한 성능 향상을 넘어, 뇌의 시각 정보 처리 방식과 더욱 유사한 구조와 작동방식을 구현하고 있음을 실험적으로 입증한 것으로 의미를 갖는다.

이번 연구의 제1저자인 권재 IBS 박사후연구원은 “Lp-컨볼루션은 뇌에서 착안한 ‘구조화된 희소성’을 도입함으로써 단순 계산량 증가가 아닌 뇌 중요 부분에 집중해 효율성과 성능을 동시에 확보했다”며 “아울러 뇌 활동 예측에도 뛰어난 성능으로 AI와 뇌과학의 연결고리를 강화했다”고 설명했다.
이 단장은 “이번 연구는 AI와 뇌과학이 함께 발전할 수 있는 새로운 융합 모델의 좋은 사례가 될 것”이라며 “향후 신경과학 분야에서 밝혀지고 있는 다양한 아이디어를 인공신경망에 지속적으로 도입해 AI 성능과 효율을 높이고, 뇌에 대한 이해도 함께 심화시킬 계획”이라고 말했다.
한편, 이번 연구결과는 24~28일 싱가포르에서 열리는 세계적 권위의 AI학회 ‘The International Conference on Learning Representations(ICLR)’서 발표할 예정이다.